Rune in Go

Jay Singh 30 Januar 2023
  1. Beispiel mit Rune in Go
  2. Verwendung von Rune mit Backslash \ in Go
  3. Vergleich von byte() und rune() in Go
Rune in Go

In Go ist eine Rune ein Alias ​​für den int32-Datentyp, der Unicode-Codepunkte darstellt. Es bezieht sich auf den numerischen Wert, der einem Unicode-Zeichen zugeordnet ist.

Vor einigen Jahren haben wir den ASCII-Zeichensatz verwendet, der sieben Bits verwendet, um einhundertzweiundachtzig Zeichen darzustellen, einschließlich Großbuchstaben, Zahlenwerte usw. Im Gegensatz dazu erwies sich der ASCII-Zeichensatz als unfähig, die riesige Zahl der Welt zu bewältigen von Sprachen und Symbolen.

Die Unicode-Zeichenkodierung wurde geschaffen, um dieses Problem zu lösen. Es ist eine Obermenge der ASCII-Zeichenkodierung mit maximal 1114112 Unicode-Codepunkten.

Schauen wir uns zum besseren Verständnis einige Beispiele an.

Beispiel mit Rune in Go

package main

import (
    "fmt"
    "reflect"
    "unsafe"
)

func main() {
    r := 'b'

    fmt.Printf("Size: %d\n", unsafe.Sizeof(r))
    fmt.Printf("Type: %s\n", reflect.TypeOf(r))
    fmt.Printf("Unicode CodePoint: %U\n", r)
    fmt.Printf("Character: %c\n", r)

    s := "Jay Singh"

    fmt.Printf("%U\n", []rune(s))
    fmt.Println([]rune(s))
}

Ausgabe:

Size: 4
Type: int32
Unicode CodePoint: U+0062
Character: b
[U+004A U+0061 U+0079 U+0020 U+0053 U+0069 U+006E U+0067 U+0068]
[74 97 121 32 83 105 110 103 104]

Verwendung von Rune mit Backslash \ in Go

Alle Sequenzen, die mit einem Backslash beginnen, sind in Runenliteralen verboten.

package main

import (
    "fmt"
    "reflect"
)

func main() {

    rune1 := 'J'
    rune2 := 'c'
    rune3 := '\\'

    fmt.Printf("Rune 1: %c; Unicode: %U; Type: %s", rune1,
        rune1, reflect.TypeOf(rune1))

    fmt.Printf("\nRune 2: %c; Unicode: %U; Type: %s", rune2,
        rune2, reflect.TypeOf(rune2))

    fmt.Printf("\nRune 3: Unicode: %U; Type: %s", rune3,
        rune3, reflect.TypeOf(rune3))
}

Ausgabe:

Rune 1: J; Unicode: U+004A; Type: int32
Rune 2: c; Unicode: U+0063; Type: int32
Rune 3: Unicode: U+005C; Type: %!s(int32=92)%!(EXTRA *reflect.rtype=int32)

Vergleich von byte() und rune() in Go

Lassen Sie uns in diesem Beispiel das Byte-Array und die Rune einer Zeichenfolge ausgeben, die Nicht-ASCII-Zeichen enthält. Der spezielle Runenwert für Unicode-Zeichen ist 214; die Codierung dauert jedoch zwei Bytes.

package main

import (
    "fmt"
)

func main() {
    s := "GÖ"

    s_rune := []rune(s)
    s_byte := []byte(s)

    fmt.Println(s_rune)
    fmt.Println(s_byte)
}

Ausgabe:

[71 214]
[71 195 150]