Rohe String und Unicode String in Python
Roher String in Python
Rohe String-Literale in Python definieren normale Strings, denen entweder ein r
oder R
vor dem öffnenden Anführungszeichen vorangestellt ist. Wenn ein Backslash (\
) in der Zeichenkette enthalten ist, behandelt die RohZeichenkette dieses Zeichen als Literalzeichen, jedoch nicht als Escape-Zeichen.
Zum Beispiel,
print(r"\n")
print(r"\t")
Ausgabe:
\n
\t
Es ist erforderlich, bei der Definition eines Strings jeden Backslash zu verdoppeln, damit er nicht als Anfang einer Escape-Sequenz wie einem Zeilenumbruch oder einem neuen Tab verwechselt wird. Wir sehen eine solche Syntaxanwendung in der Syntax von regulären Ausdrücken und beim Ausdrücken von Windows-Dateipfaden
.
r'\'
führt zu einem Syntaxfehler, da r
den Backslash als Literal behandelt. Ohne das Präfix r
wird der Backslash als Escape-Zeichen behandelt.Beispiel:
text = "Hello\nWorld"
print(text)
Ausgabe:
Hello
World
Ohne das rohe String-Flag r
wird der Backslash als Escape-Zeichen behandelt, so dass beim Drucken des obigen Strings die neue Zeilen-Escape-Sequenz generiert wird. Daher werden die beiden Strings im Text in separaten Zeilen ausgegeben, wie in der Ausgabe angezeigt.
Fügen Sie im gleichen Textbeispiel das Präfix r
vor der Zeichenkette hinzu.
Beispiel:
text = r"Hello\nWorld"
print(text)
Ausgabe:
Hello\nWorld
In der Ausgabe behandelt das Raw-String-Flag den Backslash als Literal und gibt den Text mit eingeschlossenem Backslash aus. Eingabe und Ausgabe sind also identisch, da der umgekehrte Schrägstrich nicht mit Escapezeichen versehen ist.
Zum Beispiel haben '\\n'
und r'\n'
denselben Wert.
print("\\n")
print(r"\n")
Python-Unicode-String
Unicode ist eine Möglichkeit, Python-Strings zu speichern. Unicode kann Strings aller Sprachtypen speichern. Der zweite Weg ist der String-Speicher vom Typ ASCII
, der in Python als str
dargestellt wird. str
ist der Standarddatentyp zum Speichern von Strings in Python.
Um einen String in den Unicode-Typ umzuwandeln, setzen Sie ein u
vor den Text - u'string'
oder rufen Sie die Funktion unicode()
wie folgt auf - unicode('string')
.
u'text'
ist ein Unicode-String, währendtext
ein Byte-String ist. Ein Unicode-Objekt benötigt mehr Speicherplatz.
Zum Beispiel,
test = u"一二三"
print(test)
Ausgabe:
一二三
Verwandter Artikel - Python String
- Entfernen Kommas aus String in Python
- Wie man prüft, ob eine Zeichenkette auf pythonische Weise leer ist
- Konvertieren einer Zeichenkette in einen Variablennamen in Python
- Wie man Leerzeichen in einem String in Python entfernt
- Wie man in Python Zahlen aus einer Zeichenkette extrahiert
- Wie man in Python String in datetime konvertiert