Rohe String und Unicode String in Python

Neema Muganga 3 Januar 2023
  1. Roher String in Python
  2. Python-Unicode-String
Rohe String und Unicode String in Python

Roher String in Python

Rohe String-Literale in Python definieren normale Strings, denen entweder ein r oder R vor dem öffnenden Anführungszeichen vorangestellt ist. Wenn ein Backslash (\) in der Zeichenkette enthalten ist, behandelt die RohZeichenkette dieses Zeichen als Literalzeichen, jedoch nicht als Escape-Zeichen.

Zum Beispiel,

print(r"\n")
print(r"\t")

Ausgabe:

\n
\t

Es ist erforderlich, bei der Definition eines Strings jeden Backslash zu verdoppeln, damit er nicht als Anfang einer Escape-Sequenz wie einem Zeilenumbruch oder einem neuen Tab verwechselt wird. Wir sehen eine solche Syntaxanwendung in der Syntax von regulären Ausdrücken und beim Ausdrücken von Windows-Dateipfaden.

HINWEIS
r'\' führt zu einem Syntaxfehler, da r den Backslash als Literal behandelt. Ohne das Präfix r wird der Backslash als Escape-Zeichen behandelt.

Beispiel:

text = "Hello\nWorld"
print(text)

Ausgabe:

Hello
World

Ohne das rohe String-Flag r wird der Backslash als Escape-Zeichen behandelt, so dass beim Drucken des obigen Strings die neue Zeilen-Escape-Sequenz generiert wird. Daher werden die beiden Strings im Text in separaten Zeilen ausgegeben, wie in der Ausgabe angezeigt.

Fügen Sie im gleichen Textbeispiel das Präfix r vor der Zeichenkette hinzu.

Beispiel:

text = r"Hello\nWorld"
print(text)

Ausgabe:

Hello\nWorld

In der Ausgabe behandelt das Raw-String-Flag den Backslash als Literal und gibt den Text mit eingeschlossenem Backslash aus. Eingabe und Ausgabe sind also identisch, da der umgekehrte Schrägstrich nicht mit Escapezeichen versehen ist.

Zum Beispiel haben '\\n' und r'\n' denselben Wert.

print("\\n")
print(r"\n")

Python-Unicode-String

Unicode ist eine Möglichkeit, Python-Strings zu speichern. Unicode kann Strings aller Sprachtypen speichern. Der zweite Weg ist der String-Speicher vom Typ ASCII, der in Python als str dargestellt wird. str ist der Standarddatentyp zum Speichern von Strings in Python.

Um einen String in den Unicode-Typ umzuwandeln, setzen Sie ein u vor den Text - u'string' oder rufen Sie die Funktion unicode() wie folgt auf - unicode('string').

u'text' ist ein Unicode-String, während text ein Byte-String ist. Ein Unicode-Objekt benötigt mehr Speicherplatz.

Zum Beispiel,

test = u"一二三"
print(test)

Ausgabe:

一二三

Verwandter Artikel - Python String