Wie man in Python die Interpunktion von einer Zeichenkette entfernt
-
Verwendung von Klassenmethoden der Klasse
String
, um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen -
Verwenden Sie
regex
, um Interpunktion aus einer Zeichenkette in Python zu entfernen -
Verwenden Sie
string.punctuation
, um Interpunktion aus einer Zeichenkette in Python zu entfernen -
Verwenden Sie
replace()
, um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen
In diesem Tutorial werden Methoden zum Entfernen von Interpunktion aus einer Zeichenkette in Python besprochen. Es ist ein besonders nützlicher Schritt bei der Vorverarbeitung und Bereinigung von Textdaten für NLP.
Verwendung von Klassenmethoden der Klasse String
, um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen
Wir können die eingebauten Funktionen der Klasse String
verwenden, um in Python die Interpunktion einer Zeichenkette zu entfernen. Das folgende Beispiel veranschaulicht dies.
s = "string. With. Punctuations!?"
out = s.translate(str.maketrans("", "", string.punctuation))
print(out)
Ausgabe:
'string With Punctuations'
Die obige Methode entfernt alle Interpunktionen aus einer gegebenen Eingabezeichenkette.
Verwenden Sie regex
, um Interpunktion aus einer Zeichenkette in Python zu entfernen
Wir können auch regex
verwenden, um Interpunktion aus einer Zeichenkette in Python zu entfernen. Das folgende Beispiel veranschaulicht dies.
import re
s = "string. With. Punctuation?"
out = re.sub(r"[^\w\s]", "", s)
print(out)
Ausgabe:
'string With Punctuations'
Verwenden Sie string.punctuation
, um Interpunktion aus einer Zeichenkette in Python zu entfernen
Sie ist ähnlich wie die erste diskutierte Methode. string.punctuation
enthält alle Zeichen, die im Englischen als Interpunktion betrachtet werden. Wir können diese Liste verwenden und alle Interpunktionszeichen aus einer Zeichenkette ausschließen. Das folgende Beispiel veranschaulicht dies.
s = "string. With. Punctuation?"
out = "".join([i for i in s if i not in string.punctuation])
print(out)
Ausgabe:
'string With Punctuations'
Verwenden Sie replace()
, um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen
Wir können auch replace()
verwenden, um Interpunktion aus einer Zeichenkette in Python zu entfernen. Auch hier verwenden wir string.punctuation
, um eine Liste von Interpunktionen zu definieren, und ersetzen dann alle Interpunktionen durch eine leere Zeichenkette, um die Interpunktionen zu entfernen. Das folgende Beispiel veranschaulicht dies.
s = "string. With. Punctuation?"
punct = string.punctuation
for c in punct:
s = s.replace(c, "")
print(s)
Ausgabe:
'string With Punctuations'
Verwandter Artikel - Python String
- Entfernen Kommas aus String in Python
- Wie man prüft, ob eine Zeichenkette auf pythonische Weise leer ist
- Konvertieren einer Zeichenkette in einen Variablennamen in Python
- Wie man Leerzeichen in einem String in Python entfernt
- Wie man in Python Zahlen aus einer Zeichenkette extrahiert
- Wie man in Python String in datetime konvertiert