Wie man in Python die Interpunktion von einer Zeichenkette entfernt

Hassan Saeed 30 Januar 2023
  1. Verwendung von Klassenmethoden der Klasse String, um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen
  2. Verwenden Sie regex, um Interpunktion aus einer Zeichenkette in Python zu entfernen
  3. Verwenden Sie string.punctuation, um Interpunktion aus einer Zeichenkette in Python zu entfernen
  4. Verwenden Sie replace(), um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen
Wie man in Python die Interpunktion von einer Zeichenkette entfernt

In diesem Tutorial werden Methoden zum Entfernen von Interpunktion aus einer Zeichenkette in Python besprochen. Es ist ein besonders nützlicher Schritt bei der Vorverarbeitung und Bereinigung von Textdaten für NLP.

Verwendung von Klassenmethoden der Klasse String, um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen

Wir können die eingebauten Funktionen der Klasse String verwenden, um in Python die Interpunktion einer Zeichenkette zu entfernen. Das folgende Beispiel veranschaulicht dies.

s = "string. With. Punctuations!?"
out = s.translate(str.maketrans("", "", string.punctuation))
print(out)

Ausgabe:

'string With Punctuations'

Die obige Methode entfernt alle Interpunktionen aus einer gegebenen Eingabezeichenkette.

Verwenden Sie regex, um Interpunktion aus einer Zeichenkette in Python zu entfernen

Wir können auch regex verwenden, um Interpunktion aus einer Zeichenkette in Python zu entfernen. Das folgende Beispiel veranschaulicht dies.

import re

s = "string. With. Punctuation?"
out = re.sub(r"[^\w\s]", "", s)
print(out)

Ausgabe:

'string With Punctuations'

Verwenden Sie string.punctuation, um Interpunktion aus einer Zeichenkette in Python zu entfernen

Sie ist ähnlich wie die erste diskutierte Methode. string.punctuation enthält alle Zeichen, die im Englischen als Interpunktion betrachtet werden. Wir können diese Liste verwenden und alle Interpunktionszeichen aus einer Zeichenkette ausschließen. Das folgende Beispiel veranschaulicht dies.

s = "string. With. Punctuation?"

out = "".join([i for i in s if i not in string.punctuation])
print(out)

Ausgabe:

'string With Punctuations'

Verwenden Sie replace(), um in Python die Zeichensetzung aus einer Zeichenkette zu entfernen

Wir können auch replace() verwenden, um Interpunktion aus einer Zeichenkette in Python zu entfernen. Auch hier verwenden wir string.punctuation, um eine Liste von Interpunktionen zu definieren, und ersetzen dann alle Interpunktionen durch eine leere Zeichenkette, um die Interpunktionen zu entfernen. Das folgende Beispiel veranschaulicht dies.

s = "string. With. Punctuation?"

punct = string.punctuation
for c in punct:
    s = s.replace(c, "")
print(s)

Ausgabe:

'string With Punctuations'

Verwandter Artikel - Python String