Möglichkeiten zum Entfernen von xa0 aus einem String in Python
-
Verwenden Sie die Funktion
Normalize()
von Unicodedata, um\xa0
aus einem String in Python zu entfernen -
Verwenden Sie die Funktion
replace()
des Strings, um\xa0
aus einem String in Python zu entfernen -
Verwendung der Funktion
get_text()
der BibliothekBeautifulSoup
mit der Einstellungstrip
auf True, um\xa0
aus einem String in Python zu entfernen
Dieser Artikel stellt verschiedene Methoden vor, um \xa0
aus einem String in Python zu entfernen.
Der Unicode \xa0
repräsentiert ein hartes Leerzeichen oder ein Leerzeichen ohne Unterbrechung in einem Programm. Es wird als
dargestellt. im HTML-Format.
Die Python-Funktionen, die helfen können, \xa0
aus einem String zu entfernen, sind wie folgt.
- Die Funktion
normalize()
vonunicodedata
- Die Funktion
replace()
des Strings - Die Funktion
get_text()
der BibliothekBeautifulSoup
mit aktiviertemstrip
alsTrue
.
Verwenden Sie die Funktion Normalize()
von Unicodedata, um \xa0
aus einem String in Python zu entfernen
Mit der Funktion unicodedata
normalize()
der Standardbibliothek unicodedata
können Sie \xa0
aus einem String entfernen.
Die Funktion normalize()
wird wie folgt verwendet.
unicodedata.normalize("NFKD", string_to_normalize)
Dabei bezeichnet NFKD die normal form KD
. Es ersetzt alle Kompatibilitätszeichen durch ihre entsprechenden Zeichen.
Das folgende Beispielprogramm veranschaulicht dies.
import unicodedata
str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"
if xa in str_hard_space:
print("xa0 is Found!")
else:
print("xa0 is not Found!")
new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
print("xa0 is Found!")
else:
print("xa0 is not Found!")
Ausgabe:
17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!
Verwenden Sie die Funktion replace()
des Strings, um \xa0
aus einem String in Python zu entfernen
Sie können die Funktion replace()
des Strings verwenden, um \xa0
aus einem String zu entfernen.
Die Funktion replace()
wird wie folgt verwendet.
str_hard_space.replace(u"\xa0", u" ")
Das folgende Beispiel veranschaulicht dies.
str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"
if xa in str_hard_space:
print("xa0 Found!")
else:
print("xa0 not Found!")
new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
print("xa0 Found!")
else:
print("xa0 not Found!")
Ausgabe:
16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!
Verwendung der Funktion get_text()
der Bibliothek BeautifulSoup
mit der Einstellung strip
auf True, um \xa0
aus einem String in Python zu entfernen
Sie können die Funktion get_text()
der Standardbibliothek BeautifulSoup
verwenden, wenn strip
als True
aktiviert ist, um \xa0
aus einem String zu entfernen.
Die Funktion get_text()
wird wie folgt verwendet.
clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)
Das folgende Beispiel veranschaulicht dies.
from bs4 import BeautifulSoup
html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)
clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)
print(clean_text)
Ausgabe:
Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!
Verwandter Artikel - Python String
- Entfernen Kommas aus String in Python
- Wie man prüft, ob eine Zeichenkette auf pythonische Weise leer ist
- Konvertieren einer Zeichenkette in einen Variablennamen in Python
- Wie man Leerzeichen in einem String in Python entfernt
- Wie man in Python Zahlen aus einer Zeichenkette extrahiert
- Wie man in Python String in datetime konvertiert