Möglichkeiten zum Entfernen von xa0 aus einem String in Python

Najwa Riyaz 30 Januar 2023
  1. Verwenden Sie die Funktion Normalize() von Unicodedata, um \xa0 aus einem String in Python zu entfernen
  2. Verwenden Sie die Funktion replace() des Strings, um \xa0 aus einem String in Python zu entfernen
  3. Verwendung der Funktion get_text() der Bibliothek BeautifulSoup mit der Einstellung strip auf True, um \xa0 aus einem String in Python zu entfernen
Möglichkeiten zum Entfernen von xa0 aus einem String in Python

Dieser Artikel stellt verschiedene Methoden vor, um \xa0 aus einem String in Python zu entfernen.

Der Unicode \xa0 repräsentiert ein hartes Leerzeichen oder ein Leerzeichen ohne Unterbrechung in einem Programm. Es wird als   dargestellt. im HTML-Format.

Die Python-Funktionen, die helfen können, \xa0 aus einem String zu entfernen, sind wie folgt.

  • Die Funktion normalize() von unicodedata
  • Die Funktion replace() des Strings
  • Die Funktion get_text() der Bibliothek BeautifulSoup mit aktiviertem strip als True.

Verwenden Sie die Funktion Normalize() von Unicodedata, um \xa0 aus einem String in Python zu entfernen

Mit der Funktion unicodedata normalize() der Standardbibliothek unicodedata können Sie \xa0 aus einem String entfernen.

Die Funktion normalize() wird wie folgt verwendet.

unicodedata.normalize("NFKD", string_to_normalize)

Dabei bezeichnet NFKD die normal form KD. Es ersetzt alle Kompatibilitätszeichen durch ihre entsprechenden Zeichen.

Das folgende Beispielprogramm veranschaulicht dies.

import unicodedata

str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")


new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")

Ausgabe:

17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!

Verwenden Sie die Funktion replace() des Strings, um \xa0 aus einem String in Python zu entfernen

Sie können die Funktion replace() des Strings verwenden, um \xa0 aus einem String zu entfernen.

Die Funktion replace() wird wie folgt verwendet.

str_hard_space.replace(u"\xa0", u" ")

Das folgende Beispiel veranschaulicht dies.

str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

Ausgabe:

16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!

Verwendung der Funktion get_text() der Bibliothek BeautifulSoup mit der Einstellung strip auf True, um \xa0 aus einem String in Python zu entfernen

Sie können die Funktion get_text() der Standardbibliothek BeautifulSoup verwenden, wenn strip als True aktiviert ist, um \xa0 aus einem String zu entfernen.

Die Funktion get_text() wird wie folgt verwendet.

clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)

Das folgende Beispiel veranschaulicht dies.

from bs4 import BeautifulSoup

html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)

clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)

print(clean_text)

Ausgabe:

Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!

Verwandter Artikel - Python String