Formas de eliminar xa0 de una cadena en Python
-
Utilice la función
Normalize()
de Unicodedata para eliminar\xa0
de una cadena en Python -
Utilice la función
replace()
de la cadena para eliminar\xa0
de una cadena en Python -
Utilice la función
get_text()
de la bibliotecaBeautifulSoup
constrip
establecido como verdadero para eliminar\xa0
de una cadena en Python
Este artículo presenta diferentes métodos para eliminar \xa0
de una cadena en Python.
El Unicode \xa0
representa un espacio duro o un espacio sin interrupciones en un programa. Se representa como
en HTML.
Las funciones de Python que pueden ayudar a eliminar \xa0
de una cadena son las siguientes.
- La función
normalize()
deunicodedata
- La función
replace()
de la cadena - La función
get_text()
de la bibliotecaBeautifulSoup
constrip
habilitado comoTrue
.
Utilice la función Normalize()
de Unicodedata para eliminar \xa0
de una cadena en Python
Puede utilizar la función normalize()
de la biblioteca estándar unicodedata
para eliminar \xa0
de una cadena.
La función normalize()
se utiliza de la siguiente manera.
unicodedata.normalize("NFKD", string_to_normalize)
Aquí, NFKD denota la forma normal KD
. Reemplaza todos los caracteres de compatibilidad con sus caracteres equivalentes.
El programa de ejemplo siguiente ilustra esto.
import unicodedata
str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"
if xa in str_hard_space:
print("xa0 is Found!")
else:
print("xa0 is not Found!")
new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
print("xa0 is Found!")
else:
print("xa0 is not Found!")
Producción :
17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!
Utilice la función replace()
de la cadena para eliminar \xa0
de una cadena en Python
Puede utilizar la función replace()
de la cadena para eliminar \xa0
de una cadena.
La función replace()
se utiliza de la siguiente manera.
str_hard_space.replace(u"\xa0", u" ")
El siguiente ejemplo ilustra esto.
str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"
if xa in str_hard_space:
print("xa0 Found!")
else:
print("xa0 not Found!")
new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
print("xa0 Found!")
else:
print("xa0 not Found!")
Producción :
16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!
Utilice la función get_text()
de la biblioteca BeautifulSoup
con strip
establecido como verdadero para eliminar \xa0
de una cadena en Python
Puede utilizar la función get_text()
de la biblioteca estándar BeautifulSoup
con strip
habilitado como True
para eliminar \xa0
de una cadena.
La función get_text()
se utiliza de la siguiente manera.
clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)
El siguiente ejemplo ilustra esto.
from bs4 import BeautifulSoup
html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)
clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)
print(clean_text)
Producción :
Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!