Formas de eliminar xa0 de una cadena en Python

Najwa Riyaz 30 enero 2023
  1. Utilice la función Normalize() de Unicodedata para eliminar \xa0 de una cadena en Python
  2. Utilice la función replace() de la cadena para eliminar \xa0 de una cadena en Python
  3. Utilice la función get_text() de la biblioteca BeautifulSoup con strip establecido como verdadero para eliminar \xa0 de una cadena en Python
Formas de eliminar xa0 de una cadena en Python

Este artículo presenta diferentes métodos para eliminar \xa0 de una cadena en Python.

El Unicode \xa0 representa un espacio duro o un espacio sin interrupciones en un programa. Se representa como   en HTML.

Las funciones de Python que pueden ayudar a eliminar \xa0 de una cadena son las siguientes.

  • La función normalize() de unicodedata
  • La función replace() de la cadena
  • La función get_text() de la biblioteca BeautifulSoup con strip habilitado como True.

Utilice la función Normalize() de Unicodedata para eliminar \xa0 de una cadena en Python

Puede utilizar la función normalize() de la biblioteca estándar unicodedata para eliminar \xa0 de una cadena.

La función normalize() se utiliza de la siguiente manera.

unicodedata.normalize("NFKD", string_to_normalize)

Aquí, NFKD denota la forma normal KD. Reemplaza todos los caracteres de compatibilidad con sus caracteres equivalentes.

El programa de ejemplo siguiente ilustra esto.

import unicodedata

str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")


new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")

Producción :

17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!

Utilice la función replace() de la cadena para eliminar \xa0 de una cadena en Python

Puede utilizar la función replace() de la cadena para eliminar \xa0 de una cadena.

La función replace() se utiliza de la siguiente manera.

str_hard_space.replace(u"\xa0", u" ")

El siguiente ejemplo ilustra esto.

str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

Producción :

16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!

Utilice la función get_text() de la biblioteca BeautifulSoup con strip establecido como verdadero para eliminar \xa0 de una cadena en Python

Puede utilizar la función get_text() de la biblioteca estándar BeautifulSoup con strip habilitado como True para eliminar \xa0 de una cadena.

La función get_text() se utiliza de la siguiente manera.

clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)

El siguiente ejemplo ilustra esto.

from bs4 import BeautifulSoup

html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)

clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)

print(clean_text)

Producción :

Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!

Artículo relacionado - Python String