Façons de supprimer xa0 d'une chaîne en Python

Najwa Riyaz 30 janvier 2023
  1. Utilisez la fonction Normalize() d’Unicodedata pour supprimer \xa0 d’une chaîne en Python
  2. Utilisez la fonction replace() de la chaîne pour supprimer \xa0 d’une chaîne en Python
  3. Utilisez la fonction get_text() de la bibliothèque BeautifulSoup avec strip défini sur True pour supprimer \xa0 d’une chaîne en Python
Façons de supprimer xa0 d'une chaîne en Python

Cet article présente différentes méthodes pour supprimer \xa0 d’une chaîne en Python.

L’Unicode \xa0 représente un espace dur ou un espace sans interruption dans un programme. Il est représenté par   en HTML.

Les fonctions Python qui peuvent aider à supprimer \xa0 d’une chaîne sont les suivantes.

  • La fonction normalize() de unicodedata
  • La fonction replace() de la chaîne
  • La fonction get_text() de la bibliothèque BeautifulSoup avec strip’ activée comme True.

Utilisez la fonction Normalize() d’Unicodedata pour supprimer \xa0 d’une chaîne en Python

Vous pouvez utiliser la fonction normalize() de la bibliothèque standard unicodedata pour supprimer \xa0 d’une chaîne.

La fonction normalize() est utilisée comme suit.

unicodedata.normalize("NFKD", string_to_normalize)

Ici, NFKD désigne la forme normale KD. Il remplace tous les caractères de compatibilité par leurs caractères équivalents.

L’exemple de programme ci-dessous illustre cela.

import unicodedata

str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")


new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")

Production:

17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!

Utilisez la fonction replace() de la chaîne pour supprimer \xa0 d’une chaîne en Python

Vous pouvez utiliser la fonction replace() de la chaîne pour supprimer \xa0 d’une chaîne.

La fonction replace() est utilisée comme suit.

str_hard_space.replace(u"\xa0", u" ")

L’exemple ci-dessous illustre cela.

str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

Production:

16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!

Utilisez la fonction get_text() de la bibliothèque BeautifulSoup avec strip défini sur True pour supprimer \xa0 d’une chaîne en Python

Vous pouvez utiliser la fonction get_text() de la bibliothèque standard BeautifulSoup avec strip activé comme True pour supprimer \xa0 d’une chaîne.

La fonction get_text() est utilisée comme suit.

clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)

L’exemple ci-dessous illustre cela.

from bs4 import BeautifulSoup

html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)

clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)

print(clean_text)

Production:

Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!

Article connexe - Python String