Corrector ortográfico en Python
-
Corrector ortográfico con la biblioteca
autocorrect
en Python -
Corrector ortográfico con la biblioteca
pyspellchecker
en Python -
Corrector ortográfico con la biblioteca
textblob
en Python
Este tutorial discutirá los métodos que puede utilizar para crear un corrector ortográfico en Python.
Corrector ortográfico con la biblioteca autocorrect
en Python
La autocorrect
es una biblioteca externa que se puede utilizar para desarrollar un corrector ortográfico en Python. Dado que es una biblioteca externa, tenemos que descargarla e instalarla antes de usarla en nuestro código. El comando para instalar el módulo autocorrección
se da a continuación.
pip install autocorrect
Podemos usar la clase Speller
dentro de la biblioteca autocorrect
y especificar el idioma en el constructor. El siguiente código de ejemplo nos muestra cómo podemos crear un corrector ortográfico con el módulo autocorrect
.
from autocorrect import Speller
spell = Speller(lang="en")
misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
print("original word: " + word)
print("corrected word: " + spell(word))
Producción :
original word: scisors
corrected word: scissors
original word: chemp
corrected word: champ
original word: celender
corrected word: calendar
original word: berthday
corrected word: birthday
En el código anterior, desarrollamos un corrector ortográfico con la clase Speller
dentro de la biblioteca autocorrect
. Creamos una instancia spell
de la clase Speller
y especificamos el idioma inglés dentro del constructor. Pasamos la palabra mal escrita dentro del objeto tal como lo hacemos con una función normal, y devolvió la palabra corregida.
Corrector ortográfico con la biblioteca pyspellchecker
en Python
El pyspellchecker
es otra biblioteca externa que puede usarse en lugar de la biblioteca autocorrect
para desarrollar un corrector ortográfico en Python.
Dado que también es una biblioteca externa, tenemos que descargarla e instalarla para usarla en nuestro código. El comando para instalar la biblioteca pyspellchecker
se da a continuación.
pip install pyspellchecker
Podemos usar la clase SpellChecker
dentro de la biblioteca pyspellchecker
para predecir la palabra correcta. La función correction()
dentro de la clase SpellChecker
toma la palabra mal escrita como argumento de entrada y devuelve la palabra corregida como una cadena.
El siguiente programa nos muestra cómo podemos crear un corrector ortográfico con la biblioteca pyspellchecker
.
from spellchecker import SpellChecker
spell = SpellChecker()
misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
print("original word: " + word)
print("corrected word: " + spell.correction(word))
Producción :
original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: calender
original word: berthday
corrected word: birthday
Desarrollamos un corrector ortográfico con la clase SpellChecker
dentro del módulo spellchecker
en el código anterior. Creamos una instancia spell
de la clase SpellChecker
y el idioma predeterminado es el inglés. Pasamos la palabra mal escrita dentro de la función correctio()
del objeto spell
, devolviendo la palabra corregida.
Corrector ortográfico con la biblioteca textblob
en Python
Para desarrollar un corrector ortográfico de Python, también podemos usar la biblioteca textblob
. La librería textblob
se utiliza para procesar datos textuales. Es una biblioteca externa y necesitamos instalarla con el siguiente comando.
pip install textblob
La función correct()
dentro de la biblioteca textblob
devuelve la corrección de una palabra incorrecta. El siguiente programa de ejemplo nos muestra cómo crear un programa de revisión ortográfica usando la biblioteca textblob
de Python.
from textblob import TextBlob
misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
print("original word: " + word)
spell = TextBlob(word)
print("corrected word: " + str(spell.correct()))
Producción :
original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: slender
original word: berthday
corrected word: birthday
En el código anterior, desarrollamos un corrector ortográfico con la clase TextBlob
dentro de la biblioteca textblob
. Creamos una instancia spell
de la clase TextBlob
y pasamos la palabra dentro del constructor; el idioma predeterminado es el inglés. Luego usamos la función correct()
para mostrar la ortografía adecuada para esa palabra en particular.
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn