Corrector ortográfico en Python

Muhammad Maisam Abbas 30 enero 2023
  1. Corrector ortográfico con la biblioteca autocorrect en Python
  2. Corrector ortográfico con la biblioteca pyspellchecker en Python
  3. Corrector ortográfico con la biblioteca textblob en Python
Corrector ortográfico en Python

Este tutorial discutirá los métodos que puede utilizar para crear un corrector ortográfico en Python.

Corrector ortográfico con la biblioteca autocorrect en Python

La autocorrect es una biblioteca externa que se puede utilizar para desarrollar un corrector ortográfico en Python. Dado que es una biblioteca externa, tenemos que descargarla e instalarla antes de usarla en nuestro código. El comando para instalar el módulo autocorrección se da a continuación.

pip install autocorrect

Podemos usar la clase Speller dentro de la biblioteca autocorrect y especificar el idioma en el constructor. El siguiente código de ejemplo nos muestra cómo podemos crear un corrector ortográfico con el módulo autocorrect.

from autocorrect import Speller

spell = Speller(lang="en")

misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
    print("original word: " + word)
    print("corrected word: " + spell(word))

Producción :

original word: scisors
corrected word: scissors
original word: chemp
corrected word: champ
original word: celender
corrected word: calendar
original word: berthday
corrected word: birthday

En el código anterior, desarrollamos un corrector ortográfico con la clase Speller dentro de la biblioteca autocorrect. Creamos una instancia spell de la clase Speller y especificamos el idioma inglés dentro del constructor. Pasamos la palabra mal escrita dentro del objeto tal como lo hacemos con una función normal, y devolvió la palabra corregida.

Corrector ortográfico con la biblioteca pyspellchecker en Python

El pyspellchecker es otra biblioteca externa que puede usarse en lugar de la biblioteca autocorrect para desarrollar un corrector ortográfico en Python.

Dado que también es una biblioteca externa, tenemos que descargarla e instalarla para usarla en nuestro código. El comando para instalar la biblioteca pyspellchecker se da a continuación.

pip install pyspellchecker

Podemos usar la clase SpellChecker dentro de la biblioteca pyspellchecker para predecir la palabra correcta. La función correction() dentro de la clase SpellChecker toma la palabra mal escrita como argumento de entrada y devuelve la palabra corregida como una cadena.

El siguiente programa nos muestra cómo podemos crear un corrector ortográfico con la biblioteca pyspellchecker.

from spellchecker import SpellChecker

spell = SpellChecker()

misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
    print("original word: " + word)
    print("corrected word: " + spell.correction(word))

Producción :

original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: calender
original word: berthday
corrected word: birthday

Desarrollamos un corrector ortográfico con la clase SpellChecker dentro del módulo spellchecker en el código anterior. Creamos una instancia spell de la clase SpellChecker y el idioma predeterminado es el inglés. Pasamos la palabra mal escrita dentro de la función correctio() del objeto spell, devolviendo la palabra corregida.

Corrector ortográfico con la biblioteca textblob en Python

Para desarrollar un corrector ortográfico de Python, también podemos usar la biblioteca textblob. La librería textblob se utiliza para procesar datos textuales. Es una biblioteca externa y necesitamos instalarla con el siguiente comando.

pip install textblob

La función correct() dentro de la biblioteca textblob devuelve la corrección de una palabra incorrecta. El siguiente programa de ejemplo nos muestra cómo crear un programa de revisión ortográfica usando la biblioteca textblob de Python.

from textblob import TextBlob

misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
    print("original word: " + word)
    spell = TextBlob(word)
    print("corrected word: " + str(spell.correct()))

Producción :

original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: slender
original word: berthday
corrected word: birthday

En el código anterior, desarrollamos un corrector ortográfico con la clase TextBlob dentro de la biblioteca textblob. Creamos una instancia spell de la clase TextBlob y pasamos la palabra dentro del constructor; el idioma predeterminado es el inglés. Luego usamos la función correct() para mostrar la ortografía adecuada para esa palabra en particular.

Muhammad Maisam Abbas avatar Muhammad Maisam Abbas avatar

Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.

LinkedIn