Corretor ortográfico em Python

Muhammad Maisam Abbas 30 janeiro 2023
  1. Verificador ortográfico com a biblioteca autocorrect em Python
  2. Verificador ortográfico com a biblioteca pyspellchecker em Python
  3. Verificador ortográfico com a biblioteca textblob em Python
Corretor ortográfico em Python

Este tutorial discutirá os métodos que você pode usar para criar um corretor ortográfico em Python.

Verificador ortográfico com a biblioteca autocorrect em Python

O autocorrect é uma biblioteca externa que pode ser usada para desenvolver um corretor ortográfico em Python. Por se tratar de uma biblioteca externa, devemos baixá-la e instalá-la antes de usá-la em nosso código. O comando para instalar o módulo autocorreção é fornecido abaixo.

pip install autocorrect

Podemos usar a classe Speller dentro da biblioteca autocorrect e especificar a linguagem no construtor. O código de exemplo a seguir nos mostra como podemos criar um corretor ortográfico com o módulo autocorrect.

from autocorrect import Speller

spell = Speller(lang="en")

misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
    print("original word: " + word)
    print("corrected word: " + spell(word))

Produção:

original word: scisors
corrected word: scissors
original word: chemp
corrected word: champ
original word: celender
corrected word: calendar
original word: berthday
corrected word: birthday

No código acima, desenvolvemos um corretor ortográfico com a classe Speller dentro da biblioteca autocorrect. Criamos uma instância spell da classe Speller e especificamos o idioma inglês dentro do construtor. Passamos a palavra com erros ortográficos dentro do objeto, como fazemos com uma função normal, e ele retornou a palavra corrigida.

Verificador ortográfico com a biblioteca pyspellchecker em Python

O pyspellchecker é outra biblioteca externa que pode ser usada no lugar da biblioteca autocorrect para desenvolver um verificador ortográfico em Python.

Uma vez que também é uma biblioteca externa, temos que fazer o download e instalá-la também para usá-la em nosso código. O comando para instalar a biblioteca pyspellchecker é fornecido abaixo.

pip install pyspellchecker

Podemos usar a classe SpellChecker dentro da biblioteca pyspellchecker para prever a palavra correta. A função correction() dentro da classe SpellChecker pega a palavra incorreta como um argumento de entrada e retorna a palavra corrigida como uma string.

O programa a seguir nos mostra como podemos criar um corretor ortográfico com a biblioteca pyspellchecker.

from spellchecker import SpellChecker

spell = SpellChecker()

misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
    print("original word: " + word)
    print("corrected word: " + spell.correction(word))

Produção:

original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: calender
original word: berthday
corrected word: birthday

Desenvolvemos um verificador ortográfico com a classe SpellChecker dentro do módulo spellchecker no código acima. Criamos uma instância spell da classe SpellChecker e o idioma padrão é o inglês. Passamos a palavra incorreta dentro da função correction() do objeto spell, retornando a palavra corrigida.

Verificador ortográfico com a biblioteca textblob em Python

Para desenvolver um verificador ortográfico em Python, também podemos usar a biblioteca textblob. O textblob é usado para processar dados textuais. É uma biblioteca externa e precisamos instalá-la com o seguinte comando.

pip install textblob

A função correct() dentro da biblioteca textblob retorna a correção para uma palavra incorreta. O programa de exemplo a seguir nos mostra como criar um programa verificador ortográfico usando a biblioteca textblob do Python.

from textblob import TextBlob

misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
    print("original word: " + word)
    spell = TextBlob(word)
    print("corrected word: " + str(spell.correct()))

Produção:

original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: slender
original word: berthday
corrected word: birthday

No código acima, desenvolvemos um corretor ortográfico com a classe TextBlob dentro da biblioteca textblob. Criamos uma instância spell da classe TextBlob e passamos a palavra dentro do construtor; o idioma padrão é o inglês. Em seguida, usamos a função correct() para exibir a grafia adequada para aquela palavra em particular.

Muhammad Maisam Abbas avatar Muhammad Maisam Abbas avatar

Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.

LinkedIn