Ortho - Verificador e Conselheiro Ortográfico

Informações gerais

O ortho é um serviço gratuito de verificação e correção ortográfica para a língua portuguesa (variante do Brasil), oferecido pelo Instituto de Computação da Unicamp ao público em geral.

O serviço ortho pode ser utlizado por qualquer pessoa com acesso à Internet, via WWW ou via correio eletrônico. Usuários do IC-Unicamp podem também utilizá-lo diretamente, como filtro Unix, nas estações Sun (Solaris 5.5).

O servidor ortho utiliza tecnologia original, baseada em autômatos finitos, desenvolvida no IC-Unicamp. Em comparação com a tecnologia de "hashing", usada entre outros pelo verificador spell do Unix, a tecnologia do ortho permite maior rigor na verificação da validade das palavras, e a geração de sugestões mais ``inteligentes'' para as palavras erradas --- de maneira mais eficiente.

Usando o servidor ortho

Qualquer que seja o meio de acesso, o funcionamento do servidor é o mesmo. Você fornece um conjunto de palavras, e o ortho verifica cada uma delas contra um dicionário interno.

Você pode escolher entre três tipos de resposta. No mais simples, o servidor ortho informa apenas quais palavras são inválidas (não constam do dicionário interno). Se você quiser, ele fornecerá também sugestões para correção desses erros (palavras válidas semelhantes às erradas). Finalmente, o ortho pode fornecer sugestões para todas as palavras que lhe foram passadas, válidas ou inválidas.

Em qualquer caso, cada palavra fornecida é tratada isoladamente. A verificação e o aconselhamento são puramente ortográficos, sem levar em conta a gramática. Na saída, as palavras são ordenadas alfabeticamente, e palavras repetidas são eliminadas.

Codificação de acentos

Nas palavras fornecidas ao ortho, os acentos e cedilhas podem estar indicados de três maneiras:

Registro de uso

Todo uso do servidor ortho é registrado internamente, para fins de relatórios, depuração de problemas e aperfeiçoamento do serviço.

O registro de uso inclui o numero ou nome da máquina de onde partiu o pedido (no caso da interface WWW), o endereço de e-mail do solicitante (na interface por e-mail), ou seu username (no uso direto como filtro). Além disso são registradas a data, a hora, o tamanho do texto submetido, e o conjunto das palavras submetidas (reordenadas alfabeticamente, sem repetições).

Os membros do projeto DICIO se compromentem a não divulgar estes dados a terceiros, ou utilizá-los para fins indevidos.

Autoria e colaborações

O servidor ortho é um dos resultados do projeto DICIO, que consiste dos professores Tomasz Kowaltowski, Cláudio L. Lucchesi e Jorge Stolfi do Instituto de Computação da UNICAMP.

O dicionário usado atualmente pelo do ortho, com mais de 200.000 mil palavras, foi fornecido pela TTI Tecnologia, para uso exclusivo em ensino e pesquisa.

O projeto DICIO e a implementação do servidor ortho foram apoiadas em parte por bolsas da FAPESP e CNPq.


Last edited on 1999-08-12 08:51:43 by stolfi