2011/4/2 David Emmerich Jourdain <jourdain@documentfoundation.org>
(...)
Talvez, Rogério. Mas, o maior volume de erros gramaticais que tanto o
CoGroo
como outras ferramentas vão corrigir são relativamente comuns a maioria
dos
idiomas ocidentais. Cito exemplos:
pelo pelo > Corrigir para "pelo";
ou ou > Corrigir para "ou";
e e > Corrigir para "e";
vírgula onde não deveria ter vírgula;
Na verdade o CoGrO não verifica nenhum desses erros. Esse são os ditos
mecânicos, que podem ser resolvidos mecanicamente. Deixamos isso para
desenvolvimento pela comunidade, já que não existe interesse acadêmico,
mas
ngm contribuiu com um patch ainda :-(
E assim por diante.
Não sou profundo estudioso desta problemática, mas o Marcin
(LanguageTool)
me garantiu que estudos feitos pela Universidade de Varsóvia comprovam
que
mais de 80% dos erros gramaticais são comuns aos idiomas ocidentais.
Parece
que todos herdaram os mesmos vícios de gramática dos romanos!! :-)
Em um cenário otimista, pode restar 20% de idiossincrasias da língua
portuguesa, que então poderiam ter regras particulares. Talvez o pt_BR
possa
ter mais particularidades, por conta de outras influências lingüísticas.
Experimentos realizados pela Universidade de São Paulo apontam o contrário
:-)
Tenho aqui referências, com gráficos bonitos inclusive, apontando que o
contrário! Em textos bem escritos, o mais desafiador é encontrar erros
gramaticais, e eles são mais frequentes.
Com isso, um plugin multi-lingual passa a atender a maioria das demandas
de
vários idiomas, a partir de regras comuns a todos e trata suas
particularidades, a partir de arquivos de configuração separados, como:
ext-pt_BR.xml, ext-pt_pt.xml, ext-de_DE.xml, ext-de_AT.xml,
ext-de_CH.xml,
etc...
Até porque disponibilizar na web um arquivo xml, para permitir que a
comunidade colabore com a inclusão de itens de correção gramatical
diminui
a
distância entre desenvolvedor e comunidade e tira das costas dos
desenvolvedores a parte "pesada" do trabalho, que é adicionar as regras
particulares de cada idioma.
Visite o http://ccsl.ime.usp.br/cogroo/comunidade
Durante anos tivemos um XML pronto para receber contribuições:
http://cogroo.svn.sourceforge.net/viewvc/cogroo/cogroo3/trunk/CoGrOOBase/src/main/rules/rules.xml?revision=1409
Acho que temos que ir devagar com o CoGroo ... primeiro a equipe interna
do projeto tem que decidir se vai se esforçar para fazer com que ele
funcione em Java 64bits (não sei nem o que precisa para isso
acontecer),
caso eles não consigam, a coisa complica muito e acho que a ideia de
portar
para Python seja a mais correta (mas isso atrasaria o desenvolvimento
do
projeto em até 1-2anos dependendo da quantidade de gente trabalhando
nele).
Eu também tenho o CoGroo instalado e sei que sentiria falta dele,
contudo,
eu tenho que ser realista e pragmático. Se o melhor caminho for
desenvolver
tudo do zero, para Python, realmente será muito chato. Eu já tive que
reescrever aplicativos, feito por mim e por terceiros, em outra
linguagem.
É uma M#@d%!! :-) Você se sente realmente fazendo "re-trabalho"! É
desgastante!
Por isso, até eu mesmo recomendaria a sugestão dita pelo William, caso o
melhor caminho seja a migração do CoGroo para Python. Ele faz a
consultoria
do trabalho, outros "escovam bits"!!
Vou abordar a questão de um corretor gramatical Python mais tarde.
Abraços !
--
Unsubscribe instructions: E-mail to usuarios+help@pt-br.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/pt-br/usuarios/
All messages sent to this list will be publicly archived and cannot be
deleted