Date: prev next · Thread: first prev next last
2011 Archives by date, by thread · List index


Oi,

2011/4/2 Paulo de Souza Lima <paulo.s.lima@gmail.com>

Em 2 de abril de 2011 12:56, David Emmerich Jourdain <
jourdain@documentfoundation.org> escreveu:

Oi Paulo.


Oi David.

Esqueci de clicar em "Responder para todos" e a msg foi só pra vc e vc
respondeu só pra mim. Desculpe por isso. Estou copiando a lista, ok?



 Nesse caso, o CoGroo e outras extensões terão de se adaptar, ou
ficaremos
sem elas. É isso?


Sim, Paulo. Infelizmente.

Contudo, o William já manifestou que, se tivermos pessoas que se
disponham
a conduzir o trabalho em Python, ele colabora com alguma consultoria, ou
algo assim.

Eu compreendo a condição do William. De certa forma, ele pode se sentir
como tendo que "refazer a roda". Por isso, se alguém se dispor a
colaborar
com ele, para portar o CoGroo para Python, creio que seria uma boa
solução.


Eu também compreendo a posição dele. A coisa envolve mais do que o
LibreOffice. Temos de colocar outras comunidades (leia-se python e outras)
nas discussões.


Eu não me importo em refazer a roda rs. O CoGrOO já foi refeito umas 2
vezes, e estou começando a 3. Será fruto de 2 anos de pesquisas e
experimentos. Espero espero acabar em uns 3 meses, e terão o melhor CoGrOO
de todos os tempos :)

Mas gosto de fazer as coisas na direção certa. Uma coisa é refazer para
melhorar a arquitetura, velocidade, desempenho. Até empolga.

O CoGrOO é grande, e depende fortemente de uma biblioteca chamada Apache
OpenNLP, para a qual eu também contribuo. O problema não é nem reescrever o
CoGrOO, mas reescrever o Apache OpenNLP.

No Python existem alternativas ao Apache OpenNLP, por exemplo o NLTK, mas os
próprios desenvolvedores afirmam que não oferece boa performance, é mais
para uso didático. Já o OpenNLP é usado por centenas de outros projetos,
super bem testado e de alta performance.




Contudo, talvez seja o momento de unirmos trabalhos com outro projeto. O
LanguageTool faz o mesmo serviço que o CoGroo, só que para outros
idiomas,
não para o português. O Marcin, mantenedor principal do projeto, já tem
uma
linha "paralela", que de pouco em pouco, vai ter um outro LanguageTool em
Python.

Eu já estou auxiliando o Marcin com alguns patch's em python para este
novo
LanguageTool, para portar parte do trabalho feito em Galego, para o
português, já que o Galego é o idioma mais próximo do português, e que já
está suportado na versão feita em Java.

Talvez, para plugins que atendam demandas comuns a diversas culturas,
como
correção gramatical, o caminho para manutenção voluntária seja
transformá-los em multi-lingual.


Nessa eu nem vou dar opinião. Não sou programador e não tenho a menor ideia
do que isso implica, se é possível aproveitar a tecnologia do CoGroo pra
isso, ou se é preferível portar o CoGroo pra Python. Enfim, sou zero à
esquerda no assunto. =D


Quando o CoGrOO nasceu, também estava por aí o Language Tool, e trocamos
muitas figurinhas. Inclusive o CoGrOO foi o primeiro corretor gramatical
livre a ser integrado ao OO, o LT veio logo depois :)

O problema do Language Tool é justamente ser multi-lingual e bem simples, e
por isso não é bom em nenhuma língua.
Assim como o CoGrOO, o Language Tool faz processamento e análise do texto. O
processamento do LT é bem superficial, e *não* funciona para português,
assim como para a maioria das línguas.
O CoGrOO segue o modelo de análise semi-profunda, que é capaz de identificar
estruturas da língua como sintagmas, sujeito, objeto.

No LT é impossível escrever uma regra como
http://ccsl.ime.usp.br/cogroo/comunidade/rule/124 e como muitas outras do
CoGrOO.

Abraços

-- 
Unsubscribe instructions: E-mail to usuarios+help@pt-br.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/pt-br/usuarios/
All messages sent to this list will be publicly archived and cannot be deleted

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.