Hej Leif
Her er en opremsning af nogle af de ting jeg kan huske fra 2015.
Stavekontrol (Stavekontrolden):Support for genitiv med es, som var tilladt før 2001, er fjernet fra
de fleste ord.Nye ordklasser for ord der ender på -el, hvor el bliver til -le i bestemt ental.
Disse er et udspring af ny retskrivningspraksis i Retskrivningsordbogen af 2012. 697 ord tildelt de
nye ordklasser for ord der ender på -el.Ca. 380 flere ord har fået tilføjet
ordsammensætningsopmærkning.Ca. 200 verber med dobbeltkonsonant har fået en strammere
opmærkning.Over 2000 ord er blevet ændret eller tilføjet i alt.Div. test- og bygge script er
forbedret.
Version 2.3 af Stavekontrolden er frigivet som udvidelse, men er ikke i LibreOffice kodetræet endnu.
Synonymordbog:Nyest udgave af koden, udviklet af Magenta, til bygning af synonymordbogen har været
anvendt til den aktuelle udgave.Data fra DanNet er opdateret fra version 2.1 til 2.2.Der er fjernet
en del apostroffer fra ordforbindelser, hvor der indgår flere ord i reference ordet.Der er rettet
og slettet nogle fejl i vores p.t. offline synonymordbogs-websides database.
Regressionstestene er blevet forbedret.Script til at samle data og bygge synonymordbogen er lavet.
Grammatikkontrol (LanguageTool):Oversættelsen af brugergrænsefladen vedligeholdt.Websiderne
"Community Website" og "wikicheck" er oversat.Tagger har fået rettet nogle fejl, tilføjet nogle
flere tags, og en del flere ord er opmærket.Scriptlinjer der laver tags, her er 13 databasetræk og
38 reverse engineering af dic-filen.Script til regressionstest af tagger er lavet.Hunspell ordbogen
er opdateret til Stavekontrolden version 2.3.
Der har været arbejdet med XML-regler, der gør kraftig bruger af tags. Men det er ikke lykkedes at
lave nogle gode regler, hvor der enten ikke er for mange falske positiver eller at reglerne bliver
for tynde.
Orddeling:Status quo, vi bruger stadig de mønstre Frank Jensen producerede i ca. 1988, og som
Preben Randhol bearbejdede for bedre kompatibilitet i 1994.
Bag scenen har jeg udvidet mine test data en smule, lavet nogle forsøg og haft en god snak med
László Németh udvikleren af Hyphen (orddelingsmotoren der bl.a. bruges i LibreOffice) til
LibreOffice konferencen i Aarhus. Men summen er at der kun er kommet nogle idéer ned i noterne.
Med venlig hilsen
Esben Aaberg
Fra: Leif Lodahl <leiflodahl@gmail.com>
Til: "stavekontrol@da.libreoffice.org" <stavekontrol@da.libreoffice.org> wikicheck Sendt: 19:11
tirsdag den 29. december 2015
Emne: [da-stavekontrol] Status på sprogværktøjer i LibreOffice
Hej alle,
I forbindelse med årsskiftet plejer jeg at give en status på forskellige
dele af vores projekt, herunder også en status på diverse sprogværktøjer.
Vi når det ikke til nytår, men måske første februar?
Jeg vil derfor gerne have en status over, hvad vi (I) har opnået i løbet af
året 2015:
Stavekontrol
Synonymordbog
Grammatikkontrol
Orddeling
Jeg overvejer (igen) at forsøge at puste liv i grammatikkontrollen.
Konkret vil jeg skrive en artikel i nyhedsbrevet med nogle simple eksempler.
Mig bekendt er der ikke sket noget siden Henrik Bendt lavede en større
opdatering, herunder skrev en rigtig god dokumentation (
https://wiki.documentfoundation.org/DA/LanguageTool ). Jeg har kigget lidt
på det, og jeg mener at vi dels kan kopiere nogle af reglerne fra de andre
sprog, og dels kan oprette nogle simple regler, blandt andet om "forkert
brug af faste vendinger".
Fik vi nogensinde lavet en tagger, så vi kan lave sætningsanalyse og dermed
gennemføre egentlig sætningsanalyse.
/Leif
--
Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org for instruktioner om hvordan du
ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
--
Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org for instruktioner om hvordan du
ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
Context
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.