Date: prev next · Thread: first prev next last


Hej Leif

(svar indlejret)

--- Den søn 27/3/11 skrev leif <leiflodahl@gmail.com>:

Fra: leif <leiflodahl@gmail.com>
Emne: [da-stavekontrol] Status fra stavekontrollen
Til: stavekontrol@da.libreoffice.org
Dato: søndag 27. marts 2011 16.19
Hej alle,
Nu er det ca. et år siden vi sidst afholdt
generalforsamling i stavekontrolden. Jeg 
mener ikke vi behøver at afholde en
generalforsamling når vi kun er fire (som sidste år).
Derimod bør vi nok alligevel komme med en form
for beretning på skrift - en årsstatus.

I "Foreningen for frit tilgængelige sprogværktøjer" ;-)
Jeg vi give dig delvis ret, dog bør vi nok afholde generalforsamlingen, og så stille 
ændringsforslag til vedtægten. Her i kunne bl.a. indgå et eller andet med at generalforsamlingen 
afholdes med 8 til 25 måneders intervaller alt efter aktivitetsniveau og behov.

Jeg indkalder til bestyrelsesmøde en af de kommende dag så kan vi få snakket om hvad vi gør og hvad 
der er på beddingen.

Hvad har vi bedrevet i årets løb?

Stavekontrol
Her kunne jeg tænke mig nogle konkrete fakta om hvor mange
ord vi har og
hvor mange vi har behandlet i 2010. Måske også et par
eksempler på de 'fejl' vi har repareret.

Det kunne måske være en udmærket ide at komme med en annoncering til medlemmer og bidragydere, hver 
gang der frigives et produkt med ændringer i af vores produkter. Lidt i den form som det indlæg jeg 
havde skrevet til nyhedsbrevet i efteråret.

Konkret kan jeg nævne nogle af de ting jeg har haft fokus på siden efterårsversionen:
Frekvensanalyse af DSL-korpusserne, Wikipedia og dokumenter fra UddannelsesCenter 
Ringkøbing-Skjern, dette arbejde har udløst over 7000 ord der nu er lagt ind i databasen. En del af 
disse ord har man tidligere godt kunne stave til, men langt fra alle. Forventningen er at det på 
sigt vil give bedre ordforslag når man har taste/stavet forkert, specielt med den muligheden der er 
på vej i Hunspell 1.3.x der er på vej ind i de store bruger OOo, LibO og Fx, hvor man kan slå 
ordforlag fra på sammensatte ord.
Udbredte stavefejl der ikke blev fanges, bl.a. baseret på publikationen "114 stavefejl (som du for 
alt i verden ikke må begå)"
Der er rettet 2 regler som havde med ord der ender på "er" og "r", den ene af reglerne var der ca. 
32 ord som var påvirket, dan anden har jeg ikke nogen ide om endnu.
Ca. 109 intetkøns ord der sluttet på "er", som var høstet forkert, er rettet til. F.eks. 
amperemeter og center.
Jeg er ved at skrive en "regressiontest", som har afsløret mange fejl, selvom meningen var at den 
skulle hjælpe med at beskytte mod fremtidige fejl. Eksempelvis opmærkning af ord hvor flagene 
mangler så der kun er et "/,", substantiver der lagt ind som ubestemt, hvor de er torso, og torsoer 
der burde være fuldt bøjede.
Der er opmærket en del ord med fugeelementer hvor der er konsonantfordobling+e, når det skal være 
første led i en sammensætning.

Nærmer forklaring og statistik kommer senere, i takt med at jeg presenter værktøjet og der kommer 
en udgivelse.


Grammatikkontrol
LanguageTool er integreret i LibreOffice og
grammatikkontrollen bliver dermed mere synlig.
Jeg kan se at der er 22 danske regler. For noget tid siden
lavede jeg yderligere omkring 10 forslag til regler. Skal
vi ikke prøve at få gang
i det projekt igen? Vi kan evt. mødes til en omgang pizza
og snakke om hvilke muligheder vi har.

Jeg har opdaget at vi faktisk er med på community-siden,
dog er der ikke
link. Prøv http://community.languagetool.org/?lang=da . Her bliver
vores regler checket op mod teksterne på Wikipedia.

I en af udviklingsudgaverne af LibO, så jeg også at LT var med. Så i forbindelse med at jeg 
implementerede SRX (på opfordring fra deltager i LT-projektet) til LT 1.2 rettede jeg også i 
xml-reglerne, så bl.a. den temmelig fejlbehæftede adjektiver i intetkøns regel blev deaktiveret som 
standard, der kom en ny regel egenavne->egennavne, og der blev rettet flere småfejl. Af dine 
forslag var det kun de stavefejl du havde pointeret der kom med, da jeg var under tidspres og dine 
xml-regler enten krævede tilretning eller var overflødige.
Nu efter du havde skrevet den e-mail jeg her svare på, tog jeg og gennemgik alle de e-mails fra 
dengang, og tror faktisk at jeg har fundet en regel (dog stadig utestet) som kan bruges næsten 
direkte og en anden regel som er interessant.
De regler der gik på idag, iaften osv. er ikke grammatikfejl, men stavefejl. På det tidspunkt hvor 
du skrev reglerne fangede stavekontrol dem ikke, men jeg ændrede med afset i dem Stavekontrolden så 
den tog hånd om det, så den udgave der er ude i dag, vil ikke godkende "idag", og foreslår "i dag". 
Når et ord ikke godkendes af stavekontrollen, vil den aldrig udløsen en grammatikfejl, da stavefejl 
overtrumfer grammatikfejl.

Vedr. community-siden så er den i forbindelse med opdateringen til LT 1.3, blevet opdateret med de 
regelændringer der var med i LT 1.2 for dansk!
Dette er sket efter din e-mails afsendelse.
Jeg har ændre ca. 15 artikler på Wikipedia efterfølgende, da fejlraten nu er mere retvisende.

Vedr. pizza, så er afstanden altid et problem, men du skal ikke være det mindste i tvivle om at jeg 
gladelig gi'r en øl hvis du kommer på Ringkøbing/Søndervig egnen igen. Men vi kan da tage et par 
timer over Skype hvor vi får lavet nogle regler, og evt. sætte et mål om min. 3-5 ny regler pr. LT 
udgivelse.
Dog er det ikke helt så interessant hvordan vi for aktiveret hverken dig eller mig, da det kun vil 
betyde en omprioritering af opgaver/projekter, for med de 100+ timer jeg fik fyret af på 
Stavekontrolden i sidste måned, så tro jeg nok jeg er over det niveau jeg normalt ville kunne finde 
i min fritid. Og jeg følger så lidt min lyst og hvor jeg tro jeg gør mest gavn, og her begynder den 
ca. ½ million Fx-bruger af Stavekontrolden så også at spille ind!


Med venlig hilsen

Esben Aaberg




-- 
Unsubscribe instructions: E-mail to stavekontrol+help@da.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/da/stavekontrol/
All messages sent to this list will be publicly archived and cannot be deleted

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.