Date: prev next · Thread: first prev next last


Den 07-04-2011 00:17, Esben Aaberg skrev:
Hej Leif

(svar indlejret)
I lige måde ;-)

--- Den søn 27/3/11 skrev leif <leiflodahl@gmail.com>:

Fra: leif <leiflodahl@gmail.com>
Nu er det ca. et år siden vi sidst afholdt generalforsamling i stavekontrolden. Jeg mener ikke 
vi behøver at afholde en
generalforsamling når vi kun er fire (som sidste år).
Derimod bør vi nok alligevel komme med en form for beretning på skrift - en årsstatus.
I "Foreningen for frit tilgængelige sprogværktøjer" ;-)
Jeg vi give dig delvis ret, dog bør vi nok afholde generalforsamlingen, og så stille 
ændringsforslag til vedtægten. Her i kunne bl.a. indgå et eller andet med at generalforsamlingen 
afholdes med 8 til 25 måneders intervaller alt efter aktivitetsniveau og behov.

Jeg indkalder til bestyrelsesmøde en af de kommende dag så kan vi få snakket om hvad vi gør og 
hvad der er på beddingen.
God idè. Vi kan tage den over Skype. Det bliver efter Påske (eller i
Ringkøbing i Påsken)

Hvad har vi bedrevet i årets løb?

Stavekontrol
Her kunne jeg tænke mig nogle konkrete fakta om hvor mange ord vi har og hvor mange vi har 
behandlet i 2010. Måske også et par eksempler på de 'fejl' vi har repareret.
Det kunne måske være en udmærket ide at komme med en annoncering til medlemmer og bidragydere, 
hver gang der frigives et produkt med ændringer i af vores produkter. Lidt i den form som det 
indlæg jeg havde skrevet til nyhedsbrevet i efteråret.
Netop.
Sprogværktøjerne lever jo et stille liv, og jeg tror ikke de almindelige
brugere tænker over hvor stort et arbejde der egentlig ligger bag
resultatet.

Desuden vil jeg gerne sætte fokus på detaljerne, så vi evt. kan vække
interessen hos nogle flere nørder og få et par stykker mere med om bord.

Konkret kan jeg nævne nogle af de ting jeg har haft fokus på siden efterårsversionen:
Frekvensanalyse af DSL-korpusserne, Wikipedia og dokumenter fra UddannelsesCenter 
Ringkøbing-Skjern, dette arbejde har udløst over 7000 ord der nu er lagt ind i databasen. 
Spændende. Er det en idè at kigge på at høste ord fra Wikipedia?
Indholdet er Creative Commons og der findes et interface til maskinel
læsning af artiklerne.

Der er også mulighed for at bede flere uddannelsesinstitutioner bidrag
med ord. Tidligere har jeg hørt at det ikke er antallet af ord, der er
afgørende. Men du er måske ved at løbe tør for ord?     ;-)

En del af disse ord har man tidligere godt kunne stave til, men langt fra alle. Forventningen er 
at det på sigt vil give bedre ordforslag når man har taste/stavet forkert, specielt med den 
muligheden der er på vej i Hunspell 1.3.x der er på vej ind i de store bruger OOo, LibO og Fx, 
hvor man kan slå ordforlag fra på sammensatte ord.
Har du mulighed for at beskrive hvilke nyheder der er på vej, og evt.
også hvilke konkrete konsekvenser du forestiller dig det vil få for os?

Udbredte stavefejl der ikke blev fanges, bl.a. baseret på publikationen "114 stavefejl (som du 
for alt i verden ikke må begå)"
Har du konkret indarbejdet den i stavekontrollen?
Der er rettet 2 regler som havde med ord der ender på "er" og "r", den ene af reglerne var der 
ca. 32 ord som var påvirket, dan anden har jeg ikke nogen ide om endnu.
Ca. 109 intetkøns ord der sluttet på "er", som var høstet forkert, er rettet til. F.eks. 
amperemeter og center.
Jeg er ved at skrive en "regressiontest", som har afsløret mange fejl, selvom meningen var at den 
skulle hjælpe med at beskytte mod fremtidige fejl. Eksempelvis opmærkning af ord hvor flagene 
mangler så der kun er et "/,", substantiver der lagt ind som ubestemt, hvor de er torso, og 
torsoer der burde være fuldt bøjede.
Der er opmærket en del ord med fugeelementer hvor der er konsonantfordobling+e, når det skal være 
første led i en sammensætning.

Nærmer forklaring og statistik kommer senere, i takt med at jeg presenter værktøjet og der kommer 
en udgivelse.
Det ser jeg frem til :-)

Grammatikkontrol
LanguageTool er integreret i LibreOffice og
grammatikkontrollen bliver dermed mere synlig.
Jeg kan se at der er 22 danske regler. For noget tid siden
lavede jeg yderligere omkring 10 forslag til regler. Skal
vi ikke prøve at få gang
i det projekt igen? Vi kan evt. mødes til en omgang pizza
og snakke om hvilke muligheder vi har.

Jeg har opdaget at vi faktisk er med på community-siden,
dog er der ikke
link. Prøv http://community.languagetool.org/?lang=da . Her bliver
vores regler checket op mod teksterne på Wikipedia.
I en af udviklingsudgaverne af LibO, så jeg også at LT var med. Så i forbindelse med at jeg 
implementerede SRX 
Forklar lige hvad SRX er for en ting.

(på opfordring fra deltager i LT-projektet) til LT 1.2 rettede jeg også i xml-reglerne, så bl.a. 
den temmelig fejlbehæftede adjektiver i intetkøns regel blev deaktiveret som standard, der kom en 
ny regel egenavne->egennavne, og der blev rettet flere småfejl. Af dine forslag var det kun de 
stavefejl du havde pointeret der kom med, da jeg var under tidspres og dine xml-regler enten 
krævede tilretning eller var overflødige.
:-)

Nu efter du havde skrevet den e-mail jeg her svare på, tog jeg og gennemgik alle de e-mails fra 
dengang, og tror faktisk at jeg har fundet en regel (dog stadig utestet) som kan bruges næsten 
direkte og en anden regel som er interessant.
:-)

De regler der gik på idag, iaften osv. er ikke grammatikfejl, men stavefejl. På det tidspunkt 
hvor du skrev reglerne fangede stavekontrol dem ikke, men jeg ændrede med afset i dem 
Stavekontrolden så den tog hånd om det, så den udgave der er ude i dag, vil ikke godkende "idag", 
og foreslår "i dag". Når et ord ikke godkendes af stavekontrollen, vil den aldrig udløsen en 
grammatikfejl, da stavefejl overtrumfer grammatikfejl.
Desuden skal vi måske også tage en diskussion om, hvordan vi bedst
udnytter de tre funktioner: Stavekontrol, autokorrektur og LanguageTool.

LanguageTool tager sig både af grammatiske fejl og syntaktiske fejl. Jeg
har primært lavet forslag til de syntaktiske fejl, idet jeg ikke er
verdensmester i grammatikken (for at sige det mildt).

Vedr. community-siden så er den i forbindelse med opdateringen til LT 1.3, blevet opdateret med 
de regelændringer der var med i LT 1.2 for dansk!
Dette er sket efter din e-mails afsendelse.
Jeg har ændre ca. 15 artikler på Wikipedia efterfølgende, da fejlraten nu er mere retvisende.
Se der er jo sandelig positive sideeffekter.
Skal vi gøre da.wikipedia opmærksom på at de faktisk kan få hjælp fra os?

Vedr. pizza, så er afstanden altid et problem, men du skal ikke være det mindste i tvivle om at 
jeg gladelig gi'r en øl hvis du kommer på Ringkøbing/Søndervig egnen igen. Men vi kan da tage et 
par timer over Skype hvor vi får lavet nogle regler, og evt. sætte et mål om min. 3-5 ny regler 
pr. LT udgivelse.
Dog er det ikke helt så interessant hvordan vi for aktiveret hverken dig eller mig, da det kun 
vil betyde en omprioritering af opgaver/projekter, for med de 100+ timer jeg fik fyret af på 
Stavekontrolden i sidste måned, så tro jeg nok jeg er over det niveau jeg normalt ville kunne 
finde i min fritid. Og jeg følger så lidt min lyst og hvor jeg tro jeg gør mest gavn, og her 
begynder den ca. ½ million Fx-bruger af Stavekontrolden så også at spille ind!
Helt enig.

Det bedste markedsføringsværktøj vi har er nyhedsbrevet samt de gode
historier.

Med venlig hilsen

Esben Aaberg
Leif

-- 
Unsubscribe instructions: E-mail to stavekontrol+help@da.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/da/stavekontrol/
All messages sent to this list will be publicly archived and cannot be deleted

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.