Den 07-04-2011 00:17, Esben Aaberg skrev:
Hej Leif
(svar indlejret)
I lige måde ;-)
--- Den søn 27/3/11 skrev leif <leiflodahl@gmail.com>:
Fra: leif <leiflodahl@gmail.com>
Nu er det ca. et år siden vi sidst afholdt generalforsamling i stavekontrolden. Jeg mener ikke
vi behøver at afholde en
generalforsamling når vi kun er fire (som sidste år).
Derimod bør vi nok alligevel komme med en form for beretning på skrift - en årsstatus.
I "Foreningen for frit tilgængelige sprogværktøjer" ;-)
Jeg vi give dig delvis ret, dog bør vi nok afholde generalforsamlingen, og så stille
ændringsforslag til vedtægten. Her i kunne bl.a. indgå et eller andet med at generalforsamlingen
afholdes med 8 til 25 måneders intervaller alt efter aktivitetsniveau og behov.
Jeg indkalder til bestyrelsesmøde en af de kommende dag så kan vi få snakket om hvad vi gør og
hvad der er på beddingen.
God idè. Vi kan tage den over Skype. Det bliver efter Påske (eller i
Ringkøbing i Påsken)
Hvad har vi bedrevet i årets løb?
Stavekontrol
Her kunne jeg tænke mig nogle konkrete fakta om hvor mange ord vi har og hvor mange vi har
behandlet i 2010. Måske også et par eksempler på de 'fejl' vi har repareret.
Det kunne måske være en udmærket ide at komme med en annoncering til medlemmer og bidragydere,
hver gang der frigives et produkt med ændringer i af vores produkter. Lidt i den form som det
indlæg jeg havde skrevet til nyhedsbrevet i efteråret.
Netop.
Sprogværktøjerne lever jo et stille liv, og jeg tror ikke de almindelige
brugere tænker over hvor stort et arbejde der egentlig ligger bag
resultatet.
Desuden vil jeg gerne sætte fokus på detaljerne, så vi evt. kan vække
interessen hos nogle flere nørder og få et par stykker mere med om bord.
Konkret kan jeg nævne nogle af de ting jeg har haft fokus på siden efterårsversionen:
Frekvensanalyse af DSL-korpusserne, Wikipedia og dokumenter fra UddannelsesCenter
Ringkøbing-Skjern, dette arbejde har udløst over 7000 ord der nu er lagt ind i databasen.
Spændende. Er det en idè at kigge på at høste ord fra Wikipedia?
Indholdet er Creative Commons og der findes et interface til maskinel
læsning af artiklerne.
Der er også mulighed for at bede flere uddannelsesinstitutioner bidrag
med ord. Tidligere har jeg hørt at det ikke er antallet af ord, der er
afgørende. Men du er måske ved at løbe tør for ord? ;-)
En del af disse ord har man tidligere godt kunne stave til, men langt fra alle. Forventningen er
at det på sigt vil give bedre ordforslag når man har taste/stavet forkert, specielt med den
muligheden der er på vej i Hunspell 1.3.x der er på vej ind i de store bruger OOo, LibO og Fx,
hvor man kan slå ordforlag fra på sammensatte ord.
Har du mulighed for at beskrive hvilke nyheder der er på vej, og evt.
også hvilke konkrete konsekvenser du forestiller dig det vil få for os?
Udbredte stavefejl der ikke blev fanges, bl.a. baseret på publikationen "114 stavefejl (som du
for alt i verden ikke må begå)"
Har du konkret indarbejdet den i stavekontrollen?
Der er rettet 2 regler som havde med ord der ender på "er" og "r", den ene af reglerne var der
ca. 32 ord som var påvirket, dan anden har jeg ikke nogen ide om endnu.
Ca. 109 intetkøns ord der sluttet på "er", som var høstet forkert, er rettet til. F.eks.
amperemeter og center.
Jeg er ved at skrive en "regressiontest", som har afsløret mange fejl, selvom meningen var at den
skulle hjælpe med at beskytte mod fremtidige fejl. Eksempelvis opmærkning af ord hvor flagene
mangler så der kun er et "/,", substantiver der lagt ind som ubestemt, hvor de er torso, og
torsoer der burde være fuldt bøjede.
Der er opmærket en del ord med fugeelementer hvor der er konsonantfordobling+e, når det skal være
første led i en sammensætning.
Nærmer forklaring og statistik kommer senere, i takt med at jeg presenter værktøjet og der kommer
en udgivelse.
Det ser jeg frem til :-)
Grammatikkontrol
LanguageTool er integreret i LibreOffice og
grammatikkontrollen bliver dermed mere synlig.
Jeg kan se at der er 22 danske regler. For noget tid siden
lavede jeg yderligere omkring 10 forslag til regler. Skal
vi ikke prøve at få gang
i det projekt igen? Vi kan evt. mødes til en omgang pizza
og snakke om hvilke muligheder vi har.
Jeg har opdaget at vi faktisk er med på community-siden,
dog er der ikke
link. Prøv http://community.languagetool.org/?lang=da . Her bliver
vores regler checket op mod teksterne på Wikipedia.
I en af udviklingsudgaverne af LibO, så jeg også at LT var med. Så i forbindelse med at jeg
implementerede SRX
Forklar lige hvad SRX er for en ting.
(på opfordring fra deltager i LT-projektet) til LT 1.2 rettede jeg også i xml-reglerne, så bl.a.
den temmelig fejlbehæftede adjektiver i intetkøns regel blev deaktiveret som standard, der kom en
ny regel egenavne->egennavne, og der blev rettet flere småfejl. Af dine forslag var det kun de
stavefejl du havde pointeret der kom med, da jeg var under tidspres og dine xml-regler enten
krævede tilretning eller var overflødige.
:-)
Nu efter du havde skrevet den e-mail jeg her svare på, tog jeg og gennemgik alle de e-mails fra
dengang, og tror faktisk at jeg har fundet en regel (dog stadig utestet) som kan bruges næsten
direkte og en anden regel som er interessant.
:-)
De regler der gik på idag, iaften osv. er ikke grammatikfejl, men stavefejl. På det tidspunkt
hvor du skrev reglerne fangede stavekontrol dem ikke, men jeg ændrede med afset i dem
Stavekontrolden så den tog hånd om det, så den udgave der er ude i dag, vil ikke godkende "idag",
og foreslår "i dag". Når et ord ikke godkendes af stavekontrollen, vil den aldrig udløsen en
grammatikfejl, da stavefejl overtrumfer grammatikfejl.
Desuden skal vi måske også tage en diskussion om, hvordan vi bedst
udnytter de tre funktioner: Stavekontrol, autokorrektur og LanguageTool.
LanguageTool tager sig både af grammatiske fejl og syntaktiske fejl. Jeg
har primært lavet forslag til de syntaktiske fejl, idet jeg ikke er
verdensmester i grammatikken (for at sige det mildt).
Vedr. community-siden så er den i forbindelse med opdateringen til LT 1.3, blevet opdateret med
de regelændringer der var med i LT 1.2 for dansk!
Dette er sket efter din e-mails afsendelse.
Jeg har ændre ca. 15 artikler på Wikipedia efterfølgende, da fejlraten nu er mere retvisende.
Se der er jo sandelig positive sideeffekter.
Skal vi gøre da.wikipedia opmærksom på at de faktisk kan få hjælp fra os?
Vedr. pizza, så er afstanden altid et problem, men du skal ikke være det mindste i tvivle om at
jeg gladelig gi'r en øl hvis du kommer på Ringkøbing/Søndervig egnen igen. Men vi kan da tage et
par timer over Skype hvor vi får lavet nogle regler, og evt. sætte et mål om min. 3-5 ny regler
pr. LT udgivelse.
Dog er det ikke helt så interessant hvordan vi for aktiveret hverken dig eller mig, da det kun
vil betyde en omprioritering af opgaver/projekter, for med de 100+ timer jeg fik fyret af på
Stavekontrolden i sidste måned, så tro jeg nok jeg er over det niveau jeg normalt ville kunne
finde i min fritid. Og jeg følger så lidt min lyst og hvor jeg tro jeg gør mest gavn, og her
begynder den ca. ½ million Fx-bruger af Stavekontrolden så også at spille ind!
Helt enig.
Det bedste markedsføringsværktøj vi har er nyhedsbrevet samt de gode
historier.
Med venlig hilsen
Esben Aaberg
Leif
--
Unsubscribe instructions: E-mail to stavekontrol+help@da.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/da/stavekontrol/
All messages sent to this list will be publicly archived and cannot be deleted
Context
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.