Date: prev next · Thread: first prev next last


Hej Jeppe,
Finn Gruwier Larsen lavede for mange år siden nogle makroer til at udtrække
ord fra tekstdokumenter. Udvidelsen er her:
http://extensions.openoffice.org/en/project/linguist

Jeg kan se at der er nogle kommentarer af teknisk karakter, og det er mange
år siden jeg selv har brugt den. Så uden garanti eller noget fra min side.
Men måske kan det være til inspiration.

Som jeg husker det, laver den en unik liste over stavefejl i form at et nyt
regneark.


/Leif

Den 15. juni 2016 kl. 15.37 skrev Jeppe Bundsgaard <jeppe@bundsgaard.net>:

Hej alle
Jeg har kopieret wikipedias liste over typiske fejl i wikipedia og sat
den ind i et dokument. Som det fremgår ser vores stavekontrold langt de
fleste fejl, og har ikke mange falske positive/negative.
Mon nogen ville kunne køre et script som trak fejlord ud og rigtige ord
ligeså. Så ville vi have en god liste at sammenligne msword med lo
writer.
Jeg har lagt dokumentet her: https://sky.bundsgaard.net/index.php/s/oD5
uhliyp7b4T2f
vh
Jeppe
tor, 09 06 2016 kl. 00:21 +0000, skrev Esben Aaberg:
Hej Leif
Jeg har hurtigt kigget lidt gamle mails igennem, uden at finde noget
reelt!
Finn lavede nogle tests i 2007, hvor han sammenlignede med DSDO. Han
kommer med en beskrivelse af testens rammer og referer til nogle
dokumenter med makroer m.m. på hans hjemmeside. Hjemmesiden findes
dog ikke mere og er ikke at finde på web.archive.org. Tror også at du
Leif lavede en enkelt test. Men gældende for begges tests er jeg kun
her set resultater og ingen testdata.

MS Office XP er den nyeste udgave jeg har liggende, så den ville ikke
give et retvisende billede. For øvrigt er det OpenOffice.org 2.0 der
er installeret på samme maskine!
Udfordringen med sådanne test er også at gøre dem neutrale. Her er
f.eks. en sætning som stavekontrollen i Word XP ikke er så glad for:
 "Hivsmittettransperson gav eneundervisning i kokkerering af
pekingand medostekiks som topping."Ja, Stavekontrolden 2.3 har da
også 3 ikke genkendte ord, men når Stavekontrolden 2.4 udgives vil
alle ordene være genkendt, da testordene er fundet blandt de ord jeg
har behandlet i år.
Jeg har ca. 1 MB testdata liggende, som jeg bruger til at tracke fejl
og teste hver ny udgivelse med. Men da denne data specifik indeholder
kendte fejl og 100 % rigtige ordklasser fra Stavekontrolden, er disse
data ikke neutrale.
Dengang Finn testede fandt han en tilfældig tekst på ca. 200 ord, men
i dag vil det nok være for lidt, og derved bliver det hurtig en
større omgang. Hvis testen skal automationers har MS Office da en API
der giver mulighed for at teste brugeroplevelsen omkring
stavekontrolleringen?
Med venlig hilsen
Esben Aaberg

      Fra: Leif Lodahl <leiflodahl@gmail.com>
 Til: "stavekontrol@da.libreoffice.org"
org>
 Sendt: 19:59 onsdag den 8. juni 2016
 Emne: [da-stavekontrol] Sammenligne ordboger og stavekontrol

Hej alle her på listen,
Der har været en diskussion på Facebook, hvor en person nævner at
ordbogen
i LibreOffice ikke er helt så god som i Word_

Som artiklen nævner, så har MS Office den bedste stavekontrol...
Hvordan

ser det ud med at forbedre den der er i LibreOffice?

Hvis stavekontrollen bliver bedre, og det bliver lettere at starte
flotte
dokumenter op, så er jeg temmelig sikker på at langt flere ville
rykke
over.

Vi lavede for mange år siden en sammenligning, hvor vi opgjorde dels
evnen
til at finde fejl, men også antallet af falske positive.

 Der er løbet meget vand i åen siden da, og det på begge sider. Måske
er
det på tide at lave en ny sammenligning.

Har vi et korpus (testmateriale) fra den tidligere analyse, eller kan
vi
skabe et nyt?

Hvor stor vil opgaven være?


/Leif

--
Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org for
instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netique
tte
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/d
a/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke
efterfølgende slettes



--
Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org for
instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på
http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke
efterfølgende slettes


-- 
Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org for instruktioner om hvordan du 
ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.