Date: prev next · Thread: first prev next last


man, 20 04 2020 kl. 19:58 +0200, skrev Leif Lodahl:
Mht. languagetools.org forsøgte jeg for efterhånden en del år siden
atsætte gang i den. Det lykkedes desværre ikke, for der var absolut
ingeninteresse for det. Måske er tiden moden nu, men vi skal nok
prioritere atfå stavekontrol op på klingen igen. Der ligger rigtig
mange detaljer ilanguagetools, blandt andet både syntaktisk kontrol
og grammatisk kontrol.


Jeg har søgt lidt rundt i forhold til hvad der skal til for at komme
videre med langugetools og grammatiktjek...

En central ting er at have et ordkorpus der er opmærket ifht. Part-of-
speech - dvs. morfologisk. 
https://en.wikipedia.org/wiki/Parts_of_speech og 
https://en.wikipedia.org/wiki/Part-of-speech_tagging

Jeg ved ikke hvor vores morfologiske klasser stammer fra. Måske fra det
oprindelige ordliste fra dansk sprognævn. Men her er et helt udfoldet
bud på hvordan de skal være på dansk: 
https://cst.dk/online/pos_tagger/rapport/bilag/tagset.html

Måske skulle vi omnavngive vores morfologiske kategorier derefter - og
få opmærket vores affix-regler korrekt... Det ville ikke være
uoverkommeligt.

Dernæst ville udfordringen være at anvende vores ordliste til at skabe
en tre-kolonne ordliste med ord-stamme-POS som beskrevet her: 
http://wiki.languagetool.org/developing-a-tagger-dictionary#toc3

Jeg kan ikke helt gennemskue hvordan man på overkommelig vis kommer fra
vores grundord til alle deres bøjningsformer. Jeg mindes ikke at have
set hunspell kunne gøre det. Men med noget programmering ville man jo
kunne...

Så kan man i den grad gå i gang med at lave grammatikregler ☺
Jeppe


De bedste hilsner
Leif
Den man. 20. apr. 2020 kl. 11.06 skrev Jeppe Bundsgaard <
jeppe@bundsgaard.net>:
Kære stavekontroldpostlistemodtagere(og også modtagere af
libreofficepostlisten - håber det er okay, ogbeklager krydspost -
videre samtale helst på stavekontroldenspostliste)
Det er et par år siden der  sidst har været aktivitet på
dennepostliste. Men til gengæld har Lars Jødal ikke ligget stille
i forholdtil at tilføje, opmærke og opdatere ord. Det er blevet
til mangetusind!
Foranlediget af hans ønske om også at forbedre nogle af
affixreglerne,besluttede jeg at gøre alvor af en længe
påtrængende plan om atopdatere stavekontrolden.dk. Jeg har derfor
programmeret et nyt systemhelt fra bunden, så det nu fremstår
mere nutidigt både i form ogindhold. Det betyder at Lars og jeg
nu har kunnet kvalificere nogle afde dele af affixfilen der ikke
fungerede som de skulle.Stavekontroldens ordbog er derfor nu
endnu bedre end før. Hent denseneste version på
stavekontrolden.dk.Hvis andre sprog vil bruge systemet, vil det
også være ligetil nu.
Hvis nogen har mod på at bidrage, fx ved at sende os dokumenter
hvorider er ord, der ikke genkendes af Stavekontrolden, eller ved
atbehandle de mange ord som nu har fået et første eller to besøg
af Larsog andre, så skal I være mere end velkomne. Gå ind
påstavekontrolden.dk og opret en bruger. Nu kan I uploade ord.
Hvis Iønsker at blive ordbehandlere, så skriv en mail til mig, så
opgradererjeg jeres bruger til også at kunne det.  Hvis I oplever
fejl ellermangler eller har gode ideer, så sig endelig til.
Næste skridt er at få opdateret ordbogen i LibreOffice og andre
steder.Det er meget længe siden jeg har hørt fra Esben som er
maintainer påLibreOffices extension. Jeg håber han har det godt
og blot er optagetaf andre ting. Jeg vil gerne overtage
vedligeholdelsesopgaven, men jegskal finde ud af hvordan jeg
teknisk får adgang. Hvis der er andre dervil tage opgaven med at
stå for at holde de forskellige repositorierup-to-date, så siger
jeg gerne ja tak.
Og næste skridt kunne også være at tage et seriøst næste skridt
iretning af at få en grammatiktjekker til at fungere. Esben har
megetgjort et stort arbejde i den retning, men der er stadig
meget langt førdet virkelig fungerer. Arbejdet foregår her:
https://www.languagetool.org/, se
https://www.languagetool.org/languages. Vi er så vidt jeg kan se,
godthjulpet fordi vi allerede i ordbogen har oplysninger om ords
ordklasse.Jeg er dog ikke helt klar over hvordan languagetool får
denoplysning... nogen der kan gennemskue det? Jeg tror det kan
give meningat udvikle en udvidelse af stavekontrolden.dk
(hjemmesiden) så vi derkan revidere grammatik-reglerne i direkte
tilknytning til voresordliste. Jeg vil gerne gøre en indsats for
at finde ud af mere. Hvisnogen vil deltage - eller hvis I kender
studerende eller forskere ellerbare grammatikinteresserede som
har lyst til at lave en opgave/specialeeller bidrage til dansk
sprogudvikling (intet mindre ☺), så sig til!
Mange hilsnerJeppe--Jeppe BundsgaardTel.: +45 31192607Web:
jeppe.bundsgaard.net
--Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org
forinstruktioner om hvordan du ophæver dit abonnementProblemer? 
https://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: 
https://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på
https://listarchives.libreoffice.org/da/stavekontrol/
Privacy Policy: https://www.documentfoundation.org/privacy


-- 
Send en e-mail til stavekontrol+unsubscribe@da.libreoffice.org for instruktioner om hvordan du 
ophæver dit abonnement
Problemer? https://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: https://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på https://listarchives.libreoffice.org/da/stavekontrol/
Privacy Policy: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.