Date: prev next · Thread: first prev next last
2019 Archives by date, by thread · List index


Hallo Jörg,

Am 16.10.2019 um 17:05 schrieb Jörg Schmidt:
Hallo,

die Frage steht eigentlich bereits im Betreff. Ein Kunde von mir meint das die Rechtschreibprüfung 
in LO 6.3.1 auffallend besser sein soll als in anderen LO-Versionen.

Gab es da relevante Änderungen?

(Evtl. auch in 'zeitnahen' vorherigen Versionen?)

_Meine_ Annahme ist aber zunächst nur, das sich vielleicht die mitgeliefertern Wörterbücher 
verändert haben, und das vielleicht zufällig um Begriffe die mein Kunde bevorzugt benutzt.



*Rückblick und Ausblick*

Die Hunspell-Technologie gibt es seit rund zehn Jahren. Die letzten Extensions für die deutsche Rechtschreibung (DE, AT, CH) habe ich am 12.01.2017 veröffentlicht:

https://extensions.libreoffice.org/extensions/german-de-de-frami-dictionaries
https://extensions.libreoffice.org/extensions/german-de-at-frami-dictionaries
https://extensions.libreoffice.org/extensions/german-de-ch-frami-dictionaries

Zuvor gab es zumeist ein Update pro Jahr. Der Umfang der aufgenommenen Wörter ist im Laufe der Jahre beträchtlich angewachsen auf zwischenzeitlich fast 260 000 Wörter. Damit dürfte es zurzeit das größte Wörterbuch für Rechtschreibung im Open-Source-Bereich sein. Aber angesichts des riesigen Wortschatzes der deutschen Sprache kommt einer solchen Aussage nur relative Bedeutung zu.

Dabei spielt es keine Rolle, ob jemand die o.g. "originalen" Extensions verwendet oder die "vorinstallierten" Extensions. Der einzige Unterschied ist, dass die vorinstallierten Extensions DE, AT und CH zu einer einzigen Extension vereinigt sind. Wenn ein Wörterbuch-Update erscheint, wird es immer auch zeitnah in die neue LO- bzw. AOO-Version übernommen.

Eine Schwachstelle kommt bisher der automatischen Silbentrennung zu. Im Gegensatz zur Rechtschreibung arbeitet diese mit Patterns auf einstufiger algorithmischer Basis. Das funktioniert im Englischen und Französischen gut - aber nicht mit hochkomplexen Sprachen, wie bspw. Deutsch mit seiner Unzahl an Präfixen, Suffixen, Fremdwörtern und kreativen Zusammensetzungen. Deshalb arbeite ich seit fast vier Jahren an einer "Generalrevision" der alten Silbentrennung.

Die künftige Version arbeitet mit einer hybriden Technik: Es gibt eine Liste mit Grundwörtern, aber auch mit möglichen Zusammensetzungen mit ihren unterschiedlichen Nahtstellen. In der ersten Stufe werden Zusammensetzungen in ihre Bestandteile zerlegt, in der zweiten Stufe werden jeweils alle Einzelbestandteile getrennt - beide Stufen arbeiten jeweils auf algorithmischer Basis.

Ein Extension-Update ist m.E. erst dann sinnvoll, wenn auch die neue automatische Silbentrennung fertig ist. Und das wird noch etwas dauern.

Viele Grüße
Karl

--
Liste abmelden mit E-Mail an: discuss+unsubscribe@de.libreoffice.org
Probleme? https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/discuss/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.