Eine gute Nachricht zur Analyse der plattdeutschen Wikipedia. Da gibt es ein Skript WikiExtractor.py, mit dem man aus dem Datenbankdump den Plaintext rausziehen kann. Das habe ich jetzt vorliegen. Den werde ich dann so wie ich das bei KDE gemacht habe, wortweise zerlegen und durchzählen.
[] Moin, hast Du die KDE-Wörter in der Wortliste verarbeitet? Gruß Jörn -- Liste abmelden mit E-Mail an: nds+unsubscribe@de.libreoffice.org Probleme? http://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/ Tipps zu Listenmails: http://wiki.documentfoundation.org/Netiquette/de Listenarchiv: http://listarchives.libreoffice.org/de/nds/ Alle E-Mails an diese Liste werden unlöschbar öffentlich archiviert