Date: prev next · Thread: first prev next last
2019 Archives by date, by thread · List index


Beste LO'ers,

Ik heb een woordenboekbestand voor mijn neus gekregen, dat van elk lemma in een paar talen het artikel (zeg maar, de beschrijving die bij het lemma hoort) weergeeft.

Elk lemma begin met een getal (het volgnummer), gevolgd door ófwel een spatie, ofwel een N, een E of F, voor respectievelijk Latijn, Nederlands, Engels en Fries. Dat document wil mijn kennis graag gesplitst hebben in die vier talen, zodat voor elke taal er een separaat document ontstaat, met de lemmata weer op volgnummer.

Met reguliere expressies lukt het me prima om de scheiding te maken, door te zoeken op (voorbeeld in het geval van Engels): ^[0-9]{1,4}.*$

Voor wie niet zo thuis is in reguliere expressies: wat hier staat is "zoek een getal ([0-9] in de zoekstring) van minstens 1, en hoogstens vier cijfers, ({ 1,4} in de zoekstring), dat aan het begin van een alinea staat (^), gevolgd door een hoofdletter E (we zoeken hier op Engels), en daarna een willekeurig aantal van elke willekeurig teken (een punt staat voor elk willekeurig teken, de asterisk voor "mag onbeperkt vaak voorkomen"), tot aan het eind van de alinea (weergegeven met het $-teken)

Elk artikel is in principe één alinea, dus dat werkt dan goed.

Als voorbeeld het eerste lemma:

2 _A <http://gtb.inl.nl/iWDB/search?actie=article&wdb=WFT&id=0&lemma=a&domein=0&conc=true>_, cg. literarum prima. /Di slugen binne ind bliuwe by di A/, inertes non proficiunt. /Hy ken nin A foár 'n Bie/, homo est stipes. A.v. /He does not know great A from a bulls foot/, idem. - /It lexom fen Amor kenne di domste fammen fen A ta Zeddet/, amoris secreta stupidissimæ norunt virgines.

2F _A <http://gtb.inl.nl/iWDB/search?actie=article&wdb=WFT&id=0&lemma=a&domein=0&conc=true>_, cg. <l>de earste letter [fan it alfabet]</l>. /Di slugen binne ind bliuwe by di A/, <l>loaie lju komme net fierder</l>. /Hy ken nin A foár 'n Bie/, <l>hy is ûnnoazel</l>. A. v. He does not know great A from a bulls foot, idem. - /It lexom fen Amor kenne di domste fammen fen A ta Zeddet/, <l>sels de stomste jonge froulju kinne de geheimen fan de leafde</l>.

2E _A <http://gtb.inl.nl/iWDB/search?actie=article&wdb=WFT&id=0&lemma=a&domein=0&conc=true>_, cg. <l>the first letter [of the alphabet]</l>. /Di slugen binne ind bliuwe by di A/, <l>lazy people don’t make progress</l>. /Hy ken nin A foár 'n Bie/, <l>he is a silly man</l>. A.v. He does not know great A from a bulls foot, idem. - /It lexom fen Amor kenne di domste fammen fen A ta Zeddet/, <l>even the most stupid of young ladies know the secrets of love</l>.


Maar soms gaat het mis, en één van die gevallen is wanneer binnen een lemma een harde return gegeven is, gevolgd door een "inspringing eerste regel" (het bovenste driehoekje in de toplineaal is verschoven). Nu is mijn vraag, is er een mogelijkheid om op die code "inspringing eerste regel" te zoeken?

Waarschijnlijk niet, maar wie weet heeft iemand hier een ingeving...

Alvast bedankt voor het meedenken!

met vriendelijke groet, Jogchum Reitsma



--
Unsubscribe instructions: E-mail to users+unsubscribe@nl.libreoffice.org
Posting guidelines + more: https://wiki.documentfoundation.org/Netiquette
List archive: https://listarchives.libreoffice.org/nl/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.