Beste LO'ers,
Ik heb een woordenboekbestand voor mijn neus gekregen, dat van elk lemma
in een paar talen het artikel (zeg maar, de beschrijving die bij het
lemma hoort) weergeeft.
Elk lemma begin met een getal (het volgnummer), gevolgd door ófwel een
spatie, ofwel een N, een E of F, voor respectievelijk Latijn,
Nederlands, Engels en Fries. Dat document wil mijn kennis graag
gesplitst hebben in die vier talen, zodat voor elke taal er een separaat
document ontstaat, met de lemmata weer op volgnummer.
Met reguliere expressies lukt het me prima om de scheiding te maken,
door te zoeken op (voorbeeld in het geval van Engels): ^[0-9]{1,4}.*$
Voor wie niet zo thuis is in reguliere expressies: wat hier staat is
"zoek een getal ([0-9] in de zoekstring) van minstens 1, en hoogstens
vier cijfers, ({ 1,4} in de zoekstring), dat aan het begin van een
alinea staat (^), gevolgd door een hoofdletter E (we zoeken hier op
Engels), en daarna een willekeurig aantal van elke willekeurig teken
(een punt staat voor elk willekeurig teken, de asterisk voor "mag
onbeperkt vaak voorkomen"), tot aan het eind van de alinea (weergegeven
met het $-teken)
Elk artikel is in principe één alinea, dus dat werkt dan goed.
Als voorbeeld het eerste lemma:
2 _A
<http://gtb.inl.nl/iWDB/search?actie=article&wdb=WFT&id=0&lemma=a&domein=0&conc=true>_,
cg. literarum prima. /Di slugen binne ind bliuwe by di A/, inertes non
proficiunt. /Hy ken nin A foár 'n Bie/, homo est stipes. A.v. /He does
not know great A from a bulls foot/, idem. - /It lexom fen Amor kenne di
domste fammen fen A ta Zeddet/, amoris secreta stupidissimæ norunt virgines.
2F _A
<http://gtb.inl.nl/iWDB/search?actie=article&wdb=WFT&id=0&lemma=a&domein=0&conc=true>_,
cg. <l>de earste letter [fan it alfabet]</l>. /Di slugen binne ind
bliuwe by di A/, <l>loaie lju komme net fierder</l>. /Hy ken nin A foár
'n Bie/, <l>hy is ûnnoazel</l>. A. v. He does not know great A from a
bulls foot, idem. - /It lexom fen Amor kenne di domste fammen fen A ta
Zeddet/, <l>sels de stomste jonge froulju kinne de geheimen fan de
leafde</l>.
2E _A
<http://gtb.inl.nl/iWDB/search?actie=article&wdb=WFT&id=0&lemma=a&domein=0&conc=true>_,
cg. <l>the first letter [of the alphabet]</l>. /Di slugen binne ind
bliuwe by di A/, <l>lazy people don’t make progress</l>. /Hy ken nin A
foár 'n Bie/, <l>he is a silly man</l>. A.v. He does not know great A
from a bulls foot, idem. - /It lexom fen Amor kenne di domste fammen fen
A ta Zeddet/, <l>even the most stupid of young ladies know the secrets
of love</l>.
Maar soms gaat het mis, en één van die gevallen is wanneer binnen een
lemma een harde return gegeven is, gevolgd door een "inspringing eerste
regel" (het bovenste driehoekje in de toplineaal is verschoven). Nu is
mijn vraag, is er een mogelijkheid om op die code "inspringing eerste
regel" te zoeken?
Waarschijnlijk niet, maar wie weet heeft iemand hier een ingeving...
Alvast bedankt voor het meedenken!
met vriendelijke groet, Jogchum Reitsma
--
Unsubscribe instructions: E-mail to users+unsubscribe@nl.libreoffice.org
Posting guidelines + more: https://wiki.documentfoundation.org/Netiquette
List archive: https://listarchives.libreoffice.org/nl/users/
Privacy Policy: https://www.documentfoundation.org/privacy
Context
- [nl-users] Zoeken op "inspringen eerste regel" in Writer · Jogchum Reitsma
Privacy Policy |
Impressum (Legal Info) |
Copyright information: Unless otherwise specified, all text and images
on this website are licensed under the
Creative Commons Attribution-Share Alike 3.0 License.
This does not include the source code of LibreOffice, which is
licensed under the Mozilla Public License (
MPLv2).
"LibreOffice" and "The Document Foundation" are
registered trademarks of their corresponding registered owners or are
in actual use as trademarks in one or more countries. Their respective
logos and icons are also subject to international copyright laws. Use
thereof is explained in our
trademark policy.