Vorbemerkung: Für die Registererstellung mit TUSTEP werden drei Module benötigt:
#RVORBEREITE
(mit Parametern): zum Zerlegen des Eingabetextes oder zur Auswahl von Registereinträgen; zur Angabe der Sortierung oder von Sortieralphabeten (etwa bei Sprachen mit nichtlateinischen Buchstaben); u.a.#SORTIERE
(ohne Parameter): zum Sortieren der Registereinträge#RAUFBEREITE
(mit Parametern): zum Zusammenfassen und Aufbereiten der Registereinträge und Referenzen für die Ausgabe in gedruckter oder digitaler Form.
Der modulare Aufbau von TUSTEP erlaubt dem Benutzer maßgeschneiderte Lösungen und eine sonst nicht erreichbare Flexibilität.
►► Lösungen zu Detailfragen und -Problemen im Zusammenhang mit Registererstellung finden Sie hier.
Zurück zum Inhaltsverzeichnis - Lösungen und Tipps
- schneider-lastin
Musterdatei:
lukrez.tf [80 KB]
#= 1. Zerteilen des Textes in Registereinträge #rv,lukrez.tf,-std-,-,+,* par {} Trennzeichenfolgen zwischen Registereinträgen tr | |,|;|.|:|!|\?| Länge des Sortierschlüssels ssl 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,1+20,+ #= 3. Zusammenfassen gleicher Registereinträge #da,index,fr=- #ra,-std-,index,-,+,*,prot=- ssl 20 *eof
- schneider-lastin
Musterdatei:
kafka.tf [88 KB]
#= 1. Zerteilen des Textes in Registereinträge #rv,kafka.tf,-std-,+,+,* par {} Trennzeichenfolgen zwischen Registereinträgen tr | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;| tr |<{0}/h1>|<{0}/p>| Ersetzen von Zeichenfolgen im Sortierschlüssel xs1 |ä|a|ö|o|ü|u|ß|ss| xs2 |ä|z|ö|z|ü|z|ß|z| Länge der Sortierschlüssel ssl 20 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+40,+ #= 3. Zusammenfassen gleicher Registereinträge #da,index,fr=- #ra,-std-,index,+,+,*,prot=- ssl 20 20 Referenzlänge (6 für Seitennummer, 3 für Zeilennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| *eof
- schneider-lastin
KWIC = Key Word In Context (Roh-Konkordanz)
Musterdatei:
lukrez.tf [80 KB]
#= 1. Zerteilen des Textes in Schlüsselwörter #rv,lukrez.tf,-std-,k,+,*,-std- par {} Trennzeichenfolgen zwischen Schlüsselwörtern swt | |,|;|.|:|!|\?|"| -|- |(|)| Länge der Sortierschlüssel ssl 20 0 0 40 0 0 *eof #= 2. Sortieren der Schlüsselwörter #so,-std-,-std-,17+60,+,17+60 #= 3. Erstellen des KWIC #ra,-std-,-,k,+,*,-std-,-std- Druckertyp drt win-10 ssl 0 Referenzlänge (6 für Satznummer, 3 für Zeilennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| Ergänzung vor und nach dem Schlüsselwort vsw | | nsw | | *eof #= 4. Ausgabe direkt auf Drucker (auf Bildschirm: ^#dr,,win-10,+) #dr,,win-10
► Ausgabe auf den Bildschirm auf MAC: #dr,,mac-10,+
- schneider-lastin
KWIC = Key Word In Context (Roh-Konkordanz)
Musterdatei:
kafka.tf [88 KB]
#= 1. Zerteilen des Textes in Registereinträge #rv,kafka.tf,-std-,k,+,*,-std- par {} Abschnittsanfang festlegen aa |<h1>|<p>| Trennzeichenfolgen zwischen Schlüsselwörtern swt |<{0}/h1>|<{0}/p>| swt | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;| Austauschen in den Sortierschlüsseln xs1 |ä|a|ö|o|ü|u|ß|ss| xs2 |ä|z|ö|z|ü|z|ß|z| Länge der Sortierschlüssel ssl 20 20 0 40 0 0 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+80,+ #= 3. Erstellen des KWIC #ra,-std-,-,k,+,*,-std-,-std- ssl 20 20 0 40 0 0 Druckerausgabe drt win-10 dr 1 0 100 0 Referenzlänge (6 für Seitennummer, 3 für Seitennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| Ergänzung vor und nach dem Schlüsselwort vsw | | nsw | | *eof #= 4. Ausgabe auf Bildschirm #dr,,win-10,+
► Ausgabe auf den Bildschirm auf MAC: #dr,,mac-10,+
- schneider-lastin
Vorbemerkung: Im folgenden Skript sind die Buchstaben in der Reihenfolge des deutschen Alphabets sortiert, nicht in einer der für das Mittelhochdeutsche üblichen Sortierfolgen, wie sie z.B. dargelegt ist in Erwin Koller u.a., Mittelhochdeutsches Wörterbuch. Alphabetischer Index, Stuttgart: Hirzel 1990, S. ii, wo f- in Initialposition unter v-, y- unter i- und c- unter k- bzw. z- eingereiht erscheint, während c, f und v im Wortinneren auf ihrem alphabetischen Platz stehen. Das Skript müsste also noch der gewünschten Sortierfolge angepasst werden. Im Skript berücksichtigt ist allerdings die übliche Sortierfolge bei den Vokalen mit Akzent und den Ligaturen.
Musterdatei:
tristan.tf [1 MB]
#= 1. Zerteilen des Textes in Registereinträge #rv,tristan.tf,-std-,+,+,* Trennzeichen zwischen Registereinträgen tr | |,|;|.|:|!|\?|(|)| -|- |"|'||#.ä|#.ö|%{%}|| Ersetzen von Zeichenfolgen in den Sortierschlüsseln xs1 |ä|a|ö|o|ü|u|%{%}||#.ä|a|#.ö|o| xs2 |ä|z2|â|z3|æ|z4| xs2 |ö|z2|ô|z3|œ|z4| xs2 |ü|z2|û|z3| xs2 |%{%}{&a}|{-1=}z9| Länge der Sortierschlüssel ssl 20 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+40,+ #= 3. Zusammenfassen gleicher Registereinträge #ra,-std-,-,+,+,* ssl 20 20 Druckausgabe (zweispaltig) drt win-10 dr 2 2 35 5 Kopftext kt |xxx Wortformenregister zu Gottfrieds "Tristan"| Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer) rfl 6 3 1. Referenzteil immer ausgeben rtw 1 Ergänzung von führenden Nullen im 2. Referenzteil --> Referenz = Versnr. (Bsp.: Satznr. 19.6 --> Versnr. 19006) xrt 2 |{3}{\0}|{+0=}|{2}{\0}|0{+0=}|{\0}|00{+0=}| *eof #= 4. Ausgabe auf Bildschirm (direkt auf Drucker: ^#dr,,win-10) #dr,,win-10,+
► Ausgabe auf den Bildschirm auf MAC: #dr,,mac-10,+
Vorbemerkung: Eine Besonderheit der französischen Sortierung besteht darin, dass die Buchstaben von links nach rechts, die Akzente aber von rechts nach links, also von hinten her sortiert werden: „La comparaison des caractères accentués se fait alors à l'envers en commençant par la dernière lettre“. Beispiel: Von den beiden Wörtern „élève“ und „élevé“ wird nach dieser Regel „élève“ vor „élevé“ sortiert, weil das letzte e ohne Akzent Vorrang hat vor é. Die Reihenfolge der Akzente ist in der Norm NF Z 44-001 festgelegt.
1. Vorübung
- [ wilhelmott | wilhelmott ]
Musterdatei:
dedale.tf [4 KB]
Die Musterdatei 'dedale.tf' enthält Reihen von Wörtern mit verschiedenen Akzenten (z.B. cote, côte, coté, côté), die mit dem folgenden Skript korrekt sortiert werden sollen. Eine einfache Kontrolle des Ergebnisses besteht darin zu prüfen, ob die Einträge aus der Seite 1 der Datei 'dedale.tf', die alle mindestens noch einmal weiter hinten in der Datei vorkommen, im Ergebnis in derselben Reihenfolge stehen wie in der Quelldatei; die übrigen Einträge aus den Seiten 2-4 müssen dazwischen einsortiert sein.
#an,dedale.tf #da,reg,fr=- #sv,dedale.tf,-std-,+,+,* xs1 ~%{%}~~ xs1 ~%{%}{%}~~ Reihenfolge der Akzente nach NF Z 44-001 xs1 ~œ~oe~ xs2 ~%/~1z~ xs2 ~%\\~2z~ xs2 ~%<~3z~ xs2 ~%?~4z~ xs2 ~%:~5z~ xs2 ~%\*~6z~ xs2 ~%;~7z~ xs2 ~%{%}~8z~ xs2 ~#.{&a}~9z~ 1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen (und oben nicht "z1" sondern "1z" schreiben!) rlf 0 1 ssl 20 20 *eof #so,-std-,-std-,17+40,+ #ra,-std-,reg,+,+,*,pr=- ssl 20 20 rfl 6 3 nrt |.| *eof
2. Wortformenliste zu frz. Text
- schneider-lastin
Musterdatei:
figaro.tf [4 KB]
#rv,figaro.tf,-std-,+,+,* par {} mit ' abgekürzte Wörter (z.B. d'un) abrücken: x |'|' | Wort-Trennzeichen angeben, Akzente als Ausnahmen: tr | |,|.|;|:|!|\?|(|)| -|- |/|#.;|#.:|#.<|#.>| tr ||%{%}|%{%}{%}|#.{&a}|| Akzente für 1. Sortierschlüssel rauswerfen: xs1 |%{%}|| xs1 |%{%}{%}|| Reihenfolge der Akzente nach NF Z 44-001 xs1 |œ|oe| xs2 |%/|1z| xs2 |%\\|2z| xs2 |%<|3z| xs2 |%?|4z| xs2 |%:|5z| xs2 |%\*|6z| xs2 |%;|7z| xs2 |%{%}|8z| xs2 |#.{&a}|9z| 1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen (und oben nicht "z1" sondern "1z" schreiben!) rlf 0 1 ssl 20 20 *eof #so,-std-,-std-,17+40,+ #da,index,fr=- #ra,-std-,index,+,+,*,prot=- par {} ssl 20 20 rfl 6 3 nrt |.| *eof
- schneider-lastin
Musterdatei:
guzman.tf [132 KB]
Vorbemerkung: Die Buchstaben ch, ll und ñ wurden im Spanischen bis 2010 als gesonderte Buchstaben betrachtet und entsprechend bei der Sortierung nach c bzw. l bzw. n aufgeführt. Seit dem Erscheinen der „Ortografía de la lengua española“ im Jahr 2010 wurde diese Regelung aufgegeben. Die Sortierung im folgenden Skript folgt nach der alten Regelung.
#rv,guzman.tf,-std-,+,+,* par {} mit ' abgekürzte Wörter (z.B. d'Alva) abrücken: x |'|' | Wort-Trennzeichen angeben, Akzente als Ausnahmen: tr | |,|.|;|:|!|\?|(|)|\[|\]|-|#.;|#.:|#.<|#.>|¿|¡| tr ||%{%}|| Akzente im 1. Sortierschlüssel entfernen xs1 |%{%}|| xs1 |%{%}{%}|| Sonderregeln fürs Spanische: xs1 |%\?n|^n| xs1 |ch|^c| xs1 |ll|^l| Reihenfolge der Akzente nach NF Z 44-001 xs2 |%/|z1| xs2 |%\\|z2| xs2 |%<|z3| xs2 |%\?|z4| xs2 |%:|z5| xs2 |%*|z6| xs2 |%;|z7| xs2 |%{%}|z8| xs2 |%#.{&a}|z9| ssl 20 20 a1 {|}abc^cdefghijkl^lmn^nopqrstuvwxyz #so,-std-,-std-,17+40,+ #da,index,fr=- #ra,-std-,index,+,+,*,prot=- par {} ssl 20 20 rfl 6 3 nrt |.| *eof
- [ MTrauth | MTrauth ]
Musterdatei: Kap. 1-8 aus Platons Εὐθύφρων, erfasst nach: Platon, Euthyphron und Texte zur Religionskritik, Frings, U. (Hg.), Münster 1996, 4. Aufl. (ohne Garantie für Fehlerfreiheit)
euthyphron.tf [32 KB]
Registerprogramm: Die Datei „reggr.p“ enthält das nachstehende Programm und kann für Testzwecke auf den eigenen Rechner heruntergeladen werden. Ein Kopieren und Einfügen der nachfolgenden Programmzeilen über die Zwischenablage des Betriebssystems führt zu einer Verdopplung der Codierungen, die ein „^“ aufweisen. Diese Dopplungen müssen entfernt werden, bevor das Programm ausgeführt wird, da es sonst zu Fehlermeldungen kommt. Dieser Umweg kann durch den Download der Datei „reggr.p“ eingespart werden.
reggr.p [4 KB]
Vorbemerkung: Die Referenzen sind die Satznummern der Quelldatei. Das Ergebnis wird mit dem Satzmakro #*satz
aufbereitet und zweispaltig ausgegeben.
#an,euthyphron.tf #da,index,fr=- #rv,euthyphron.tf,-std-,+,+,* par {} * Definition aller Zeichen im Tagnamen: >z1 ?{-}<> * Definition der Vokale im Griechischen: >vo aäeh^hiov^v * Definition der Konsonanten im Griechischen: >ks bgdzuüklmnjprswqtf^fxc * unterschiedliche Schreibweisen von theta: >th uü * unterschiedliche Schreibweisen von sigma: >sg swq * unterschiedliche Schreibweisen von phi: >ph f^f x |<{00}{C:z1}>|| tr | |.|,|;|\?|!| tr |"|^-|\[|\]| tr |-| tr ||%{%}|%{%}{%}|| * Graves auf der Schlußsilbe -> Akut xx :%\\{C:vo}{0--0}{C:ks}{]}:%/{+3-4-}: xx :%)\\{C:vo}{0--0}{C:ks}{]}:%)/{+4-5-}: xx :%(\\{C:vo}{0--0}{C:ks}{]}:%(/{+4-5-}: xs1 |ä|a|^h|h|^v|v| * Sonderbehandlung der Akzente a) in XS1: xs1 |%{%}{0}_||%{%}{%}{0}_||%{%}{%}{%}{0}_|| * Sonderbehandlung der Akzente b) in XS2: xs2 |ä|av|^h|hv|^v|vv| xs2 |%){0}_{&a}|{-1-}v01| xs2 |%({0}_{&a}|{-1-}v02| xs2 |%/{0}_{&a}|{-1-}v03| xs2 |%\\{0}_{&a}|{-1-}v04| xs2 |%{%}{0}_{&a}|{-1-}v05| xs2 |%)/{0}_{&a}|{-1-}v06| xs2 |%)\\{0}_{&a}|{-1-}v07| xs2 |%){%}{0}_{&a}|{-1-}v08| xs2 |%(/{0}_{&a}|{-1-}v09| xs2 |%(\\{0}_{&a}|{-1-}v10| xs2 |%({%}{0}_{&a}|{-1-}v11| xs2 |%{%}{%}{0}_{&a}|{-1-}v12| xs2 |%){%}{%}{0}_{&a}|{-1-}v13| xs2 |%({%}{%}{0}_{&a}|{-1-}v14| ssl 20 20 a1 : {|}abgdezh{c:th}iklmnjopr{c:sg}ty{c:ph}xcv a2 : {|}aäbgdezh^huüiklmnjoprsqwtyf^fxcv^v *eof #so,-std-,-std-,17+40,+ #ra,-std-,index,+,+,*,pr=- par {} ssl 20 20 rfl 6 3 nrt |.| vtt |$$$<gr>| ntt |</gr> _ | *eof #*satz,index,s,A42
- schneider-lastin
Musterdatei:
schweiz.tf [8 KB]
► Die Registereinträge wurden mit <re>…</re> codiert.
#= 1. Herausziehen der Registereinträge #rv,schweiz.tf,-std-,+,+,* par {} ea |<re>| ee |</re>| xs1 |ä|a|ö|o|ü|u|ß|ss| xs2 |ä|az|ö|oz|ü|uz|ß|sz| ssl 20 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+40,+ #= 3. Zusammenfassen gleicher Registereinträge #da,index,fr=- #ra,-std-,index,+,+,*,prot=- ssl 40 Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| *eof