{{indexmenu_n>5}} **Vorbemerkung:** Für die Registererstellung mit TUSTEP werden **drei Module** benötigt:\\ * ''#RVORBEREITE'' (mit Parametern): zum **Zerlegen** des Eingabetextes oder zur **Auswahl** von Registereinträgen; zur Angabe der **Sortierung** oder von Sortieralphabeten (etwa bei Sprachen mit nichtlateinischen Buchstaben); u.a. * ''#SORTIERE'' (ohne Parameter): zum **Sortieren** der Registereinträge * ''#RAUFBEREITE'' (mit Parametern): zum **Zusammenfassen** und **Aufbereiten** der Registereinträge und Referenzen für die Ausgabe in gedruckter oder digitaler Form. Der modulare Aufbau von TUSTEP erlaubt dem Benutzer **maßgeschneiderte Lösungen** und eine sonst nicht erreichbare **Flexibilität**.\\ \\ **►► Lösungen zu Detailfragen und -Problemen** im Zusammenhang mit Registererstellung finden Sie [[tustep:loesungen:register:detailprobleme|hier]]. ---- [[tustep:loesungen:start|Zurück zum Inhaltsverzeichnis - Lösungen und Tipps]] ---- ====== Wortformenliste ohne Referenzen zu l​at. Text ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:lukrez.tf|lukrez.tf}} [80 KB] \\ #= 1. Zerteilen des Textes in Registereinträge #rv,lukrez.tf,-std-,-,+,* par {} Trennzeichenfolgen zwischen Registereinträgen tr | |,|;|.|:|!|\?| Länge des Sortierschlüssels ssl 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,1+20,+ #= 3. Zusammenfassen gleicher Registereinträge #da,index,fr=- #ra,-std-,index,-,+,*,prot=- ssl 20 *eof \\ ====== Wortformenliste mit Referenzen zu nhd. Text ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:kafka.tf|kafka.tf}} [88 KB] \\ #= 1. Zerteilen des Textes in Registereinträge #rv,kafka.tf,-std-,+,+,* par {} Trennzeichenfolgen zwischen Registereinträgen tr | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;| tr |<{0}/h1>|<{0}/p>| Ersetzen von Zeichenfolgen im Sortierschlüssel xs1 |ä|a|ö|o|ü|u|ß|ss| xs2 |ä|z|ö|z|ü|z|ß|z| Länge der Sortierschlüssel ssl 20 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+40,+ #= 3. Zusammenfassen gleicher Registereinträge #da,index,fr=- #ra,-std-,index,+,+,*,prot=- ssl 20 20 Referenzlänge (6 für Seitennummer, 3 für Zeilennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| *eof \\ ====== KWIC-Index zu lat. Verstext ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ KWIC = Key Word In Context (Roh-Konkordanz)\\ \\ **Musterdatei:**\\ {{files_open:daten:lukrez.tf|lukrez.tf}} [80 KB] \\ #= 1. Zerteilen des Textes in Schlüsselwörter #rv,lukrez.tf,-std-,k,+,*,-std- par {} Trennzeichenfolgen zwischen Schlüsselwörtern swt | |,|;|.|:|!|\?|"| -|- |(|)| Länge der Sortierschlüssel ssl 20 0 0 40 0 0 *eof #= 2. Sortieren der Schlüsselwörter #so,-std-,-std-,17+60,+,17+60 #= 3. Erstellen des KWIC #ra,-std-,-,k,+,*,-std-,-std- Druckertyp drt win-10 ssl 0 Referenzlänge (6 für Satznummer, 3 für Zeilennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| Ergänzung vor und nach dem Schlüsselwort vsw | | nsw | | *eof #= 4. Ausgabe direkt auf Drucker (auf Bildschirm: ^#dr,,win-10,+) #dr,,win-10 \\ ► Ausgabe auf den Bildschirm auf MAC: **#dr,,mac-10,+**\\ \\ \\ ====== KWIC-Index zu nhd. Text ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ KWIC = Key Word In Context (Roh-Konkordanz)\\ \\ **Musterdatei:**\\ {{files_open:daten:kafka.tf|kafka.tf}} [88 KB]\\ \\ #= 1. Zerteilen des Textes in Registereinträge #rv,kafka.tf,-std-,k,+,*,-std- par {} Abschnittsanfang festlegen aa |

|

| Trennzeichenfolgen zwischen Schlüsselwörtern swt |<{0}/h1>|<{0}/p>| swt | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;| Austauschen in den Sortierschlüsseln xs1 |ä|a|ö|o|ü|u|ß|ss| xs2 |ä|z|ö|z|ü|z|ß|z| Länge der Sortierschlüssel ssl 20 20 0 40 0 0 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+80,+ #= 3. Erstellen des KWIC #ra,-std-,-,k,+,*,-std-,-std- ssl 20 20 0 40 0 0 Druckerausgabe drt win-10 dr 1 0 100 0 Referenzlänge (6 für Seitennummer, 3 für Seitennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| Ergänzung vor und nach dem Schlüsselwort vsw | | nsw | | *eof #= 4. Ausgabe auf Bildschirm #dr,,win-10,+ ► Ausgabe auf den Bildschirm auf MAC: **#dr,,mac-10,+**\\ \\ ====== Wortformenliste mit Referenzen zu mhd. Verstext ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Vorbemerkung:** Im folgenden Skript sind die Buchstaben in der Reihenfolge des deutschen Alphabets sortiert, nicht in einer der für das Mittelhochdeutsche üblichen Sortierfolgen, wie sie z.B. dargelegt ist in Erwin Koller u.a., Mittelhochdeutsches Wörterbuch. Alphabetischer Index, Stuttgart: Hirzel 1990, S. ii, wo f- in Initialposition unter v-, y- unter i- und c- unter k- bzw. z- eingereiht erscheint, während c, f und v im Wortinneren auf ihrem alphabetischen Platz stehen. Das Skript müsste also noch der gewünschten Sortierfolge angepasst werden. Im Skript berücksichtigt ist allerdings die übliche Sortierfolge bei den Vokalen mit Akzent und den Ligaturen.\\ \\ **Musterdatei:**\\ {{files_open:daten:tristan.tf|tristan.tf}} [1 MB] \\ #= 1. Zerteilen des Textes in Registereinträge #rv,tristan.tf,-std-,+,+,* Trennzeichen zwischen Registereinträgen tr | |,|;|.|:|!|\?|(|)| -|- |"|'||#.ä|#.ö|%{%}|| Ersetzen von Zeichenfolgen in den Sortierschlüsseln xs1 |ä|a|ö|o|ü|u|%{%}||#.ä|a|#.ö|o| xs2 |ä|z2|â|z3|æ|z4| xs2 |ö|z2|ô|z3|œ|z4| xs2 |ü|z2|û|z3| xs2 |%{%}{&a}|{-1=}z9| Länge der Sortierschlüssel ssl 20 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+40,+ #= 3. Zusammenfassen gleicher Registereinträge #ra,-std-,-,+,+,* ssl 20 20 Druckausgabe (zweispaltig) drt win-10 dr 2 2 35 5 Kopftext kt |xxx Wortformenregister zu Gottfrieds "Tristan"| Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer) rfl 6 3 1. Referenzteil immer ausgeben rtw 1 Ergänzung von führenden Nullen im 2. Referenzteil --> Referenz = Versnr. (Bsp.: Satznr. 19.6 --> Versnr. 19006) xrt 2 |{3}{\0}|{+0=}|{2}{\0}|0{+0=}|{\0}|00{+0=}| *eof #= 4. Ausgabe auf Bildschirm (direkt auf Drucker: ^#dr,,win-10) #dr,,win-10,+ ► Ausgabe auf den Bildschirm auf MAC: **#dr,,mac-10,+**\\ \\ ====== Wortformenliste mit Referenzen zu frz. Text ====== \\ **Vorbemerkung:** Eine Besonderheit der französischen Sortierung besteht darin, dass die Buchstaben von links nach rechts, die **Akzente aber von rechts nach links**, also von hinten her sortiert werden: "La comparaison des caractères accentués se fait alors à l'envers **en commençant par la dernière lettre**". **Beispiel:** Von den beiden Wörtern "élève" und "élevé" wird nach dieser Regel "élève" **vor** "élevé" sortiert, weil das letzte e ohne Akzent Vorrang hat vor é. Die **Reihenfolge der Akzente** ist in der Norm NF Z 44-001 festgelegt.\\ \\ **1. Vorübung**\\ - [ wilhelmott | wilhelmott ]\\ \\ **Musterdatei:**\\ {{files_open:daten:dedale.tf|dedale.tf}} [4 KB]\\ \\ Die Musterdatei 'dedale.tf' enthält Reihen von Wörtern mit verschiedenen Akzenten (z.B. cote, côte, coté, côté), die mit dem folgenden Skript korrekt sortiert werden sollen. Eine einfache Kontrolle des Ergebnisses besteht darin zu prüfen, ob die Einträge aus der Seite 1 der Datei 'dedale.tf', die alle mindestens noch einmal weiter hinten in der Datei vorkommen, im Ergebnis in derselben Reihenfolge stehen wie in der Quelldatei; die übrigen Einträge aus den Seiten 2-4 müssen dazwischen einsortiert sein.\\ #an,dedale.tf #da,reg,fr=- #sv,dedale.tf,-std-,+,+,* xs1 ~%{%}~~ xs1 ~%{%}{%}~~ Reihenfolge der Akzente nach NF Z 44-001 xs1 ~œ~oe~ xs2 ~%/~1z~ xs2 ~%\\~2z~ xs2 ~%<~3z~ xs2 ~%?~4z~ xs2 ~%:~5z~ xs2 ~%\*~6z~ xs2 ~%;~7z~ xs2 ~%{%}~8z~ xs2 ~#.{&a}~9z~ 1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen (und oben nicht "z1" sondern "1z" schreiben!) rlf 0 1 ssl 20 20 *eof #so,-std-,-std-,17+40,+ #ra,-std-,reg,+,+,*,pr=- ssl 20 20 rfl 6 3 nrt |.| *eof \\ **2. Wortformenliste zu frz. Text**\\ - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:figaro.tf|figaro.tf}} [4 KB] \\ #rv,figaro.tf,-std-,+,+,* par {} mit ' abgekürzte Wörter (z.B. d'un) abrücken: x |'|' | Wort-Trennzeichen angeben, Akzente als Ausnahmen: tr | |,|.|;|:|!|\?|(|)| -|- |/|#.;|#.:|#.<|#.>| tr ||%{%}|%{%}{%}|#.{&a}|| Akzente für 1. Sortierschlüssel rauswerfen: xs1 |%{%}|| xs1 |%{%}{%}|| Reihenfolge der Akzente nach NF Z 44-001 xs1 |œ|oe| xs2 |%/|1z| xs2 |%\\|2z| xs2 |%<|3z| xs2 |%?|4z| xs2 |%:|5z| xs2 |%\*|6z| xs2 |%;|7z| xs2 |%{%}|8z| xs2 |#.{&a}|9z| 1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen (und oben nicht "z1" sondern "1z" schreiben!) rlf 0 1 ssl 20 20 *eof #so,-std-,-std-,17+40,+ #da,index,fr=- #ra,-std-,index,+,+,*,prot=- par {} ssl 20 20 rfl 6 3 nrt |.| *eof ====== Wortformenliste mit Referenzen zu span. Text ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:guzman.tf|guzman.tf}} [132 KB]\\ \\ \\ **Vorbemerkung:** Die Buchstaben **ch, ll** und **ñ** wurden im Spanischen bis 2010 als **gesonderte Buchstaben** betrachtet und entsprechend bei der Sortierung **nach c bzw. l bzw. n aufgeführt**. Seit dem Erscheinen der "Ortografía de la lengua española" im Jahr 2010 wurde diese Regelung aufgegeben. Die Sortierung im folgenden Skript folgt nach der alten Regelung.\\ {{files_open:bilder:spanisch.jpg|spanisch.jpg}}\\ #rv,guzman.tf,-std-,+,+,* par {} mit ' abgekürzte Wörter (z.B. d'Alva) abrücken: x |'|' | Wort-Trennzeichen angeben, Akzente als Ausnahmen: tr | |,|.|;|:|!|\?|(|)|\[|\]|-|#.;|#.:|#.<|#.>|¿|¡| tr ||%{%}|| Akzente im 1. Sortierschlüssel entfernen xs1 |%{%}|| xs1 |%{%}{%}|| Sonderregeln fürs Spanische: xs1 |%\?n|^n| xs1 |ch|^c| xs1 |ll|^l| Reihenfolge der Akzente nach NF Z 44-001 xs2 |%/|z1| xs2 |%\\|z2| xs2 |%<|z3| xs2 |%\?|z4| xs2 |%:|z5| xs2 |%*|z6| xs2 |%;|z7| xs2 |%{%}|z8| xs2 |%#.{&a}|z9| ssl 20 20 a1 {|}abc^cdefghijkl^lmn^nopqrstuvwxyz #so,-std-,-std-,17+40,+ #da,index,fr=- #ra,-std-,index,+,+,*,prot=- par {} ssl 20 20 rfl 6 3 nrt |.| *eof \\ ====== Wortformenliste mit Referenzen zu altgriech. Text ====== - [ MTrauth | MTrauth ]\\ \\ **Musterdatei:** Kap. 1-8 aus Platons Εὐθύφρων, erfasst nach: Platon, Euthyphron und Texte zur Religionskritik, Frings, U. (Hg.), Münster 1996, 4. Aufl. (ohne Garantie für Fehlerfreiheit)\\ \\ {{files_open:daten:euthyphron.tf|euthyphron.tf}} [32 KB]\\ \\ \\ \\ **Registerprogramm**: Die Datei "reggr.p" enthält das nachstehende Programm und kann für Testzwecke auf den eigenen Rechner heruntergeladen werden. Ein Kopieren und Einfügen der nachfolgenden Programmzeilen über die Zwischenablage des Betriebssystems führt zu einer Verdopplung der Codierungen, die ein "^" aufweisen. Diese Dopplungen müssen entfernt werden, bevor das Programm ausgeführt wird, da es sonst zu Fehlermeldungen kommt. Dieser Umweg kann durch den Download der Datei "reggr.p" eingespart werden.\\ \\ {{files_open:daten:reggr.p|reggr.p}} [4 KB]\\ \\ \\ **Vorbemerkung:** Die **Referenzen** sind die Satznummern der Quelldatei. Das Ergebnis wird mit dem Satzmakro ''#*satz'' aufbereitet und **zweispaltig** ausgegeben.\\ #an,euthyphron.tf #da,index,fr=- #rv,euthyphron.tf,-std-,+,+,* par {} * Definition aller Zeichen im Tagnamen: >z1 ?{-}<> * Definition der Vokale im Griechischen: >vo aäeh^hiov^v * Definition der Konsonanten im Griechischen: >ks bgdzuüklmnjprswqtf^fxc * unterschiedliche Schreibweisen von theta: >th uü * unterschiedliche Schreibweisen von sigma: >sg swq * unterschiedliche Schreibweisen von phi: >ph f^f x |<{00}{C:z1}>|| tr | |.|,|;|\?|!| tr |"|^-|\[|\]| tr |-| tr ||%{%}|%{%}{%}|| * Graves auf der Schlußsilbe -> Akut xx :%\\{C:vo}{0--0}{C:ks}{]}:%/{+3-4-}: xx :%)\\{C:vo}{0--0}{C:ks}{]}:%)/{+4-5-}: xx :%(\\{C:vo}{0--0}{C:ks}{]}:%(/{+4-5-}: xs1 |ä|a|^h|h|^v|v| * Sonderbehandlung der Akzente a) in XS1: xs1 |%{%}{0}_||%{%}{%}{0}_||%{%}{%}{%}{0}_|| * Sonderbehandlung der Akzente b) in XS2: xs2 |ä|av|^h|hv|^v|vv| xs2 |%){0}_{&a}|{-1-}v01| xs2 |%({0}_{&a}|{-1-}v02| xs2 |%/{0}_{&a}|{-1-}v03| xs2 |%\\{0}_{&a}|{-1-}v04| xs2 |%{%}{0}_{&a}|{-1-}v05| xs2 |%)/{0}_{&a}|{-1-}v06| xs2 |%)\\{0}_{&a}|{-1-}v07| xs2 |%){%}{0}_{&a}|{-1-}v08| xs2 |%(/{0}_{&a}|{-1-}v09| xs2 |%(\\{0}_{&a}|{-1-}v10| xs2 |%({%}{0}_{&a}|{-1-}v11| xs2 |%{%}{%}{0}_{&a}|{-1-}v12| xs2 |%){%}{%}{0}_{&a}|{-1-}v13| xs2 |%({%}{%}{0}_{&a}|{-1-}v14| ssl 20 20 a1 : {|}abgdezh{c:th}iklmnjopr{c:sg}ty{c:ph}xcv a2 : {|}aäbgdezh^huüiklmnjoprsqwtyf^fxcv^v *eof #so,-std-,-std-,17+40,+ #ra,-std-,index,+,+,*,pr=- par {} ssl 20 20 rfl 6 3 nrt |.| vtt |$$$| ntt | _ | *eof #*satz,index,s,A42 \\ ====== Sachregister (einfach) ====== - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:schweiz.tf|schweiz.tf}} [8 KB]\\ \\ ► Die Registereinträge wurden mit ... codiert.\\ #= 1. Herausziehen der Registereinträge #rv,schweiz.tf,-std-,+,+,* par {} ea || ee || xs1 |ä|a|ö|o|ü|u|ß|ss| xs2 |ä|az|ö|oz|ü|uz|ß|sz| ssl 20 20 *eof #= 2. Sortieren der Registereinträge #so,-std-,-std-,17+40,+ #= 3. Zusammenfassen gleicher Registereinträge #da,index,fr=- #ra,-std-,index,+,+,*,prot=- ssl 40 Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer) rfl 6 3 Ergänzung nach dem 1. Referenzteil nrt |.| *eof ---- [[tustep:loesungen:start|Zurück zum Inhaltsverzeichnis - Lösungen und Tipps]]