Benutzer-Werkzeuge

Webseiten-Werkzeuge


Seitenleiste

tustep:loesungen:register

Vorbemerkung: Für die Registererstellung mit TUSTEP werden drei Module benötigt:

  • #RVORBEREITE (mit Parametern): zum Zerlegen des Eingabetextes oder zur Auswahl von Registereinträgen; zur Angabe der Sortierung oder von Sortieralphabeten (etwa bei Sprachen mit nichtlateinischen Buchstaben); u.a.
  • #SORTIERE (ohne Parameter): zum Sortieren der Registereinträge
  • #RAUFBEREITE (mit Parametern): zum Zusammenfassen und Aufbereiten der Registereinträge und Referenzen für die Ausgabe in gedruckter oder digitaler Form.

Der modulare Aufbau von TUSTEP erlaubt dem Benutzer maßgeschneiderte Lösungen und eine sonst nicht erreichbare Flexibilität.

►► Lösungen zu Detailfragen und -Problemen im Zusammenhang mit Registererstellung finden Sie hier.


Zurück zum Inhaltsverzeichnis - Lösungen und Tipps


Wortformenliste ohne Referenzen zu l​at. Text

- schneider-lastin schneider-lastin

Musterdatei:
lukrez.tf [80 KB]

#= 1. Zerteilen des Textes in Registereinträge
#rv,lukrez.tf,-std-,-,+,*
par       {}
          Trennzeichenfolgen zwischen Registereinträgen
tr        | |,|;|.|:|!|\?|
          Länge des Sortierschlüssels
ssl       20
*eof

#= 2. Sortieren der Registereinträge
#so,-std-,-std-,1+20,+

#= 3. Zusammenfassen gleicher Registereinträge
#da,index,fr=-
#ra,-std-,index,-,+,*,prot=-
ssl       20
*eof


Wortformenliste mit Referenzen zu nhd. Text

- schneider-lastin schneider-lastin

Musterdatei:
kafka.tf [88 KB]

#=        1. Zerteilen des Textes in Registereinträge
#rv,kafka.tf,-std-,+,+,*
par       {}
          Trennzeichenfolgen zwischen Registereinträgen
tr        | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;|
tr        |<{0}/h1>|<{0}/p>|
          Ersetzen von Zeichenfolgen im Sortierschlüssel
xs1       |ä|a|ö|o|ü|u|ß|ss|
xs2       |ä|z|ö|z|ü|z|ß|z|
          Länge der Sortierschlüssel
ssl       20 20
*eof

#= 2. Sortieren der Registereinträge
#so,-std-,-std-,17+40,+

#= 3. Zusammenfassen gleicher Registereinträge
#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
ssl       20 20
          Referenzlänge (6 für Seitennummer, 3 für Zeilennummer)
rfl       6 3
          Ergänzung nach dem 1. Referenzteil
nrt       |.|
*eof


KWIC-Index zu lat. Verstext

- schneider-lastin schneider-lastin
KWIC = Key Word In Context (Roh-Konkordanz)

Musterdatei:
lukrez.tf [80 KB]

#=        1. Zerteilen des Textes in Schlüsselwörter
#rv,lukrez.tf,-std-,k,+,*,-std-
par       {}
          Trennzeichenfolgen zwischen Schlüsselwörtern
swt       | |,|;|.|:|!|\?|"| -|- |(|)|
          Länge der Sortierschlüssel
ssl       20 0 0 40 0 0
*eof

#=        2. Sortieren der Schlüsselwörter
#so,-std-,-std-,17+60,+,17+60

#=        3. Erstellen des KWIC
#ra,-std-,-,k,+,*,-std-,-std-
          Druckertyp
drt       win-10
ssl       0
          Referenzlänge (6 für Satznummer, 3 für Zeilennummer)
rfl       6 3
          Ergänzung nach dem 1. Referenzteil
nrt       |.|
          Ergänzung vor und nach dem Schlüsselwort
vsw       | |
nsw       | |
*eof

#=        4. Ausgabe direkt auf Drucker (auf Bildschirm: ^#dr,,win-10,+)
#dr,,win-10


► Ausgabe auf den Bildschirm auf MAC: #dr,,mac-10,+


KWIC-Index zu nhd. Text

- schneider-lastin schneider-lastin
KWIC = Key Word In Context (Roh-Konkordanz)

Musterdatei:
kafka.tf [88 KB]

#=        1. Zerteilen des Textes in Registereinträge
#rv,kafka.tf,-std-,k,+,*,-std-
par       {}
          Abschnittsanfang festlegen
aa        |<h1>|<p>|
          Trennzeichenfolgen zwischen Schlüsselwörtern
swt       |<{0}/h1>|<{0}/p>|
swt       | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;|
          Austauschen in den Sortierschlüsseln
xs1       |ä|a|ö|o|ü|u|ß|ss|
xs2       |ä|z|ö|z|ü|z|ß|z|
          Länge der Sortierschlüssel
ssl       20 20 0 40 0 0
*eof

#=        2. Sortieren der Registereinträge
#so,-std-,-std-,17+80,+

#=        3. Erstellen des KWIC
#ra,-std-,-,k,+,*,-std-,-std-
ssl       20 20 0 40 0 0
          Druckerausgabe
drt       win-10
dr        1 0 100 0
          Referenzlänge (6 für Seitennummer, 3 für Seitennummer)
rfl       6 3
          Ergänzung nach dem 1. Referenzteil
nrt       |.|
          Ergänzung vor und nach dem Schlüsselwort
vsw       | |
nsw       | |
*eof

#=        4. Ausgabe auf Bildschirm
#dr,,win-10,+

► Ausgabe auf den Bildschirm auf MAC: #dr,,mac-10,+

Wortformenliste mit Referenzen zu mhd. Verstext

- schneider-lastin schneider-lastin

Vorbemerkung: Im folgenden Skript sind die Buchstaben in der Reihenfolge des deutschen Alphabets sortiert, nicht in einer der für das Mittelhochdeutsche üblichen Sortierfolgen, wie sie z.B. dargelegt ist in Erwin Koller u.a., Mittelhochdeutsches Wörterbuch. Alphabetischer Index, Stuttgart: Hirzel 1990, S. ii, wo f- in Initialposition unter v-, y- unter i- und c- unter k- bzw. z- eingereiht erscheint, während c, f und v im Wortinneren auf ihrem alphabetischen Platz stehen. Das Skript müsste also noch der gewünschten Sortierfolge angepasst werden. Im Skript berücksichtigt ist allerdings die übliche Sortierfolge bei den Vokalen mit Akzent und den Ligaturen.

Musterdatei:
tristan.tf [1 MB]

#=        1. Zerteilen des Textes in Registereinträge
#rv,tristan.tf,-std-,+,+,*
          Trennzeichen zwischen Registereinträgen
tr        | |,|;|.|:|!|\?|(|)| -|- |"|'||#.ä|#.ö|%{%}||
          Ersetzen von Zeichenfolgen in den Sortierschlüsseln
xs1       |ä|a|ö|o|ü|u|%{%}||#.ä|a|#.ö|o|
xs2       |ä|z2|â|z3|æ|z4|
xs2       |ö|z2|ô|z3|œ|z4|
xs2       |ü|z2|û|z3|
xs2       |%{%}{&a}|{-1=}z9|
          Länge der Sortierschlüssel
ssl       20 20
*eof

#=        2. Sortieren der Registereinträge
#so,-std-,-std-,17+40,+

#=        3. Zusammenfassen gleicher Registereinträge
#ra,-std-,-,+,+,*
ssl       20 20
          Druckausgabe (zweispaltig)
drt       win-10
dr        2 2 35 5
          Kopftext
kt        |xxx    Wortformenregister zu Gottfrieds "Tristan"|
          Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer)
rfl       6 3
          1. Referenzteil immer ausgeben
rtw       1
          Ergänzung von führenden Nullen im 2. Referenzteil
          --> Referenz = Versnr. (Bsp.: Satznr. 19.6 --> Versnr. 19006)
xrt   2   |{3}{\0}|{+0=}|{2}{\0}|0{+0=}|{\0}|00{+0=}|
*eof

#=        4. Ausgabe auf Bildschirm (direkt auf Drucker: ^#dr,,win-10)
#dr,,win-10,+

► Ausgabe auf den Bildschirm auf MAC: #dr,,mac-10,+

Wortformenliste mit Referenzen zu frz. Text


Vorbemerkung: Eine Besonderheit der französischen Sortierung besteht darin, dass die Buchstaben von links nach rechts, die Akzente aber von rechts nach links, also von hinten her sortiert werden: „La comparaison des caractères accentués se fait alors à l'envers en commençant par la dernière lettre“. Beispiel: Von den beiden Wörtern „élève“ und „élevé“ wird nach dieser Regel „élève“ vor „élevé“ sortiert, weil das letzte e ohne Akzent Vorrang hat vor é. Die Reihenfolge der Akzente ist in der Norm NF Z 44-001 festgelegt.

1. Vorübung
- [ wilhelmott | wilhelmott ]

Musterdatei:
dedale.tf [4 KB]

Die Musterdatei 'dedale.tf' enthält Reihen von Wörtern mit verschiedenen Akzenten (z.B. cote, côte, coté, côté), die mit dem folgenden Skript korrekt sortiert werden sollen. Eine einfache Kontrolle des Ergebnisses besteht darin zu prüfen, ob die Einträge aus der Seite 1 der Datei 'dedale.tf', die alle mindestens noch einmal weiter hinten in der Datei vorkommen, im Ergebnis in derselben Reihenfolge stehen wie in der Quelldatei; die übrigen Einträge aus den Seiten 2-4 müssen dazwischen einsortiert sein.

#an,dedale.tf
#da,reg,fr=-
#sv,dedale.tf,-std-,+,+,*
xs1       ~%{%}~~
xs1       ~%{%}{%}~~
          Reihenfolge der Akzente nach NF Z 44-001
xs1       ~œ~oe~
xs2       ~%/~1z~
xs2       ~%\\~2z~
xs2       ~%<~3z~
xs2       ~%?~4z~
xs2       ~%:~5z~
xs2       ~%\*~6z~
xs2       ~%;~7z~
xs2       ~%{%}~8z~
xs2       ~#.{&a}~9z~
          1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen
          (und oben nicht "z1" sondern "1z" schreiben!)
rlf       0  1
ssl       20 20
*eof

#so,-std-,-std-,17+40,+

#ra,-std-,reg,+,+,*,pr=-
ssl       20 20
rfl       6 3
nrt       |.|
*eof


2. Wortformenliste zu frz. Text
- schneider-lastin schneider-lastin

Musterdatei:
figaro.tf [4 KB]

#rv,figaro.tf,-std-,+,+,*
par       {}
          mit ' abgekürzte Wörter (z.B. d'un) abrücken:
x         |'|' |
          Wort-Trennzeichen angeben, Akzente als Ausnahmen:
tr        | |,|.|;|:|!|\?|(|)| -|- |/|#.;|#.:|#.<|#.>|
tr        ||%{%}|%{%}{%}|#.{&a}||
          Akzente für 1. Sortierschlüssel rauswerfen:
xs1       |%{%}||
xs1       |%{%}{%}||
          Reihenfolge der Akzente nach NF Z 44-001
xs1       |œ|oe|
xs2       |%/|1z|
xs2       |%\\|2z|
xs2       |%<|3z|
xs2       |%?|4z|
xs2       |%:|5z|
xs2       |%\*|6z|
xs2       |%;|7z|
xs2       |%{%}|8z|
xs2       |#.{&a}|9z|
          1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen
          (und oben nicht "z1" sondern "1z" schreiben!)
rlf       0  1
ssl       20 20
*eof

#so,-std-,-std-,17+40,+

#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
par       {}
ssl       20 20
rfl       6 3
nrt       |.|
*eof

Wortformenliste mit Referenzen zu span. Text

- schneider-lastin schneider-lastin

Musterdatei:
guzman.tf [132 KB]


Vorbemerkung: Die Buchstaben ch, ll und ñ wurden im Spanischen bis 2010 als gesonderte Buchstaben betrachtet und entsprechend bei der Sortierung nach c bzw. l bzw. n aufgeführt. Seit dem Erscheinen der „Ortografía de la lengua española“ im Jahr 2010 wurde diese Regelung aufgegeben. Die Sortierung im folgenden Skript folgt nach der alten Regelung.
spanisch.jpg

#rv,guzman.tf,-std-,+,+,*
par       {}
          mit ' abgekürzte Wörter (z.B. d'Alva) abrücken:
x         |'|' |
          Wort-Trennzeichen angeben, Akzente als Ausnahmen:
tr        | |,|.|;|:|!|\?|(|)|\[|\]|-|#.;|#.:|#.<|#.>|¿|¡|
tr        ||%{%}||
          Akzente im 1. Sortierschlüssel entfernen
xs1       |%{%}||
xs1       |%{%}{%}||
          Sonderregeln fürs Spanische:
xs1       |%\?n|^n|
xs1       |ch|^c|
xs1       |ll|^l|
          Reihenfolge der Akzente nach NF Z 44-001
xs2       |%/|z1|
xs2       |%\\|z2|
xs2       |%<|z3|
xs2       |%\?|z4|
xs2       |%:|z5|
xs2       |%*|z6|
xs2       |%;|z7|
xs2       |%{%}|z8|
xs2       |%#.{&a}|z9|
ssl       20 20
a1        {|}abc^cdefghijkl^lmn^nopqrstuvwxyz

#so,-std-,-std-,17+40,+

#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
par       {}
ssl       20 20
rfl       6 3
nrt       |.|
*eof


Wortformenliste mit Referenzen zu altgriech. Text

- [ MTrauth | MTrauth ]

Musterdatei: Kap. 1-8 aus Platons Εὐθύφρων, erfasst nach: Platon, Euthyphron und Texte zur Religionskritik, Frings, U. (Hg.), Münster 1996, 4. Aufl. (ohne Garantie für Fehlerfreiheit)

euthyphron.tf [32 KB]



Registerprogramm: Die Datei „reggr.p“ enthält das nachstehende Programm und kann für Testzwecke auf den eigenen Rechner heruntergeladen werden. Ein Kopieren und Einfügen der nachfolgenden Programmzeilen über die Zwischenablage des Betriebssystems führt zu einer Verdopplung der Codierungen, die ein „^“ aufweisen. Diese Dopplungen müssen entfernt werden, bevor das Programm ausgeführt wird, da es sonst zu Fehlermeldungen kommt. Dieser Umweg kann durch den Download der Datei „reggr.p“ eingespart werden.

reggr.p [4 KB]


Vorbemerkung: Die Referenzen sind die Satznummern der Quelldatei. Das Ergebnis wird mit dem Satzmakro #*satz aufbereitet und zweispaltig ausgegeben.

#an,euthyphron.tf
#da,index,fr=-
#rv,euthyphron.tf,-std-,+,+,*
par       {}
        * Definition aller Zeichen im Tagnamen:
>z1       ?{-}<>
        * Definition der Vokale im Griechischen:
>vo       aäeh^hiov^v
        * Definition der Konsonanten im Griechischen:
>ks       bgdzuüklmnjprswqtf^fxc
        * unterschiedliche Schreibweisen von theta:
>th       uü
        * unterschiedliche Schreibweisen von sigma:
>sg       swq
        * unterschiedliche Schreibweisen von phi:
>ph       f^f

x         |<{00}{C:z1}>||
tr        | |.|,|;|\?|!|
tr        |"|^-|\[|\]|
tr        |-|
tr        ||%{%}|%{%}{%}||

        * Graves auf der Schlußsilbe -> Akut
xx        :%\\{C:vo}{0--0}{C:ks}{]}:%/{+3-4-}:
xx        :%)\\{C:vo}{0--0}{C:ks}{]}:%)/{+4-5-}:
xx        :%(\\{C:vo}{0--0}{C:ks}{]}:%(/{+4-5-}:

xs1       |ä|a|^h|h|^v|v|
        * Sonderbehandlung der Akzente a) in XS1:
xs1       |%{%}{0}_||%{%}{%}{0}_||%{%}{%}{%}{0}_||
        * Sonderbehandlung der Akzente b) in XS2:
xs2       |ä|av|^h|hv|^v|vv|
xs2       |%){0}_{&a}|{-1-}v01|
xs2       |%({0}_{&a}|{-1-}v02|
xs2       |%/{0}_{&a}|{-1-}v03|
xs2       |%\\{0}_{&a}|{-1-}v04|
xs2       |%{%}{0}_{&a}|{-1-}v05|
xs2       |%)/{0}_{&a}|{-1-}v06|
xs2       |%)\\{0}_{&a}|{-1-}v07|
xs2       |%){%}{0}_{&a}|{-1-}v08|
xs2       |%(/{0}_{&a}|{-1-}v09|
xs2       |%(\\{0}_{&a}|{-1-}v10|
xs2       |%({%}{0}_{&a}|{-1-}v11|
xs2       |%{%}{%}{0}_{&a}|{-1-}v12|
xs2       |%){%}{%}{0}_{&a}|{-1-}v13|
xs2       |%({%}{%}{0}_{&a}|{-1-}v14|

ssl       20 20
a1      :  {|}abgdezh{c:th}iklmnjopr{c:sg}ty{c:ph}xcv
a2      :  {|}aäbgdezh^huüiklmnjoprsqwtyf^fxcv^v
*eof

#so,-std-,-std-,17+40,+

#ra,-std-,index,+,+,*,pr=-
par       {}
ssl       20 20
rfl       6 3
nrt       |.|
vtt       |$$$<gr>|
ntt       |</gr> _ |
*eof

#*satz,index,s,A42


Sachregister (einfach)

- schneider-lastin schneider-lastin

Musterdatei:
schweiz.tf [8 KB]

► Die Registereinträge wurden mit <re>…</re> codiert.

#=        1. Herausziehen der Registereinträge
#rv,schweiz.tf,-std-,+,+,*
par       {}
ea        |<re>|
ee        |</re>|
xs1       |ä|a|ö|o|ü|u|ß|ss|
xs2       |ä|az|ö|oz|ü|uz|ß|sz|
ssl       20 20
*eof

#=        2. Sortieren der Registereinträge
#so,-std-,-std-,17+40,+

#=        3. Zusammenfassen gleicher Registereinträge
#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
ssl       40
          Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer)
rfl       6 3
          Ergänzung nach dem 1. Referenzteil
nrt       |.|
*eof

Zurück zum Inhaltsverzeichnis - Lösungen und Tipps

tustep/loesungen/register.txt · Zuletzt geändert: 2022/03/04 15:01 von Thomas Kollatz