#= 1. Zerteilen des Textes in Registereinträge
#rv,lukrez.tf,-std-,-,+,*
par {}
Trennzeichenfolgen zwischen Registereinträgen
tr | |,|;|.|:|!|\?|
Länge des Sortierschlüssels
ssl 20
*eof
#= 2. Sortieren der Registereinträge
#so,-std-,-std-,1+20,+
#= 3. Zusammenfassen gleicher Registereinträge
#da,index,fr=-
#ra,-std-,index,-,+,*,prot=-
ssl 20
*eof
\\
====== Wortformenliste mit Referenzen zu nhd. Text ======
- {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:kafka.tf|kafka.tf}} [88 KB]
\\
#= 1. Zerteilen des Textes in Registereinträge
#rv,kafka.tf,-std-,+,+,*
par {}
Trennzeichenfolgen zwischen Registereinträgen
tr | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;|
tr |<{0}/h1>|<{0}/p>|
Ersetzen von Zeichenfolgen im Sortierschlüssel
xs1 |ä|a|ö|o|ü|u|ß|ss|
xs2 |ä|z|ö|z|ü|z|ß|z|
Länge der Sortierschlüssel
ssl 20 20
*eof
#= 2. Sortieren der Registereinträge
#so,-std-,-std-,17+40,+
#= 3. Zusammenfassen gleicher Registereinträge
#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
ssl 20 20
Referenzlänge (6 für Seitennummer, 3 für Zeilennummer)
rfl 6 3
Ergänzung nach dem 1. Referenzteil
nrt |.|
*eof
\\
====== KWIC-Index zu lat. Verstext ======
- {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ KWIC = Key Word In Context (Roh-Konkordanz)\\ \\ **Musterdatei:**\\ {{files_open:daten:lukrez.tf|lukrez.tf}} [80 KB]
\\
#= 1. Zerteilen des Textes in Schlüsselwörter
#rv,lukrez.tf,-std-,k,+,*,-std-
par {}
Trennzeichenfolgen zwischen Schlüsselwörtern
swt | |,|;|.|:|!|\?|"| -|- |(|)|
Länge der Sortierschlüssel
ssl 20 0 0 40 0 0
*eof
#= 2. Sortieren der Schlüsselwörter
#so,-std-,-std-,17+60,+,17+60
#= 3. Erstellen des KWIC
#ra,-std-,-,k,+,*,-std-,-std-
Druckertyp
drt win-10
ssl 0
Referenzlänge (6 für Satznummer, 3 für Zeilennummer)
rfl 6 3
Ergänzung nach dem 1. Referenzteil
nrt |.|
Ergänzung vor und nach dem Schlüsselwort
vsw | |
nsw | |
*eof
#= 4. Ausgabe direkt auf Drucker (auf Bildschirm: ^#dr,,win-10,+)
#dr,,win-10
\\
► Ausgabe auf den Bildschirm auf MAC: **#dr,,mac-10,+**\\ \\ \\
====== KWIC-Index zu nhd. Text ======
- {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ KWIC = Key Word In Context (Roh-Konkordanz)\\ \\ **Musterdatei:**\\ {{files_open:daten:kafka.tf|kafka.tf}} [88 KB]\\
\\
#= 1. Zerteilen des Textes in Registereinträge
#rv,kafka.tf,-std-,k,+,*,-std-
par {}
Abschnittsanfang festlegen
aa ||
|
Trennzeichenfolgen zwischen Schlüsselwörtern
swt |<{0}/h1>|<{0}/p>|
swt | |,|;|.|:|!|\?|"| -|- |(|)|#.:|#.;|
Austauschen in den Sortierschlüsseln
xs1 |ä|a|ö|o|ü|u|ß|ss|
xs2 |ä|z|ö|z|ü|z|ß|z|
Länge der Sortierschlüssel
ssl 20 20 0 40 0 0
*eof
#= 2. Sortieren der Registereinträge
#so,-std-,-std-,17+80,+
#= 3. Erstellen des KWIC
#ra,-std-,-,k,+,*,-std-,-std-
ssl 20 20 0 40 0 0
Druckerausgabe
drt win-10
dr 1 0 100 0
Referenzlänge (6 für Seitennummer, 3 für Seitennummer)
rfl 6 3
Ergänzung nach dem 1. Referenzteil
nrt |.|
Ergänzung vor und nach dem Schlüsselwort
vsw | |
nsw | |
*eof
#= 4. Ausgabe auf Bildschirm
#dr,,win-10,+
► Ausgabe auf den Bildschirm auf MAC: **#dr,,mac-10,+**\\ \\
====== Wortformenliste mit Referenzen zu mhd. Verstext ======
- {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Vorbemerkung:** Im folgenden Skript sind die Buchstaben in der Reihenfolge des deutschen Alphabets sortiert, nicht in einer der für das Mittelhochdeutsche üblichen Sortierfolgen, wie sie z.B. dargelegt ist in Erwin Koller u.a., Mittelhochdeutsches Wörterbuch. Alphabetischer Index, Stuttgart: Hirzel 1990, S. ii, wo f- in Initialposition unter v-, y- unter i- und c- unter k- bzw. z- eingereiht erscheint, während c, f und v im Wortinneren auf ihrem alphabetischen Platz stehen. Das Skript müsste also noch der gewünschten Sortierfolge angepasst werden. Im Skript berücksichtigt ist allerdings die übliche Sortierfolge bei den Vokalen mit Akzent und den Ligaturen.\\ \\ **Musterdatei:**\\ {{files_open:daten:tristan.tf|tristan.tf}} [1 MB]
\\
#= 1. Zerteilen des Textes in Registereinträge
#rv,tristan.tf,-std-,+,+,*
Trennzeichen zwischen Registereinträgen
tr | |,|;|.|:|!|\?|(|)| -|- |"|'||#.ä|#.ö|%{%}||
Ersetzen von Zeichenfolgen in den Sortierschlüsseln
xs1 |ä|a|ö|o|ü|u|%{%}||#.ä|a|#.ö|o|
xs2 |ä|z2|â|z3|æ|z4|
xs2 |ö|z2|ô|z3|œ|z4|
xs2 |ü|z2|û|z3|
xs2 |%{%}{&a}|{-1=}z9|
Länge der Sortierschlüssel
ssl 20 20
*eof
#= 2. Sortieren der Registereinträge
#so,-std-,-std-,17+40,+
#= 3. Zusammenfassen gleicher Registereinträge
#ra,-std-,-,+,+,*
ssl 20 20
Druckausgabe (zweispaltig)
drt win-10
dr 2 2 35 5
Kopftext
kt |xxx Wortformenregister zu Gottfrieds "Tristan"|
Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer)
rfl 6 3
1. Referenzteil immer ausgeben
rtw 1
Ergänzung von führenden Nullen im 2. Referenzteil
--> Referenz = Versnr. (Bsp.: Satznr. 19.6 --> Versnr. 19006)
xrt 2 |{3}{\0}|{+0=}|{2}{\0}|0{+0=}|{\0}|00{+0=}|
*eof
#= 4. Ausgabe auf Bildschirm (direkt auf Drucker: ^#dr,,win-10)
#dr,,win-10,+
► Ausgabe auf den Bildschirm auf MAC: **#dr,,mac-10,+**\\ \\
====== Wortformenliste mit Referenzen zu frz. Text ======
\\ **Vorbemerkung:** Eine Besonderheit der französischen Sortierung besteht darin, dass die Buchstaben von links nach rechts, die **Akzente aber von rechts nach links**, also von hinten her sortiert werden: "La comparaison des caractères accentués se fait alors à l'envers **en commençant par la dernière lettre**". **Beispiel:** Von den beiden Wörtern "élève" und "élevé" wird nach dieser Regel "élève" **vor** "élevé" sortiert, weil das letzte e ohne Akzent Vorrang hat vor é. Die **Reihenfolge der Akzente** ist in der Norm NF Z 44-001 festgelegt.\\ \\ **1. Vorübung**\\ - [ wilhelmott | wilhelmott ]\\ \\ **Musterdatei:**\\ {{files_open:daten:dedale.tf|dedale.tf}} [4 KB]\\
\\ Die Musterdatei 'dedale.tf' enthält Reihen von Wörtern mit verschiedenen Akzenten (z.B. cote, côte, coté, côté), die mit dem folgenden Skript korrekt sortiert werden sollen. Eine einfache Kontrolle des Ergebnisses besteht darin zu prüfen, ob die Einträge aus der Seite 1 der Datei 'dedale.tf', die alle mindestens noch einmal weiter hinten in der Datei vorkommen, im Ergebnis in derselben Reihenfolge stehen wie in der Quelldatei; die übrigen Einträge aus den Seiten 2-4 müssen dazwischen einsortiert sein.\\
#an,dedale.tf
#da,reg,fr=-
#sv,dedale.tf,-std-,+,+,*
xs1 ~%{%}~~
xs1 ~%{%}{%}~~
Reihenfolge der Akzente nach NF Z 44-001
xs1 ~œ~oe~
xs2 ~%/~1z~
xs2 ~%\\~2z~
xs2 ~%<~3z~
xs2 ~%?~4z~
xs2 ~%:~5z~
xs2 ~%\*~6z~
xs2 ~%;~7z~
xs2 ~%{%}~8z~
xs2 ~#.{&a}~9z~
1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen
(und oben nicht "z1" sondern "1z" schreiben!)
rlf 0 1
ssl 20 20
*eof
#so,-std-,-std-,17+40,+
#ra,-std-,reg,+,+,*,pr=-
ssl 20 20
rfl 6 3
nrt |.|
*eof
\\ **2. Wortformenliste zu frz. Text**\\ - {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:figaro.tf|figaro.tf}} [4 KB]
\\
#rv,figaro.tf,-std-,+,+,*
par {}
mit ' abgekürzte Wörter (z.B. d'un) abrücken:
x |'|' |
Wort-Trennzeichen angeben, Akzente als Ausnahmen:
tr | |,|.|;|:|!|\?|(|)| -|- |/|#.;|#.:|#.<|#.>|
tr ||%{%}|%{%}{%}|#.{&a}||
Akzente für 1. Sortierschlüssel rauswerfen:
xs1 |%{%}||
xs1 |%{%}{%}||
Reihenfolge der Akzente nach NF Z 44-001
xs1 |œ|oe|
xs2 |%/|1z|
xs2 |%\\|2z|
xs2 |%<|3z|
xs2 |%?|4z|
xs2 |%:|5z|
xs2 |%\*|6z|
xs2 |%;|7z|
xs2 |%{%}|8z|
xs2 |#.{&a}|9z|
1. Sortierschlüssel normal (0), 2. Sortierschlüssel rückläufig (1) aufbauen
(und oben nicht "z1" sondern "1z" schreiben!)
rlf 0 1
ssl 20 20
*eof
#so,-std-,-std-,17+40,+
#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
par {}
ssl 20 20
rfl 6 3
nrt |.|
*eof
====== Wortformenliste mit Referenzen zu span. Text ======
- {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:guzman.tf|guzman.tf}} [132 KB]\\
\\ \\ **Vorbemerkung:** Die Buchstaben **ch, ll** und **ñ** wurden im Spanischen bis 2010 als **gesonderte Buchstaben** betrachtet und entsprechend bei der Sortierung **nach c bzw. l bzw. n aufgeführt**. Seit dem Erscheinen der "Ortografía de la lengua española" im Jahr 2010 wurde diese Regelung aufgegeben. Die Sortierung im folgenden Skript folgt nach der alten Regelung.\\ {{files_open:bilder:spanisch.jpg|spanisch.jpg}}\\
#rv,guzman.tf,-std-,+,+,*
par {}
mit ' abgekürzte Wörter (z.B. d'Alva) abrücken:
x |'|' |
Wort-Trennzeichen angeben, Akzente als Ausnahmen:
tr | |,|.|;|:|!|\?|(|)|\[|\]|-|#.;|#.:|#.<|#.>|¿|¡|
tr ||%{%}||
Akzente im 1. Sortierschlüssel entfernen
xs1 |%{%}||
xs1 |%{%}{%}||
Sonderregeln fürs Spanische:
xs1 |%\?n|^n|
xs1 |ch|^c|
xs1 |ll|^l|
Reihenfolge der Akzente nach NF Z 44-001
xs2 |%/|z1|
xs2 |%\\|z2|
xs2 |%<|z3|
xs2 |%\?|z4|
xs2 |%:|z5|
xs2 |%*|z6|
xs2 |%;|z7|
xs2 |%{%}|z8|
xs2 |%#.{&a}|z9|
ssl 20 20
a1 {|}abc^cdefghijkl^lmn^nopqrstuvwxyz
#so,-std-,-std-,17+40,+
#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
par {}
ssl 20 20
rfl 6 3
nrt |.|
*eof
\\
====== Wortformenliste mit Referenzen zu altgriech. Text ======
- [ MTrauth | MTrauth ]\\ \\ **Musterdatei:** Kap. 1-8 aus Platons Εὐθύφρων, erfasst nach: Platon, Euthyphron und Texte zur Religionskritik, Frings, U. (Hg.), Münster 1996, 4. Aufl. (ohne Garantie für Fehlerfreiheit)\\ \\ {{files_open:daten:euthyphron.tf|euthyphron.tf}} [32 KB]\\
\\ \\ \\ **Registerprogramm**: Die Datei "reggr.p" enthält das nachstehende Programm und kann für Testzwecke auf den eigenen Rechner heruntergeladen werden. Ein Kopieren und Einfügen der nachfolgenden Programmzeilen über die Zwischenablage des Betriebssystems führt zu einer Verdopplung der Codierungen, die ein "^" aufweisen. Diese Dopplungen müssen entfernt werden, bevor das Programm ausgeführt wird, da es sonst zu Fehlermeldungen kommt. Dieser Umweg kann durch den Download der Datei "reggr.p" eingespart werden.\\ \\ {{files_open:daten:reggr.p|reggr.p}} [4 KB]\\
\\ \\ **Vorbemerkung:** Die **Referenzen** sind die Satznummern der Quelldatei. Das Ergebnis wird mit dem Satzmakro ''#*satz'' aufbereitet und **zweispaltig** ausgegeben.\\
#an,euthyphron.tf
#da,index,fr=-
#rv,euthyphron.tf,-std-,+,+,*
par {}
* Definition aller Zeichen im Tagnamen:
>z1 ?{-}<>
* Definition der Vokale im Griechischen:
>vo aäeh^hiov^v
* Definition der Konsonanten im Griechischen:
>ks bgdzuüklmnjprswqtf^fxc
* unterschiedliche Schreibweisen von theta:
>th uü
* unterschiedliche Schreibweisen von sigma:
>sg swq
* unterschiedliche Schreibweisen von phi:
>ph f^f
x |<{00}{C:z1}>||
tr | |.|,|;|\?|!|
tr |"|^-|\[|\]|
tr |-|
tr ||%{%}|%{%}{%}||
* Graves auf der Schlußsilbe -> Akut
xx :%\\{C:vo}{0--0}{C:ks}{]}:%/{+3-4-}:
xx :%)\\{C:vo}{0--0}{C:ks}{]}:%)/{+4-5-}:
xx :%(\\{C:vo}{0--0}{C:ks}{]}:%(/{+4-5-}:
xs1 |ä|a|^h|h|^v|v|
* Sonderbehandlung der Akzente a) in XS1:
xs1 |%{%}{0}_||%{%}{%}{0}_||%{%}{%}{%}{0}_||
* Sonderbehandlung der Akzente b) in XS2:
xs2 |ä|av|^h|hv|^v|vv|
xs2 |%){0}_{&a}|{-1-}v01|
xs2 |%({0}_{&a}|{-1-}v02|
xs2 |%/{0}_{&a}|{-1-}v03|
xs2 |%\\{0}_{&a}|{-1-}v04|
xs2 |%{%}{0}_{&a}|{-1-}v05|
xs2 |%)/{0}_{&a}|{-1-}v06|
xs2 |%)\\{0}_{&a}|{-1-}v07|
xs2 |%){%}{0}_{&a}|{-1-}v08|
xs2 |%(/{0}_{&a}|{-1-}v09|
xs2 |%(\\{0}_{&a}|{-1-}v10|
xs2 |%({%}{0}_{&a}|{-1-}v11|
xs2 |%{%}{%}{0}_{&a}|{-1-}v12|
xs2 |%){%}{%}{0}_{&a}|{-1-}v13|
xs2 |%({%}{%}{0}_{&a}|{-1-}v14|
ssl 20 20
a1 : {|}abgdezh{c:th}iklmnjopr{c:sg}ty{c:ph}xcv
a2 : {|}aäbgdezh^huüiklmnjoprsqwtyf^fxcv^v
*eof
#so,-std-,-std-,17+40,+
#ra,-std-,index,+,+,*,pr=-
par {}
ssl 20 20
rfl 6 3
nrt |.|
vtt |$$$|
ntt | _ |
*eof
#*satz,index,s,A42
\\
====== Sachregister (einfach) ======
- {{files_open:benutzericons:schneider-lastin-lg.jpg?nolink&16x16|schneider-lastin}} schneider-lastin\\ \\ **Musterdatei:**\\ {{files_open:daten:schweiz.tf|schweiz.tf}} [8 KB]\\
\\ ► Die Registereinträge wurden mit #= 1. Herausziehen der Registereinträge
#rv,schweiz.tf,-std-,+,+,*
par {}
ea ||
ee | |
xs1 |ä|a|ö|o|ü|u|ß|ss|
xs2 |ä|az|ö|oz|ü|uz|ß|sz|
ssl 20 20
*eof
#= 2. Sortieren der Registereinträge
#so,-std-,-std-,17+40,+
#= 3. Zusammenfassen gleicher Registereinträge
#da,index,fr=-
#ra,-std-,index,+,+,*,prot=-
ssl 40
Referenzlänge (6 für die Seitennummer, 3 für die Zeilennummer)
rfl 6 3
Ergänzung nach dem 1. Referenzteil
nrt |.|
*eof
----
[[tustep:loesungen:start|Zurück zum Inhaltsverzeichnis - Lösungen und Tipps]]