Merge private git for latim grammar into official darcs.

See https://github.com/daherb/GF orhttps://gitlab.cip.ifi.lmu.de/langeh/gf 
for full git commit history
This commit is contained in:
Herbert Lange
2013-09-03 17:13:58 +00:00
parent d2ea52e0ec
commit 1f91d2287b
55 changed files with 52150 additions and 1606 deletions

View File

@@ -0,0 +1,39 @@
@grammar{BAYER-LINDAUER1994,
title = {Lateinische Grammatik},
editor = {Karl Bayer, Josef Lindauer},
publisher = {C.C. Buchners Verlag, J. Lindauer Verlag, R. Oldenburg Verlag},
year = {1994},
city = {Bamberg, M"unchen},
edition = {2. Auflage, auf der Grundlage der Lateinischen Schulgrammatik von Landgraf-Leitschuh neu bearbeitet}
}
@dictionary{LANGENSCHEIDT1981,
title = {Langenscheidts Schulw"orterbuch Lateinisch},
subtitle = {Lateinisch-Deutsch Deutsch-Latein},
edition = {14. Auflage},
editor = {Dr. Erich Pertsch, Dr. Ernst Erwin Lange-Kowal},
publisher = {Langenscheidt},
year = {1981},
city = {Berlin, M"uenchen, Wien, Z"urich}
}
@dictionary{PONS2012,
title = {Sch"ulerw"orterbuch Latein},
editor = {Anette Dralle, Walther Federking, Gregor Vetter},
publisher = {PONS GmbH},
year = {2012},
city = {Stuttgart},
subtitle = {Latein-Deutsch und Deutsch-Latein},
edition = {1. Auflage}
}
@book{RANTA2011,
author = {Aaarne Ranta},
title = {Grammatical Framework},
publisher = {CSLL Studies in Computational Linguistics},
year = {2011},
subtitle = {Programming with Multilingual Grammars},
city = {Stanford, California}
}

Binary file not shown.

View File

@@ -0,0 +1,227 @@
%\documentclass[handout]{beamer}
\documentclass{beamer}
%\usetheme{Singapore} % anderes Layout
%\usetheme{Antibes} % anderes Layout
%\usecolortheme{lily}
\usetheme{Antibes}
\usecolortheme{beaver}
\setbeamertemplate{footline}[frame number]
\usepackage{color}
\usepackage{german}
\usepackage{latexsym,amssymb}
\usepackage{amsmath} % für begin{cases} ... \end{cases}
%\usepackage[utf8]{inputenc}
%\usepackage[T1]{fontenc}
%\usepackage{algorithm}
%\usepackage{algorithmicx}
%\usepackage{algpseudocode}
\usepackage{multicol}
\usepackage{graphicx}
\usepackage{fontspec}
\setbeamertemplate{footline}[frame number]
\parindent0pt
\parskip1.2ex
\def\nat{{\mathbb N}}
\def\bool{{\mathbb B}}
\def\real{{\mathbb R}}
\title[Implementierung einer Lateingrammatik]{Implementierung einer Lateingrammatik im Grammatical Framework \\ \quad \\ \large Kolloquium Computerlinguistisches Arbeiten SS 2013 }
\author{Herbert Lange}
\date{\today}
\begin{document}
\frame{\titlepage}
\section*{Überblick}
\subsection*{Inhalt}
\begin{frame}{Inhalt}
%\begin{multicols}{2}
\tableofcontents
%\end{multicols}
\end{frame}
\section{Einführung}
\subsection{Das Grammatical Framework}
\begin{frame}[fragile]{Das Grammatical Framework}
\begin{itemize}
\item Mächtigkeit äquivalent zu PMCFG (Parallel Multiple Context-Free Grammars)
$\rightarrow$ zwischen mild und voll kontextsensitiv
\item Trennung von abstrakter und konkreter Syntax
\item Verschiedene API-Ebenen und Einbindungsmöglichkeiten (u.a. Java, JavaScript)
\end{itemize}
\end{frame}
\subsection{Die Ressource Grammar Library}
\begin{frame}{Die Ressource Grammar Library}
\begin{itemize}
\item Minimaler Satz gemeinsamer Bestandteile verschiedener Sprachen (Beispielvokabular, Wort-/Satzarten, Syntaxregeln)
\item ca. 38 Sprachen voll oder teilweise umgesetzt
\item ca. 43 geschlossene Kategorien (Determiner, ...) und Phrasentypen
\item ca. 22 offene Kategorien (Nomen, Verben, Adjektive, ...)
\end{itemize}
\end{frame}
\begin{frame}
\begin{block}{}
{\scriptsize\ttfamily
%> i alltenses/LangGer.gfo \\
% linking ... OK \\
% Languages: LangGer \\
% 47884 msec \\
Lang> p ''der Mann sieht die Frau'' \\
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (DetCN (DetQuant DefArt NumSg) (UseN man\_N)) (ComplSlash (SlashV2a see\_V2) (DetCN (DetQuant DefArt NumSg) (UseN woman\_N)))))) NoVoc
}
\end{block}
{\tiny
\begin{center}
\begin{tabular}{|l|l|l|l|}
\hline
Funktion & Typ & Argumente & Übersetzung\\
\hline
PhrUtt & Phr & (PConj) Utt (Voc) & der Mann sieht die Frau \\
NoPConj & PConj & & (Keine Konjunktion) \\
UttS & Utt & S & der Mann sieht die Frau \\
UseCl & S & (Temp) (Pol) Cl & der Mann sieht die Frau \\
TTAnt & Temp & Tense Ant & (Tempus und Aspekt) \\
TPres & Tense & & (Präsens) \\
ASimul & Ant & & (Gleichzeitigkeit) \\
PPos & Pol & & (Positive Aussage) \\
PredVP & Cl & NP VP & der Mann sehen die Frau \\
DetCN & NP & Det CN & der Mann \\
DetQuant & Det & Quant Num & der \\
DefArt & Quant & & der \\
NumSg & Num & & (Singular) \\
UseN & CN & N & Mann \\
man\_N & N & & Mann \\
ComplSlash & VP & VPSlash NP & sehen die Frau \\
%SlashV2a & VPSlash & V2 & sehen \\
%see\_V2 & V2 & & sehen \\
\multicolumn{4}{|c|}{...} \\
NoVoc & Voc & & (Keine Anrede) \\
\hline
\end{tabular}
\end{center}
}
\end{frame}
\subsection{Die Lateinische Sprache}
\begin{frame}[fragile]{Die Lateinische Sprache}
Teil der indogermanischen Sprachfamilie $\rightarrow$ Ähnlichkeiten zu germanischen Sprachen so wie dem Griechischen \\
\begin{center}
\begin{tabular}{|l|l|l|}
\hline
lateinisch & griechisch & deutsch \\
\hline
pater & patér & Vater \\
ager & agrós & Acker \\
trēs & treĩs & drei \\
decem & déka & zehn \\
est & estí & ist \\
\hline
\end{tabular}
\end{center}
Ursprünglich Sprache der Bewohner der mittelitalienischen Region Latium
\end{frame}
\begin{frame}{Sprachliche Besonderheiten}
\begin{itemize}
\item Sehr freie Satzstellung $\rightarrow$ aber meist Verwendung von Subjekt-Objekt-Verb
\item Flektierende Sprache mit synthetischer Syntax (Abl. abs. und AcI)
\begin{itemize}
\item Augusto regente pax erat in toto imperio romano $\rightarrow$ Als/weil Augustus regierte, herrschte im ganzen römischen Reich Frieden.
\item Imperatorem venire audit $\rightarrow$ Er hört, dass der Imperator kommt.
\end{itemize}
\item Ablativ und Vokativ als eigene Fälle
\item Fehlen von Artikel
\end{itemize}
\end{frame}
\section{Umsetzung}
\begin{frame}{Umsetzung}
\begin{itemize}
\item Lexikon der RGL
\item Morphologie der RGL
\item Syntax der RGL
\item Optional: rein sprachspezifische Konstrukte
\end{itemize}
\end{frame}
\subsection{Lexikon}
\begin{frame}{Lexikon}
\begin{itemize}
\item Ca. 400 vorgegebene englische Wörter aus allen möglichen Wortarten und verschiedenen Bereichen
\item Keine Klärung von Ambiguitäten (z.B. bank) $\rightarrow$ willkürliche Wahl der Übersetzung
\item Viele moderne Begriffe (Auto, Eisenbahn, Computer, Fernseher) $\rightarrow$ Übersetzung mit Hilfe der Wikipedia
\item Begriffe ohne auffindbare Übersetzung (ein-/ausschalten) $\rightarrow$ Wahl eines nahe liegenden Wortes (accendere/exstinguere)
\item Manche Differenzierungen nicht in jeder Sprache möglich
\end{itemize}
\end{frame}
\begin{frame}{}
\begin{block}{Beispiel}
{\scriptsize\ttfamily
blue\_A = mkA ( variants { ''caeruleus'' ; ''caerulus'' } ) ; -- 3 L... \\
boat\_N = mkN ''navicula'' ; -- -ae f. L... \\
book\_N = mkN ''liber'' ''libri'' masculine ; -- Ranta; -bri m. L... \\
boot\_N = mkN ''calceus'' ; -- -i m. L... \\
boss\_N = mkN ''dux'' ''ducis'' ( variants { feminine ; masculine } ) ; -- ducis m./f. L... \\
boy\_N = mkN ''puer'' ''pueri'' masculine ; -- -eri m. L... \\
bread\_N = ( variants { (mkN ''panis'' ''panis'' masculine ) ; mkN ''pane'' } ) ; -- -is m./n. L... \\
break\_V2 = mkV2 (mkV ''rumpo'' ''rupi'' ''ruptum'' ''rumpere'') ; -- Ranta; 3 L...
}
\end{block}
\end{frame}
\subsection{Morphologie}
\begin{frame}{Morphologie}
\begin{itemize}
\item Einteilung in vier Gruppen: Nomina (Substantive, Adjektive, Pronomina, Numeralia), Verben, Partikel (Adverbien, Präpositionen, Konjunktionen), Interjektionen. Es gibt keine Artikel
\item Nomina und Verben werden flektiert, Partikel und Interjektionen werden nicht flektiert
\item Fünf Nomendeklinationen, drei Adjektivdeklinationen, Adjektivkomparation, Adverbbildung, vier Verbkonjugationen, Deponentia
\end{itemize}
\end{frame}
\begin{frame}{Smart Paradigms}
Pattern Matching um für ein Wort aus möglichst wenig Formen das Paradigma zu bestimmen
\begin{block}{Beispiel}
{\scriptsize\ttfamily
noun : Str -> Noun = \textbackslash verbum -> \\
case verbum of \{ \\
\_ + ''a'' => noun1 verbum ; \\
\_ + ''us'' => noun2us verbum ; \\
\_ + ''um'' => noun2um verbum ; \\
\_ + ''er'' => noun2er verbum ; \\
\_ + ''u'' => noun4u verbum ; \\
\_ + ''es'' => noun5 verbum ; \\
\_ => noun3 verbum \\
\} ;
}
\end{block}
\end{frame}
\subsection{Syntax}
\begin{frame}{Syntax}
\begin{itemize}
\item Problem: Freie Wortstellung im Satz $\rightarrow$ Variationen erhöhen die Komplexität exponentiell
\item Zunächst: Beschränkung auf SOV-Wortstellung (Subjekt-Objekt-Verb)
\item Später: Suche nach performanten Implementierungsmöglichkeiten für beschränkte oder volle Variation
\end{itemize}
\end{frame}
\subsection{Ausblick}
\begin{frame}{Ausblick}
\begin{itemize}
\item Anbinden eines größeres Lexikons
\item Integration in eine Weboberfläche oder eine Android-App
\item Anwendung in der Lehre (Translation Quiz)
\end{itemize}
\end{frame}
\section{Abschluss}
\begin{frame}{Zusammenfassung}
\begin{itemize}
\item Lexikon mit ca. 400 teils modernen Wörtern
\item Morphologie mit Smart Paradigms
\item Syntax mit möglichst freier Wortstellung
\end{itemize}
\end{frame}
\begin{frame}{Literatur}
\begin{itemize}
\item Bayer, Karl u. Lindauer, Josef: Lateinische Grammatik, C.C. Buchners Verlag, Bamberg 1994
\item Leuman, M./Hofmann, J.B./ Szantyr, A.: Lateinische Grammatik. Auf der Grundlage des Werkes von Friedrich Stolz und Joseph Hermann Schmalz; Band 2: Lateinische Syntax und Stilistik, C.H. Beck'sche Verlagsbuchhandlung, München 1972
\item Ranta, Aarne: Grammatical Framework. Programming with Multilingual Grammars, CSLI Publications, Stanford 2011
\item Ranta, Aarne: Grammatical Framework Tutorial, http://www.grammaticalframework.org/doc/tutorial/gf-tutorial.html 2010
\end{itemize}
\end{frame}
\end{document}

Binary file not shown.

View File

@@ -0,0 +1,152 @@
\documentclass[draft,11pt]{scrartcl}
%\usepackage[utf8]{inputenc}
\usepackage[onehalfspacing]{setspace}
\usepackage[ngerman]{babel}
\usepackage{fontspec}
\usepackage[a4paper, left=3cm, right=3cm, top=3cm]{geometry}
\usepackage{amsmath}
\usepackage{qtree}
\usepackage{listings}
\usepackage{floatrow}
\usepackage{capt-of}
\floatstyle{plain}
\newfloat{program}{thp}{lop}
\floatname{program}{Beispiel}
\lstdefinelanguage{gf}
{
morekeywords={abstract, flags, cat, fun, concrete, of, lincat, lin},
sensitive=false,
morecomment=[l]{--},
morestring=[b]"
}
\lstset{language=gf}
\begin{document}
\setcounter{tocdepth}{3}
\date{30.9.2013}
\makeatletter
\begin{titlepage}
\begin{center}
\vspace{4cm}
\begin{huge}
Hausarbeit \\
zur Erlangung des Magistergrades \\
an der Ludwig-Maximilians-Universität München
\end{huge} \\[3cm]
{\Huge Erstellen einer Lateingrammatik im Grammatical Framework} \\[6cm]
{\LARGE vorgelegt von Herbert Lange} \\[5cm]
\end{center}
\parindent0mm
\begin{huge}
Fach: Computerlinguistik \\[0.3cm]
Referent: Prof. Dr. Klaus U. Schulz \\[0.3cm]
München, den \@date
\end{huge}
\end{titlepage}
\makeatother
\tableofcontents
\pagebreak
\section{Einleitung}
\subsection{Motivation}
So mancher, der den Titel dieser Arbeit liest, wird sich wundern, warum man in der heutigen Zeit eine computergestützte Grammatik gerade für eine tote Sprache wie Latein entwickeln will. Doch die konkrete Sprache, die umgesetzt werden sollte, war bei der Wahl des Themas zunächst zweitrangig. Die Intention hinter dieser Arbeit war es eher, einmal in einem konkreten Falle die im Studium behandelten Theorien der Morphologie und der Syntax, aber auch die Prinzipien der Lexikonerstellung, in einem einheitlichen Projekt zusammenzuführen. \\
Das fuer dieses Unterfangen am ehesten geeignete Softwaresystem schien schon sehr bald das Grammatical Framework\footnote{http://www.grammaticalframework.org/} zu sein. Es stellt alle benötigten Hilfsmittel zur Verfügung, die jeweils für die einzelnen Komponenten benötigt werden, sorgt aber auch durch einen einheitlichen Beschreibungsformalismus für die nötige Konsistenz zwischen allen Bestandteilen. Weitere Vorteile des Grammatical Frameworks sind der mächtige Beschreibungsformalismus für Grammatiken, Unterstützung für Multilingualität und aktive Entwicklung als Open Source-Software. \\
Nachdem sich das Grammatical Framework als geeignet heraus gestellt hatte, fiel die Wahl der zu bearbeitenden Sprache auf Latein, da diese Sprache, die trotz ihres Alters in der Linguistik weiterhin nicht unbedeutend ist, in der Ressource Grammar Library\footnote{http://www.grammaticalframework.org/lib/doc/synopsis.html} bisher nur sehr rudimentär umgesetzt war. \\
\subsection{Inhalt}
Im Folgenden sollen zunächst die Grundlagen der Arbeit genauer geschildert werden, es folgt also eine genauere Betrachtung des Grammatical Framework so wie der lateinischen Sprache. Anschließend wird das Vorgehen bei der Implementierung der Grammatik als zukünftiger Bestandteil der Ressource Grammar Library geschildert werden. Und zum Schluss soll noch eine Betrachtung der Erweiterungs- und Anwendungsmöglichkeiten folgen.
\subsection{Das Grammatical Framework}
Das Grammatical Framework ist ein Softwaresystem mit einer spezialisierten Programmiersprache um Grammatiken zu entwickeln. Es bietet die nötigen Möglichkeiten um natürliche Sprachen zu verarbeiten. Dabei benutzt es Formalismen, wie sie auch in modernen funktionalen Programmiersprachen wie Haskell zu finden sind.\footnote{RANTA S. vii} \\
Die große Stärke dabei ist die Multilingualität. Grundkonzept dabei ist die Trennung in eine konkrete und eine abstrakte Repräsentation der Grammatik. Dabei ist die konkrete repräsentation jeder Sprache eigen während die abstrakte Repräsentation von mehreren Sprachen geteilt werden kann. Über diesen Schritt der abstrakten Repräsentation kann man eine Übersetzung zwischen allen Sprachen umsetzen, die diese abstrakte Syntax teilen.\footnote{RANTA S. 10ff.} Im folgenden soll darauf noch genauer eingegangen werden.
\subsubsection{Der Grammatikformalismus}
Meist werden im Bereich der Computerlinguistik und Informatik kontextfreie Grammatiken, also Grammatiken von Typ 2 der Chomsky-Hierarchie verwendet.\footnote{quelle} Dies hat meist den Grund, dass die Ausdrucksmächtigkeit größtenteils ausreicht, jedoch der Verarbeitungsaufwand vergleichsweise gering ist.\footnote{quelle}
\begin{program}[h]
\begin{flushleft}
$S\ \longrightarrow\ NP\ \ VP$ \\
$NP\ \longrightarrow\ Det\ N$ \\
$N\ \longrightarrow\ \text{Mann}$ \\
$Det\ \longrightarrow\ \text{der}$ \\
$VP\ \longrightarrow\ V$ \\
$V\ \longrightarrow\ \text{schläft} $ \\
\end{flushleft}
\caption{Kontextfreie Grammatikfragment}
\label{CFG-Beispiel}
\end{program}
Die in Beispiel \ref{CFG-Beispiel} gegebene Grammatik ist ein sehr minimalistisches Beispiel für eine kontextfreie Grammatik. Mit ihrer Hilfe kann nur der eine deutsche Satz \textit{Der Mann schläft} hergeleitet werden. Dabei hat die Ableitung die in Beispiel \ref{CFG-Ableitung} gezeigte Form.
\begin{figure}
\begin{floatrow}[2]
\ffigbox{
\begin{flushleft}
S \\ $\Rightarrow$ NP VP \\ $\Rightarrow$ Det N VP \\ $\Rightarrow$ ``der'' N VP \\ $\Rightarrow$ ``der Mann'' VP \\ $\Rightarrow$ ``der Mann'' V \\ $\Rightarrow$ ``der Mann schläft''
\end{flushleft}
}{\caption{Ableitung eines Satzes}\label{CFG-Ableitung}}
\ffigbox{\Tree [.S [.NP [.Det ``der'' ] [.N ``Mann'' ] ] [.VP [.V ``schläft'' ] ] ]}{\caption{Entsprechender Syntaxbaum}\label{CFG-Syntaxbaum}}
\end{floatrow}
\end{figure}
Im Formalismus des Grammatical Framework wird die oben gegebene Grammatik in die abstrakte und die konkrete Syntax zerlegt.
Dabei entspricht die abstrakte Syntax dem Syntaxbaum ohne die terminalen Blätter.
\begin{minipage}{0.5\textwidth}
\begin{verbatim}
abstract Satz = {
flags startcat = S ;
cat S ; NP ; VP ; Det ; N ; V ;
lin
mkNP : Det -> N -> NP ;
mkVP : V -> VP ;
mkS : NP -> VP -> S ;
der_Det : Det ;
Mann_N : N ;
schlafen_V : V ;
}
\end{verbatim}
\captionof{program}{Abstrakte Syntax}
\end{minipage}
\begin{minipage}{0.45\textwidth}
\begin{verbatim}
concrete Satz of SatzAbs = {
lincat S,NP,VP,Det,N,V = Str;
lin
mkNP det n = det ++ n ;
mkVP v = v ;
mkS np vp = np ++ vp ;
der_Det = "der" ;
Mann_N = "Mann" ;
schlafen_V = "schlaeft" ;
}
\end{verbatim}
\captionof{program}{Konkrete Syntax}
\end{minipage}
\subsubsection{Die Ressource Grammar Library}
Was für allgemeine Programmiersprachen eine Standardbibliothek ist, ist im Grammatical Framework für die Multilingualität die Ressource Grammar Library. Sie ist definiert als gemeinsame abstrakte Syntax, die für verschiedenen Sprachen implementiert ist. Auf diese Möglichkeit ist eine grundlegende Übersetzung zwischen den unterstützten Sprachen direkt nach der Installation möglich. Meist muss jedoch mindestens das nötige Vokabular angegeben werden, da das Lexikon auf eine kleine Anzahl von Wörtern beschränkt ist, die benötigt wird um die grammatischen Konstrukte zu testen. \\
\subsection{Die Lateinische Sprache}
\subsubsection{Sprachwissenschaftliche Einordnung}
Die lateinische Sprache gehört zur indogermanische Sprachfamilie und dort zur Unterfamilie der italischen Sprachen. Entstanden ist es als ein in der Stadt Rom üblicher Dialekt parallel zu weiteren ländlichen Dialekten im Latium, im laufe der Zeit verdrängte es jedoch die weiteren italischen Sprachen im Zuge der Ausdehnung des römischen Reichs.\footnote{METZLER2004 S. 5359} Die Sprachgeschichte kann in mehrere Epochen unterteilt werden, nämlich das Altlatein, das klassische Latei, das Mittellatein (ca. 650 n. Chr. bis ca. 1400 n. Chr.) und das Neulatein (ca. 1400 n. Chr. bis heute).\footnote{MÜLLER-LANCE2006 S. 27ff.} Auch heute noch am bedeutendsten ist wohl das klassische Latein, das weiterhin in Schulen unterrichtet wird und vor allem mit seinem großen überlieferten Textkorpus hervorsticht. \\
Latein gehört zu den stark flektierenden Sprachen. Es gibt fünf zum teil genusbasierte Flektionsklassen für Nomen, sechs Verschiedene Kasus (Nominativ, Genitiv, Dativ, Akkusativ, Ablativ und Vokativ), drei Genera (Maskulin, Feminin, Neutrum), ein voll flektierendes Pronomensystem und vier relativ stark synthetische Deklinationsklassen für Verben.\footnote{METZLER2004 S. 5359} Zu den Kasus sei anzumerken, dass der Ablativ ein eigenständiger Kasus ist, jedoch der Vokativ oft mit dem Nominativ zusammenfällt.\footnote{???} \\
Die Wortstellung des Lateinischen wird oft als sehr frei beschrieben, allerdings gibt es eine klare Präferenz der SOV-Wortstellung im Satz, also dass das Objekt des Satzes direkt auf das Subjekt folgt, und das Verb den Satz abschließt. Die position des Adjektivs im Bezug auf das Nomen ist allerdings wirklich recht frei.\footnote{METZLER2004 s. 5359}
\subsubsection{Bedeutung in der heutigen Zeit}
Man kann sich natürlich über die Notwendigkeit streiten, sich in der heutigen Zeit noch mit der lateinischen Sprache zu beschäftigen. Es gibt aber auch ziemlich gute Gründe dafür Latein nicht einfach nur als tote Sprache abzustempeln und nicht weiter zu betrachten. \\
So gibt es verschiedenste Personengruppen, für die Lateinkenntnis von Vorteil ist.
\section{Grammatikerstellung}
\subsection{Lexikon}
Den Beginn dieser Grammatikimplementierung bildete die Erstellung des minimal nötigen Lexikons. Durch die abstrakte Syntax der RGL\footnote{vgl. lib/src/abstract/Lexicon.gf} eine Liste von ca. 400 englischen Bezeichnern für Worte vorgegeben, die in jeder Sprache umgesetzt werden sollten. \\
Um für das vorgegebene Vokabular die passenden lateinischen Entsprechungen zu finden, wurde verschiedene Vorgehensweisen angewandt. \\
Für die meisten englischen Begriffe war es zunächst problemlos möglich, deutsche Entsprechungen zu finden. Bei problematischeren Begriffen wurde ein verbreitetes Onlinewörterbuch\footnote{http://dict.leo.org} zu Rate gezogen. Somit war es für fast alle vorgegebenen Begriffe möglich, eine adequate deutsche Übersetzung zu finden. Die einzige Art von Wörtern, die weiterhin zu Problemen führten, waren Wörter mit ambiger Bedeutung, wie das häufig gezeigte Wort \textit{bank}, das in vielen Sprachen mehrer verschiedene Bedeutungen haben kann, z.B. im Deutschen als Sitzgelegenheit und als Geldinstitut oder im Englischen ebenfalls als Geldinstitut oder als Flussufer.\footnote{} Für diesen und ähnliche Begriffe wurde willkürlich eine plausible Bedeutung gewählt, da keine Hinweise zur gewünschten Bedeutung in der Grammar Library gefunden werden konnte. Die Entscheidung eine einzige Bedeutung zu wählen, und nicht verschiedene Bedeutungen als Varianten des Wortes zu implementieren, wurde getroffen um die Anzahl der möglichen Übersetzungen möglichst gering zu halten. \\
Nachdem für alle Bezeichner im abstrakten Lexikon eine zwischenzeitliche deutsche Entsprechung, nach dem obigen Schema, gefunden wurde, wurde versucht, diese deutschen Begriffe in die lateinische Sprache zu übersetzen. Dies geschah zum größten Teil mit Hilfe des deutsch-lateinischen Teils des Standardwörterbuchs\footnote{Langenscheidt}, soweit ein entsprechender Eintrag im diesem Wörterbuch zu finden war. Zusätzlich zu den recht kurzen Einträgen in diesem Teil des Wörterbuch, wurden auch alle weiteren vefügbaren Informationen zu den gefundenen lateinischen Begriffen berücksichtigt. \\
Bei vielen, meist moderneren Begriffen, konnte nicht immer ein entsprechender Wörterbucheintrag gefunden werden. Wenn auch in anderen verfügbaren Wörterbüchern\footnote{PONS} kein Eintrag zu finden war, gab es noch die Möglichkeit, auf Internetquellen zurückzugreifen, die meist auf dem Prinzip der freiwilligen Kollaboration basieren. Eine der interessantes Quelle für moderne Begriffe aus dem Breich der Substantive ist wohl die lateinische Wikipedia\footnote{http://la.wikipedia.org/wiki/Pagina\_prima}. Obwohl Latein als tote Sprache gilt, existieren dort über 90000 lateinische Artikel\footnote{http://la.wikipedia.org/wiki/Specialis:Census; Stand: 30.7.2013}. Natürlich muss man immer bedenken, dass es keine Garantie für die Qualität von kollaborativen Onlinequellen gibt.
\subsubsection{Geschlossene Kategorien}
\subsubsection{Offene Kategorien}
\subsubsection{Ausnahmen}
\subsection{Morphologie}
\subsubsection{Nomenflektion}
\subsubsection{Verbdeklination}
\subsubsection{Pronomen}
\subsubsection{Ausnahmen}
\subsection{Syntax}
\subsubsection{Nominalphrasen}
\subsubsection{Verbalphrasen}
\subsubsection{Einfache Sätze}
\subsection{Anwendungen und Ausblick}
\section{Ausblick}
\end{document}

View File

@@ -0,0 +1,6 @@
Lateinisch
(lingua latina. Engl. Latin, frz. latin) Als Erstsprache ausgestorbene idg. Spr., Vorläufer der roman. Spr.n. Mit der lat. Sprache und Literatur beschäftigt sich die Latinistik. Das L. gehört zur Gruppe der italischen Sprachen. Es war ursprüngl. der Stadtdialekt des antiken Rom, umgeben von weiteren eng verwandten, stärker ländl. Dialekten des heutigen Latium. Mit dem Aufstieg Roms gewann das L. gegenüber den anderen ital. Spr. an Bedeutung und verdrängte diese schließlich vollkommen. Seit dem 6. Jh. v.u.Z. schriftl. belegt (Fibel von Praeneste). Das L. stand bis ins 2. Jh. v.u.Z. stark unter griech. Einfluß; erst mit der polit. Festigung Roms entstand auch die kulturelle Eigenständigkeit. Unter Altlatein (archaisches Lat.) versteht man die Zeit von den ältesten Inschriften bis zum Beginn der klass. Periode im 1. Jh. v.u.Z. Dazu zählen Schriftsteller wie Livius Andronicus (v.a. dessen Übersetzungen aus dem Griech.), Plautus (Theater), Naevius (ep. Dichtung), Ennius (Gedichte). Der sozioling. Status des klass. L. ist umstritten; es ist wesentlich durch die Schriftsteller der klass. Periode (1. Jh. v.u.Z. bis ins 2. Jh.u.Z.) belegt (Cicero, Caesar, Vergil, Horaz). Seine tatsächliche mündl. Verwendung war jedenfalls diastrat. sehr beschränkt; das klass. Lat. galt aber bis ins 5. Jh. als schriftl. Norm. Es wird heute allgemein angenommen, daß das sog. Vulgärlatein nicht nur postklass., sondern als Sprechlatein bereits während der klass. Periode die Volkssprache darstellte und somit nicht eine Degeneration der Klassik, sondern vielmehr deren parallele Weiterentwicklung ist. Die zahlreichen vorröm. Spr. (z.B. Etruskisch, Venet., Lepont.) des röm. Reiches haben den lat. Wortschatz beeinflußt [»Reliktwörter«, z.B. persona, taberna). Das Vulgärlat. war ein sehr inhomogenes sprachl. Gebilde, beeinflußt je nach Ort und Zeit seiner Verwendung. Es umfaßt alle Varianten von der Umgangssprache Roms bis zum Regionallatein der Provinzen. In postklass. Epoche setzt sich stärker das Vulgärlat. durch und bildet weitgehend die Grundlage der roman. Spr.n. Die mittelalterl. Varietäten wie Mönchslat. oder Kirchenlat. stehen in nur einem sektoriellen Gebrauchszusammenhang mit der antiken Spr., ebenso das Gelehrtenlat. des Mittelalters bis ins 16./17. Jh. (Humanistenlat.). Eine einigermaßen homogene Sprachgemeinschaft dürfte nur für die frühen Phasen (bis zum Beginn der Expansion durch den 1. Pun. Krieg) anzunehmen sein, wiewohl zu dieser Zeit die Vormachtstellung gegenüber den anderen ital. Spr. noch nicht endgültig gefestigt ist. - Phonologie: Fünfvokalsystem /i, e, u, o, a/ mit Quantitätsunterschied [± lang]; quantitätssensitives Akzentsystem ( Dreimorengesetz); silben- bzw. morenzählend, von antiken Grammatikern (nach griech. Vorbild) als tonal beschrieben (unwahrscheinlich); schon früh Verlust der Vokalquantität und der Morenphonologie, häufige Vokalelisionen, Diphthongierungen, Ausfall von /h-/, /-m/, /-s/ (z.T. restituiert). Morphologie: in den meisten Bereichen stark flektierend; 5 Flexionsklassen (z.T. genusbasiert), 6 Kasus (Nom., Vok., Gen., Dat., Akk., Abl.), 3 Genera (m., f., n.); voll dekliniertes Pronominalsystem; 4 Konjugationsklassen mit stark synthet. Charakter. Morpholog. Veränderungen in der postklass. Epoche vor allem durch neue periphrast. (analyt.) Bildungen ( coniugatio periphrastica), Neutralisierung und Abbau von Kategorien (z.B. Kasus- und Genussystem), analogischer und paradigmat. Ausgleich (z.B. volo - vis - vult - volumus - vultis - volunt statt *voleo - *voles - *volet - *volemus - *voletis - *voleunt). Syntax: Nullsubjektssprache; entgegen der häufig geäußerten Annahme von freier Wortstellung gibt es eindeutige Präferenz von SOV-Stellung, Adjektivposition zum Nomen relativ frei; nicht konfigurational. Auch in der Syntax im Übergang zum postklass. Latein wesentl. Änderungen: SOV > SVO; Herausbildung des Artikels aus Demonstrativa (6. Jh.), Konfigurationalität; Entstehung des periphrast. Konditionals, Festlegung der Adjektivposition als NA, Grammatikalisierung des Präpositionalsystems u.a. Viele Änderungen beginnen allerdings bereits in klass. Zeit (z.B. der sog. Quantitätenkollaps mit seinen weitreichenden Folgen). Die späteren purist. Tendenzen - vgl. die Antibarbari wie den Appendix des Probus -scheinen, wie die Entwicklung der roman. Spr. zeigt, relativ erfolglos geblieben zu sein. Die exakte Chronologie der einzelnen Wandelerscheinungen ist jedoch nicht immer unumstritten.
Lit. L.R. Palmer, The Latin Language. London 1961. - A. Meillet, Esquisse d'une histoire de la langue latine. Paris 1948. - F. Stolz & A. Debrunner, Geschichte der lat. Spr. Bln. 1953. - C.H. Grandgent, An Introduction to Vulgar Latin. Boston 1907. - F. Stolz & J.H. Schmalz, Lat. Grammatik. Mchn. 1928. - F. Sommer, Hdb. der latein. Laut- und Formenlehre (hg. von R. Pfister). Heidelberg 1977.HU
[Lexikon Sprache: Lateinisch. Metzler Lexikon Sprache, S. 5359 (vgl. MLSpr, S. 397 ff.) (c) J.B. Metzler Verlag]

1010
lib/src/latin/doc/qtree.sty Normal file

File diff suppressed because it is too large Load Diff

Binary file not shown.

View File

@@ -0,0 +1,711 @@
%\documentclass[handout]{beamer}
\documentclass{beamer}
%\usetheme{Singapore} % anderes Layout
%\usetheme{Antibes} % anderes Layout
%\usecolortheme{lily}
\usetheme{Antibes}
\usecolortheme{beaver}
\setbeamertemplate{footline}[frame number]
\usepackage{color}
\usepackage{german}
\usepackage{latexsym,amssymb}
\usepackage{amsmath} % für begin{cases} ... \end{cases}
%\usepackage[utf8]{inputenc}
%\usepackage[T1]{fontenc}
%\usepackage{algorithm}
%\usepackage{algorithmicx}
%\usepackage{algpseudocode}
\usepackage{multicol}
\usepackage{graphicx}
\usepackage{fontspec}
\usepackage{url}
\usepackage{fancyvrb}
\setbeamertemplate{footline}[frame number]
\setbeamerfont{example script}{size=\scriptsize}
\setbeamerfont{example tiny}{size=\tiny}
\parindent0pt
\parskip1.2ex
\def\nat{{\mathbb N}}
\def\bool{{\mathbb B}}
\def\real{{\mathbb R}}
\title[The Latin Language Ressource Grammar]{The Latin Language Ressource Grammar\\\quad \\ \small{ GF Summer School, Frauenchiemsee 2013 }}
\author{Herbert Lange\\Centrum für Informations- und Sprachverarbeitung\\München}
\date{\today}
\begin{document}
\frame{\titlepage}
\section{The Latin RG}
\begin{frame}
\tableofcontents
\end{frame}
\subsection{Current Status}
\begin{frame}[fragile]{Current Status}
%\begin{example}[fontsize=\small]{Changes in the files}
\begin{Verbatim}[fontsize=\tiny,commandchars=\\\{\}]
lib/src/latin/AdjectiveLat.gf | 14 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/AdverbLat.gf | 4 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/AllLat.gf | 4 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/AllLatAbs.gf | 10 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/CatLat.gf | 69 \textcolor{green}{++}\textcolor{red}{---}
lib/src/latin/ConjunctionLat.gf | 37 \textcolor{green}{++}\textcolor{red}{-}
lib/src/latin/ExtraLat.gf | 8 \textcolor{green}{+}
lib/src/latin/ExtraLatAbs.gf | 5 \textcolor{green}{+}
lib/src/latin/GrammarLat.gf | 5 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/IrregLat.gf | 631 \textcolor{green}{+++++++++++++++++++++++++++++++}\textcolor{red}{-------------}
lib/src/latin/IrregLatAbs.gf | 11 \textcolor{green}{+}
lib/src/latin/LangLat.gf | 2 \textcolor{green}{+}
lib/src/latin/LexiconLat.gf | 752 \textcolor{green}{++++++++++++++++++++++++++}\textcolor{red}{--------------------------}
lib/src/latin/MorphoLat.gf | 800 \textcolor{green}{++++++++++++++++++++++++++++++++++++++++++}\textcolor{red}{-------------}
lib/src/latin/NounLat.gf | 92 \textcolor{green}{++++}\textcolor{red}{---}
lib/src/latin/ParadigmsLat.gf | 63 \textcolor{green}{++++}\textcolor{red}{-}
lib/src/latin/PhraseLat.gf | 24 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/ResLat.gf | 1223 \textcolor{green}{++++++++++++++++++++++++++++++++++++++++++++++++++++++++}
\textcolor{red}{-----------------------------}
lib/src/latin/SentenceLat.gf | 22 \textcolor{green}{+}\textcolor{red}{-}
lib/src/latin/StructuralLat.gf | 226 \textcolor{green}{++++++++}\textcolor{red}{--------}
lib/src/latin/VerbLat.gf | 13 \textcolor{green}{+}\textcolor{red}{-}
21 files changed, 2610 insertions(+), 1405 deletions(-)
\end{Verbatim}
%\end{example}
\end{frame}
\subsection{Lexicon}
\begin{frame}[fragile]{Lexicon}
\begin{itemize}
\item All strings replaced by (more or less) appropriate Latin translations
\item Some words only translatable by phrases (e.g. camera\_N, travel\_V) $\Rightarrow$ Create phrases and wrap them up as a noun or verb $\Rightarrow$ Works fine for CN but not so well for VPs
\item Discovered all kinds of irregular word forms in the lexicon (e.g. deponent verbs, defective verbs, plural only nouns) $\Rightarrow$ Motivation to implement as much of the morphology as possible
\item Challenge to implement modern words (airplane\_N, train\_N, ...) $\Rightarrow$ Wikipedia as a useful source for translations
\end{itemize}
\end{frame}
\begin{frame}[fragile]{Examples from the Lexicon}
\begin{example}{Excerpt from the Lexicon\footnote{LexiconLat.gf}}
\begin{Verbatim}[fontsize=\tiny,commandchars=\\\{\}]
lin
[...]
camera_N =
ResLat.useCNasN (AdjCN (PositA (mkA "photographicus") )
(UseN (mkN "machina" ) )
) ; -- (http://la.wikipedia.org/wiki/Machina_photographica / Pons)
[...]
train_N = mkN "hamaxostichus" ; -- -i m. (http://la.wikipedia.org/wiki/Hamaxostichus)
travel_V =
ResLat.useVPasV ( ComplSlash ( SlashV2a ( mkV2 "facere" ) )
( DetCN ( DetQuant IndefArt NumSg )
( UseN ( mkN "iter" "itineris" Neutr ) )
)
) ; -- facio, feci, factum 3
[...]
science_N = pluralN (mkN "litera" ) ; -- only pl. (Langenscheidts)
\end{Verbatim}
\end{example}
\end{frame}
\subsection{Morphology}
\begin{frame}{Morphology}
\begin{itemize}
\item Trying not to use sound laws
\item Morphology for Nouns, Adjectives, Verbs and Personal/Possesive Pronouns
\item Smart Paradigms as smart as possible
\end{itemize}
\end{frame}
\begin{frame}[fragile]{Noun Morphology}
\begin{itemize}
\item Six Cases (but mostly Nominative and Vocative have the same form)
\item Two Number categories \\
$\Rightarrow 6x2 = $ 12 Forms
\item Five Declension classes
\end{itemize}
\begin{example}{Noun type and parameters\footnote{ResLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
param
Case = Nom | Acc | Gen | Dat | Abl | Voc ;
Gender = Masc | Fem | Neutr ;
oper
Noun : Type = {s : Number => Case => Str ; g : Gender} ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{Smart paradigm}
\begin{example}{Smart paradigm\footnote{MorphoLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}[label=Smart paradigm,fontsize=\scriptsize]
noun : Str -> Noun = \verbum ->
case verbum of {
_ + "a" => noun1 verbum ;
_ + "us" => noun2us verbum ;
_ + "um" => noun2um verbum ;
_ + ( "er" | "ir" ) =>
noun2er verbum ( (Predef.tk 2 verbum) + "ri" ) ;
_ + "u" => noun4u verbum ;
_ + "es" => noun5 verbum ;
_ =>
Predef.error
("3rd declinsion cannot be applied to just
one noun form " ++ verbum)
} ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{Smart paradigm}
\begin{example}{Smart paradigm\footnote{MorphoLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}[label=Smart paradigm,fontsize=\scriptsize]
noun_ngg : Str -> Str -> Gender -> Noun = \verbum,verbi,g ->
let s : Noun = case <verbum,verbi> of {
<_ + "a", _ + "ae"> => noun1 verbum ;
<_ + "us", _ + "i"> => noun2us verbum ;
<_ + "um", _ + "i"> => noun2um verbum ;
<_ + ( "er" | "ir" ) , _ + "i"> => noun2er verbum verbi ;
<_ + "us", _ + "us"> => noun4us verbum ;
<_ + "u", _ + "us"> => noun4u verbum ;
<_ + "es", _ + "ei"> => noun5 verbum ;
_ => noun3 verbum verbi g
}
in
nounWithGen g s ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]
\begin{example}{Paradigm of friend\_N}
\usebeamerfont{example script}
\begin{multicols}{2}
\begin{Verbatim}
Lang> l -table friend_N
s Sg Nom : amicus
s Sg Acc : amicum
s Sg Gen : amici
s Sg Dat : amico
s Sg Abl : amico
s Sg Voc : amice
s Pl Nom : amici
s Pl Acc : amicos
s Pl Gen : amicorum
s Pl Dat : amicis
s Pl Abl : amicis
s Pl Voc : amici
\end{Verbatim}
\begin{Verbatim}
s Sg Nom : amica
s Sg Acc : amicam
s Sg Gen : amicae
s Sg Dat : amicae
s Sg Abl : amica
s Sg Voc : amica
s Pl Nom : amicae
s Pl Acc : amicas
s Pl Gen : amicarum
s Pl Dat : amicis
s Pl Abl : amicis
s Pl Voc : amicae
\end{Verbatim}
\end{multicols}
\end{example}
\end{frame}
\begin{frame}[fragile]{Adjective Morphology}
\begin{itemize}
\item Three Gender categories
\item Two Number categories
\item Six Cases
\item Three degrees of comparation \\
$\Rightarrow 3 x 2 x 6 x 3 = $ 108 Forms
\item Three Declination Classes
\end{itemize}
\begin{example}{Adjective type\footnote{ResLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
param
Agr = Ag Gender Number Case ; -- Agreement for NP et al.
oper
Adjective : Type = { s : Degree => Agr => Str } ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]
\begin{itemize}
\item More complex than noun declension
\item Some hard-coded exception handling (Maybe find a better solution later)
\end{itemize}
\begin{example}{Exceptions in adjective declension\footnote{MorphoLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
adj12 : Str -> Adjective = \bonus ->
let
bon : Str = case bonus of {
-- Exceptions Bayer-Lindauer 41 3.2
("asper" | "liber" | "miser" | "tener" | "frugifer") => bonus ;
-- Usual cases
pulch + "er" => pulch + "r" ;
bon + "us" => bon ;
_ => Predef.error ("adj12 does not apply to" ++ bonus)
} ;
[...]
in [...]
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{Verb conjugation}
\begin{itemize}
\item Lots of Forms: Active 60 forms, passive 30 forms, participle 108, gerund 4 forms, gerundive 36 forms, infinitive 12 forms, imperative 8 forms, supine 2 forms $\Rightarrow$ Total 260 Forms
\end{itemize}
\begin{example}{Verb parameters\footnote{ResLat.gf}}
\usebeamerfont{example tiny}
\begin{Verbatim}
param
VActForm = VAct VAnter VTense Number Person ;
VPassForm = -- No anteriority because perfect forms are built using participle
VPass VTense Number Person ;
VInfForm = VInfActPres | VInfActPerf Gender | VInfActFut Gender |
VInfPassPres | VInfPassPerf Gender | VinfPassFut ;
VImpForm = VImp1 Number | VImp2 Number Person ;
VGerund = VGenAcc | VGenGen |VGenDat | VGenAbl ;
VSupine = VSupAcc | VSupAbl ;
VPartForm = VActPres | VActFut | VPassPerf ;
VAnter = VAnt | VSim ;
VTense = VPres VMood | VImpf VMood | VFut ;
VMood = VInd | VConj ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]
\begin{example}{Verb type\footnote{ResLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
oper
Verb : Type = {
act : VActForm => Str ;
pass : VPassForm => Str ;
inf : VInfForm => Str ;
imp : VImpForm => Str ;
ger : VGerund => Str ;
geriv : Agr => Str ;
sup : VSupine => Str ;
part : VPartForm =>Agr => Str ;
} ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{A (nearly) complete verb lemma}
\begin{example}%{A (nearly)complete verb lemma}
\begin{multicols}{5}
{\fontsize{2pt}{0.15em}\selectfont
\begin{Verbatim}
act (VAct VAnt (VPres VInd) Sg P1) : legi
act (VAct VAnt (VPres VInd) Sg P2) : legisti
act (VAct VAnt (VPres VInd) Sg P3) : legit
act (VAct VAnt (VPres VInd) Pl P1) : legimus
act (VAct VAnt (VPres VInd) Pl P2) : legistis
act (VAct VAnt (VPres VInd) Pl P3) : legerunt
act (VAct VAnt (VPres VConj) Sg P1) : legerim
act (VAct VAnt (VPres VConj) Sg P2) : legeris
act (VAct VAnt (VPres VConj) Sg P3) : legerit
act (VAct VAnt (VPres VConj) Pl P1) : legerimus
act (VAct VAnt (VPres VConj) Pl P2) : legeritis
act (VAct VAnt (VPres VConj) Pl P3) : legerint
act (VAct VAnt (VImpf VInd) Sg P1) : legeram
act (VAct VAnt (VImpf VInd) Sg P2) : legeras
act (VAct VAnt (VImpf VInd) Sg P3) : legerat
act (VAct VAnt (VImpf VInd) Pl P1) : legeramus
act (VAct VAnt (VImpf VInd) Pl P2) : legeratis
act (VAct VAnt (VImpf VInd) Pl P3) : legerant
act (VAct VAnt (VImpf VConj) Sg P1) : legissem
act (VAct VAnt (VImpf VConj) Sg P2) : legisses
act (VAct VAnt (VImpf VConj) Sg P3) : legisset
act (VAct VAnt (VImpf VConj) Pl P1) : legissemus
act (VAct VAnt (VImpf VConj) Pl P2) : legissetis
act (VAct VAnt (VImpf VConj) Pl P3) : legissent
act (VAct VAnt VFut Sg P1) : legero
act (VAct VAnt VFut Sg P2) : legeris
act (VAct VAnt VFut Sg P3) : legerit
act (VAct VAnt VFut Pl P1) : legerimus
act (VAct VAnt VFut Pl P2) : legeritis
act (VAct VAnt VFut Pl P3) : legerint
act (VAct VSim (VPres VInd) Sg P1) : lego
act (VAct VSim (VPres VInd) Sg P2) : legis
act (VAct VSim (VPres VInd) Sg P3) : legit
act (VAct VSim (VPres VInd) Pl P1) : legimus
act (VAct VSim (VPres VInd) Pl P2) : legitis
act (VAct VSim (VPres VInd) Pl P3) : legunt
act (VAct VSim (VPres VConj) Sg P1) : legam
act (VAct VSim (VPres VConj) Sg P2) : legas
act (VAct VSim (VPres VConj) Sg P3) : legat
act (VAct VSim (VPres VConj) Pl P1) : legamus
act (VAct VSim (VPres VConj) Pl P2) : legatis
act (VAct VSim (VPres VConj) Pl P3) : legant
act (VAct VSim (VImpf VInd) Sg P1) : legebam
act (VAct VSim (VImpf VInd) Sg P2) : legebas
act (VAct VSim (VImpf VInd) Sg P3) : legebat
act (VAct VSim (VImpf VInd) Pl P1) : legebamus
act (VAct VSim (VImpf VInd) Pl P2) : legebatis
act (VAct VSim (VImpf VInd) Pl P3) : legebant
act (VAct VSim (VImpf VConj) Sg P1) : legerem
act (VAct VSim (VImpf VConj) Sg P2) : legeres
act (VAct VSim (VImpf VConj) Sg P3) : legeret
act (VAct VSim (VImpf VConj) Pl P1) : legeremus
act (VAct VSim (VImpf VConj) Pl P2) : legeretis
act (VAct VSim (VImpf VConj) Pl P3) : legerent
act (VAct VSim VFut Sg P1) : legam
act (VAct VSim VFut Sg P2) : leges
act (VAct VSim VFut Sg P3) : leget
act (VAct VSim VFut Pl P1) : legemus
act (VAct VSim VFut Pl P2) : legetis
act (VAct VSim VFut Pl P3) : legent
ger VGenAcc : legendum
ger VGenGen : legendi
ger VGenDat : legendo
ger VGenAbl : legendo
geriv (Ag Masc Sg Nom) : legendus
geriv (Ag Masc Sg Acc) : legendum
geriv (Ag Masc Sg Gen) : legendi
geriv (Ag Masc Sg Dat) : legendo
geriv (Ag Masc Sg Abl) : legendo
geriv (Ag Masc Sg Voc) : legende
geriv (Ag Masc Pl Nom) : legendi
geriv (Ag Masc Pl Acc) : legendos
geriv (Ag Masc Pl Gen) : legendorum
geriv (Ag Masc Pl Dat) : legendis
geriv (Ag Masc Pl Abl) : legendis
geriv (Ag Masc Pl Voc) : legendi
geriv (Ag Fem Sg Nom) : legenda
geriv (Ag Fem Sg Acc) : legendam
geriv (Ag Fem Sg Gen) : legendae
geriv (Ag Fem Sg Dat) : legendae
geriv (Ag Fem Sg Abl) : legenda
geriv (Ag Fem Sg Voc) : legenda
geriv (Ag Fem Pl Nom) : legendae
geriv (Ag Fem Pl Acc) : legendas
geriv (Ag Fem Pl Gen) : legendarum
geriv (Ag Fem Pl Dat) : legendis
geriv (Ag Fem Pl Abl) : legendis
geriv (Ag Fem Pl Voc) : legendae
geriv (Ag Neutr Sg Nom) : legendum
geriv (Ag Neutr Sg Acc) : legendum
geriv (Ag Neutr Sg Gen) : legendi
geriv (Ag Neutr Sg Dat) : legendo
geriv (Ag Neutr Sg Abl) : legendo
geriv (Ag Neutr Sg Voc) : legendum
geriv (Ag Neutr Pl Nom) : legenda
geriv (Ag Neutr Pl Acc) : legenda
geriv (Ag Neutr Pl Gen) : legendorum
geriv (Ag Neutr Pl Dat) : legendis
geriv (Ag Neutr Pl Abl) : legendis
geriv (Ag Neutr Pl Voc) : legenda
imp (VImp1 Sg) : lege
imp (VImp1 Pl) : legite
imp (VImp2 Sg P1) : ######
imp (VImp2 Sg P2) : legito
imp (VImp2 Sg P3) : legito
imp (VImp2 Pl P1) : ######
imp (VImp2 Pl P2) : legitote
imp (VImp2 Pl P3) : legunto
inf VInfActPres : legere
inf (VInfActPerf Masc) : legisse
inf (VInfActPerf Fem) : legisse
inf (VInfActPerf Neutr) : legisse
inf (VInfActFut Masc) : lecturum
inf (VInfActFut Fem) : lecturam
inf (VInfActFut Neutr) : lecturum
inf VInfPassPres : legeri
inf (VInfPassPerf Masc) : lectum
inf (VInfPassPerf Fem) : lectam
inf (VInfPassPerf Neutr) : lectum
inf VinfPassFut : lectum
part VActPres (Ag Masc Sg Nom) : legens
part VActPres (Ag Masc Sg Acc) : legentem
part VActPres (Ag Masc Sg Gen) : legentis
part VActPres (Ag Masc Sg Dat) : legenti
part VActPres (Ag Masc Sg Abl) : legente
part VActPres (Ag Masc Sg Voc) : legens
part VActPres (Ag Masc Pl Nom) : legentes
part VActPres (Ag Masc Pl Acc) : legentes
part VActPres (Ag Masc Pl Gen) : legentium
part VActPres (Ag Masc Pl Dat) : legentibus
part VActPres (Ag Masc Pl Abl) : legentibus
part VActPres (Ag Masc Pl Voc) : legentes
part VActPres (Ag Fem Sg Nom) : legens
part VActPres (Ag Fem Sg Acc) : legentem
part VActPres (Ag Fem Sg Gen) : legentis
part VActPres (Ag Fem Sg Dat) : legenti
part VActPres (Ag Fem Sg Abl) : legente
part VActPres (Ag Fem Sg Voc) : legens
part VActPres (Ag Fem Pl Nom) : legentes
part VActPres (Ag Fem Pl Acc) : legentes
part VActPres (Ag Fem Pl Gen) : legentium
part VActPres (Ag Fem Pl Dat) : legentibus
part VActPres (Ag Fem Pl Abl) : legentibus
part VActPres (Ag Fem Pl Voc) : legentes
part VActPres (Ag Neutr Sg Nom) : legens
part VActPres (Ag Neutr Sg Acc) : legens
part VActPres (Ag Neutr Sg Gen) : legentis
part VActPres (Ag Neutr Sg Dat) : legenti
part VActPres (Ag Neutr Sg Abl) : legente
part VActPres (Ag Neutr Sg Voc) : legens
part VActPres (Ag Neutr Pl Nom) : legentia
part VActPres (Ag Neutr Pl Acc) : legentia
part VActPres (Ag Neutr Pl Gen) : legentium
part VActPres (Ag Neutr Pl Dat) : legentibus
part VActPres (Ag Neutr Pl Abl) : legentibus
part VActPres (Ag Neutr Pl Voc) : legentia
part VActFut (Ag Masc Sg Nom) : lecturus
part VActFut (Ag Masc Sg Acc) : lecturum
part VActFut (Ag Masc Sg Gen) : lecturi
part VActFut (Ag Masc Sg Dat) : lecturo
part VActFut (Ag Masc Sg Abl) : lecturo
part VActFut (Ag Masc Sg Voc) : lecture
part VActFut (Ag Masc Pl Nom) : lecturi
part VActFut (Ag Masc Pl Acc) : lecturos
part VActFut (Ag Masc Pl Gen) : lecturorum
part VActFut (Ag Masc Pl Dat) : lecturis
part VActFut (Ag Masc Pl Abl) : lecturis
part VActFut (Ag Masc Pl Voc) : lecturi
part VActFut (Ag Fem Sg Nom) : lectura
part VActFut (Ag Fem Sg Acc) : lecturam
part VActFut (Ag Fem Sg Gen) : lecturae
part VActFut (Ag Fem Sg Dat) : lecturae
part VActFut (Ag Fem Sg Abl) : lectura
part VActFut (Ag Fem Sg Voc) : lectura
part VActFut (Ag Fem Pl Nom) : lecturae
part VActFut (Ag Fem Pl Acc) : lecturas
part VActFut (Ag Fem Pl Gen) : lecturarum
part VActFut (Ag Fem Pl Dat) : lecturis
part VActFut (Ag Fem Pl Abl) : lecturis
part VActFut (Ag Fem Pl Voc) : lecturae
part VActFut (Ag Neutr Sg Nom) : lecturum
part VActFut (Ag Neutr Sg Acc) : lecturum
part VActFut (Ag Neutr Sg Gen) : lecturi
part VActFut (Ag Neutr Sg Dat) : lecturo
part VActFut (Ag Neutr Sg Abl) : lecturo
part VActFut (Ag Neutr Sg Voc) : lecturum
part VActFut (Ag Neutr Pl Nom) : lectura
part VActFut (Ag Neutr Pl Acc) : lectura
part VActFut (Ag Neutr Pl Gen) : lecturorum
part VActFut (Ag Neutr Pl Dat) : lecturis
part VActFut (Ag Neutr Pl Abl) : lecturis
part VActFut (Ag Neutr Pl Voc) : lectura
part VPassPerf (Ag Masc Sg Nom) : lectus
part VPassPerf (Ag Masc Sg Acc) : lectum
part VPassPerf (Ag Masc Sg Gen) : lecti
part VPassPerf (Ag Masc Sg Dat) : lecto
part VPassPerf (Ag Masc Sg Abl) : lecto
part VPassPerf (Ag Masc Sg Voc) : lecte
part VPassPerf (Ag Masc Pl Nom) : lecti
part VPassPerf (Ag Masc Pl Acc) : lectos
part VPassPerf (Ag Masc Pl Gen) : lectorum
part VPassPerf (Ag Masc Pl Dat) : lectis
part VPassPerf (Ag Masc Pl Abl) : lectis
part VPassPerf (Ag Masc Pl Voc) : lecti
part VPassPerf (Ag Fem Sg Nom) : lecta
part VPassPerf (Ag Fem Sg Acc) : lectam
part VPassPerf (Ag Fem Sg Gen) : lectae
part VPassPerf (Ag Fem Sg Dat) : lectae
part VPassPerf (Ag Fem Sg Abl) : lecta
part VPassPerf (Ag Fem Sg Voc) : lecta
part VPassPerf (Ag Fem Pl Nom) : lectae
part VPassPerf (Ag Fem Pl Acc) : lectas
part VPassPerf (Ag Fem Pl Gen) : lectarum
part VPassPerf (Ag Fem Pl Dat) : lectis
part VPassPerf (Ag Fem Pl Abl) : lectis
part VPassPerf (Ag Fem Pl Voc) : lectae
part VPassPerf (Ag Neutr Sg Nom) : lectum
part VPassPerf (Ag Neutr Sg Acc) : lectum
part VPassPerf (Ag Neutr Sg Gen) : lecti
part VPassPerf (Ag Neutr Sg Dat) : lecto
part VPassPerf (Ag Neutr Sg Abl) : lecto
part VPassPerf (Ag Neutr Sg Voc) : lectum
part VPassPerf (Ag Neutr Pl Nom) : lecta
part VPassPerf (Ag Neutr Pl Acc) : lecta
part VPassPerf (Ag Neutr Pl Gen) : lectorum
part VPassPerf (Ag Neutr Pl Dat) : lectis
part VPassPerf (Ag Neutr Pl Abl) : lectis
part VPassPerf (Ag Neutr Pl Voc) : lecta
pass (VPass (VPres VInd) Sg P1) : legor
pass (VPass (VPres VInd) Sg P2) : legeris
pass (VPass (VPres VInd) Sg P3) : legitur
pass (VPass (VPres VInd) Pl P1) : legimur
pass (VPass (VPres VInd) Pl P2) : legimini
pass (VPass (VPres VInd) Pl P3) : leguntur
pass (VPass (VPres VConj) Sg P1) : legar
pass (VPass (VPres VConj) Sg P2) : legaris
pass (VPass (VPres VConj) Sg P3) : legatur
pass (VPass (VPres VConj) Pl P1) : legamur
pass (VPass (VPres VConj) Pl P2) : legamini
pass (VPass (VPres VConj) Pl P3) : legantur
pass (VPass (VImpf VInd) Sg P1) : legebar
pass (VPass (VImpf VInd) Sg P2) : legebaris
pass (VPass (VImpf VInd) Sg P3) : legebatur
pass (VPass (VImpf VInd) Pl P1) : legebamur
pass (VPass (VImpf VInd) Pl P2) : legebamini
pass (VPass (VImpf VInd) Pl P3) : legebantur
pass (VPass (VImpf VConj) Sg P1) : legerer
pass (VPass (VImpf VConj) Sg P2) : legereris
pass (VPass (VImpf VConj) Sg P3) : legeretur
pass (VPass (VImpf VConj) Pl P1) : legeremur
pass (VPass (VImpf VConj) Pl P2) : legeremini
pass (VPass (VImpf VConj) Pl P3) : legerentur
pass (VPass VFut Sg P1) : legar
pass (VPass VFut Sg P2) : legeris
pass (VPass VFut Sg P3) : legetur
pass (VPass VFut Pl P1) : legemur
pass (VPass VFut Pl P2) : legemini
pass (VPass VFut Pl P3) : legentur
sup VSupAcc : lectum
sup VSupAbl : lectu
\end{Verbatim}
}
\end{multicols}
\end{example}
\end{frame}
\begin{frame}{Problems with verb morphology}
Problems:
\begin{itemize}
\item Hard to overlook
\item Rarely all fields filled in (Deponent verbs $\Rightarrow$ Passive forms with active usage, defective Verbs $\Rightarrow$ Perfect forms with preset usage, ...)
\item Right place for derivative morphology?
\end{itemize}
\end{frame}
\begin{frame}[fragile]{Pronouns}
Only handling
\begin{example}{Pronoun type and parameters\footnote{ResLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
param
PronReflForm = -- refelxive usage of pronoun like 'I see myself'
PronRefl | PronNonRefl ;
PronDropForm = PronDrop | PronNonDrop;
oper
Pronoun : Type = {
pers : PronDropForm => PronReflForm => Case => Str ;
poss : PronReflForm => Agr => Str ;
g : Gender ;
n : Number ;
p : Person ;
} ;
\end{Verbatim}
\end{example}
\end{frame}
\subsection{Syntax}
\begin{frame}[fragile]{Syntax}
At the moment: just the basic syntax constructions to create VPs and NPs and to form sentences from them \\
Different word orders on sentence level possible
\begin{example}{Possible word orders\footnote{ResLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
param
Order = SVO | VSO | VOS | OSV | OVS | SOV ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{Syntax}
Attributes can appear in front of or after nouns (only implemented for APs)
\begin{example}{Handling APs in different possitions\footnote{ResLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
CompoundNoun : Type =
{
s : Number => Case => Str ;
g : Gender ;
preap : {s : Agr => Str } ;
postap : {s : Agr => Str } ;
} ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{Syntax}
Trying to handle Pro-Drop
\begin{example}{Default UsePron\footnote{NounLat.gf}}
\usebeamerfont{example script}
\begin{Verbatim}
UsePron p = -- Pron -> Np
{
g = p.g ;
n = p.n ;
p = p.p ;
s = p.pers ! PronDrop ! PronRefl ;
} ;
\end{Verbatim}
\end{example}
Only works correctly in the subject possition
\end{frame}
\section{Project for the Summer School}
\subsection{Beginning of Summer school: Plans}
\begin{frame}{Beginning of Summer school: Plans}
\begin{itemize}
\item Handling of modifiers for NPs (Adjectives, APs, ...)
\item Rules to create S and Utt from Cl
\item Evaluation of the Lexicon
\item Further testing of the morphology
\end{itemize}
\end{frame}
\subsection{End of Summer school: Results}
\begin{frame}[fragile]{Handling of modifiers for NPs (Adjectives, APs, ...)}
\begin{example}{Better handling of APs and adjectives (Variable order before or after noun)}
\usebeamerfont{example tiny}
\begin{Verbatim}
param
AdjPos = Pre | Post ;
lin
AdjCN ap cn = -- AP -> CN -> CN
let pos = variants { Post ; Pre }
in
{
s = cn.s ;
postap =
case pos of {
Pre => cn.postap ;
Post => { s = \\a => ap.s ! a ++ cn.postap.s ! a }
} ;
preap =
case pos of {
Post => cn.preap ;
Pre => { s = \\a => ap.s ! a ++ cn.preap.s ! a }
} ;
g = cn.g
} ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}[fragile]{Rules to create S and Utt from Cl}
\begin{example}{Sentence rules\footnote{SentenceLat.gf}}
\usebeamerfont{example tiny}
\begin{Verbatim}
PredVP np vp = -- NP -> VP -> Cl
{
s = \\tense,anter,pol,order =>
case order of {
[...]
OSV -- Object - Subject - Verb
=> vp.obj ++ np.s ! Nom ++ negation pol ++
vp.fin ! VAct ( anteriorityToVAnter anter ) ( tenseToVTense tense ) np.n np.p ;
[...]
SOV -- Subject - Objecy - Verb
=> np.s ! Nom ++ vp.obj ++ negation pol ++
vp.fin ! VAct ( anteriorityToVAnter anter ) ( tenseToVTense tense ) np.n np.p
}
} ;
[...]
UseCl t p cl = -- Temp -> Pol-> Cl -> S
{
s = t.s ++ p.s ++ cl.s ! t.t ! t.a ! p.p ! SOV
} ;
\end{Verbatim}
\end{example}
\end{frame}
\begin{frame}{Testing and evaluation}
Still to be done \\
$\Rightarrow$ Different ressources (Latin treebank, compilation of a test corpus, ...)
\end{frame}
\begin{frame}
{\huge Any Questions?}
\end{frame}
\end{document}

Binary file not shown.

View File

@@ -0,0 +1,68 @@
%\documentclass[handout]{beamer}
\documentclass{beamer}
%\usetheme{Singapore} % anderes Layout
%\usetheme{Antibes} % anderes Layout
%\usecolortheme{lily}
\usetheme{Antibes}
\usecolortheme{beaver}
\setbeamertemplate{footline}[frame number]
\usepackage{color}
\usepackage{german}
\usepackage{latexsym,amssymb}
\usepackage{amsmath} % für begin{cases} ... \end{cases}
%\usepackage[utf8]{inputenc}
%\usepackage[T1]{fontenc}
%\usepackage{algorithm}
%\usepackage{algorithmicx}
%\usepackage{algpseudocode}
\usepackage{multicol}
\usepackage{graphicx}
\usepackage{fontspec}
\usepackage{url}
\setbeamertemplate{footline}[frame number]
\parindent0pt
\parskip1.2ex
\def\nat{{\mathbb N}}
\def\bool{{\mathbb B}}
\def\real{{\mathbb R}}
\title[Implementation of the Latin Language for the RGL]{Implementation of the Latin Language for the RGL\\\quad \\ \small{ GF Summer School, Frauenchiemsee 2013 }}
\author{Herbert Lange\\Centrum für Informations- und Sprachverarbeitung\\München}
\date{\today}
\begin{document}
\frame{\titlepage}
\section{The Latin RG}
\subsection{Current Status}
\begin{frame}[fragile]{Current Status}
\begin{itemize}
\item Translated nearly all strings in LexiconLat and StructuralLat
\item Morphology for all common word types (with smart paradigms)
\item Basic syntax rules to create simple Clauses
\item Basic handling of pronoun drop (ExtraLat)
\item On Github \url{https://www.github.com/daherb/GF}
\end{itemize}
\end{frame}
\subsection{Project for the Summer School}
\begin{frame}{Project for the Summer School}
\begin{itemize}
\item Handling of modifiers for NPs (Adjectives, APs, ...)
\item Rules to create S and Utt from Cl
\item Evaluation of the Lexicon
\item Further testing of the morphology
\end{itemize}
\end{frame}
\subsection{The more Distant Future}
\begin{frame}{The more Distant Future}
\begin{itemize}
\item Subordinate Clauses, relative clauses
\item Different word orders
\item Change handling incomplete paradigms
\item Much more
\end{itemize}
\end{frame}
\end{document}