forked from GitHub/gf-rgl
See https://github.com/daherb/GF orhttps://gitlab.cip.ifi.lmu.de/langeh/gf for full git commit history
228 lines
8.3 KiB
TeX
228 lines
8.3 KiB
TeX
%\documentclass[handout]{beamer}
|
|
\documentclass{beamer}
|
|
%\usetheme{Singapore} % anderes Layout
|
|
%\usetheme{Antibes} % anderes Layout
|
|
%\usecolortheme{lily}
|
|
\usetheme{Antibes}
|
|
\usecolortheme{beaver}
|
|
\setbeamertemplate{footline}[frame number]
|
|
\usepackage{color}
|
|
\usepackage{german}
|
|
\usepackage{latexsym,amssymb}
|
|
\usepackage{amsmath} % für begin{cases} ... \end{cases}
|
|
%\usepackage[utf8]{inputenc}
|
|
%\usepackage[T1]{fontenc}
|
|
%\usepackage{algorithm}
|
|
%\usepackage{algorithmicx}
|
|
%\usepackage{algpseudocode}
|
|
\usepackage{multicol}
|
|
\usepackage{graphicx}
|
|
\usepackage{fontspec}
|
|
|
|
\setbeamertemplate{footline}[frame number]
|
|
\parindent0pt
|
|
\parskip1.2ex
|
|
|
|
\def\nat{{\mathbb N}}
|
|
\def\bool{{\mathbb B}}
|
|
\def\real{{\mathbb R}}
|
|
|
|
\title[Implementierung einer Lateingrammatik]{Implementierung einer Lateingrammatik im Grammatical Framework \\ \quad \\ \large Kolloquium Computerlinguistisches Arbeiten SS 2013 }
|
|
\author{Herbert Lange}
|
|
|
|
\date{\today}
|
|
|
|
\begin{document}
|
|
\frame{\titlepage}
|
|
|
|
\section*{Überblick}
|
|
\subsection*{Inhalt}
|
|
\begin{frame}{Inhalt}
|
|
%\begin{multicols}{2}
|
|
\tableofcontents
|
|
%\end{multicols}
|
|
\end{frame}
|
|
\section{Einführung}
|
|
\subsection{Das Grammatical Framework}
|
|
\begin{frame}[fragile]{Das Grammatical Framework}
|
|
\begin{itemize}
|
|
\item Mächtigkeit äquivalent zu PMCFG (Parallel Multiple Context-Free Grammars)
|
|
$\rightarrow$ zwischen mild und voll kontextsensitiv
|
|
\item Trennung von abstrakter und konkreter Syntax
|
|
\item Verschiedene API-Ebenen und Einbindungsmöglichkeiten (u.a. Java, JavaScript)
|
|
\end{itemize}
|
|
\end{frame}
|
|
\subsection{Die Ressource Grammar Library}
|
|
\begin{frame}{Die Ressource Grammar Library}
|
|
\begin{itemize}
|
|
\item Minimaler Satz gemeinsamer Bestandteile verschiedener Sprachen (Beispielvokabular, Wort-/Satzarten, Syntaxregeln)
|
|
\item ca. 38 Sprachen voll oder teilweise umgesetzt
|
|
\item ca. 43 geschlossene Kategorien (Determiner, ...) und Phrasentypen
|
|
\item ca. 22 offene Kategorien (Nomen, Verben, Adjektive, ...)
|
|
\end{itemize}
|
|
\end{frame}
|
|
\begin{frame}
|
|
|
|
\begin{block}{}
|
|
{\scriptsize\ttfamily
|
|
%> i alltenses/LangGer.gfo \\
|
|
% linking ... OK \\
|
|
% Languages: LangGer \\
|
|
% 47884 msec \\
|
|
Lang> p ''der Mann sieht die Frau'' \\
|
|
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (DetCN (DetQuant DefArt NumSg) (UseN man\_N)) (ComplSlash (SlashV2a see\_V2) (DetCN (DetQuant DefArt NumSg) (UseN woman\_N)))))) NoVoc
|
|
}
|
|
\end{block}
|
|
{\tiny
|
|
\begin{center}
|
|
\begin{tabular}{|l|l|l|l|}
|
|
\hline
|
|
Funktion & Typ & Argumente & Übersetzung\\
|
|
\hline
|
|
PhrUtt & Phr & (PConj) Utt (Voc) & der Mann sieht die Frau \\
|
|
NoPConj & PConj & & (Keine Konjunktion) \\
|
|
UttS & Utt & S & der Mann sieht die Frau \\
|
|
UseCl & S & (Temp) (Pol) Cl & der Mann sieht die Frau \\
|
|
TTAnt & Temp & Tense Ant & (Tempus und Aspekt) \\
|
|
TPres & Tense & & (Präsens) \\
|
|
ASimul & Ant & & (Gleichzeitigkeit) \\
|
|
PPos & Pol & & (Positive Aussage) \\
|
|
PredVP & Cl & NP VP & der Mann sehen die Frau \\
|
|
DetCN & NP & Det CN & der Mann \\
|
|
DetQuant & Det & Quant Num & der \\
|
|
DefArt & Quant & & der \\
|
|
NumSg & Num & & (Singular) \\
|
|
UseN & CN & N & Mann \\
|
|
man\_N & N & & Mann \\
|
|
ComplSlash & VP & VPSlash NP & sehen die Frau \\
|
|
%SlashV2a & VPSlash & V2 & sehen \\
|
|
%see\_V2 & V2 & & sehen \\
|
|
\multicolumn{4}{|c|}{...} \\
|
|
NoVoc & Voc & & (Keine Anrede) \\
|
|
\hline
|
|
\end{tabular}
|
|
\end{center}
|
|
}
|
|
\end{frame}
|
|
\subsection{Die Lateinische Sprache}
|
|
\begin{frame}[fragile]{Die Lateinische Sprache}
|
|
Teil der indogermanischen Sprachfamilie $\rightarrow$ Ähnlichkeiten zu germanischen Sprachen so wie dem Griechischen \\
|
|
\begin{center}
|
|
\begin{tabular}{|l|l|l|}
|
|
\hline
|
|
lateinisch & griechisch & deutsch \\
|
|
\hline
|
|
pater & patér & Vater \\
|
|
ager & agrós & Acker \\
|
|
trēs & treĩs & drei \\
|
|
decem & déka & zehn \\
|
|
est & estí & ist \\
|
|
\hline
|
|
\end{tabular}
|
|
\end{center}
|
|
Ursprünglich Sprache der Bewohner der mittelitalienischen Region Latium
|
|
\end{frame}
|
|
\begin{frame}{Sprachliche Besonderheiten}
|
|
\begin{itemize}
|
|
\item Sehr freie Satzstellung $\rightarrow$ aber meist Verwendung von Subjekt-Objekt-Verb
|
|
\item Flektierende Sprache mit synthetischer Syntax (Abl. abs. und AcI)
|
|
\begin{itemize}
|
|
\item Augusto regente pax erat in toto imperio romano $\rightarrow$ Als/weil Augustus regierte, herrschte im ganzen römischen Reich Frieden.
|
|
\item Imperatorem venire audit $\rightarrow$ Er hört, dass der Imperator kommt.
|
|
\end{itemize}
|
|
\item Ablativ und Vokativ als eigene Fälle
|
|
\item Fehlen von Artikel
|
|
\end{itemize}
|
|
\end{frame}
|
|
\section{Umsetzung}
|
|
\begin{frame}{Umsetzung}
|
|
\begin{itemize}
|
|
\item Lexikon der RGL
|
|
\item Morphologie der RGL
|
|
\item Syntax der RGL
|
|
\item Optional: rein sprachspezifische Konstrukte
|
|
\end{itemize}
|
|
\end{frame}
|
|
\subsection{Lexikon}
|
|
\begin{frame}{Lexikon}
|
|
\begin{itemize}
|
|
\item Ca. 400 vorgegebene englische Wörter aus allen möglichen Wortarten und verschiedenen Bereichen
|
|
\item Keine Klärung von Ambiguitäten (z.B. bank) $\rightarrow$ willkürliche Wahl der Übersetzung
|
|
\item Viele moderne Begriffe (Auto, Eisenbahn, Computer, Fernseher) $\rightarrow$ Übersetzung mit Hilfe der Wikipedia
|
|
\item Begriffe ohne auffindbare Übersetzung (ein-/ausschalten) $\rightarrow$ Wahl eines nahe liegenden Wortes (accendere/exstinguere)
|
|
\item Manche Differenzierungen nicht in jeder Sprache möglich
|
|
\end{itemize}
|
|
\end{frame}
|
|
\begin{frame}{}
|
|
\begin{block}{Beispiel}
|
|
{\scriptsize\ttfamily
|
|
blue\_A = mkA ( variants { ''caeruleus'' ; ''caerulus'' } ) ; -- 3 L... \\
|
|
boat\_N = mkN ''navicula'' ; -- -ae f. L... \\
|
|
book\_N = mkN ''liber'' ''libri'' masculine ; -- Ranta; -bri m. L... \\
|
|
boot\_N = mkN ''calceus'' ; -- -i m. L... \\
|
|
boss\_N = mkN ''dux'' ''ducis'' ( variants { feminine ; masculine } ) ; -- ducis m./f. L... \\
|
|
boy\_N = mkN ''puer'' ''pueri'' masculine ; -- -eri m. L... \\
|
|
bread\_N = ( variants { (mkN ''panis'' ''panis'' masculine ) ; mkN ''pane'' } ) ; -- -is m./n. L... \\
|
|
break\_V2 = mkV2 (mkV ''rumpo'' ''rupi'' ''ruptum'' ''rumpere'') ; -- Ranta; 3 L...
|
|
}
|
|
\end{block}
|
|
\end{frame}
|
|
\subsection{Morphologie}
|
|
\begin{frame}{Morphologie}
|
|
\begin{itemize}
|
|
\item Einteilung in vier Gruppen: Nomina (Substantive, Adjektive, Pronomina, Numeralia), Verben, Partikel (Adverbien, Präpositionen, Konjunktionen), Interjektionen. Es gibt keine Artikel
|
|
\item Nomina und Verben werden flektiert, Partikel und Interjektionen werden nicht flektiert
|
|
\item Fünf Nomendeklinationen, drei Adjektivdeklinationen, Adjektivkomparation, Adverbbildung, vier Verbkonjugationen, Deponentia
|
|
\end{itemize}
|
|
\end{frame}
|
|
\begin{frame}{Smart Paradigms}
|
|
Pattern Matching um für ein Wort aus möglichst wenig Formen das Paradigma zu bestimmen
|
|
\begin{block}{Beispiel}
|
|
{\scriptsize\ttfamily
|
|
noun : Str -> Noun = \textbackslash verbum -> \\
|
|
case verbum of \{ \\
|
|
\_ + ''a'' => noun1 verbum ; \\
|
|
\_ + ''us'' => noun2us verbum ; \\
|
|
\_ + ''um'' => noun2um verbum ; \\
|
|
\_ + ''er'' => noun2er verbum ; \\
|
|
\_ + ''u'' => noun4u verbum ; \\
|
|
\_ + ''es'' => noun5 verbum ; \\
|
|
\_ => noun3 verbum \\
|
|
\} ;
|
|
}
|
|
\end{block}
|
|
\end{frame}
|
|
\subsection{Syntax}
|
|
\begin{frame}{Syntax}
|
|
\begin{itemize}
|
|
\item Problem: Freie Wortstellung im Satz $\rightarrow$ Variationen erhöhen die Komplexität exponentiell
|
|
\item Zunächst: Beschränkung auf SOV-Wortstellung (Subjekt-Objekt-Verb)
|
|
\item Später: Suche nach performanten Implementierungsmöglichkeiten für beschränkte oder volle Variation
|
|
\end{itemize}
|
|
\end{frame}
|
|
\subsection{Ausblick}
|
|
\begin{frame}{Ausblick}
|
|
\begin{itemize}
|
|
\item Anbinden eines größeres Lexikons
|
|
\item Integration in eine Weboberfläche oder eine Android-App
|
|
\item Anwendung in der Lehre (Translation Quiz)
|
|
\end{itemize}
|
|
\end{frame}
|
|
\section{Abschluss}
|
|
\begin{frame}{Zusammenfassung}
|
|
\begin{itemize}
|
|
\item Lexikon mit ca. 400 teils modernen Wörtern
|
|
\item Morphologie mit Smart Paradigms
|
|
\item Syntax mit möglichst freier Wortstellung
|
|
\end{itemize}
|
|
\end{frame}
|
|
\begin{frame}{Literatur}
|
|
\begin{itemize}
|
|
\item Bayer, Karl u. Lindauer, Josef: Lateinische Grammatik, C.C. Buchners Verlag, Bamberg 1994
|
|
\item Leuman, M./Hofmann, J.B./ Szantyr, A.: Lateinische Grammatik. Auf der Grundlage des Werkes von Friedrich Stolz und Joseph Hermann Schmalz; Band 2: Lateinische Syntax und Stilistik, C.H. Beck'sche Verlagsbuchhandlung, München 1972
|
|
\item Ranta, Aarne: Grammatical Framework. Programming with Multilingual Grammars, CSLI Publications, Stanford 2011
|
|
\item Ranta, Aarne: Grammatical Framework Tutorial, http://www.grammaticalframework.org/doc/tutorial/gf-tutorial.html 2010
|
|
\end{itemize}
|
|
\end{frame}
|
|
\end{document}
|