Minimalist Grammar: Construction without Overgeneration

要約

本稿では、ミニマリスト文法(MG)の書き方を説明する。アルゴリズムとして説明するために、入力形式として文脈自由文法(CFG)を用いる。CFGに再帰がない場合、すなわち、どの非終端もそれ自身を含む右辺に(間接的に)導出することができない場合、過剰生成を除外することができる。構築されたMGは、例外処理の特別な方法としてライセンサー/-eesを利用する。A$と$B$が名詞句を生成する導出のCFGフォーマット$A_eats_B_mapsto^* peter_eats_apples$は、通常$i_eats_apples$のように過 生成になる。過剰生成を避けるために、CFGは例外を処理するためだけに、主に同じ単語を生成する多くの非終端記号と規則を必要とする。しかし、我々のMGでは、同じ単語を生成するCFG規則を1つの項目にまとめ、licensees/-orsを適切に分配することで例外を処理することができる。このテクニックの難点は、ほとんどの世代において、licensees/-orsの大部分は必要ないが、それでも何らかの方法でトリガされなければならないことである。この問題を解決するために、$epsilon$-itemsを使用する。

要約(オリジナル)

In this paper we give instructions on how to write a minimalist grammar (MG). In order to present the instructions as an algorithm, we use a variant of context free grammars (CFG) as an input format. We can exclude overgeneration, if the CFG has no recursion, i.e. no non-terminal can (indirectly) derive to a right-hand side containing itself. The constructed MGs utilize licensors/-ees as a special way of exception handling. A CFG format for a derivation $A\_eats\_B\mapsto^* peter\_eats\_apples$, where $A$ and $B$ generate noun phrases, normally leads to overgeneration, e.\,g., $i\_eats\_apples$. In order to avoid overgeneration, a CFG would need many non-terminal symbols and rules, that mainly produce the same word, just to handle exceptions. In our MGs however, we can summarize CFG rules that produce the same word in one item and handle exceptions by a proper distribution of licensees/-ors. The difficulty with this technique is that in most generations the majority of licensees/-ors is not needed, but still has to be triggered somehow. We solve this problem with $\epsilon$-items called \emph{adapters}.

arxiv情報

著者 Isidor Konrad Maier,Johannes Kuhn,Jesse Beisegel,Markus Huber-Liebl,Matthias Wolff
発行日 2023-11-03 10:02:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク