node17.html

Next: Up: Previous:

TAG
文脈自由文法の拡張として, 記号列を書き換える文法規則ではなく, 木構造を書き換える文法規則を持った文法を考えることができる. このような文法形式をTAG(Tree-Adjoining Grammar)とよぶ. TAGでは, initial treeとauxiliary treeという形で与えられる木構造規則を, 代入と接合という操作で組み合わせていくことによって文の解析, 生成を行なう. 以下に initial tree と auxiliary tree の説明をする.
initial tree
ある文法の根ノードと同一のラベルをもつ導出木の葉ノードと置き換えられる木構造規則. この置き換え操作を代入 (substitution) とよぶ.
auxiliary tree
ある根ノードと同一ラベルをもつ導出木中のノードにその構造全体が挿入される木構造規則. この挿入操作を接合 (adjunction, adjoining) とよぶ. auxiliary tree には根ノードと同一のラベルをもつ葉ノードが必ずある. この葉ノードをフットノードと呼び, ``*''をつけて区別する.

図5.2 にTAGで記述された文法の例を示す. 図中ので示されるルールは initial tree, で示されるものは auxiliary tree である.

図5.2:LTAGルールと代入接合操作の例
TAGは弱文脈依存文法(mildly context sensitive grammar)というクラスに属し, 文脈自由文法と文脈依存文法の間の生成能力を持つ. TAGは強力な文法生成能力を特徴とする, 木を生成する形式からなる. それは文を連想する構造の記述を特徴とするものである. TAGが木を構成するために持つ操作は接合だけである. 接合は代入を模擬することができるのだが, 明示的に代入のオペレーションを加えることにより, lexicalized TAG(LTAG)を得る. LTAGは, 形式的に TAGと同等である. これゆえ, 今後LTAGのみで記述する. 更に, LTAGは直接言語学上の関連を持つ. 最近のlinguistic and computationalの研究では, LTAGのフレームワークで研究がなされている.
TAGにおいて, 各木構造が必ずアンカー(anchor)とよばれる一つの単語を持つようにしたものをLTAGとよぶ. LTAGを導入することで, 文法の語彙化をはかることが可能となる. 文脈自由文法の形式のままでは文法の語彙化をおこなうことはできない. TAGは語彙化を可能にするために文脈自由文法を最低限拡張した文法形式であるとみなすこともできる. 図5.2 は, LTAGの形式で描かれている.
ここではLTAGに深層格フィーチャを持たすことを提案する. LTAGでは, 動詞の引数を指定することが可能である. そもそもなぜ動詞が引数を持つかというと, 指定した引数に意味がある, すなわち格を指定しているということであり, 文生成に関してこのようなフィーチャを提案することは自然な拡張といえる. 深層格を素性として持たせたLTAGの例を図5.3 に示す.

図5.3:深層格フィーチャ付TAGの例
「行く」という動詞に対しての概念は以下のようになる.
[*go: (Obligatory: Agent) (Optional: Source, Goal, Instrument, etc. )]
ここで指定された格について, 表層の位置情報をTAGによって指定されたと考えれば良い. また, 動詞以外のルールに関しても, その根ノードに, 品詞に加えて, 素性としてどの格と代入できるかということを指定する. そして, 代入または接合の操作をする際, 格情報をユニフィケーションするのである. ここで問題が生じる. それは, 各言語が持つ文法ルールに対して格を割り当てるために, 任意の言語に対する格の共通性がなくなってしまうことである. 例えば, 英語文法における「自分自身」を示す単語は, ``I'', ``me'' 等があげられるが, 各単語にはそれぞれ行為者格と対行為者格であるという情報が既に含まれているのに対し, 日本語文法における「自分自身」を示す単語は「私」だけであり, ここには格に関する情報は含まれていない. 日本語では行為者格であることを示すために, 「は」という格情報のみを持つ助詞が必要なのである. ここであげられるルールを図5.4 に示す.

図5.4: 「私」を表す英語と日本語のTAG
しかし, これはあまり問題にならない. なぜなら, 動詞に関する格情報は変わることがないために, 共通な概念というものは変わらないからである. 表層であるTAGに深層格を素性として持たせた時点で, その文法に特化した深層の表現が必要である. 上述のユニフィケーションを用いることにより, 文生成やパースが可能である. 以下にその手順を示す. 文生成に関しては例えば,
[*give: (Agent: *I)(Counter-Agent: *you)(Object: *flower)]
をもとにして図5.3 のルールで文を生成する際,
*giveを意味として持つルールを探索する.
葉ノードの品詞と, 概念で指定された格と意味をもとに (NP, Agent, *I) をユニフィケーションできるルールを探索する. 他も同じ.
代入または接合操作が必要でなくなるまで (品詞, 格, 意味) をもとに適応する文法を探索し, ユニフィケーションを繰り返す.
といった処理をする. 文をパースする場合は, ユニフィケーションすることによって得られる, 格と意味を記憶しておき, 得られた動詞にこれらの情報を付け加えてやれば良い.

Mitsubishi Research Institute,Inc.
Mon Feb 24 19:32:21 JST 1997