Next: Up: Previous:

TAG

文脈自由文法の拡張として, 記号列を書き換える文法規則ではなく, 木構造を書き換える文法規則を持った文法を考えることができる. このような文法形式をTAG(Tree-Adjoining Grammar)とよぶ. TAGでは, initial treeとauxiliary treeという形で与えられる木構造規則を, 代入と接合という操作で組み合わせていくことによって文の解析, 生成を行な う. 以下に initial tree と auxiliary tree の説明をする.
initial tree
ある文法の根ノードと同一のラベルをもつ導出木の葉 ノードと置き換えられる木構造規則. この置き換え操作を代入 (substitution) とよぶ.
auxiliary tree
ある根ノードと同一ラベルをもつ導出木中のノード にその構造全体が挿入される木構造規則. この挿入操作を接合 (adjunction, adjoining) とよぶ. auxiliary tree には根ノードと同 一のラベルをもつ葉ノードが必ずある. この葉ノードをフットノードと 呼び, ``*''をつけて区別する.

図5.2 にTAGで記述された文法の例を示す. 図中の tex2html_wrap_inline1828 で示さ れるルールは initial tree, tex2html_wrap_inline1830 で示されるものは auxiliary tree で ある.

figure125

図5.2:LTAGルールと代入接合操作の例

TAGは弱文脈依存文法(mildly context sensitive grammar)という クラスに属し, 文脈自由文法と文脈依存文法の間の生成能力を持つ. TAGは強力な文法生成能力を特徴とする, 木を生成する形式からなる. それは文を連想する構造の記述を特徴とするものである. TAGが木を構成するために持つ操作は接合だけである. 接合は代入を模擬することができるのだが, 明示的に代入のオペレー ションを加えることにより, lexicalized TAG(LTAG)を得る. LTAGは, 形式的に TAGと同等である. これゆえ, 今後LTAGのみで記述する. 更に, LTAGは直接言語学 上の関連を持つ. 最近のlinguistic and computationalの研究では, LTAGのフレー ムワークで研究がなされている.

TAGにおいて, 各木構造が必ずアンカー(anchor)とよばれる一つの単語を持つよ うにしたものをLTAGとよぶ. LTAGを導入することで, 文法の語彙化をはかること が可能となる. 文脈自由文法の形式のままでは文法の語彙化をおこなうことは できない. TAGは語彙化を可能にするために文脈自由文法を最低限拡張した文法 形式であるとみなすこともできる. 図5.2 は, LTAGの形式で描かれて いる.

ここではLTAGに深層格フィーチャを持たすことを提案する. LTAGでは, 動詞の引数を指定することが可能である. そもそもなぜ動詞が引数を 持つかというと, 指定した引数に意味がある, すなわち格を指定し ているということであり, 文生成に関してこのようなフィーチャを提案 することは自然な拡張といえる. 深層格を素性として持たせたLTAGの例を 図5.3 に示す.

figure135

図5.3:深層格フィーチャ付TAGの例

「行く」という動詞に対しての概念は以下のようになる.

[*go: (Obligatory: Agent) (Optional: Source, Goal, Instrument, etc. )]
ここで指定された格について, 表層の位置情報をTAGによって指定されたと考え れば良い. また, 動詞以外のルールに関しても, その根ノードに, 品詞に加えて, 素性として どの格と代入できるかということを指定する. そして, 代入または接合の操作を する際, 格情報をユニフィケーションするのである. ここで問題が生じる. それは, 各言語が持つ文法ルールに対して格を割り当てるために, 任意の言語に対する格の共通性がなくなっ てしまうことである. 例えば, 英語文法における「自分自身」を示す単語は, ``I'', ``me'' 等があげられるが, 各単語にはそれぞれ行為者格と対行為者格 であるという情報が既に含まれているのに対し, 日本語文法における「自分自 身」を示す単語は「私」だけであり, ここには格に関する情報は含まれていな い. 日本語では行為者格であることを示すために, 「は」という格情報のみを持 つ助詞が必要なのである. ここであげられるルールを 図5.4 に示す.

figure146

図5.4: 「私」を表す英語と日本語のTAG

しかし, これはあまり問題にならない. なぜなら, 動詞に関する格情報は変わる ことがないために, 共通な概念というものは変わらないからである. 表層であるTAGに深層格を素性として持たせた時点で, その文法に特化 した深層の表現が必要である. 上述のユニフィケーションを用いることにより, 文生成やパースが可能である. 以下にその手順を示す. 文生成に関しては例えば,

[*give: (Agent: *I)(Counter-Agent: *you)(Object: *flower)]
をもとにして 図5.3 のルールで文を生成する際,
  1. *giveを意味として持つルールを探索する.
  2. 葉ノードの品詞と, 概念で指定された格と意味をもとに (NP, Agent, *I) をユニフィケーションできるルールを探索する. 他も同じ.
  3. 代入または接合操作が必要でなくなるまで (品詞, 格, 意味) をもとに 適応する文法を探索し, ユニフィケーションを繰り返す.
といった処理をする. 文をパースする場合は, ユニフィケーションすることによっ て得られる, 格と意味を記憶しておき, 得られた動詞にこれらの情報を付け加え てやれば良い.



Mitsubishi Research Institute,Inc.
Mon Feb 24 19:32:21 JST 1997