node36.html

Next: Up: Previous:

PAXの原理

PAXの原理をCKYアルゴリズムとの違いを明らかにしながら説明すると以下のようになる. CKYアルゴリズムにおいて, ある

に非終端記号xが生成された(つまり, 解析木の言葉でいえば, 文

に対する, 記号xを根に持つ解析木ができた)場合, ここからさらに, この解析木を左または右の子に持つ, より大きな解析木が構築可能になる. 具体的には,

という生成規則によって, が生成される

かまたは,

という生成規則によって, が生成される

の両方の可能性がある. 言葉で書けば,

pを左端, qを右端とする構文木( に対する構文木)で, 根に記号xを持つものが見つかると,
その右にqを左端とする構文木を組み合わせて新しい構文木を作る. その際には, という規則を用いる.
その左にpを右端とする構文木を組み合わせてより大きな構文木を作る. その際には, という規則を用いる.
という二つの発展の可能性がある.

図で書くと図5.10のようになる. つまり, 斜線で塗られた構文木が生成されると, 点線で書かれたような構文木と, 生成規則により結びついて, さらに大きな木を生成する可能性が生まれる.

     図5.11: 構文木の発展. 斜線部の構文木が生成されると, 
             さらに点線部のような大きな構文木が生成される可能性が生まれる.

PAXでは以下のようなデータ構造とプロセスを組み合わせて, この構文木の発展を実現している.

集合 : kを右端とする構文木を貯めておく集合である. CKYアルゴリズムと大雑把な対応をとると, である. より正確には, 以下のようになる. 今, あるi, s'に対して, であることがわかったとする. この時, 集合には, という形をしたルールの識別子(一意に割り当てられた番号)全てを挿入する. つまり単に記号そのものを入れるのではなく, 自分を左の子に持つような構文木を作るに当たって適用可能なルールを入れておくのである. また, 構文木の左端の位置を示すために, も合わせて挿入する. 集合はKL1ではもちろん, 不完全データ構造として生成し, mergeによってflatなlistに変形し, それを読むプロセスが, 順番にそれを読み込む.
プロセス : kを左端, jを右端とする構文木で, 根がs''であるものを表すプロセスである. 集合から要素を一つずつ取り出しては, s''が, その要素で指定されているルールの右端の記号であるかどうかを検査し, そうであれば, それは新たにiを左端, j を右端とする構文木ができたということなので, 適切な操作( への挿入および, プロセスの起動)を行なう.

図で書くと図5.11のようになる. 実線で示された構文木 L-- を覆い, s'を根とする構文木--Lに対して, 実際にに格納されるのは, という形をした要素全てである(つまり, という形をしたルールの数分だけ挿入される). 点線で示された構文木 R-- を覆い, s''を根とする構文木--は実際にはデータとして存在するのではなく, プロセスであり, から要素を一つずつ取り出しては, それが, という形をした要素であるかどうかを調べ, 一致していれば, より大きな構文木を生成する.

     図5.11: PAXの動作. L は, wi+1 ... w_k を覆い, 
             s'を根とする構文木で, この時実際には, 
             Akという集合に,  s'¥;c, Ai>という要素が
             全て(?-> s'?という形をした規則の数だけ)挿入される. 
             Rは, wk+1 ... wjを覆い, s''を根とする構文木で, 
             この時実際にはこれに対応するプロセスが作られる. 
             そのプロセスは, Akの要素を一つずつ取り出しては, 
             それが,  y ; s'', A>という形であるかどうかを検査し, 
             そうであれば, wi+1 ... wjを覆い, 
             根がxであるような構文木を生成する.

Mitsubishi Research Institute,Inc.
Thu Feb 27 10:02:38 JST 1997