「猫」からロジットまで：単語の特徴ベクトルがどのように変化するか

No Comments
GPTschool
2023年7月13日

自然言語処理（NLP）のモデルが、ある単語（ここでは「猫」）から次の単語を予測するまでにどのようなプロセスを経るのか、今回はその過程と単語の特徴がどのように変化するかを詳しく見ていきましょう。

初めの一歩：単語エンベディング

まず、「猫」という単語はモデルの語彙中の一つとして単語エンベディング層（nn.Embedding）を通過します。この段階では、「猫」という単語は固有の数値ベクトルに変換されます。このベクトルが単語の「エンベディング」であり、単語の基本的な意味情報を多次元空間上の点として表現します。

ポジショナルエンベディングの役割

この単語エンベディングに、ポジショナルエンベディングが加えられ、単語の位置情報が組み込まれます。ポジショナルエンベディングは単語が文章中のどの位置に存在するかを示す情報を付加します。これにより、単語のエンベディングは、単語そのものの意味と位置の両方を同時に反映することが可能となります。

自己注意メカニズムでの特徴変化

その後、このエンベディングベクトルは一連のトランスフォーマーブロック（Block）を通過します。トランスフォーマーブロックの中には自己注意メカニズムがあり、この自己注意メカニズムは、文章中の他の単語からの情報を収集し、その情報を「猫」のエンベディングに組み込みます。その結果、「猫」のエンベディングは、その周囲の単語の影響を受けて大きく変化します。この変化は、「猫」の特徴がその文脈により動的に変わることを示しています。

マルチレイヤーパーセプトロンでの特徴変化

トランスフォーマーブロックのもう一つの主要な部分はマルチレイヤーパーセプトロン（MLP）です。MLPは、単語の特徴ベクトルに非線形性を導入し、特徴空間を変換します。この変換により、「猫」の特徴ベクトルはさらに洗練され、多層的な表現を取り入れることができます。

正規化と最終出力

これらのプロセスを経た後、「猫」の特徴ベクトルはLayerNorm層によって正規化され、その後、出力層（nn.Linear）によってロジットへと変換されます。この出力層は、「猫」の後にどの単語が続く確率が最も高いかを示すロジットを生成します。

この過程を通じて、「猫」の単語エンベディングは、最初の静的な表現から、文脈依存の動的な表現へと大きく変化します。そして最終的には、その後に続く単語の確率を示すロジットを生成します。この一連のプロセスが、自然言語処理における単語の旅というものです。