IT大手のサイバーエージェントは、対話などができる生成AIの技術的な基盤となる「大規模言語モデル」を開発し、17日に公開しました。このモデルは、日本語を中心に学習させていて、今後、日本語に特化した生成AIの開発につながることも期待されます。
「ChatGPT」など急速に利用が広がる生成AIには、大量のデータを学習することで、文章の作成や要約などをできるようにする「大規模言語モデル」と呼ばれるAIが、技術的な基盤として使われています。
ただ、海外で開発が進む「大規模言語モデル」は、英語を中心に学習させていることから、日本語の精度が低いという指摘もあります。
このためサイバーエージェントは、日本語を中心に学習させた独自の「大規模言語モデル」を開発し、17日に公開しました。
AIの学習量を示すという「パラメータ数」は68億で、「ChatGPT」の3550億と比べると差がありますが、日本語を中心に学習させていることから、正確な日本語で表現できるのが特徴だとしています。
会社では、今回、開発した「大規模言語モデル」を外部に公開して、国内のAI開発を促すとともに、日本語に特化した生成AIの研究開発を進める方針です。
このほか、LINEも日本語を学習させた「大規模言語モデル」の研究を進めていて、今後、日本語に特化した生成AIの開発につながることも期待されます。
-- NHK NEWS WEB