neoAIが日本語LLM「Llama 3 neoAI」を公開

生成AI特化の東大松尾研発スタートアップ株式会社neoAIは、Meta Platforms, Inc.が開発した大規模言語モデル「Llama 3」に日本語学習を行い、商用利用可能な日本語LLM「Llama 3 neoAI 8B Chat v0.1」を公開した。本モデルは、商用利用可能なオープンソースで、同等パラメータ数のLLMと比べても最高水準の日本語性能を持ちながら、学習コストは20万円と非常に低い。

neoAIでは、本モデルを用いたクラウドを利用しないオンプレミス生成AI環境構築や、LLM学習の知見と企業データを用いた業務特化の独自LLM開発支援を進めていく。「Llama 3 neoAI 8B Chat v0.1」のライセンスは、LLAMA 3 Community Licenseに準拠しており、Acceptable Use Policyに従う限り、研究および商業目的での利用が可能だ。

独自LLMの開発背景には、クラウドでの利用が難しいセキュリティレベルの高いデータを扱う際のオンプレミス環境での利用ニーズや、専門性の高い業務への適用を低コストで実現するための追加学習の必要性がある。neoAIでは、海外ビックテックの公開する商用利用可能なLLMに日本語能力を獲得させる効率的なアプローチで、ビジネス利用可能な独自LLMの開発を進めている。

「Llama 3 neoAI 8B Chat v0.1」は、Metaが一般公開している「Llama 3 8B」に対して、neoAIが独自に作成した高品質少量日本語データセットで追加学習を行うことで、低コストで日本語能力の向上を実現した。今後、本モデルと生成AIプロダクト「neoAI Chat」を組み合わせたオンプレミス版「neoAI Chat for On-Premises」の提供も進められる予定だ。

neoAIの生成AI R&Dチーム「neoAI Research」は、最新の生成AI技術を用いてビジネスに価値をもたらすことを目標に研究開発を進めており、今後も日本語LLMの高精度化や、図の読み取りなど画像解釈が可能な日本語Vision Language Model(VLM)の開発などを進めていく。