博報堂テクノロジーズ、日本語特化型AIモデルを開発、無償公開

東京都港区に本社を置く株式会社博報堂テクノロジーズは、日本語に特化した視覚と言語を組み合わせた事前学習モデルを開発し、無償で公開することを発表しました。このモデルは、画像検索やテキストからの画像生成、画像のタグ付け、画像に対する質問応答など、多岐にわたる応用が可能となっています。

博報堂テクノロジーズが開発したこの視覚言語事前学習モデルは、日本語に特化した画像とテキストの理解を深めることを目的としています。このモデルは、Hugging FaceというAIモデル共有プラットフォーム上で無償公開され、非商用利用が可能となっています。

多くの視覚言語事前学習（Vision-Language Pre-training; VLP）技術は、英語中心の開発により、日本語データへの対応が不十分であったという課題がありました。しかし、博報堂テクノロジーズは、画像エンコーダの改良と訓練データ量の増加、言語エンコーダの能力強化を通じて、日本語特化VLPモデルを開発しました。

このモデルにより、「桜の花が満開の公園」など具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すことが可能になります。これにより、日本語の視覚言語理解の精度が大幅に向上し、より幅広い応用が可能となります。

博報堂テクノロジーズが開発した日本語特化型AIモデルは、AI技術の進化とともに、その可能性を広げています。このモデルは、画像検索やテキストからの画像生成、画像のタグ付け、画像に対する質問応答など、多岐にわたる応用が可能となっています。

このモデルの公開により、研究コミュニティやAI技術の開発者に対し、より高度な日本語の視覚言語理解の基盤を提供します。博報堂テクノロジーズは、今後も継続的な技術革新を通じて、研究コミュニティへの貢献を強化していく予定です。