
日本発のAI開発を強力に後押し!スタートアップの旗手が語るGENIACの「効能」

【参加者】(左から)小島煕之・Kotoba Technologies CEO、鈴木脩司・Preferred Networksリサーチャー、杉之尾大介・経済産業省情報処理基盤産業室室長補佐
生成AIの開発力強化に向けて、経済産業省が2024年にスタートしたプロジェクト「GENIAC」では、開発に取り組むスタートアップを積極的に支援している。支援を受ける企業は、海外のビッグテックにも匹敵する生成AIモデルを次々に開発するなど、成果も生まれている。ともに日本発AIスタートアップであるKotoba Technologies最高経営責任者(CEO)で共同創設者の小島煕之氏、Preferred Networksリサーチャーの鈴木脩司氏と、経済産業省情報処理基盤産業室で室長補佐の杉之尾大介が日本の生成AI開発の展望や課題、GENIACの役割などについて語り合った。
――― まず、それぞれ会社の業務内容をお話しください。
小島 Kotoba Technologies(コトバテクノロジーズ)は、米国のアカデミア出身の生成AI研究者と日本が誇るスーパーコンピューター「富岳」を使って生成AIを開発してきたメンバーが2023年7月、タッグを組んで作ったスタートアップです。音声の生成AIを使った同時通訳技術を開発しています。

小島煕之(こじま・のりゆき) Kotoba Technologiesの共同創業者兼CEO。同社では独自の音声生成AI技術による同時通訳機能を開発し言語の壁をなくすことを目指している。米国コーネル大学CS PhD。EMNLP 2022で最優秀論文賞を受賞。Fugaku-LLMプロジェクトの共同創設者。
鈴木 Preferred Networks(プリファードネットワークス、PFN)はもともと、機械学習、特に深層学習を軸に、AI技術を製造業やバイオヘルスケアなど様々な産業分野に応用するための技術開発を行ってきました。2022年の対話型AIサービス「ChatGPT」の登場を機に、言語の生成AIの開発を積極的に進めています。
三つの支援で生成AIエコシステム構築目指す
――― GENIACについて、事業開始の背景や経緯などをご説明ください。
杉之尾 GENIACは2024年2月にスタートしました。具体的な中身としては三つパートがあり、①生成AI開発に必要な「計算資源」の調達支援②データや生成AIの利活用に向けた先進事例支援③ナレッジシェア(知識や知見の共有)を行うコミュニティ活動支援――を進めています。
「計算資源の調達支援」とは要するにスーパーコンピューターなどを調達してAI開発者に活用してもらうことです。当時はAI開発に必要なスーパーコンピューター(GPUサーバー)は取り合いで、日本勢が確保できない状況でした。そうした中で、経産省が、クラウドサービスを提供するビッグテックから一括で調達してAIの開発者に使ってもらうプロジェクトとしてスタートしました。1回目の計算資源の提供は2024年2月から8月まで行われ、世界に匹敵するような性能を持つモデルが開発されるなど、成果は順調に出ていると感じています。
「データ・AIの利活用に向けた先進事例支援」は、データや生成AIの利活用に向けた様々な課題やボトルネックの解決に先進的に取り組む事業者の支援です。そして3つ目が「ナレッジシェアを行うコミュニティ活動支援」です。GENIAC創設当時は、モデル開発者のみのコミュニティでしたが、徐々にアプリケーション開発者やユーザー企業、計算資源の提供者、ベンチャーキャピタルなどの資金提供者、システムインテグレーターへと幅が広がりました。意見交換を通じて生成AIの開発、利活用や資金の循環までつながるような「エコシステム」を、GENIAC の中で作っていこうとしているところです。

鈴木脩司(すずき・しゅうじ) Preferred Networksリサーチャー 富士通研究所を経て2017年にPreferred Networksに入社。バイオヘルスケア領域と深層学習における大規模分散学習の研究開発を行う。現在はPFNグループが開発する大規模言語モデル「PLaMo」の事前学習を担当。
計算資源の不足で大規模開発ができなかった過去
――― GENIACが立ち上がった頃、どういう開発をしていましたか、また開発上で困難なことはありましたか。
小島 当時、GPU(画像処理装置)、スパコンが十分に使える状況ではなく、私たちのような規模の小さい会社では、自前でGPUを調達することは経営判断的にもできませんでした。やはり、GENIACから大規模な計算資源の提供を受けたことで、研究開発を爆発的に進めることができました。我々が開発に成功したモデルは、日本語の音声生成が非常に流ちょうにでき、米国のOpenAIやGoogle社のモデルと比べても性能が高いものです。GENIACに選ばれたことが、その後の会社の発展につながったと言えます。
鈴木 我々は産業技術総合研究所の大規模AIクラウド計算システム「ABCI」を利用して、10B(100億)パラメータ近くのモデルまでは開発していましたが、それ以上に大きいモデルの開発には計算資源が足りませんでした。どうにか確保する方法はないかと悩んでいたところにGENIACの公募に採択され、結果として、10倍の100Bのモデルをフルスクラッチで開発できました。開発したモデルは2024年12月から、顧客に提供しています。
杉之尾 GENIACは「日本の優秀なエンジニアが、環境が整っていないことによって、その能力が発揮できないのは日本にとって損失だ」との思いからスタートしていますので、GENIACによって、希望通りの開発ができ、成果につながりつつある、とのお話は非常にうれしいことです。

杉之尾大介(すぎのお・だいすけ) 経済産業省情報処理基盤産業室室長補佐。経済産業省では、気候変動対策、エネルギー政策、石油・天然ガス政策を担当した後、情報産業課に着任し、現在はGENIACを始めとした生成AIの開発力強化やソフトウェア産業の振興を担当。兵庫県出身。
同時通訳、日本語のニュアンスを理解するモデルを研究開発
――― GENIACを通じて、現在、どういう取り組みをしていますか。
小島 音声に特化した生成AIを開発しています。インターネットの時代になっても、やはり人間は基本的に音声ベースでコミュニケーションすることが多い。音声の良いところはリアルタイム性、スピードです。情報を認知するスピードも速く、感情やイントネーションなど、テキスト以上の情報を載せられる、とてもリッチな表現媒体なのです。日本は言語の壁をAIで越えていく取り組みにとって、やりがいのある土壌です。私自身も米国の大学と大学院で学び、言語の壁にぶつかりました。これを生成AIの力で解決できたら、こんなに面白いことはありません。
鈴木 日本語の細かなニュアンスや、日本人の感覚などをきちんと理解する日本語のLLM(大規模言語モデル)を作っています。例えば、海外のモデルでは日本の法律の解釈、文化的背景、価値観などが微妙に違っていて、違和感を持つことが時々ありますが、そういう点をうまく解消できるモデルを作り、日本の様々な産業で活用できる状態にしていきたいと思っています。
コミュニティ活動支援から事業に発展するケースも
――― GENIACの三つの支援のうち、特に自社の生成AI開発に役立っている支援は何でしょうか。
小島 「計算資源の調達支援」がいちばん大きいのは間違いありません。計算資源が豊富にあれば、自信を持って大胆な研究開発プロジェクトに取り組めます。また、あえて2番目を挙げるなら「コミュニティ活動支援」です。それまで、日本のスタートアップは様々な規模でそれぞれが開発している状況だったと思います。GENIACができたことで、そのコミュニティに入ればスタートアップが一堂に会して、お互いに刺激し合いながら、研究開発の競争ができています。日本の生成AIエコシステムの実現可能性が高まったと感じます。
鈴木 GENIACは、我々エンジニアのコミュニティだけでなく、ユーザー企業のコミュニティとうまくつないでくれています。実際、マッチングイベントが定期的に開催されていて、そこではユーザー企業のニーズを我々のようなLLM開発者がヒアリングさせていただき、開発に反映させられる貴重な機会になっています。結果として、我々のLLMも知っていただき、うまく事業に発展させていくチャンスになっています。
――― それぞれの会社の技術開発のユニークな点について、ご紹介ください。
小島 音声の分野で生成AI的なアプローチを取っている会社は、世界的に見てもわずかしかありません。我々は、まだ他社が踏み出していないフィールドで、さらに同時通訳、言語の壁を越えるというテーマに絞って大量のGPU資源を投下しており、この分野に特化すると現状でも世界1位の性能とポテンシャルに迫っています。
開発したモデルの提供形態はいろいろありますが、一般の人々にとっては、アップルの「iOS」向けアプリケーションが1番のオプションです。2025年2月には、「同時通訳」アプリを公開しました。現在は評価版という位置づけで無償ですので、多くの人に使ってみていただきたいですね。
鈴木 日本の社会、文化、日本語をきちんと理解するLLMを作り、様々な産業に応用していく点がユニークだと思っています。それぞれの分野での困りごとに対して言語モデルを適用し、うまく活用していくためには、産業の理解度をかなり深めることも必要です。ENEOSと共同開発した、材料探索を高速化する汎用原子レベルシミュレータ「Matlantis(マトランティス)」は、我々の機械学習のノウハウと、深い産業理解によって実現した事例です。こうした成功事例を言語の分野でも目指していきたいと考えています。
日本は開発プレーヤーを増やし、技術の競争が必要
――― 海外と比較して、日本の生成AI開発の強みや課題はどういうところにあると見ていますか。
小島 投資家から「あなたのテックモート(技術的な優位性)は何か」と聞かれますが、テックモートなんて、今の生成AI開発の世界では1年もたてばなくなると思います。何をやっていたとしても、結局、いかに速く技術を作って市場を取っていくかという勝負になると思っています。今の我々のアプローチはとても順調で、GENIACのコミュニティの中でも順調な企業が多いのではないかと思っています。
日本の課題としては、もっとプレーヤーが出てきてほしいですよね。米国でなぜイノベーションが起こっているかというと、やはり競争です。競合会社が新しいモデルを出したら、追いつこうとする企業がいくつも出てくる。この動きが日本でも起こり始めたらすごい。互いを意識し合えるような関係性の企業が増えてほしいと思います。
鈴木 日本特有の商習慣や文化、日本語に優れた生成AIの開発は、日本企業が強みを発揮しやすい分野だとは思います。ただ、それだけでは海外のモデルには勝てません。我々は日本が世界的にも強い産業の各分野とリンクさせています。そうしたプラスアルファの強みを作っていく必要があります。課題という意味では、産業界のデータにアクセスする難易度がかなり高いと感じます。特定の産業に特化した生成AIを作ろうとしても、産業の中で閉じているデータがかなりあります。いかに品質の高いデータにアクセスしやすくするかがLLMを始めとした生成AIを作る上で重要になってくると思います。
将来は「同時通訳で海外展開」「様々な国で使える言語モデル開発」
――― 今後の事業展開について、海外展開も含めて、お聞かせください。
小島 我々のテクノロジーを発信する目的でiOSアプリをスタートしましたが、次のステップとして、この技術をAPI(ソフトウェアやプログラム、Webサービスをつなぐインターフェース)化して企業の既存のシステムに組み込んでいくことに取り組んでいます。同時通訳の技術はすごく海外展開しやすい技術です。日本のマーケットからスタートはしていますが、米国にもチャレンジしています。米国市場に食い込めるかどうかによって、我々の企業としてのスケール感も大きく変わってきます。先陣を切って、見事に成功させたいですね。
鈴木 既に始めている部分もありますが、国産フルスクラッチ開発のLLMが本当に使えるかどうか、様々な企業と一緒に検証して、企業の中で使っていただくことを目標に頑張っています。海外展開している企業も多いので、日本語以外のマイナーな言語もサポートして、将来的にはいろんな国で使っていける言語モデルを開発したいと考えています。
杉之尾 国内で開発されるモデルは、かなり良いものができています。国際的に認められるモデルもいくつか出てきており、GENIACの取り組みは非常に順調だと思います。これをいかに利活用できるかが次のフェーズです。
2025年度は、国産の生成AIモデルを組み込んだソリューションを表彰する懸賞金事業を実施する予定です。また、計算資源の提供支援についても、スタートアップとユーザーが組んだモデル開発への支援を増やしていきたいと思っています。本日、参加していただいた2社をはじめ、日本のトッププレーヤーたちが、国内だけでなく、海外にも展開していくことに期待しています。我々としても、どんどんサポートしていきたいと思っていますので、ぜひGENIACの活動に注目してほしいですね。