グーグルの最新生成AI「Gemini(ジェミニ)」とは⁉

AI全般
スポンサーリンク

グーグルの最新生成AIモデル

2023年12月7日、グーグル社は最新の生成AIモデル「Gemini(ジェミニ)」を発表しました。
この最新モデルは、2023年5月にグーグル社が開催した開発者向けイベント「Google IO 2023」で初めて触れられ、ただこの時点では開発中とだけアナウンスされていたものです。
Geminiは公開前からChatGPTの上位モデルであるGPT4を超える性能を持つと噂されていましたが、実際にグーグルによってその高いレベルの仕様や性能が示されると、本当にそんなに性能がでるのかといった穿った意見がでるほどに色々と話題となっています。
今回はCharGPTに対抗するグーグルの最新AI「Gemini」の全容を解説します。

マルチモーダルモデル

Geminiは文字。画像、音声、動画などの複数のコンテンツを同時に扱うことのできるマルチモーダル対応のAIモデルです。
グーグルは最初からマルチモーダル化を前提にしてGeminiを開発しており、既存のマルチモーダルモデルよりも汎用性が高く、最高水準のモデルと発表しています。
Geminiは柔軟性の高いAIモデルであり、クラウド上でもスマートフォン上でも効率的に稼働するとの事です。

Gemini1.0の3つのモデル

今回グーグル社が公開したのはGemini 1.0というバージョンです。
Gemini 1.0では以下の3つのモデルが用意されています。

Geminiウルトラ
Geminiプロ
Geminiナノ

Geminiウルトラ

Geminiウルトラ(Gemini Urutra)は最も高性能モデルです。
高度データ解析のような複雑な用途に対応できるとしています。
Geminiウルトラは現状まだ開発途上で、2024年に開発者や企業向けに公開する予定となっています。
Geminiウルトラで動くより高性能な会話型AI「Bard Advanced」も2024年に公開される予定となっています。

Geminiプロ

Geminiプロ(Gemini Pro)は幅広い用途をカバーする汎用中規模モデルです。
グーグルの会話型AI「Bard」にも実装されます。
英語版のBardには既に実装されています。

Geminiナノ

Geminiナノ(Gemini Nano)は最も軽量なモデルです。
スマートフォンなどのモバイルで動作するように設計されていて、Google Pixelにも順次実装される予定です。
Pixcel 8Proには既に搭載されています。

グーグルが発表した性能値

グーグルはGeminiのもっとも高性能のモデル、Geminiウルトラのベンチマークを公開しています。
そこでは32のAI標準のベンチマーク(指標)に対して実に30項目でGPT−4の性能を上回る成績が示されています。
また数学、法律、医学など57の科目を組み合わせて知識と問題解決の総合力を図るMMLU
と呼ばれる性能テストでも90%超というスコアを叩き出しています。
これは各分野の人間の専門家と同等以上の数値であり、グーグルは初めて人間の専門家を上回るパフォーマンスを示したと表明しています。
但し現時点ではあくまでグーグル側の発表によるものであり今後さまざまな検証がなされていくものと見られます。

2024年はGeminiで!

グーグルは今後数ヶ月間でGeminiをグーグル検索などのグーグルのサービスで利用できるようにするとしています。
開発者や企業は12月13日からGeminii Proにアクセスできるようになっています。
Bardは当初は英語版だけに搭載されていますが、2024年の早い段階で日本語版への実装もなされると考えられています。

Geminiで出来ること

ギターの絵を見て音を鳴らす

Geminiで実際にどの様な事ができるようになったのかを伝えるために、グーグルはGeminiのデモンストレーション動画をYoutubeで公開しています。
ペンでアヒルの絵を描くと、Geminiがそれを最初は線からこれはアヒルだという具合にリアルタイム音声で説明します。
あるいはギターの絵を描くとGeminiがそれを認識してギターの音を鳴らします。
更にギターの絵にアンプの絵を書き足すと、今度はエレギターの音を鳴らします。

どちらが危険かを判断する

次には2つに枝分かれした道の絵の上に熊とアヒルの絵を置いた後で「どちらに行くべきか」と質問するとアヒルの方へ行く様指示してくれます。
画像や質問をしっかり理解した上での回答である事を伺わせます。

まとめ

Geminiはグーグルが再攻勢を掛けるために総力を挙げて開発した生成AIモデルです。
グーグルの発表を見る限り、ChatGPTと同等以上の能力を持つAIモデルである事は明らかです。
2024年の早い時期にBard日本語版への実装も予想されているので、どんな飛躍が起きているのかを触って経験したいですね。
最後までお読み頂き、ありがとうございました。

コメント

タイトルとURLをコピーしました