Google Japanを訪問してGeminiについて色々教えてもらいました

Google Japanにおじゃましてきました

 ご縁あって、Googleに行ってきました!Googleさんには、5年前に六本木のオフィスの勉強会に呼んでいただいて以来の訪問でした。渋谷のオフィスは初めての訪問になります。

 色々お話をしました。なんとGeminiグッズをいただきました!

 やったー

 そして、噂のGoogleランチを楽しみました!

Googleランチ

 ここは撮影大丈夫らしいです。

 めちゃくちゃ眺めが良い場所にある食堂

 景色がよいときは富士山が見えるらしいです

 おしゃれな壁

 和室がある!茶道部があるらしいです

 ぜんぶ無料!

 カフェも楽しめます。

Geminiについて

 ちょうどGoogle I/O 2024直後ということもあり、LLM、Geminiの話で盛り上がりました。

 Geminiといえば、発音が「ジェミニ」なのか「ジェミナイ」なのか問題があるのですが、中の人いわく、日本では「ジェミニ」とのことでした。ただ、その後はずっとみなさん「ジェミナイ」と発音していたので…まあそういうことなのでしょう!

 あとGoogle AI Studioをオススメされたものの。その場で

「うーん、特に使わないかも」

 と空気を読めない発言をしてしまいました(反省しています)。

 後で使ってみて分かったのですが、Google AI StudioではGPT-4, Claude 3 Opusと肩を並べる性能のGemini 1.5 Proが無料で使える(今のところは、また回数の制限はあります)ので、普通に凄いです。Open AIのGPT-4oが無料で使えるようになって、Gemini 1.5 Flashより速いので、少し凄さが薄れてしまったのですが、GPT-4oが制限で使えなくなったらとりあえず試してみるとよい気がします。

 そして、Google I/Oで発表があったのですが、Gemini API デベロッパー コンペティションが開催されているとのことです。

 賞金がめっちゃ豪華なのですが、特に注目はグランプリの商品がデロリアンということです。

 Googleコンペサイトより引用

 デロリアン、グランプリになったらちゃんと船で送られてくるそうです。夢ありますね。デロリアンで近所のイオンとか行ったら目立ちそうですね(笑)

Gemini 1.5 Pro/Flashの性能

 Geminiの性能が結構良さそうという話だったので、面倒なことをLLMにやらせる自作ソフト「Code Cooker」をGPT-4、Claude 3 Opusに続いて、Geminiにも対応してみました。

 定性的ですが、わりとよい気がするので、色々なタスクで比較実験して遊んでみようかなと思います。そして、GeminiはAPIに関して無料枠があるのがよいですね。商用の高性能なLLMで無料枠が(今のところ)あるのはGeminiだけなのではないかなと思います。

 Geminiの論文読むと、研究レベルでは10Mトークン入るとかあるので凄まじいですね。公開されているものは100Kトークンくらいにおさえられているようですが、これが解放されたらGPT-4やClaude 3 Opusに対して、アドバンテージになりそうです。

 そんな大量なトークンあって、まともに読めるの?(Lost in the middleとかないの?)とおもいきや、そこは、論文でneedle-in-a-haystack(干し草の中から針を探す)という、タスクをさせることで検証しているとあるので、結構読んでいるらしいです。凄い…

まとめ

 Googleにおじゃまして、すっかりGemini推しに洗脳された(?)という話でした。LLMの性能は、今の時点ではなんとも言えないので、今後実際に使ってクールに評価していこうと思います。

 個人利用だと、無料枠があるというのが大きなメリットと思いますので、課金のところにハードルを感じてなかなか生成AIに手を出せなかった人は、AI StudioあたりからLLMを試してみてはいかがでしょうか?

 なにか作ったら、デロリアンゲットを目指して、コンペ参加してみるのもよいと思います(笑)

参考リンク

Google I/O 2024: 100 things Google announced

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

関連記事