「大規模言語モデルは新たな知能か」読みました
最初に。この記事は、ChatGPTを多少使って書きました。
PFNの岡野原さんの新作本「大規模言語モデルは新たな知能か」の書評です。
感想をいくつかTwitterにツイートしていました。
PFN岡野原さんの「大規模言語モデルは新たな知能か」ネコちゃんと一緒に読みました。前の拡散モデルの本が、かなりハードコアな内容なのでためらってましたが、この本は一般向けに分かりやすく書かれていて、重要なポイントもしっかりおさえられていてオススメです!
— からあげ (@karaage0703) June 25, 2023
Amazon: https://t.co/BnFaQQMZqf pic.twitter.com/wpRt3fQdIM
ちょっとした実験として、今回はこのいくつかのツイートを入力として、ChatGPTにブログ記事を書いてもらうことにしました。
一般読者にも分かりやすい本です
岡野原氏の新作、「大規模言語モデルは新たな知能か」は、大規模言語モデル(LLM)について深く考えることを促す重要な一冊となります。この本は、専門的な知識を持つ読者だけでなく、AIについて一般的な理解を持つ人々にも十分にアプローチ可能な内容です。
前作の拡散モデルに関する書籍は、正直専門的でハードコアな内容だったことから、一部の読者にとっては難解に感じられたかもしれませんが、この新作は一般向けに書かれていて、分かりやすさが際立っています。重要なポイントをうまく押さえており、AIの本質について理解するのに役立つ内容となっています。
大規模言語モデルと意味理解
印象的だったのは、岡野原氏が(現象論的にはという前置きをした上で)「大規模言語モデルは意味を理解している」と述べていることです。結局これは「理解とは何か?」という定義の問題になってくる気はします。理解というのは、単純な0か1の二元論ではなく、人間でも完全に理解しているわけではない場合が多いようには思えます。
情報の圧縮と理解
本書には、非常に示唆的なコラムも含まれています。特に「その世界のデータを圧縮できるようになることで、世界を理解できるようになる」というフレーズは思考の広がりを感じさせます。大規模言語モデル(LLM)だけでなく、多くのAIモデルが情報の圧縮という本質を持つ中で、「圧縮できる=理解できる」という発想は目新しく、新たな視点を提供してくれます。
結局のところ意味を理解しなければ、文章を要約したり、抽象化したりすることは難しいでしょう。論文などを的確に要約する大規模言語モデルが、意味を理解していると考えるのは、自然な思考の流れかもしれません。
まとめ
PFNの岡野原さんの新作本「大規模言語モデルは新たな知能か」の書評を書いてみました。岡野原さんが、書籍をChatGPTを一部活用して書いたということだったので、私も実験的にChatGPTを一部活用して書いてみました。
ただ、試みとしてはあまりうまくいかなかったかもしれません。結構文章が間違っていたり、気になったりして手直してしたので、自分でツイートコピペして書くのとあんまり変わらなかったかもしれません。
本自体は、書評の通り、分かりやすくLLM、ChatGPTに対する理解が深まる非常に良い本でした。プロンプトの使い方とか知りたい人には適しませんので、そういう人は間違って買わないようにしましょう(ない気はしますが)。
ChatGPTを使ったブログ作成、もっとAIの能力が上がるか、自分が割り切れば時短になるかもしれませんね。まあ、ブログの文章はどちらかというと楽しんで書いているところがあるので、それが良いことなのかはちょっとわかりませんが。