書評: 「大規模言語モデルは新たな知能か」- AIと「理解」の新たな地平

「大規模言語モデルは新たな知能か」読みました

　最初に。この記事は、ChatGPTを多少使って書きました。

　PFNの岡野原さんの新作本「大規模言語モデルは新たな知能か」の書評です。

大規模言語モデルは新たな知能か――ChatGPTが変えた世界 (岩波科学ライブラリー)

作者:岡野原大輔
岩波書店

　感想をいくつかTwitterにツイートしていました。

PFN岡野原さんの「大規模言語モデルは新たな知能か」ネコちゃんと一緒に読みました。前の拡散モデルの本が、かなりハードコアな内容なのでためらってましたが、この本は一般向けに分かりやすく書かれていて、重要なポイントもしっかりおさえられていてオススメです！
Amazon: https://t.co/BnFaQQMZqf pic.twitter.com/wpRt3fQdIM
— からあげ (@karaage0703) June 25, 2023

　ちょっとした実験として、今回はこのいくつかのツイートを入力として、ChatGPTにブログ記事を書いてもらうことにしました。

一般読者にも分かりやすい本です

　岡野原氏の新作、「大規模言語モデルは新たな知能か」は、大規模言語モデル（LLM）について深く考えることを促す重要な一冊となります。この本は、専門的な知識を持つ読者だけでなく、AIについて一般的な理解を持つ人々にも十分にアプローチ可能な内容です。

　前作の拡散モデルに関する書籍は、正直専門的でハードコアな内容だったことから、一部の読者にとっては難解に感じられたかもしれませんが、この新作は一般向けに書かれていて、分かりやすさが際立っています。重要なポイントをうまく押さえており、AIの本質について理解するのに役立つ内容となっています。

大規模言語モデルと意味理解

　印象的だったのは、岡野原氏が（現象論的にはという前置きをした上で）「大規模言語モデルは意味を理解している」と述べていることです。結局これは「理解とは何か？」という定義の問題になってくる気はします。理解というのは、単純な0か1の二元論ではなく、人間でも完全に理解しているわけではない場合が多いようには思えます。

情報の圧縮と理解

　本書には、非常に示唆的なコラムも含まれています。特に「その世界のデータを圧縮できるようになることで、世界を理解できるようになる」というフレーズは思考の広がりを感じさせます。大規模言語モデル（LLM）だけでなく、多くのAIモデルが情報の圧縮という本質を持つ中で、「圧縮できる＝理解できる」という発想は目新しく、新たな視点を提供してくれます。

　結局のところ意味を理解しなければ、文章を要約したり、抽象化したりすることは難しいでしょう。論文などを的確に要約する大規模言語モデルが、意味を理解していると考えるのは、自然な思考の流れかもしれません。