註1:LLM(Large Language Model:大規模言語モデル)とは、言葉を生成することが可能な生成AIのことである。なぜAIなのに「知能」ではなく「モデル」と呼ぶのかというと、内実は人間の文章の単語の並び方の確率分布を低次元に圧縮しただけのものであるからである。もっと平たくいうと、人間の言葉の列というのはどのように並べられがちか、を数式で近似したものであるから、「モデル」なのである。
註2:AIは非常に大量のデータを学習させることで、学習した質問と全く同じ事例でなくても判断や生成を行うことができる。この性質は汎化特性と呼ばれ、現代のAIが柔軟な振る舞いを行う根源となるような性質である。
註3:ChatGPTがリリースされたばかりの頃(GPT3の頃)は、「3+6×4-8-3+6×4-8は?」と聞いても全く正しく返ってこなかったが、現在では多くのモデルで勝手に途中途中式を書いて考えてくれるようになっている。これはLLMの元々の性質というよりは、昨今加熱する生成AIの精度向上の競争による賜物である。各社、計算ができるように、難しい数式は順序立てて計算するよう、追加学習(チューニング)を行っていることによるものである。「思考の連鎖」について、プロンプトに「step by stepで考えて」と付け加えると、段階的な思考をしてもらいやすい、などといったテクニックが知られている。