生体電気の発見からニューロン、記憶、情報伝達、行動選択と、神経科学の歴史についてまとまった本。マルチパーセプトロンや誤差逆伝播法、畳み込みニューラルネットワーク、ベイズ最適化、動的計画法などなど、統計学や機械学習との関連の話題も多く、馴染みの単語が出てくると、自分の知っている歴史との関連が分かって、さらに楽しい。
個人的には、バブロフの犬の実験から報酬モデル化を考え、動的計画法から価値関数に注目し、深層強化学習に繋がったり、ドーパミン放出モデルへと繋がったりする第11章が一番面白かった。
したがって、強化学習の物語は、成功した学際的相互作用の1つである。それは、心理学、工学、コンピューター科学が協力して困難な問題に進展をもたらすことができることを示している。それは、動物や人間が周囲から学ぶ能力を理解し、再現するために数学がどのように使用できるかを実証している。
11章 報酬が行動選択に与える影響(p333)
なるべく数式は出さず喩え話などを使って丁寧に説明されているが、逆に数式で書いてもらった方が理解が早い部分もなくもない。付録に簡単な数式が補足されているが、平均場理論(第5章)や情報の符号化(第6章)、ベルマン方程式(第11章)はサラッとしか書かれていない。特にベルマン方程式の説明(p318〜)は逆に難解な気もする。とはいえ、引用がちゃんと書かれているため、後で自分で調べればいい話。
1987年、ニューヨーク州バッファーローの人々は、例年と同じように、地元の郵便局から無数の請求書やバースデーカード、手紙を投函した。封筒に宛先の5桁の郵便番号を書き込んでいた市民たちは、まさか自分たちの手描き文字が不滅のものになるとは知る由もなかった。それらはデジタル化され、今後何年にもわたって全国のコンピュータに保存されることになる。それらは、人間の筆跡をコンピュータに読ませようとする研究者のためのデータベースの一部となり、ひいては人工視覚に革命をもたらすことになったのである。
6章 視覚から畳み込みへ(p178)
MNISTより古い、のちに"USPS handwritten digit"と呼ばれるデータセットで、16x16ピクセル、分類不能データも含まれる1。歴史だ。
検索すると、いくつかのサイトでアップロードされている。但し、Yann LeCunらの論文で使用されたものと全くの同一かは不明。例えば > USPS dataset ↩︎
