デビッド・マー『ビジョン――視覚の計算理論と脳内表現――』(一部)

計算論的神経科学の古典ということで一応手に取ったが、第1部とエピローグをざっと眺めたのみ。
原著が出たのは1982年とクレジットされているが、訳者あとがきによると、著者のマーは1980年に35歳で白血病により亡くなっているらしい。「はじめに」には、「ある事情で、当初の計画より2,3年早く本書を執筆することになった。」「多くの人たちのおかげでこのいくぶん苦しい時期を生き抜くことができた。」とあり、また病院の教授を紹介してくれた人への謝意も書かれている(ちなみに1979年夏、とある)。
小脳がパーセプトロンだという論で博論を書いているらしい。ケンブリッジで神経生理学の研究をしていて、その後、MITに渡って視覚の研究を始めた、と。


情報処理を理解するためには、3つの水準がある、ということが中心的な主張で、
これまの脳の研究や、人工知能研究は、これを意識していないので誤った方向にいっているというようなことを言っているようだ。
本題である視覚の話は、パラパラと見るだけでも難しそうなので、全然読めてません。

ビジョン―視覚の計算理論と脳内表現

ビジョン―視覚の計算理論と脳内表現

第1部 思想的序説
 序論
 第1章 思想と方法
第2部 視覚
 第2章 画像の表現
 第3章 画像から表面へ
 第4章 可視表面の直接表現
 第5章 認識のための形状表現
 第6章 摘要
第3部 エピローグ
 第7章 本アプローチに対する弁護

第1部 思想的序説

歴史的背景として、1950年代〜60年代にかけて、神経細胞を調べることで、知覚についてもわかるようになるという方向で研究がすすめられていたが、70年代からその方向性ではうまくいかなくなった
また、機械による視覚の再現という方向性での研究、70年代に行き詰りをみせた、と。


ある情報処理課題を実行する機械を理解するための3つの水準
(1)計算理論
計算の目標は何か、なぜそれが適切なのか
例えば、スーパーのレジであれば、それは何を行っているのか→加算
なぜ加算なのか→品目の価格から最終的な勘定をだすための制約条件からわりだされる演算が加算と一致するから(例えば、順序は合計に影響しない可換性など)
(2)表現とアルゴリズム
この計算理論はどのようにして実現することができるのか
例えば、表現としてアラビア数字を採用すると、9を超えれば桁上げするというアルゴリズム
表現は様々なものがありえ、アルゴリズムは表現に依存し、同じ処理過程を実行できるアルゴリズムは複数存在する
(3)ハードウェアによる実現
表現とアルゴリズムが物理的にどのように実装されているか
スーパーのレジは、電線とトランジスタアルゴリズムを実装している(しかし、子供が計算する場合、同じアルゴリズムを使っていても、その物理的な実装は異なっている)


神経科学でも人工知能研究でも、計算理論の水準が認識されてこなかったために、研究が正しい方向にすすんでいない、というのがマーの主張
マーは、チョムスキーの理論は、まさに計算理論であると述べている。チョムスキーの理論は、何がの水準であり、どのようにの水準ではない、と。しかし、ウィノグラードによる批判は、そこを取り違えているのではないか、と述べられている。
他に、計算理論の水準に近い研究として、ギブソンが挙げられている。しかし、情報処理の難しさをとらえられていないと難点も指摘している。


また、マーは、何度かJ.L.オースティンのことも引用している。



『シリーズ新・心の哲学3意識篇』(佐藤論文・太田論文) - logical cypher scapeの読書案内において、この本が紹介されている
そこで「自己中心的/他者中心的な表象枠組の区別など、知覚経験の本性を考えるうえで有益な内容を多く含んでいる。」と述べられているが、
本書では、網膜の画像から知覚に至るまでの表現として、「画像」や「21/2次元スケッチ」「3次元モデル表現」というものがあって、「3次元モデル表現」は物体中心座標での形状で、「21/2次元スケッチ」は観察者中心座標系での表現とされている。