第6回 視覚情報
情報デザイン論/2022|2022.05.25
AGENDA
- 研究室からリアルタイム配信します。
- 大学での受講を希望する方は、以下の方法で受講して下さい。
- 17号館6F ゼミ室のPCを利用して視聴
- 15102教室(所定の教室)にてスマホ・タブレット・PC等で視聴
- Zoom接続情報
Zoomミーティングに参加する
ミーティングID: 993 1153 3835
パスコード: 313624
- 以下名簿が表示されます。出欠確認・座席記録をお願いします。
出欠確認・座席記録
CONTENTS
> Recording
視覚システム
眼球の構造
生物の体には感光細胞というものがあります。文字通り、光を感じる細胞のことで、初期の生物の場合は体表にそれが分布していますが、進化の過程で感光細胞の集合は窪みの中に入り込みます(例えばオウム貝の眼はこの段階のもので、ピンホールカメラと同様の仕組みで視覚像を形成しています)。さらにそれが進化すると、その窪みへ入る光量の調節機能をもったり、透明な膜によって覆われたりしてきます。
人の眼球では、窪みの中の感光細胞の集合が網膜であり、光量の調節をするのが虹彩であり、透明な膜が角膜です。また水晶体は角膜の派生として、硝子体は窪み内部の空間を外圧から護るために発生したと考えられています。ちなみに眼球は発生学的には脳の一部です。
画像出典:脳科学辞典 Mammal eye.png / Tmatsuyama(CC-BY-NC)
虹彩
虹彩は外部からの光量を調節する機構で、強い光によって感光細胞が破壊されないようにするのが本来の目的ですが、カメラの絞りと同様に被写界深度の調節機能を副産物として与えてくれます。すなわち、虹彩が大きく(瞳孔が大きく)なればレンズの使用面積が大きくなるため、ピントの合う範囲が狭くなり(対象の前後がボケる)、逆に小さく絞られるとピントの合う範囲は広くなります(対象の前後もくっきりと見える)。
曇り空の下ではぼんやり見える風景が、明るい日差しの下ではすっきり見えるのというも、日差しによるコントラストの問題だけではありません。眼鏡をかけている方は、それをはずして時計のベルトの穴越しに風景を見てみて下さい。採光面積を絞ることで(像は相対的に暗くなりますが)ピントが合いやすくなるという事実が確認できるでしょう。ピンホールカメラのようにレンズを使わず結像するものは、原理的にはボケとは無縁であり、すべての距離にある対象がシャープの結像します。
- MEMO:アイリス ≡ 絞り と 被写界深度
- 絞り込む → 被写界深度大
前景から遠景までピントが合う - 絞りを開ける → 被写界深度小
焦点上にある対象以外はボケる
- 絞り込む → 被写界深度大
- MEMO:前後がボケる「いい感じ」の写真を撮るには?
口径の大きなレンズ(F値の小さいもの)を使って、シャッタースピードを上げて、レンズをめいっぱい使って撮影して下さい。たとえ高級一眼レフでも、ズームレンズのようにF値の大きなものではボケは生じにくいですし、絞り込んでしまったら結局ピンホールと同じでボケません。要はレンズの口径が大きいこと。で、それはそのまま価格に反映しています(高いです)。
- MEMO:瞳孔に関すること
- 瞳孔は心が積極的情報処理をしていると開く( Hess,E.H. )
- 光源理論:暗い部屋 > 瞳孔が広がる > 相互の関心高まる > 親密な関係に
- 散瞳は交感神経、縮瞳は副交感神経
水晶体
水晶体はカメラのレンズに相当するもので、それを支える毛様体筋の弛緩・収縮によって厚みを変えることで、焦点距離を調節し、網膜上にピントを合わせます。通常のレンズの理屈と同様で、遠方を見ている場合は薄く、近くを見る場合は厚くなります。
網膜
網膜はカメラでいうフィルム面に相当し、感光素子の2次元的な配列で像をとらえるようにできています。網膜に倒立像が写っていることを最初に考えたのはケプラー(1604)と言われており、その事実はシャイナー(1625)によって(牛の眼球で)確認されています。
網膜上の各感光細胞は、それぞれに入ってくる光の量や波長に応じて化学物質を放出し、それが視神系の細胞へ伝わります。このとき、網膜の中心付近では感光細胞と視神経細胞の連結が1対1、周辺部では多対1となっていて、中心部の像が重要であることを物語っています。
ちなみに、人の網膜を「画素数」で例えると、視神経の数から、ほぼ 1,000 × 1,000 画素程度であると考えられます。ただ機械的な撮像素子とは違って、分布は均一ではなく中心部が高解像度になります。
感光細胞
「人」が見ている「色」をさらに詳しく理解するためには、錐体(Cone)と桿体(Rod)という2種の視細胞の存在を知る必要があります。それぞれの特徴を簡単に言うと、錐体は感度は悪いが色彩を感じる能力があり、桿体は逆に高感度であるが明暗しか感じることができない、というものです。「人」の網膜上には中心部(黄斑部とも言う。凝視点の像ができる部分で、視角で言うと10度以内)に錐体が多く分布し、一方周辺部には桿体が多く分布しています。我々が「色」を感じて読み取ることができるのは、まなざしを向けている限られた範囲ということになります。
では錐体はどのようにして色を見分けるのでしょうか。錐体には R(611nm)・G(529nm)・B(462nm)に感受性のピークをもつ3種類の細胞があり、入射光の波長により生じるそれぞれの反応の割合で、色を感じていると言われます。
画像を表示するディスプレイは RGB の3原色によってすべての色をつくっていますが、本来3種類の波長の光をまぜて単一の波長の光にするというのは物理的には無理な話で、これはすなわち「我々の錐体が RGB の組み合わせで反応しているために、本来の単一の波長と、3種の波長のまざったものの区別ができない」ということを物語っています。
この3原色説は、ヤング(1801)・ヘルムホルツ(1860)によって提唱されていたものです。
- 可視光
色という心理現象は、光という物理現象によって引き起こされます。人の視覚がとらえることのできる光は、波長約 380nm から760nm の範囲の電磁波です。ちなみにその外の領域は、波長の短い方は紫外線(UV)、長い方は赤外線(IR)です。ガンマ線 < X線 < 紫外線 |可視光|赤外線 < 無線通信電磁波領域
我々はその波長の違いを「色」という現象としてとらえており、波長の長い方から「赤 橙 黄 緑 青 藍 紫 」というふうに対応づけることができます。もちろん「色」は物理的に存在するものではなく、我々の頭の中で生じている心理現象で、「色名」も本来連続的に分布するものを言葉で区切ったものにすぎません(例えば虹の色数も、日米では7色ですが、6色や4色に分類する文化圏もあります)。
- 波長 = 光速/周波数
- 光速:3x108m/s
- 可視光の波長:380nm(790THz) - 760nm(400THz)
- 周波数の高さ:IR(赤外) < 400THz - 790THz < UV(紫外)
- 電波の周波数による分類
- MF(AM) - HF - VHF(FM) - UHF(地デジ) - SHF(高速通信) …3THzまで
- 人は光を発することができない( 視覚と聴覚の比較において重要 )
しかし、人の体からは電磁波が出ている(キルリアン写真 / 気配 )
「脳」における視覚像
ここで、大脳の視覚領に関する脳科学の知見を補足紹介しておきましょう。
網膜が捉えた像は、ほぼそのままのイメージ配列を保って大脳に向かうのですが(V1野からV3野までは、ほぼ網膜の配列がそのまま)、大脳には視覚に関わる複数の領野があって、領野ごとにかなり明確な役割分担があります。
例えば、V1野(第一次視覚野)では初期的な情報の処理と振り分け、V3野では方向・線すなわち「形」の検出、V4野では「色彩」の検出、MT野では「運動」の検出など、それぞれタイプの異なる処理が異なる視覚領野で行われています。
また、その処理の流れにも分担があって、例えば、右視野の像が左脳へ、左視野の像が右脳へと分岐していること、「空間視」に関わる情報と「形態視」に関わる情報がそれぞれ大脳の背側と腹側に分岐していることなど、大脳は、かなり複雑に機能分化しているといえます。もちろん、それらがどのように連合されるのかといった複雑な問題は未解決ですが、このような視覚に関わる領野が少なくとも30以上あって、大脳皮質の60%以上が視覚情報処理に関わっているという事実は銘記しておくべきでしょう(ちなみに霊長類は皆「視覚動物」です)。
さて、今の段階で確認されている非常に重要な知見は、「視る」ことにも「想像する」ことにも、ともに側頭葉連合野の連想記憶ニューロンの活性化(すなわちイメージ表象の活性化)が関わっているということです。
目からのボトムアップ信号(視覚)、そして前頭葉からのトップダウン信号(想像)、この2つのタイプの信号は、同様のふるまいで我々のイメージ表象を活性化しています。すでにサルトルは「想像力の問題」の中でこのことを哲学的に考察していましたが、我々の視覚と想像が、脳の中でおこる「イメージ喚起」のプロセスを共有しているという知見は、特に「映像」に関する領域では、あらゆる考察の根幹をなすものとして注目すべきものです。
- MEMO:第一次視覚皮質(V1)における視覚像
画像出典:
commons.wikimedia.org Neural pathway diagram.svg(CC-BY-NC)
- MEMO:顔の認知には右脳の働きが重要
- 右半球後頭葉の損傷 → 相貌失認
- 顔の右半分(左視野:右脳担当)のイメージが認知にもたらす影響大
像は倒立している?
眼球もカメラと同様、像は「倒立」しています。すると当然、ひとつの素朴な疑問が湧いてきます。「我々が見ている世界はさかさまなのか?」という疑問です。 答えは、網膜上の物理的事実としては YES です。
カメラにおけるフィルム面と同様で、網膜上には「倒立」像が写っています。しかし、私たちはそのように認知することはありません。
この問題について、レンズやプリズムによる網膜像の逆転実験を行ったストラットン(1896)の報告によると、「逆さ眼鏡」をかけはじめて3日目ほどで違和感がうすれ、1週間ほどで以前と同様の視覚が確立して、重力方向や触覚、聴覚との矛盾がなくなるということです。
また生まれてすぐのネコに「逆さ眼鏡」をかけさせるという実験でも、ネコの成長過程ではなんら有意な現象は見られなかったといいます。
要するに重要なのは「脳の中で網膜像と体性感覚がどう関連づけられるか」であって、網膜上で正立か倒立かはどちらでもよいのです。もともと我々には、(自分自身の手足も含めて)自分の眼に入った世界しか見えていないわけで、網膜像が世界のすべてです。したがって「手の見えているところに手の感覚のある場所が結びつき、足が見えている方向と重力を感じる方向が結びつく」ようになれば、我々は矛盾を感じずにすむのです。
脳の中で視覚像と体勢感覚が同一化していれば問題はない。感覚的には理解しにくい事実ですが、我々の世界認知にとって視覚像がいかに優位な立場にあるかということを示す重要な事実だといえるでしょう。
視覚の心理
ボトムアップとトップダウン
情報処理に際し、刺激情報が目から脳へと上がっていくプロセスをボトムアッププロセス(データ駆動型処理)といい、逆に脳の知識ベースを利用して刺激を待ち受ける、つまり、上から下へ降りてくるプロセスをトップダウンプロセス(概念駆動型処理)といいます。
私たち「人」が情報の読み取りを行う場合は、ボトムアップがすべてではなく、自分の知識ベースを手がかりに「こちらから予測をつけながら情報を迎えにいく」というトップダウンが大きく関わっていると考えられます。
図と地
カタチの知覚について考える場合、まず「図と地」というキーワードの理解が必要です。「図と地」とは視覚心理学の用語で、「図」は「まとまり」をもって現出している対象、「地」はその「背景」を意味します。
Source:commons.wikimedia.org:Two_silhouette_profile_or_a_white_vase.jpg
一般に「図」として見えやすい傾向にあるのは、閉じた領域、面積の小さな領域、垂直・水平方向にそろった領域、上下で言えば下の方、幅が一定な領域、動いているもの、誘目性の高い色彩、輝度の高いもの、と言われています。
日常の視覚では、背景と視覚対象との関係は、ほぼ明白ですが、紙面やディスプレイといった2次元の視覚では教示のしかた次第でこの反転が生じやすくなります。「杯にも見えるし、向かい合う二人の顔にも見える」という有名な「ルビンの杯」なども、この図地の反転現象を応用した図形です。
特に視力が低下している場合、意識の構え方によっては、その逆転は簡単に生じるものです。 例えば、心霊スポットなどで 「出る出る」という意識で見ていると、背景の影のほうが図になりやすくなって、結果「何か」が見えてしまうことがあります。数人で同じ景色を見ていても、自分だけが、「何か」の影らしきものを見るということは十分にあり得ることなのです。
さて、「図」になるものとは、もともと物理的にひとつの独立した個体として存在するものに限られるのでしょうか。実はそればかりではありません。我々が通常ものを見る場合、 本来無関係のものでもそれらを「群化」させて見ている場合が多く、例えば「星座」はその典型的な例です。
創作という能動的な行為のみでなく、「ものを見る」という一見受動的な行為の場合にも、人は半ば自動的に物事を「秩序」だてて捉えているのです。
- GoogleImage: 図と地
- GoogleImage: 多義図形
- My Wife and My Mother-in-Law William Ely Hill
顎の長いお婆さん、あるいは、右を向いた女性
知覚の体制化(群化の要因)
物理的にはバラバラな視覚刺激を、我々の視覚が「ひとまとまりのもの」として知覚する。このような視覚の性質を、心理学では「知覚の体制化(群化の法則)」といいます。
ウェルトハイマー(1923)は、「バラバラなものがまとまって見えるための要因」を、近接・類同・閉合・よい連続・よい形・共通運命・客観的構え・過去経験の8つに分類して説明しています。
- 近接の要因
近くにあるもの同士がまとまって見える|| || || || ||
- 類同の要因
同種のもの同士がまとまって見える◯▲▲◯◯▲▲◯◯◯▲▲◯◯▲▲▲◯◯▲▲▲
- 閉合の要因
<>や()など「閉じた形」がまとまって見える[ ] [ ] [ ] [ ] [ ]
- よい連続・よい形
バラバラな線、複雑な形でも、それらが連続するものの断片、あるいは単純な形の一部分が欠落したものとして認識可能な場合、それらはひとつにまとまって見える
- 共通運命
同時に同じ方向、あるいは同じ周期の明滅などが生じて、動作の同時性がみられる場合、それらは「共通な運命」をもつものとしてまとまって見える
この法則は近接,類同の法則よりも強く働きます。
- 客観的構え
見る者の意識の構えによってまとまり方は異なる
バラバラな3点でも「三角形に注目して下さい」と言われると三角形に見える
- 過去経験
見る者の過去の経験(知識)によってまとまり方は異なる
「朝顔を見ると思い出す」という文の解釈(「(朝の)顔」か「朝顔」か)は人によって異なる
ウェルトハイマーのまとめた群化の要因は、様々な現象を説明できます。例えば、映画映像における群集(モブ)シーンでは、群衆の中で、走っている2人をカメラが対象をフォロー撮影すると、さらに主役が浮き立つ映像になります。この場合2人の役者とカメラとの3者が「共通運命」の状態にあります。
我々の視覚は、その認知において情報量の経済効率を考えています。バラバラなままで記憶するより、要素の関係を見出して、その関係を記憶する方がはるかに効率的です。
例えば「◯◯◯◯◯◯◯」は「◯が7個」とすれば3文字分圧縮できます。また例えば、文章を読む場合も、一文字一文字を読むのではなく、文脈を頼りに、前後の関係から出現しやすい単語を予測しつつ「単語単位」でざっくり読んでいます。
情報量が少なくなるようにまとめて見る。要素ではなく要素間の関係を把握する。それが人間の知覚の基本方針と言えるでしょう。
知覚とは仮説を作り出すプロセスである Gregory
- 参考:
- Wikipedia: ゲシュタルト心理学
- 「ゲシュタルト」はドイツ語の Gestalt で「形態・姿」といった意味です。
幾何学的錯視
幾何学的錯視(Geometrical Optical Illusion)とは、大きさ・形・方向などの幾何学的パラメータが実際の値とは異なって見える現象のことです。最も簡単な例は、「正方形が縦長の長方形に見える」というもので、我々の視覚では水平線より垂直線の方が長く見えます(垂直・水平錯視)。幾何学的錯視には様々なタイプのものがあり、はじめに発見・報告した学者の名で◯◯錯視などと呼ばれています。
Source:commons.wikimedia.org File:Vertical_horizontal_illusion.png / PublicDomain
一般に、錯視現象は「細く見せる」、「高く見せる」などの目的に応じて視覚情報のデザインに応用されています。
以下、錯視について解説している各国の Wikipedia です。文化の違いもあって、紹介されている内容に違いがあります。時間があれば、それぞれをゆっくりご覧ください。
主観的輪郭
物理的には描かれていないのに輪郭線が存在するように見える現象(主観的輪郭)や、物理的にも主観的にも見えていない存在が視覚情報処理に影響するという現象も、見る側の心理に大きく依存した現象です。
特に後者は重要で、例えばレイアウトグリッドのような「不可視のガイドライン」は、無意識のうちに我々の視覚に捉えられて、それが全体の構図や秩序感を大きく左右しています。
例えば、教室という空間の中でも、通常は机が「不可視のガイドライン」に沿ってならんおり、それからずれるものがあると、そのずれた机の輪郭線の延長にさらに新しい「不可視のガイドライン」が生じて、空間は雑然と見えてきます。描かれた線のみならず、図形の線の延長に感じられる「非在の線」も、画面全体の構図・秩序に大きく関与するものであることを銘記しておきましょう。
Source:commons.wikimedia.org:Kanizsa_triangle.svg
奥行き知覚
本来2次元である網膜像をもとに、我々は奥行きを含む3次元の世界を認知しています。第3の軸である、この奥行きを知る手がかりには絵画的要因・生理的要因・運動要因などがあります。
- 絵画的要因
絵画的要因とは、大きさ・上下・重なり・きめの勾配・色調・コントラスト・明暗・影のできかたなどで、配置や描きかたによって奥行きを知る手がかりが得られるというものです。
- 生理的要因
生理的要因には、水晶体の調節や視線の収斂といった筋肉の動きに関わるものと、両眼の網膜像のズレによるものとがあります、特に両眼視差(Binocular Parallax)はステレオグラムの基本原理でもあり、他の要因とは違う生々しい立体感を得ることができます。
Source:commons.wikimedia.org:1885_Allentown_PA.jpg / PublicDomain
- 運動要因
主として視点が移動している場合には運動要因が効いてきます。視点を移動しながら風景を眺めていると、近くの風景と遠くの風景とでは移動のスピードに差ができます。このことから感じられる遠近感を、運動視差 (Motion Parallax)といい、セルアニメーションなどの風景描写に応用されています。
付記:交差法立体視体験
- 画像をクリックして拡大表示
- 右目で左の画像、左目で右の画像を見るように「寄り目」にします。
- 肩の力を抜いて、ダブった画像が自然に一枚に重なるまで待ちます。
- 初めて体験する方には、多少時間がかかるかもしれませんが、がんばってお試しください。
Source:commons.wikimedia.org:File:Stereo_Photo-Cross_see,Rokkakudou
- GoogleImage: Stereophoto Cross-view
- GoogleImage: ステレオ写真 交差法
- 立体写真-交差法、六角堂
Author:daidarabotti|WikimediaCommons - ABD 5125=-Stereo Photo-3D
Author:relaxednow|WikimediaCommons
- 立体写真-交差法、六角堂
視野
頭部を固定して1点を凝視した状態で見える範囲を視野といいますが、視野計による調査では、「人」の視野は左右約200度・上下約140度といわれます。 この場合左右については大差ありませんが、上下に関しては上60度・下80度と下の方が広く、経験からもわかるとおり、日常生活ではさらに下の方が優位になります。我々の身の回りの物は大部分眼の高さより下にあって、とりあえず注意を要するのは足元なのだから、これは当然のことですが、都市生活では「頭上注意」も常識であり、人の視野と生活環境とは決して無関係ではないことは銘記すべきでしょう。
さて、上に述べた視野は「見える範囲」ですが、このうち実際に情報の読みに関わる領域というのは、左右20度・上下10度の範囲で、これは網膜上で言うと錐体が集中的に分布する域にあたります。
この範囲の情報は意味あるものとして捉えられているわけで、例えば星座のように我々がかってに群として見ているものも、ほぼこの視角内におさまっています。
視覚情報をデザインするという観点から言えば、この「見える範囲」「読む範囲」という二つの視野のもつ意味は重要で、例えば駅のホームから見える電照看板を計画するという場合でも、まず普通にホームに立った状態で、視認されうる範囲内に設置される必要があり、またそこから眺めた場合に、看板のデザイン全体がまとまって見える視角範囲におさまるかたちで判読されることが望ましいということになります(これを超える大きさのものでは、構図や配色といった画面内の設計が的はずれなものになってしまいます)。
視野と視角の問題は色彩や形態の知覚の問題に比べて忘れられがちですが、作業環境の計画、鉄道や自動車道路など交通システムにおける案内・標識の計画、公園や都市環境全般における景観の計画、あるいは又聴覚障害者のためのコミュニケーションシステムの設計など、我々の生活に関わる様々な場面で考慮されるべきものといえます。
補足的に他の動物との比較にも触れておきましょう。大半の動物は眼が顔面の両側にあって、各々の視野が独立するかたちでほぼ360度の視野をもつのに対し、「人」場合は両眼とも前方を向いていて、左右の眼の視野の共通領域が広くなっています。つまり両眼での全体の視野は狭いが、両眼視による奥行き知覚(後に詳しく述べる)が有利になるという点が特徴的です。
このことは、「人」以外の動物が障害物や外敵といった自然環境に関する情報を重視するのに対し、「人」はそうした情報よりも相手の表情やしぐさ、あるいは文字や画像情報といった同種のもの同士でのコミュニケーションに関わる情報を重視することを物語っています。
視点と視線
私(の自己意識)は「他者のまなざし」に起因するといわれます。
一般に、「人から見られずに見ることのできる環境」は快適で、「人から見られている(と感じつつ)、自分は相手を見ることができない環境」は不快なもの(緊張感が高い)となります。
見られずに 見ることのできる環境
窓際 / すだれ / 車の中 / 仮面 / そして「映画」
- 参考:
- 安部公房の実験小説「箱男」の主人公は「見られずに見る男」
- 視線が衝突しない工夫 > GoogleImage: 桂離宮 四つ腰掛
- 透明人間は成立するか? > 見えない手足はコントロールできない?
見られているのに 見ることはできない環境
監視カメラのある場所 / 試験会場 / パノプティコン / そして「競争社会」
- 参考:
- パノプティコン とは、「看守」が見えない刑務所
- 視点の高さが10センチ変わるだけでも世界は違って見えます。
- 視線はものの特徴点を跳躍移動しながら形をとらえています。
- 好きな対象と嫌いな対象では視線の集中度合いが異なります。
- カメラワークには視点と視線というパラメータが非常に重要です。
その他関連記事
- BrainScience 脳科学
- CognitivePsychology 認知心理、ボトムアップとトップダウン
- ContextEffect 文脈効果
APPENDIX
参考書籍 等
- R・アルンハイム ,美術と視覚, 1963, 美術出版社
- 大山正, 視覚心理学への招待―見えの世界へのアプローチ ,2000,サイエンス社
- J.J.ギブソン, 生態学的視覚論―ヒトの知覚世界を探る, 1986
- 三浦 佳世, 視覚心理学が明かす名画の秘密, 2018, 岩波書店
- R・アルンハイム ,美術と視覚, 1963, 美術出版社
- 角田忠信, 右脳と左脳, 1981, 小学館
- 福井康之, まなざしの心理学,1984, 創元社
- R・L・ソルソ, 脳は絵をどのように理解するか,1997, 新曜社
- 中島義明他編(2004) 心理学辞典 有斐閣
- マーク・チャンギージー, ヒトの目、驚異の進化, 2020, ハヤカワ文庫