LogoMark.png

情報デザイン概論/2021/1011

第5回 視覚情報

情報デザイン概論/20212021.10.11

AGENDA


以下、LIVE動画をご覧下さい。記事に沿って解説します。
記録動画の公開は 10月15日(金)までとします。早めの確認をお願いします。



CONTENTS


はじめに


視覚システム

眼球の構造

生物の体には感光細胞というものがあります。文字通り、光を感じる細胞のことで、初期の生物の場合は体表にそれが分布していますが、進化の過程で感光細胞の集合は窪みの中に入り込みます(例えばオウム貝の眼はこの段階のもので、ピンホールカメラと同様の仕組みで視覚像を形成しています)。さらにそれが進化すると、その窪みへ入る光量の調節機能をもったり、透明な膜によって覆われたりしてきます。

人の眼球では、窪みの中の感光細胞の集合が網膜であり、光量の調節をするのが虹彩であり、透明な膜が角膜です。また水晶体は角膜の派生として、硝子体は窪み内部の空間を外圧から護るために発生したと考えられています。ちなみに眼球は発生学的には脳の一部です。
 

Mammal_eye.png

画像出典:脳科学辞典 Mammal eye.png / Tmatsuyama(CC-BY-NC)
 

虹彩

虹彩は外部からの光量を調節する機構で、強い光によって感光細胞が破壊されないようにするのが本来の目的ですが、カメラの絞りと同様に被写界深度の調節機能を副産物として与えてくれます。すなわち、虹彩が大きく(瞳孔が大きく)なればレンズの使用面積が大きくなるため、ピントの合う範囲が狭くなり(対象の前後がボケる)、逆に小さく絞られるとピントの合う範囲は広くなります(対象の前後もくっきりと見える)。

曇り空の下ではぼんやり見える風景が、明るい日差しの下ではすっきり見えるのというも、日差しによるコントラストの問題だけではありません。眼鏡をかけている方は、それをはずして時計のベルトの穴越しに風景を見てみて下さい。採光面積を絞ることで(像は相対的に暗くなりますが)ピントが合いやすくなるという事実が確認できるでしょう。ピンホールカメラのようにレンズを使わず結像するものは、原理的にはボケとは無縁であり、すべての距離にある対象がシャープの結像します。

DOF.png

水晶体

水晶体はカメラのレンズに相当するもので、それを支える毛様体筋の弛緩・収縮によって厚みを変えることで、焦点距離を調節し、網膜上にピントを合わせます。通常のレンズの理屈と同様で、遠方を見ている場合は薄く、近くを見る場合は厚くなります。

網膜

網膜はカメラでいうフィルム面に相当し、感光素子の2次元的な配列で像をとらえるようにできています。網膜に倒立像が写っていることを最初に考えたのはケプラー(1604)と言われており、その事実はシャイナー(1625)によって(牛の眼球で)確認されています。

網膜上の各感光細胞は、それぞれに入ってくる光の量や波長に応じて化学物質を放出し、それが視神系の細胞へ伝わります。このとき、網膜の中心付近では感光細胞と視神経細胞の連結が1対1、周辺部では多対1となっていて、中心部の像が重要であることを物語っています。

ちなみに、人の網膜を「画素数」で例えると、視神経の数から、ほぼ 1,000 × 1,000 画素程度であると考えられます。ただ機械的な撮像素子とは違って、分布は均一ではなく中心部が高解像度になります。

感光細胞

「人」が見ている「色」をさらに詳しく理解するためには、錐体(Cone)と桿体(Rod)という2種の視細胞の存在を知る必要があります。それぞれの特徴を簡単に言うと、錐体は感度は悪いが色彩を感じる能力があり、桿体は逆に高感度であるが明暗しか感じることができない、というものです。「人」の網膜上には中心部(黄斑部とも言う。凝視点の像ができる部分で、視角で言うと10度以内)に錐体が多く分布し、一方周辺部には桿体が多く分布しています。我々が「色」を感じて読み取ることができるのは、まなざしを向けている限られた範囲ということになります。

では錐体はどのようにして色を見分けるのでしょうか。錐体には R(611nm)・G(529nm)・B(462nm)に感受性のピークをもつ3種類の細胞があり、入射光の波長により生じるそれぞれの反応の割合で、色を感じていると言われます。

画像を表示するディスプレイは RGB の3原色によってすべての色をつくっていますが、本来3種類の波長の光をまぜて単一の波長の光にするというのは物理的には無理な話で、これはすなわち「我々の錐体が RGB の組み合わせで反応しているために、本来の単一の波長と、3種の波長のまざったものの区別ができない」ということを物語っています。
この3原色説は、ヤング(1801)・ヘルムホルツ(1860)によって提唱されていたものです。

「脳」における視覚像

ここで、大脳の視覚領に関する脳科学の知見を補足紹介しておきましょう。

網膜が捉えた像は、ほぼそのままのイメージ配列を保って大脳に向かうのですが(V1野からV3野までは、ほぼ網膜の配列がそのまま)、大脳には視覚に関わる複数の領野があって、領野ごとにかなり明確な役割分担があります。

例えば、V1野(第一次視覚野)では初期的な情報の処理と振り分け、V3野では方向・線すなわち「形」の検出、V4野では「色彩」の検出、MT野では「運動」の検出など、それぞれタイプの異なる処理が異なる視覚領野で行われています。

また、その処理の流れにも分担があって、例えば、右視野の像が左脳へ、左視野の像が右脳へと分岐していること、「空間視」に関わる情報と「形態視」に関わる情報がそれぞれ大脳の背側と腹側に分岐していることなど、大脳は、かなり複雑に機能分化しているといえます。もちろん、それらがどのように連合されるのかといった複雑な問題は未解決ですが、このような視覚に関わる領野が少なくとも30以上あって、大脳皮質の60%以上が視覚情報処理に関わっているという事実は銘記しておくべきでしょう(ちなみに霊長類は皆「視覚動物」です)。

さて、今の段階で確認されている非常に重要な知見は、「視る」ことにも「想像する」ことにも、ともに側頭葉連合野の連想記憶ニューロンの活性化(すなわちイメージ表象の活性化)が関わっているということです。

目からのボトムアップ信号(視覚)、そして前頭葉からのトップダウン信号(想像)、この2つのタイプの信号は、同様のふるまいで我々のイメージ表象を活性化しています。すでにサルトルは「想像力の問題」の中でこのことを哲学的に考察していましたが、我々の視覚と想像が、脳の中でおこる「イメージ喚起」のプロセスを共有しているという知見は、特に「映像」に関する領域では、あらゆる考察の根幹をなすものとして注目すべきものです。

VisualCortex_V1.png



像は倒立している?

眼球もカメラと同様、像は「倒立」しています。すると当然、ひとつの素朴な疑問が湧いてきます。「我々が見ている世界はさかさまなのか?」という疑問です。 答えは、網膜上の物理的事実としては YES です。

カメラにおけるフィルム面と同様で、網膜上には「倒立」像が写っています。しかし、私たちはそのように認知することはありません。

この問題について、レンズやプリズムによる網膜像の逆転実験を行ったストラットン(1896)の報告によると、「逆さ眼鏡」をかけはじめて3日目ほどで違和感がうすれ、1週間ほどで以前と同様の視覚が確立して、重力方向や触覚、聴覚との矛盾がなくなるということです。

また生まれてすぐのネコに「逆さ眼鏡」をかけさせるという実験でも、ネコの成長過程ではなんら有意な現象は見られなかったといいます。

要するに重要なのは「脳の中で網膜像と体性感覚がどう関連づけられるか」であって、網膜上で正立か倒立かはどちらでもよいのです。もともと我々には、(自分自身の手足も含めて)自分の眼に入った世界しか見えていないわけで、網膜像が世界のすべてです。したがって「手の見えているところに手の感覚のある場所が結びつき、足が見えている方向と重力を感じる方向が結びつく」ようになれば、我々は矛盾を感じずにすむのです。

脳の中で視覚像と体勢感覚が同一化していれば問題はない。感覚的には理解しにくい事実ですが、我々の世界認知にとって視覚像がいかに優位な立場にあるかということを示す重要な事実だといえるでしょう。



視覚の心理

ボトムアップとトップダウン

情報処理に際し、刺激情報が目から脳へと上がっていくプロセスをボトムアッププロセス(データ駆動型処理)といい、逆に脳の知識ベースを利用して刺激を待ち受ける、つまり、上から下へ降りてくるプロセスをトップダウンプロセス(概念駆動型処理)といいます。

私たち「人」が情報の読み取りを行う場合は、ボトムアップがすべてではなく、自分の知識ベースを手がかりに「こちらから予測をつけながら情報を迎えにいく」というトップダウンが大きく関わっていると考えられます。

図と地

figure and ground

カタチの知覚について考える場合、まず「図と地」というキーワードの理解が必要です。「図と地」とは視覚心理学の用語で、「図」は「まとまり」をもって現出している対象、「地」はその「背景」を意味します。
Source:commons.wikimedia.org:Two_silhouette_profile_or_a_white_vase.jpg

一般に「図」として見えやすい傾向にあるのは、閉じた領域、面積の小さな領域、垂直・水平方向にそろった領域、上下で言えば下の方、幅が一定な領域、動いているもの、誘目性の高い色彩、輝度の高いもの、と言われています。

日常の視覚では、背景と視覚対象との関係は、ほぼ明白ですが、紙面やディスプレイといった2次元の視覚では教示のしかた次第でこの反転が生じやすくなります。「杯にも見えるし、向かい合う二人の顔にも見える」という有名な「ルビンの杯」なども、この図地の反転現象を応用した図形です。

特に視力が低下している場合、意識の構え方によっては、その逆転は簡単に生じるものです。 例えば、心霊スポットなどで 「出る出る」という意識で見ていると、背景の影のほうが図になりやすくなって、結果「何か」が見えてしまうことがあります。数人で同じ景色を見ていても、自分だけが、「何か」の影らしきものを見るということは十分にあり得ることなのです。

さて、「図」になるものとは、もともと物理的にひとつの独立した個体として存在するものに限られるのでしょうか。実はそればかりではありません。我々が通常ものを見る場合、 本来無関係のものでもそれらを「群化」させて見ている場合が多く、例えば「星座」はその典型的な例です。

創作という能動的な行為のみでなく、「ものを見る」という一見受動的な行為の場合にも、人は半ば自動的に物事を「秩序」だてて捉えているのです。

知覚の体制化(群化の要因)

物理的にはバラバラな視覚刺激を、我々の視覚が「ひとまとまりのもの」として知覚する。このような視覚の性質を、心理学では「知覚の体制化(群化の法則)」といいます。

ウェルトハイマー(1923)は、「バラバラなものがまとまって見えるための要因」を、近接・類同・閉合・よい連続・よい形・共通運命・客観的構え・過去経験の8つに分類して説明しています。

ウェルトハイマーのまとめた群化の要因は、様々な現象を説明できます。例えば、映画映像における群集(モブ)シーンでは、群衆の中で、走っている2人をカメラが対象をフォロー撮影すると、さらに主役が浮き立つ映像になります。この場合2人の役者とカメラとの3者が「共通運命」の状態にあります。

我々の視覚は、その認知において情報量の経済効率を考えています。バラバラなままで記憶するより、要素の関係を見出して、その関係を記憶する方がはるかに効率的です。
例えば「◯◯◯◯◯◯◯」は「◯が7個」とすれば3文字分圧縮できます。また例えば、文章を読む場合も、一文字一文字を読むのではなく、文脈を頼りに、前後の関係から出現しやすい単語を予測しつつ「単語単位」でざっくり読んでいます。

情報量が少なくなるようにまとめて見る。要素ではなく要素間の関係を把握する。それが人間の知覚の基本方針と言えるでしょう。

知覚とは仮説を作り出すプロセスである  Gregory

幾何学的錯視

Vertical–horizontal_illusion

幾何学的錯視(Geometrical Optical Illusion)とは、大きさ・形・方向などの幾何学的パラメータが実際の値とは異なって見える現象のことです。最も簡単な例は、「正方形が縦長の長方形に見える」というもので、我々の視覚では水平線より垂直線の方が長く見えます(垂直・水平錯視)。幾何学的錯視には様々なタイプのものがあり、はじめに発見・報告した学者の名で◯◯錯視などと呼ばれています。
Source:commons.wikimedia.org File:Vertical_horizontal_illusion.png / PublicDomain

一般に、錯視現象は「細く見せる」、「高く見せる」などの目的に応じて視覚情報のデザインに応用されています。

以下、錯視について解説している各国の Wikipedia です。文化の違いもあって、紹介されている内容に違いがあります。時間があれば、それぞれをゆっくりご覧ください。


主観的輪郭

Kanizsa_triangle

物理的には描かれていないのに輪郭線が存在するように見える現象(主観的輪郭)や、物理的にも主観的にも見えていない存在が視覚情報処理に影響するという現象も、見る側の心理に大きく依存した現象です。

特に後者は重要で、例えばレイアウトグリッドのような「不可視のガイドライン」は、無意識のうちに我々の視覚に捉えられて、それが全体の構図や秩序感を大きく左右しています。

例えば、教室という空間の中でも、通常は机が「不可視のガイドライン」に沿ってならんおり、それからずれるものがあると、そのずれた机の輪郭線の延長にさらに新しい「不可視のガイドライン」が生じて、空間は雑然と見えてきます。描かれた線のみならず、図形の線の延長に感じられる「非在の線」も、画面全体の構図・秩序に大きく関与するものであることを銘記しておきましょう。
Source:commons.wikimedia.org:Kanizsa_triangle.svg

奥行き知覚

本来2次元である網膜像をもとに、我々は奥行きを含む3次元の世界を認知しています。第3の軸である、この奥行きを知る手がかりには絵画的要因・生理的要因・運動要因などがあります。

付記:交差法立体視体験

立体写真-交差法 六角堂

視野

頭部を固定して1点を凝視した状態で見える範囲を視野といいますが、視野計による調査では、「人」の視野は左右約200度・上下約140度といわれます。 この場合左右については大差ありませんが、上下に関しては上60度・下80度と下の方が広く、経験からもわかるとおり、日常生活ではさらに下の方が優位になります。我々の身の回りの物は大部分眼の高さより下にあって、とりあえず注意を要するのは足元なのだから、これは当然のことですが、都市生活では「頭上注意」も常識であり、人の視野と生活環境とは決して無関係ではないことは銘記すべきでしょう。

さて、上に述べた視野は「見える範囲」ですが、このうち実際に情報の読みに関わる領域というのは、左右20度・上下10度の範囲で、これは網膜上で言うと錐体が集中的に分布する域にあたります。

この範囲の情報は意味あるものとして捉えられているわけで、例えば星座のように我々がかってに群として見ているものも、ほぼこの視角内におさまっています。

視覚情報をデザインするという観点から言えば、この「見える範囲」「読む範囲」という二つの視野のもつ意味は重要で、例えば駅のホームから見える電照看板を計画するという場合でも、まず普通にホームに立った状態で、視認されうる範囲内に設置される必要があり、またそこから眺めた場合に、看板のデザイン全体がまとまって見える視角範囲におさまるかたちで判読されることが望ましいということになります(これを超える大きさのものでは、構図や配色といった画面内の設計が的はずれなものになってしまいます)。

視野と視角の問題は色彩や形態の知覚の問題に比べて忘れられがちですが、作業環境の計画、鉄道や自動車道路など交通システムにおける案内・標識の計画、公園や都市環境全般における景観の計画、あるいは又聴覚障害者のためのコミュニケーションシステムの設計など、我々の生活に関わる様々な場面で考慮されるべきものといえます。

補足的に他の動物との比較にも触れておきましょう。大半の動物は眼が顔面の両側にあって、各々の視野が独立するかたちでほぼ360度の視野をもつのに対し、「人」場合は両眼とも前方を向いていて、左右の眼の視野の共通領域が広くなっています。つまり両眼での全体の視野は狭いが、両眼視による奥行き知覚(後に詳しく述べる)が有利になるという点が特徴的です。

このことは、「人」以外の動物が障害物や外敵といった自然環境に関する情報を重視するのに対し、「人」はそうした情報よりも相手の表情やしぐさ、あるいは文字や画像情報といった同種のもの同士でのコミュニケーションに関わる情報を重視することを物語っています。



視点と視線

私(の自己意識)は「他者のまなざし」に起因するといわれます。
一般に、「人から見られずに見ることのできる環境」は快適で、「人から見られている(と感じつつ)、自分は相手を見ることができない環境」は不快なもの(緊張感が高い)となります。

見られずに 見ることのできる環境

窓際 / すだれ / 車の中 / 仮面 / そして「映画」

見られているのに 見ることはできない環境

 監視カメラのある場所 / 試験会場 / パノプティコン / そして「競争社会」

その他関連記事

ミニッツペーパー

受講生の方のコメント




APPENDIX

参考書籍 等

PAGES

GUIDE

TOOL

DATA

Last-modified: 2021-10-11 (月) 19:15:00