認知心理学
認知心理学(cognitive psychology)は、知覚・理解・記憶・思考・学習・推論・問題解決など、人間の高次の認知機能を扱う分野で、情報科学や脳科学とも相互に関連しつつ、現在の心理学の主幹を成しています。
文章の整理がついていない部分が多々あります。随時修正しています。
CONTENTS
視覚と聴覚の心理
視覚の心理学
記載項目が多いため、以下のページに独立させています。
聴覚の心理学
記載項目が多いため、以下のページに独立させています。
感覚・知覚・認知
我々の情報の読み取りには、感覚(Sensation)・知覚(Perception)・認知(Cognition)の3つの段階があります。
感覚
「感覚」とは、外部(あるいは体内)からの刺激に対する対象性のはっきりしない「感じ」のことです。聴覚で言うと音の大きさ・高さなど、視覚で言うと明るさ・色などがそれにあたります。この感覚については一般に、1次元刺激(音の大きさ・明るさなど)について、7±2 段階程度の弁別能力があるといわれ、また感覚の大きさは刺激の物理強度の対数に比例する(R = C log S)ということが知られています。
このような、物事を物理量で捉えるレベルの問題では、「機械の視聴覚」であるセンサーは非常に優秀です。我々は通常、「明るさ」を測ったり、「音の大きさ」を測ったりするときに、測定機器に頼ります。1次元刺激の弁別・評価に関して、正確さを必要とする場面では、人間は常にそれを機械に委ねています。
知覚
「知覚」とは、受けつけた感覚刺激により構成される対象性のはっきりした経験です。聴覚でいうと時間的な刺激の配列関係である「旋律」や「リズム」が、視覚でいうと空間的な刺激の配列関係である「形」がその対象です。知覚は、刺激の関係性によって対象化されるので、物理量に変化があったとしても関係が同じならば同一のものとみなされます。例えば「キーが変わっても同じ曲に聞こえる」とか「長方形は斜めから見ても長方形とわかる」とか「明るさが変わっても一つの部屋を見間違うことはない」といったことなどが、それにあたります。
認知
「認知」というのは、受けつけた知覚対象を記憶に照合して、自分の世界像における位置づけを行う、つまり「意味を付与する」段階です。感覚・知覚までは、他の生物でも見られる比較的低次のプロセスですが、認知のレベルは、「言語」や「文化」といった知識ベースも関与する人間特有の非常に高度なプロセスです。このレベルの処理は、他の生物や人工知能を持たない通常の機械には難しいものとなります。
ノイズ ・ かたち・ことば
私たちをとりまく刺激あるいは情報は、この感覚・知覚・認知という3段階の概念をもちいて分類することができます。まず、単なる感覚刺激に止まるものの例として「ノイズ(雑音)」、次にかたちの知覚に止まるものとして「音楽」・「図形」・「外国語」、そして最後に言語的な意味の認識にまで到達する「具体的な画像」・「映像」・「母国語」など。
感覚レベルの刺激
まず感覚レベルまでの刺激情報について。一般に私たちは純粋な感覚というものを得ることがめったにありません。なぜなら大半の刺激はすぐに秩序化されて「形」として知覚され、またそれはすぐに言語的に認識されてしまうからです。したがって、このレベルの対象となり得るのは「ノイズ」のような対象化されない刺激か、あるいは「実験的芸術」に見られる「人間の自動的な『読み』を遅延させる」ようなものに出会った場合だけです。人にとって「秩序化して把握しにくいもの」、「言語化不可能な生々しさをもつもの」は、不快であると同時に新鮮であるという両義性をもっています。
知覚レベルのカタチ
次に、知覚のレベルまでのものについてですが、例えば「外国語(その内容が理解できない場合)」は、「パターンをもつ音」として聴覚に、あるいは「規則性のある図形の並び」として視覚に与えられるもので、知覚レベルまでの対象となります。外国語による歌(Voice)は、他の楽器と同様に、純粋に声という楽器が奏でるメロディー(形)として聞こえてくるし、また例えば「英字新聞」は、英語を母国語としない人には、細かな図形が並んだテクスチュア模様に見えます(だから、包装紙としても違和感なく使えるのです)。秩序あるかたちとしては捉えられるのですが、言語的に何かを意味するわけではない(言い替えれば意味を求めようという欲求を生じさせない)純粋な「形」、そのようなものが知覚レベルまでの対象です。抽象的絵画や建築は、よく音楽に例えられますが、それも、それらを知覚レベルで捉えた場合の話です。
認知レベルの意味
意味の了解にいたるレベルの情報の代表は「母国語」による文字や音声です。それらは見る・聞くと同時に、言語的な意味の付与にまで情報処理が進みます。私たちの脳は、処理効率・記憶効率を上げるために、その感覚・知覚レベルの情報を破棄(意識のレベルから除外)して、言語的な意味内容のみを意識し記憶します。内容は覚えていても、誰の声であったか、どんなフォントで書かれてあったかは覚えていない・・というのは、多くの場合にあてはまるのではないでしょうか。
さて、意味が付与されるレベルの情報として、やっかいな存在が「具体的な画像」や「映像」です。「像」はそれ自体では言葉や文字を含んでいないにもかかわらず、私たちはそれを言語的に了解しようとします。たしかに、そこに映しだされるものは、私たちの現実世界に存在するものであって「名付けられるもの」であるから、言語的に認識できるのですが、しかしスクリーンに映し出される「鳩」は、私たちが街で見かける「鳩」以上(以外)の何かを意味する場合があるし、同じ「鳩」のカットでも前後のカットとの関係でその意味する内容が変わってきます。「映像」は単なる現実のコピーとは違うのです。さらに、知覚される「形」が同じでも、その解釈すなわち認識のされかたが、見る人によって様々であることを考えれば、「映像」という情報は、それを受け取る場面で意味が生成するという性質のものだといえるのです。これは、記号の「形」や「配列規則」が同じであれば、一般的にその意味が一義的に定まる(と考えられている)「言語」とは大きな違いです。
意識されにくい感覚・知覚情報
デザインを学んだ人であれば、ビジュアルデザインにおけるフォントの重要性を知っています。しかし、一般の多くの人はそのことに気づいてはいません。それは、フォントのカタチというものが、感覚・知覚レベルの情報であって、通常のコミュニケーションでは、意識に上ってこない(すり抜ける)からです。
多くの刺激情報に対して、私たちの脳は、感覚>知覚>認知と自動的に処理を進めており、最終的に意識されるのは「言語的意味」ということになります。しかし、意識に上ることのない感覚・知覚レベルの情報が、ヒトのコミュニケーションには大きく影響しています。情報を担っている搬送体(メディア)の色彩、音色、カタチ、手触り、・・あらゆる感覚・知覚情報が意識下においてコミュニケーションに大きく影響していることを忘れてはいけません。
- GoogleImage:意識 前意識 無意識
- Google:メラビアンの法則 誤解釈が流布していますが、それはそれとして
情報への「構え」
ボトムアップとトップダウン
情報処理に際し、刺激情報が目から脳へと上がっていくプロセスをボトムアッププロセス(データ駆動型処理)といい、逆に脳の知識ベースを利用して刺激を待ち受ける、つまり、上から下へ降りてくるプロセスをトップダウンプロセス(概念駆動型処理)といいます。
私たち「人」が情報の読み取りを行う場合は、ボトムアップがすべてではなく、自分の知識ベースを手がかりに「こちらから予測をつけながら情報を迎えにいく」というトップダウンが大きく関わっていると考えられます。
例えば、多義的に解釈可能な図形(ルビンの壷など)でも、人は「情報への構え」のありかたしだいで、無意識的に一つの「読み」を選択し、他の解釈を捨てます。また例えば、話を聞くという場合も、風景を見るという場合も、私たちは日常的な経験から、時間的に次にくる「音」や、空間的にその周囲に見えるはずの「形」を事前に予測できるのが普通であり、送られてくる情報を「こちらから迎えにいく」というかたちでスムーズに(ある意味では惰性的に)処理することができるのです。
カクテルパーティー効果という言葉があります。多くの人が会話する中でも、意識を向けた特定の人の声を聞き取ることができる・・というものです。これにもトップダウンプロセスが強く効いています。
さらに、遠くで会話する2人を双眼鏡でクローズアップして見ると、声まで聞こえる(正確には聞こえやすくなる)という例があります。視覚からの情報がトップダウン的に聴覚に作用して、話者の音声が分離しやすくなった結果と考えられます。
幼少期の知覚や、新しい環境での知覚では、ボトムアップ処理が必要になりますが、我々大人の日常生活においてはトップダウン処理が効くことによって、世界とのスムーズな関わりが実現されています(ちなみにトップダウン処理に大きく寄与しているのは「言語」)。足元をほとんど確認することなく、階段を登り降りできるのは、階段の段差への対応をトップダウン的に行っているからです。
視聴覚の惰性化と日常性
私たちの世界は、日常的で予測可能な出来事のくりかえしであり、「予期せぬ出来事」というのはその言葉どおり非常に小さな確率でしかおこりません。たとえば、電車を待つホームにセスナ機がすべりこんでくるとか、机の引き出しを開けたら魚が泳いでいるなどということは、まずあり得ないことであって、もし日常がそうした予測のつかない事態の連続であれば、私たちのトップダウンは効力を失い、すべてを視聴覚のボトムアップに依存せざるをえなくなります。おそらく人はそのような状況に長くは耐えられないでしょう。
私たちはこの世界の日常性(予測可能性)ゆえに、情報の読み取りに際して部分的なボトムアップだけで状況を理解し、スムーズに世界に適応することができるのです。私たちの生活環境はトップダウンが機能しやすくなるように(つまり情報処理負荷が小さくなるように)デザインされています。一般にすぐれたデザインに対しては、私たちはその存在を意識することがありません。
- 六角柱の鉛筆 丸軸や三角軸持ってみてはじめてその使いやすさがわかります
- コップのカタチ
- 道 道は場所と場所をつなぐために、昔誰かがつくったものです
・・などなど
しかし一方で、この日常性は、人とモノとの関わり、人と情報との関わりを惰性化させてしまうものでもあります。そのせいで私たちは、はじめて何かに出会った時の新鮮な感覚を失いつつあります。大人になるにつれ、物のもつ物質的・具体的な存在感は意識下にすりぬけ、それそのものの存在感を感じることがなくなってしまう。新鮮な感動を取り戻すには、その惰性化した認知プロセスをゆさぶるものが必要です。アートと呼ばれるものの中には、「おや?」と思わせるような非日常的状況を作り出すことによって、私たちの惰性化した認知プロセスを中断させ、ゆさぶりをかけてくるものがあります。
- 現代美術
- 写真(機械の知覚)
- 実験映像
- 歩行者天国 道路の使い方を異化することで、私たちは「道」の存在を意識します
・・などなど
付記:Typoglycemia
以下の文章を(すばやく)読んでみて下さい。
こんちには みさなん おんげき ですか? わしたは げんき です。 この ぶんょしう は いりぎす の ケブンッリジ だがいく の けゅきんう の けっか にんんげ は もじ を にしんき する とき その さしいょ と さいご の もさじえ あいてっれば じばんゅん は めくちちゃゃ でも ちんゃと よめる という けゅきんう に もづいとて わざと もじの じんばゅん を いかれえて あまりす。
註)ケンブリッジ大学における研究という話は事実ではありません。
多分、意味は理解できたのではないかと思いますが、よく見て下さい。間違いだらけの文章です。私たちの脳は、入力される視覚情報を正確に処理していません(ボトムアップ処理に関して手を抜いています)。トップダウン処理を機能させることで、全体を「惰性的」に読んでいるのです。
単語の語中の文字をバラバラにしたものは、文章を理解できる読者の 読解能力にほとんど、あるいは全く影響を及ぼさない。 実際に速読が可能な読者は、単語中の文字位置をバラバラにした文章を A4サイズ1ページ提示されたとしても、4,5個の間違いにしか気づかない
G.Rawlinson,1976, The significance of letter position in word recognition
単語認識における文字の位置の重要性
文章を惰性的に読む大人はこの誤字に気づきにくく、逆に、文字を覚えたての子供たちは、すぐに間違いに気づきます。
芸術学部の学生さんの中には、誤字にすぐ気づいた方も多いのでは・・
常に新鮮な目で、現実を注意深く見ているということです。
MEMO:かごめかごめ
誰もが知っているこの歌。書き留めてみるとわかりますが、意味不明な言葉の羅列になっています。「夜明けの晩」、「鶴と亀がすべる」、「うしろの正面」・・そもそも「かごめ」とは? 私たちは、言語的意味の了解を阻むこの歌詞を「音のカタチ」すなわち知覚レベルの情報として意識・記憶しています。感覚>知覚>認識。意味が付与される手前で止まる音のカタチ(知覚像)。意味がわからない、トップダウンが効かない・・そこには純粋な造形行為としての「詩」が存在します。
フレーム・オブ・リファレンス
言葉・音楽・映像、私たちが様々な刺激情報を処理する際にトップダウン的に機能している意識の構えのことをフレーム・オブ・リファレンスといいます。日本語では「準拠枠」、「参照枠」あるいは「関係づけの枠」などと訳されます。
これは我々の視聴覚情報の認知を理解する上で重要な概念で、視覚、聴覚それぞれ以下のページに記載しています。
文脈効果 / プライミング / スキーマ
文脈効果とは「刺激の知覚過程いおいて、前後の刺激の影響で、対象となる刺激の知覚が変化する現象のこと」をいいます。
- ContextEffect ← 記事を独立させました。
視聴覚の相互作用
人の視聴覚では、聴覚中枢と視覚中枢の区別はあるものの、音と映像の独立性は完全ではなく、感覚のレベルでの色聴現象をはじめ、優位なモダリティーへの統合、読み取り支援、干渉による異次元の感覚情報の生成など、様々な相互作用があります。私たちは、視覚と聴覚のこのような相互作用を、「あたりまえ」と感じていたり、あるいは気付いていなかったりするのですが、音楽や映像の制作においては無視できない問題です。
- マガーク効果
マガーク(1976)の実験は、視覚と聴覚の相互作用を説明するものとして有名です。それは、「が」を発音する口の動きを視覚的に見せ、同時に「ば」の音を聴覚的に聞かせると、被験者には「だ」と捉えられたというものです。
- 色聴(共感覚)
これは「音を聞くと色が見える」すなわち音程と色相とのあいだに感覚的な結びつきが見られる現象で、カール・ジーツ(1931)の説によると、おもちゃのピアノのように、ドレミ・・の音階が赤橙黄・・に結びつくというタイプのものもあります。
- テレビ・映画の画面と音
音と映像が複合した情報は、時間的には聴覚が優先し、空間的には視覚が優先するかたちで、一方が他方に追随・融合するかたちで捉えられます。例えば、アフレコされた足音と素材映像の足の動きが合っていない場合でも、足音に映像がなじむように違和感なく捉えられるし、また逆に、ニュース解説者の口元(画面上)には実際の音源(スピーカ)がないにも関わらず、音はそこから聴こえているかのように捉えられます。前者は音のリズムの問題で聴覚が優先している例であり、後者は空間的な位置の問題で視覚が優先している例である。いずれにせよバラバラに与えられた音と映像は、自然に一体となって捉えられるのです。
- 余談:マッチ箱の手品
「空のマッチ箱を振ると音が聞こえる(袖の中に中身の入ったマッチ箱が隠されている)」という手品も同様で、視覚情報(「振る」という動作)に聴覚が誘導された(心理的に音源の位置が移動した)ものと説明できます。
記憶のモデル
人間の記憶には複数の領域・段階があり、それぞれ以下のように呼ばれます。
- 感覚登録器(sensory resister)
- 短期記憶(short term memory)
- 中期記憶(middle term memory)
- 長期記憶(long term memory)
記憶のモデルを「二重貯蔵モデル(マルチストアモデル)」で考える場合には「短期」と「長期」の2つに分けます。
感覚登録器
感覚登録器は、視覚で1秒以下、聴覚で数秒の記憶で、聴覚刺激・視覚刺激などの感覚刺激をそのままのパターンですべて記録するといわれます。瞬間的に目を見開いて閉じたときに「目の前の情景が焼き付いている」という感じがするのがそれです。しかしこの情報は次々に捨てられる運命にあります。
短期記憶(作動記憶)
短期記憶は、感覚登録器の内容から知覚された意味のある情報を数分という短い時間の間記憶する領域です(同時に記憶できる項目数は7±2程度)。
短期記憶を発展させた概念に「作動記憶(ワーキングメモリ)」があります。これは短期的な情報の保存と処理をまとめた概念で、中央実行系、音韻ループ、視空間スケッチパッドがあります。
余談ですが、コンピュータにおけるキャッシュメモリはこのワーキングメモリに例えることができます。今、関心のあることを、高速でアクセスできるメモリに置いておく・・というのは情報処理効率を上げるのに効果的な手法です。
机は大きい方がいい、デスクトップは大きい方がいい、スマホの画面では仕事はできない・・すべて同じことです。
参考:小さなワークスペースで作られたもの > 携帯小説
中期記憶
中期記憶は、脳内の「海馬」に1時間から最大1ヶ月程度保持される(大半は9時間ほどで消滅する)記憶で、この間に複数回のアクセスを受けたものが重要なものとして「側頭葉」に送られ、それが最終的に長期記憶になると考えられています。
長期記憶
長期記憶にはさらに、宣言的記憶(言葉で記述できる事実に関する記憶)と手続記憶(クルマの発進のしかたなどの手続きに関する記憶)との区別があり、宣言的記憶は、またさらに意味記憶とエピソード記憶に分けられます。意味記憶は反復学習による体系的な知識ベースで徴標(どこで覚えたかという情報)のないもの、エピソード記憶は特定の時間・空間に関する具体的な体験の記憶です。ちなみに「記憶を失う」という場合は、大半がこのエピソード記憶の喪失です。
記憶は「ホログラム」式
人間の記憶は、コンピュータのメモリーのような「引き出し」に知識項目が一つずつ入っているというイメージでは捉えられません*1。詳細を後にして、先に一般的な事柄を述べると、「人」の記憶は、細胞イコール一つの記憶単位と考えるより、神経細胞同士の結合の「関係」が記憶の「構造」をかたちづくっていると考える方が、あらゆる点で説明がつきやすいのです。人間の記憶は、「複数の神経細胞が複数の事象についての情報を重層的に担う」という意味で、「ホログラム式の記憶である」ともいわれます*2。
人間の脳の記憶は引き出し式ではなく、複数の細胞が複数の記憶に同時に関わっています。よって「思い出」のイメージも絶対とは言い切れず、時間とともに変質していると考えられます。
記憶とは「関係」の記憶である
さて、こうした知見によれば、物事は一つ一つの項目としてではなく、「関係」として一挙に構造化されて記憶されているということになります(構造主義言語学のF・ソシュール(1916)も同じことを言っていました)。例をあげてみると、私たちは新しい言葉を覚える際に、反対の意味の言葉や、対になる言葉とともに「二項対立」的に記憶する方法をよくとります。これは単独の項目よりも二つの対立項目で記憶するほうがその関係の問題として記憶に位置付けやすいことを意味しています。さらに言えば、私たちの日常的な用語には単独では用をなさない「上」とか「左」とかいう概念があって、辞書の「左」の項には「右の反対」、「右」の項には「左の反対」と記されており、要するに関係の問題でしかない概念も多いのです。
記憶の容量
コンピュータのような機械の記憶の場合、記憶が「引き出し式」であることから、容量というものが定まるのですが、人の「ホログラム」式記憶の場合は、どこまでが限界というものではなく、知識の構造化が能率的であればあるほど、より多くのことを記憶できます。人の脳細胞の数はほぼ同じで、実際にはその数%しか働いていないという報告とあわせれば、「頭のよい人」というのも「容量」の問題ではなく、知識の構造化がうまいかどうかの問題であるといえるでしょう。例えば、ある社会現象を説明するモデルが、過去に学んだ物理現象を説明する数式モデルと似通っていると気付いた場合、その知識はパラレルに重ねあわせながら記憶(既存の神経細胞の結合関係が流用)されるわけで、この場合の記憶は能率的です(実際、学問に興味をもった場合、このような学習の転移がおこることは多い)。ある分野について学習すると、異なる分野の知識の飲み込みも早くなるのはそのためです。
記憶の正確さ
次に「記憶の正確さ」についてですが、「機械の記憶」は当然与えられた精度の範囲で正確に再現されるもので、なんらかの障害によって間違う場合は、もとの情報は見る影もないというのが普通です。一方、人間の記憶は、基本的な言葉の意味や日々の生活に関わる範囲では正確ですが、そうでない部分については、あいまいであるか、欠落しているか、まちがった記憶になっているかのいずれかです。これも結局は、記憶の構造が「ホログラム」式であることに由来するもので、新しい情報が記憶を再構造化する過程で、言い替えれば、神経細胞同士の結合関係があちこちで強まったり弱まったりする過程で、古い記憶に関する結合が弱まって薄れたり、あるいは別の記憶に関わる部分の結合関係を変えてしまったりするということで説明がつきます。
付記:進歩という幻想
最後に「進歩」という観念について。上述したことの繰り返しになりますが、新しいことを覚えるということは、過去の記憶の「関係」を修正することで、これはすなわち「何かを覚えるとき、気付かぬうちに何かを忘れている」ということを意味します。人は成長する過程で確かに新たな知識を蓄えていくように思えますが、これは「知識を確実なものにしていく」というということで、神経細胞のレベルで言えば「頻繁に駆動する一部の知識・思考回路に関してはその結合が強化されて、その他の結合は断ち切られていく」、簡単に言えば「頭が固くなる」・「思考がワンパターン」になるということなのです。
なにも知らない子供が、ユニークな発想で大人を笑わせたり、すぐれた想像力を発揮したりするのは、このことの裏返しといえるでしょう。その意味では「進歩」は幻想であり、人の社会化(大人になること)とは、あらゆる可能性の放棄の上に成り立っていると言うこともできます。一面的な見方で、人の脳に優劣をつけることはできません。
参考
脳科学へ
ページを分割しました。