人間の世界観について

中心と周縁

・我々は通常、我々を取り巻く世界を、友好的なものと敵対的なものに
  分割する思考に馴れている。
  文献: 「文化と両義性」山口昌男
・排除された第三項が闇から全体をコントロールする
  闇の日本史 / いじめ / 鬼ごっこ / 野球 / 貨幣
  文献:「排除の構造」今村仁司
・遺伝情報による照合で環境を把握でいない人間は、
  ”文化”というクッションを自然との間に作り出した。
  それは恣意的なものであり、文化圏ごとに異なる”共同幻想”である。
  文献: 「共同幻想論」吉本隆明

境界線上の存在

・位置づけがはっきりしないもの
・節のないもの(ミミズ、蛇,髪)い
・あちらのゴミはこちらの宝・・という発想
|  PAGE TOP |


物語の構造について

時間と空間の設定

・中心と周縁という観点から  例えば、日本昔話・・
・妖怪の出る場所「妖怪談義」柳田国男
・記号論的な観点から(盛り土の上/盛り土のした)

登場人物の設定

・一時に覚えていられる項目数は7つ
・一次元刺激の弁別は7±2段階    マジカルナンバー7(G.A.Millar)
・誰の視点で描くか
・必ず登場するトリックスター
|  PAGE TOP |


人間の聴覚

聴覚が捉える音は、自然環境のものと社会環境のものとに分類できると言われます。前者は自然界や異種の生物を情報源とする音で、障害物や餌、外敵に関わる ものであり、後者は同種の生物同士でのコミュニケーションに関わる音です。

受容器

「人」の聴覚の受容器は、外耳・中耳・内耳の3つで構成されますが、外耳と中耳は音響振動の伝達を、内耳は感覚細胞をもち、刺激による興奮を起こします。

まず外耳ですが、これは耳介・耳殻・外耳道からなり、外耳道の終端には鼓膜があって、これが空気中の粗密波を最初に体内へ伝える役割を担っています。耳介 が3kHz 付近、耳殻が5kHz 付近、外耳道が2.5kHz 付近にそれぞれ共振点をもち、これと頭全体や胸・肩等の
共振もわずかに関与して、鼓膜の付近では2 .6kHz の帯域で約10dB ほど音圧が上がっているといわれます。
この帯域はすなわち人の音声の、音素識別や話者識別にもっとも重要な領域で、これは「同種間のコミュニケーションに対する優位性」を物語っています。

中耳は鼓膜の振動を内耳の前庭窓に伝える役割を担います。その中空を鼓室といいますが、そこには3つの耳小骨があって、空気の「大きな振幅・小さな圧」を 体内の「小さな振幅・大きな圧」へ変換する「てこ」の役割を担っています。すなわちここでは、空気と水のインピーダンス整合が行われているのです(ちなみ に、水中に生活する生物の場合は「水の振動」↓「体(水と同じ)の振動」で音が伝わるため、この仕組みは不要です。したがって魚やイルカなどで は、内耳が直接頭部に埋ったようなかたちになっています)。

内耳は三半規管・前庭・蝸牛で構成されますが、聴覚に関係するのは蝸牛で、その螺旋状の管を2分する基底膜と呼ばれる膜の上に音の感覚細胞が配列されてい る直線的な配列です。ベケシー(1943)の観察によれば、鼓膜から伝達されてくる振動は蝸牛内で進行波をなし、この進行波は周波数の高い音では蝸牛の入 り口に近いとこ ろ、低い音では奥のほうでその振幅が最大になるといわれます。この基底膜のふるまいによって、我々は入力された音の高低を感じ取っているということになり ます。

さて、その基底膜上には音の感覚受容器であるコルチ器官がのっているのですが、それを構成する有毛細胞は、ゆれによって電位を発生し、それが聴神経(第1 次ニューロン)に伝達され、あとは2次、3次とシナプスを介して中継されて4次で大脳皮質の聴覚領に至ります。

1次ニューロンは基底膜上のいずれかの位置の興奮を伝達しており、その位置によって、各ニューロンは特徴周波数(最大感度を示す周波数)をもつことになる のですが、その上位では多数の入力に対して1つの出力というかたちで神経回路網をなしていきます。
興奮は単純に聴覚領へ上向するだけでなく、遠心性(上から下ってくる)のニューロンのフィードバックが干渉するなどして、複雑な機能が実現されていること になり、この回路網全体でおこっている興奮の空間的・時間的パターンが、我々の音の聴こえ方を決定づけていることになります。

最終的には、大脳皮質の側頭葉にある聴覚領が情報処理をおこなっており、ここは音の感覚という単純なレベルの問題ではなく、空間や時間の知覚に関わる高度 な情報処理機能を実現しています。
|  PAGE TOP |



マイクとピックアップ(機械の聴覚)

映像メディアにおける「カメラ」に相当するものとして、音響メディアにおけるマイクロフォンとピックアップがあります。マイク ロフォンは空気中の粗密波としての音をとらえるもの、ピックアップは空気以外の振動をとらえるものです。
ここでは、余談として、その構造と機能について概説します。

マイクロ フォンはスピーカと同様、基本的には電気音響変成器(可逆変換器)あるいは継電器(不可逆変換器)で、動電形・電磁形・静電形・圧電形・炭素形・半導体形 などがあります。特に動電形と静電形が一般的で、前者は電磁誘導すなわち、小さなマグネットのつくる磁界中で、電気導体である振動板が音波により振動する こと で起電力が生じることを利用するもので、後者はコンデンサの充放電電流を利用する、すなわち、導電性の振動板と固定極が向かい合ったコンデンサ様の構造に 直流電圧をかけておき、振動に応じた静電容量の変化から生じる充電・放電電流を得るというものです。それぞれダイナミックマイク・エレクトレットコンデ ンサマイクなどと呼ばれます。
また、かつての電話(黒電話)の送話器や放送用に使用された炭素形のカーボンマイクは、炭素粒の振動接触による抵抗値の変化を 利用するもので、変換能率が非常によく(ただし不可逆)、イヤホン程度ならば増幅なしで直接音を再生できるという性能をもちます。

ピックアップは、電流の変 化・磁界の変化・物体の動きなどを振動として拾う場合に利用されるもので、動電形・電磁形・半導体形などがあります。電磁気的な振動は「マグネットの芯の まわ りにコイルを巻く」という簡単な仕組で、電磁誘導による起電力を得ることができ、また物体の振動は、圧力をかけると抵抗値が変化するというピエゾ抵抗効果 をもつ半導体(不可逆)を利用することで取り出すことができます。

さて、人間の聴覚が左右2つの耳から情報を入力するように、「メディアの聴覚」にも2つ (あるいはそれ以上)のマイクを用いる方法、すなわちステレオ(マルチ)録音の発想があります。セッティングの方法には、レベルや位相の差を考慮して、2 個 の単一指向性マイクを適当な間隔をあけて配置する「レベル・位相差方式」、2個の単一指向性マイクを一点に配置する「レベル方式」、多数のモノラルマイク の入力をそれぞれ適当に左右のチャンネルにふって、架空のステレオ音場をつくる「分岐方式」の3つの方式があります。2つ並べれば立体的に聴こえるという 単純 なものでもなく、特にマイクとマイクの距離を開ける(位相差を利用する)場合は、その距離には注意が必要です。


補足:マイクの機能

さて次にその機能 の問題ですが、マイクは音響を電気信号に変換する最初の砦であり、その良し悪しは後のすべての処理・記録に影響します。処理・記録系がどんなにすぐれてい ても、入力の段階で十分な素材が得られなければその先に限界を生じてしまうのです。
マイクの特性を表わす値には、感度・雑音・周波数特性・指向特性・最大無歪 み音圧レベル・公称インピーダンス・共振周波数などがあります。

感度というのは聴覚で言う最小可聴値とは意味が異なり、1kHz・1μbar の平面波を正面から与えた場合に発生する電圧で、1Vを0dBとしたdB単位で表示します。通常-80dBから-45dB の間の値をとります。ただし、単に感度がよければよいというものではありません。適切な情報の記録には必要外の音を捨てるということも重要だからです。

雑音はそ れ自体から発生するものを言い、音圧レベルに換算して表わします。これは当然小さな値であるほうが望ましいといえます。

周波数特性とは、周波数領域における感度分布の ことです。一般的には低中音域でバランスのとれた静電形が良く、次に動電形、その他ではいわゆる良質な録音は望めないと言われます。しかし、全体にバラン スが良いということが美的に良い音につながるとは限りません。「機械」であるマイクは、その構成のしかたで様々な帯域に対応するものが実現できるわけで、 録 音する用途によって適切な帯域をもつマイクを選択するということの方がむしろが重要です。例えば、帯域の広い音楽の録音の場合は40Hz-15000Hz とほぼ可聴域全域が必要になりますが、音声の録音では100-8000Hz に重点を置くなど、必要のない帯域をカットすることがS/N比向上の点からも望ましいといえます。

指向特性とは、音源の方向と感度との関係を表すもので、無指向性・単一指向性・両指向性・ライン・放物面(パラボラ)集音な どの分類があります。無指向性は全方向について均等な感度分布をもつもの、単一指向性はマイクを向けた側の約180 度の範囲について感度が高いもの、といったぐあいで、最も指向性の強いパラボラ集音では前面20度以下で、前方の集音距離は無指向性マイクの3倍以上とな ります。

最大無歪み音圧レベルは、出力の高調波歪み率が1%以上になるときの入力音圧レベルです。人間の耳では鼓膜を破く危険があって測定できません、メ ディアの場合は「正常に機能する範囲」を示す値として測定できます。ダイナミックレンジという言葉もこれに近いもので「ノイズレベル(下限)から歪みが生 じ るレベル(上限)までの範囲」をいいます。 インピーダンスとは、いわゆる交流抵抗(電圧/電流)であすが、これは機器間での接続の際に重要な値で、当然 整 合をとった接続にしなければ信号は回路をうまく流れません。

共振周波数は、物体としてのマイクの固有振動数で、マイク自身を叩いたときに発生する音の周波 数と考えるとよいでしょう。マイクやピックアップの「個性」を生むものであると同時に、バランスの良さを追及する場合にはやっかいな存在となります。

こうして見てく ると、マイクは「人」の聴覚とは異なり、ものによって様々な「個性」が存在するため、録音に際しては個々のマイクの特性をいかに適切に生かすかということ が重要な問題となるでしょう。室内であれば残響の程度、屋外であれば風によるノイズの問題、テレビ・映画のロケではマイクの位置の制限など、状況に応じた 録音計画 が重要です。 補足になりますが、エレクトリックギターのピックアップなどは周波数特性のアンバランスさや歪み具合まで含めて楽器の個性を左右する重要な 要 素として位置付けられており、音を拾うというより音をつくるための要素と考えたほうがいいでしょう。分類上はたしかにピックアップであり、増幅処理を行う 機器から みれば、その「聴覚」に相当するのですが、構造的にもギターの一部として音源に「寄生」している事実から、それは楽器の「声帯」として機能していると考 えるべきでしょう。「メディアの耳」はその所属をかえることで「声帯」の一部にもなるということです。
|  PAGE TOP |

 

視覚と聴覚の相互作用

色調 音を聞くと色が見える
TVのスピーカ 視覚情報の位置に音を感じる

視覚から「が」、聴覚から「ば」 → 認知は「だ」
             (マガーク効果)

 このページは書きかけです。    
|  PAGE TOP |

            

聴覚情報と視覚情報の比較

まず、音響・音楽といった聴覚情報についてですが、基本的かつ重要な事実は、我々の可聴範囲の音の波長が約17mm から17m と、ほぼ我々を囲む物の寸法と同じだということです。
このことは視覚情報と同様な、空間的な「聴覚像」の生成が根本的に不可能であるということを意味しています。もちろん複数の音源を空間的に配列して、音源 から独立した情報源からの信号によって「音像」をつくるという発想はありますが、上記の理由でそれは人のスケールでは不可能で、また、人の聴覚がたかだか 二つの受容器をもつにすぎないことからも、限界があります。したがって聴覚情報は、刺激の時間変化として表現される他はなく、音源と情報源を同一とするか たちで生成・発信されることとなります。
言葉・音楽・物音、聴覚情報はいずれも時間軸を基軸とした音の配列であり、時系列の情報であるという事実を再確認しておきましょう。

次に、画像・映像すなわち視覚情報について考えましょう。
視覚情報の担い手である「光」を、聴覚情報の場合の「音」と比較すれば、
その波長は 380nm から760nm と非常に短いものです。
我々の視覚にはこの波長の差が色相の差として知覚されていますが、その色相や輝度の時間的変化で「音」の場合のような時間情報を生成(例えば、光通信)し ても、人の能力でそれを直接処理することはできません。すなわち、我々「人」にとっては、多くの色点の空間的な分布形状が情報の担い手となるわけで、当 然、我々の視覚の受容器はそのために2次元的な配列をなしているのです。
また、このことと関連して言えば、視覚情報の生成には、
「照明という一次光源と、情報が載る二次光源との区別が存在する」
という事実が重要で、情報の生成・伝達には光源と情報源の両方を関連づけて
制御する必要があります。
これは、音源と情報源が同じ場所にある聴覚情報とは決定的な差です。
※マイクは音源に向けるのが常識ですが、カメラは直接光源に向けても意味がありません。
文字・画像・風景、すべての視覚情報は、情報源における点の空間的な配列に、光源からの照明があたることによって発生することを確認しておきましょう。
|  PAGE TOP |


「音響・音楽」と「画像・映像」

「音響・音楽」と「画像・映像」という情報の差異の問題は、すでに述べたように、前者の場合、情報は音源からやってくる時間的なもので、後者の場合は二次 光源としての物的な形状を情報源とする空間的なものであるという違いがすべての議論の骨子となります。この事実を起点として、「音響・音楽」と「画像・映 像」について以下のような特質がクローズアップされます。

まず、前者は時間的な変化が情報であり、その処理形態はシーケンシャルなものとなるのですが、後者は空間的な配列が情報であり、その処理形態は一括処理的 になるという点です。
これは、前者の場合その情報が時間とともに消えてしまうため、次々にやってくる音の情報を、その都度記憶しながら処理せねばならないのですが、後者の場合 は情報が長時間保存可能なものとなるため、必要な部分ごとに時間をかけて情報を処理できるということを意味します。

また、「音響・音楽」では、その波長が我々を取り囲むサイズであり、すべての音が重なりあっていて、特定の音源からの音のみを耳やマイクに取り込むという ことが不可能であるのに対し、「画像・映像」の場合は、短い波長の光の配列が問題であるため(その配列を捉えるすなわち結像するためのピンホールまたはレ ンズが必要ですが)、特定の場所(情報源)を選択的に見たり撮影したりすることが可能になります。

以上を具体的な話でおきかえると、

「耳は開閉しないが、目はまばたきする」
「テープもCDも回っていなければ用をなさないが、フイルムは1コマずつでも意味がある。」
「音は音の状態で持ち歩くことはできないが、絵は画像の状態で持ち歩ける」
「マイクには感音部があれば十分だが、カメラには結像と感光の二つのシステムが必要である(カメラはボディだけでは用をなさない)」
「目覚まし時計は音を使う(視覚には訴えようがない)」
「耳ざわりなものが騒音公害となることはあるが、目ざわりなだけでは公害とは認定されにくい」

といったことが「音響・音楽」と「画像・映像」の大きな差となるのです。

これらは視覚と聴覚の抱える必然的な差異の問題として、様々な想像的発想に深く関わるものであることを銘記しておきましょう。

           
このページは書きかけです。

例外的に花火は 光源=情報源

カメラは対象へ マイクは音源へ
VRは音の世界では簡単に実現できる

視覚情報は相手が見ていなければ伝わらない
聴覚情報は相手の状態によらず常に伝わる
|  PAGE TOP |


機械の視聴覚

機械の特徴の一つは、「感覚器(入力装置)」から「記憶(記録媒体)」へ至る経路が一本のケーブルで実現 できることと、そこを通過する情報が「信号」というかたちで単独で取り出せるということです。当然ですが「人の視聴覚」ではこれはできません(視神経を伝 わる画像情報を取り出してモニターで見たり、直接他人の脳と接続したりはでき ません。だから人は、様々な表現手段を用いて頭の中の情報を移動・複写しなければならないのです)。

機械の視聴覚のもう一つの特徴は、、アナロ グ処理系とデジタル処理系の2つが明確に分離されている(中継にはA/D 変換器が必要)ということです。
現在の大半のシステムでは、音や光の刺激そのものをとらえるという「感覚」レベルの処理はアナログ処理系が行い、情報を 識別・解釈するといった「知覚・認知」レベルの処理はデジタル処理系が行っています。
この図式は「人」の知覚システムでも同様なのですが、アナログとデジタル の境界が明確であること以外にも、信号の伝達が電気・電子的で化学物質の受け渡しが行われないこと、また一般に「トップダウン処理」がないこと、他のモダ リティーとの相互作用( 共感覚)がないことなども、「人の視聴覚」とは異なる特徴といえます。

機械の記憶(記録)についても述べておきましょう。
アナログ式とデジタ ル式の二つがありますが、いずれも、引出し式であること、一回で正確に記録されること、容量に明確な限界があること、自発的動機がなく自己組織化もしない こ と、情報がそのままの形で取り出せること、といった特徴をもっています(もちろん人の記憶の裏返しとしての特徴です)。 
|  PAGE TOP |



人間の記憶

人間の記憶は、コンピュータのメモリーのような「引き出し」に知識項目が一つずつ入っているというイメージでは捉えられません。詳細を後にして、先に一般 的な事柄を述べると、「人」の記憶は、細胞イコール一つの記憶単位と考えるより、神経細胞同士の結合の「関係」が記憶の「構造」をかたちづくっていると考 える方が、あらゆる点で説明がつきやすいのです。

記憶単位
細胞が一つの単位になっているという例としては「顔細胞」や「手細胞」というものが知られている。これはサルの実験で明らかにされたもので、「顔(目が必 須)」や「手」という視覚刺激に対して特異的に反応するニューロンのことである。身振りに関して述べたように、我々にとって「顔」と「手」は特別な存在と 言える。

人間の記憶は、「複数の神経細胞が複数の事象についての情報を重層的に担う」という意味で、「ホログラム式の記憶である」とも言われます。 人の脳は 140億個ほどの神経細胞(Neuron)で構成されており、それらのシナプス(Synapse)結合によって、細胞同士の興奮の伝達が行われています。

マッカロとピッツ(1943)が提唱した神経細胞のモデルによると、細胞のそれぞれは、静状態と興奮状態の2状態があって、興奮状態においては電気パルス 列が出力されるのですが、この場合、ひとつの細胞の出力は、それにに結び付くシナプス(約1万個)からの興奮信号の重み付きの総和が、あるしきい値を超え るか超えないかで「1or0」に決まるといいます。
したがって結合の強い(重みの大きい)細胞間では興奮状態が一斉に伝わり、結合の弱い細胞は静状態という、脳全体でみれば一つのパターンが生じます。この 興奮パターンが、ある一つの概念なりイメージなりに相当すると考えられるのです。

また、興奮パターンが、自己組織化する、すなわち「人」がある事象を記憶するというプロセスをうまく説明する仮説として、ヘッブ(1949)の「シナプス 強化法則」があります。その仮説によると、神経細胞が興奮する際、その細胞に刺激を伝えたシナプス結合部については、その結合がより強化され、結果として その後の刺激は以前に増して伝わりやすくなるというのです。

この考えをふまえると、我々の記憶では、複数の神経細胞の同時興奮パターンという「結合関係」が重要で、脳内でその興奮パターンが繰り返されるたびに(反 復学習にあたる)、その「関係」がひとつの記憶単位として組織化していくと考えられるのです。 ただしこの場合は、記憶単位といっても、その同時興奮する 細胞群のひとつひとつは、それ以外の刺激に対しても他の細胞との関係で興奮することがあるわけで、その意味では一つの神経細胞が複数の事象の記憶に関わっ ているといえます。これは、ある部分の細胞が欠落しても、一つの事象の記憶がすっぽり抜け落ちるのではなく、その部位に関わる記憶全体がぼやけるというこ とをも意味するもので、人の記憶が「ホログラム」的であると言われるゆえんです。

組織化
脳ほど細胞が活発に変化するところはない。特に樹状突起を伸ばして他との接合関係を更新するという活発な動作には、がん遺伝子のようなものが関わっている とも言われる。 脳は遺伝とはあまり関係がないようにも見えるが、実はタンパク質をつくる遺伝子の大半は脳で発現している。脳の中では常時DNAが活動 し、大量の化学的プロセスが高速で行われているのである。

ホログラム
3次元の空間情報を2次元の板に記録するもの。空間領域の情報を周波数領域の情報に変換して記録するため、板そのものには形は見えないが、参照光をあてる と像が再生する。板の一部(特定の周波数領域)が欠落してもボケる程度で情報が完全に消滅するわけではない。あらゆるものが重層的に記録されるという意味 で脳の記憶に例えられる。

さて、こうした知見によれば、物事は一つ一つの項目としてではなく、「関係」として 一挙に構造化されて記憶されているということになります(構造主義言 語学のF・ソシュール(1916)も同じことを言っていました)。
例をあげてみると、我々は新しい言葉を覚える際に、反対の意味の言葉や、対になる言葉とともに「二項対立」的に記憶する方法をよくとります。これは単独の 項目よりも二つの対立項目で記憶するほうがその関係の問題として記憶に位置付けやすいことを意味しています。さらに言えば、我々の日常的な用語には単独で は用をなさない「上」とか「左」とかいう概念があって、辞書の「左」の項には「右の反対」、「右」の項には「左の反対」と記されており、要するに関係の問 題でしかない概念も多いのです。

「イメージ」・・不在の現前
「いない」ということがわかるのは大変なこと

過剰なる脳は
シンボル化能力(イメージ喚起力)を生んだ

このページは書きかけです。
|  PAGE TOP |


コンピュータにおけるイメージ認知機能

画像がデジタル化されていると、コンピュータを利用することで高度なレベルの認知処理が可能になります。古くから実用化されているOCR(Optical Character Reader)等の数字認識システムに加え、手書きの文字認識も一般化し、さらにテレビカメラの画像から空間を認識するシステムなどが実用化されていま す。

文字認識では、音声に比べて識別の手がかりが多く、例えばペン入力のものでは、ペンのアップ・ダウンの情報から筆順や画数の情報を得ることができ、特定の 筆跡に限らず、ある程度クセのある文字でもほぼ正確に変換されるようになりました。もちろん「機械」はあらゆる文字についての分類識別の枠組みを知識ベー スとして記憶しており、記憶された分類枠組みのどの文字と相関が強いかをみることで、一つ一つの文字を識別します。また、文字単位の識別では限界があるた め、単語や文法レベルの情報(前後の文脈を参考にする)も知識ベースとすることで、文字識別能力を上げる方法も採用されています。

カメラによる空間認識に関しても視野内の特徴的な水平・垂直線や、消点へ集約的に向かう斜めの線などについての知識ベースを手がかりにしており、「知覚」 「認識」のレベルではトップダウン的な処理が必要不可欠であるといえます。

視覚情報の認識マシンが実用化されれば、自動車のオートクルージングや盲導ロボットなどが実現し、また「人」の視覚はあらゆる単純作業から解放されるで しょう。

「人」はこれまでに、遠くを見る(望遠鏡:1609)・微小なものを見る(顕微鏡)・「一瞬」を凍結する(写真:1839)・「動き」を記録する(映画: 1895)・遠くの出来事を実時間で見る(テレビ:1936)・疑似的な空間に介入する(ゲーム・VR)など、視覚とその周辺領域がかかえていた多くの限 界を「メディア」によって拡張してきました。その分だけ視覚はセンサとしての負荷を減らし、その機能を組み換え(例えば、活字世代の線的眼球制御から、漫 画・テレビ世代の面的眼球制御へ)、部分的にはその能力を退化させた(例えば、視*力)のです。そして近い将来、「人」はその得意領域である「知覚・認 識」をも「機械」に委ねることで、より新しい視覚を手に入れようとしています。我々はそろそろ「自由になった視覚でなにを見るか」という新しい問題への取 り組みを考えなくてはならない時期にきています。

さらに補足 : コンピュータにおける音声の認知機能

音声がデジタル化されていると、コンピュータを利用することで高度なレベルの処理が可能になります。例えば特定話者方式の音声認識では、まず特定の話者の 声で言葉の入力を行い、あらゆる音節についての特徴分布をもとに分類識別の枠組みを形成して、これを知識ベースとして記憶します。識別の段階では、入力さ れた音が、記憶された分類枠組みの中でどの音と強い相関を示すかによって、一つ一つの音節を識別します。もし、「いくつかの命令語を区別するだけ」という 問題であれば、言葉を音節単位に区分するという手間が省ける分、処理は容易になります。いずれにせよ、「メディアの脳」の場合にも「人の脳」と同様に、一 種の知識のデータベースをもたせてトップダウン的な処理をさせなければ、高度な認知的判断はむずかしいといえるでしょう。
|  PAGE TOP |



聴覚情報の生成、音声と楽器について

視覚情報を生成する「絵筆」に対し、聴覚情報を生成する「声」と「楽器」について、
余談として、いくつかの話題を紹介したいと思います。

音声

人は声帯を振動源として(男声110Hz .・女声220Hz .)、また喉から唇までの声道を共鳴腔として、複雑な音声を構成して情報を発することができます。
声帯は声の基本周波数を決め、声道(特に口の開きぐあいと舌の位置)が共鳴の性質を決めます。例外として、ささやき声の場合は声帯は振動せず、空気の流れを雑音源として共鳴のみで音を作っています。
そしてもちろんその情報の大半は、話し言葉としての言語情報です。

我々は通常、話し言葉を構成する音節を単独に生成・識別することができます。
つまり音韻的な音色についての絶対音感をもっているわけで、
たとえば日本人の場合、約100種類の日本語の音節による音韻体系をもって、
言語情報を生成処理しています。
参考までに述べると中国では400 以上、英語だと3000 以上と言われます。

この話し言葉の単位音節の生成・識別には、特に母音のホルマント(Formant、音を特徴づける成分音)の存在が重要で、例えば「イ」の音では 300Hz と2000Hz、「エ」の音では500Hz と1700Hz の成分が特に強いというような特徴があります。歌い声(Singing Voice)の場合も、この特徴成分の発振を保持すれば、音程とは無関係に「イ」・「エ」の発声ができるというしくみです。
※その意味では歌い声は、一種の楽器として捉えた場合、音の出しかたの自由度が大きい、非常に可能性の大きい楽器であると言えます。

我々は、このような音韻体系を聴覚系の形成と並行して(遺伝的ではない)習得し、生後
18ケ月ごろにはほぼその基礎的な生成・識別能力を獲得しています。

話し言葉
人間の言語ほど複雑な音声合成は現生ヒト以外の生物では構造的に不可能であると言われています。約20種ほ どいた人類の中で、絶滅した他の種と現生人(ホモ・サピエンス)との運命を分けた決定的な要因がこの声帯の構造にあったということも最近の研究で明らかに なってきています。
リチャード・ドーキンス(1976)が言うように、「言語」という情報体は、遺伝子という情報体とは異なる、物質に依存しない新たな進化のシステムであり、人類はそれを操ることで、かつてないスピードでその世界を変えているのです。


楽器の音

楽器は、弦振動や気柱管振動を利用して周期的な振動波を放射するものと、衝撃による自由振動波を放射するものとに分類されます。前者はいわゆる「楽音」とし て旋律や和声を形成するメロディー楽器群を意味し、後者は(振動に周期性がないため「音程」をもつことができない)「非楽音」を発生するリズム楽器群を意 味します。

音にも色と同様に三属性があり、それぞれ音の大きさ・音程・音色といいます。
「大きさ」は、 物理的には振動の振幅の大きさで あり、
「音程」は振動の基本周波数のことです(例えば 440Hz は「ラ=a3」の音)。
つまり、音が大きいほど波の揺れ幅が大きく、
音程が高いほど、揺れの密度が細かいということです。
さて「音色」、つまり「ピアノ の音色」とか「バイオリンの音色」とか言う場合の音色ですが、
これは時間軸上にグラフ化すれば「波形」として、周波数を軸としてグラフ化すれば、
スペク トルパターンとして物理的に捉えることができるものです。
つまり、我々の耳が聴き分ける楽器の音色というものは、
基本周波数とその倍*音列 (Overtone Series)の強度分布によっ
て特徴づけられているのです。
電子楽器がピアノに似た音やギターに似た音を生成する場合も、この倍音の分布パターンを様々な方法 でコントロールすることによってそれが実現されます。

弦振動と打弦楽器・撥弦楽器・擦弦楽器

一般に弦の振動周波数は f = √(T/m)/(2l)で求まります。Tは張力、m は単位長さあたりの質量、lは長さです。この式の意味するところは、弦長(l)が長く、また単位長さあたりの質量(m)が大きい(つまり弦が太い)ほど 周波数(f)は低くなり、張力(T)が大きいほど周波数(f)が高くなるということです。

身近な楽器であるギターをイメージすれば理解 しやすいでしょう。
弦が細いほど、弦を強く巻くほど音程は上がります。
また、12フレット目は、弦の長さの半分の位置にあるという意味で、
周波数が2倍、つま り音程が1オクターブ高くなります。
弦振動は、基本振動以外にもその2倍(中央に振動の節)・3倍(1/3のところに振動の節)‥といった倍音を含むことで様々 な音色を作り出します。
したがって弦楽器の音色は、振動の腹や節の位置に関わる「弦をはじく場所」や「弦に触れる場所」を変えることで様々にコントロールする ことが可能なのです。

さて、弦楽器はこのような弦振動により音を生成するのですが、弦そのものは表面積が小さい(すなわち放射抵抗が小さい)た め、直接大きな音を出すことはできません。
そこで、この弦の振動を駒(ブリッジ)を介して共鳴板に伝え、この板を強制的に振動させることによって音を放射させます。
いわゆるアコースティックな弦楽器では、この共鳴板が適当な容積をもつ箱に結合して、
箱の中の空気をも共鳴させるかたちで音を放射しています。
エレク トリックな弦楽器の場合は、弦と共鳴板(ソリッドボディが大半)の振動を、
電磁形変換器やピエゾ抵抗変換器などで電気的な振動に変換して利用します。
いずれ の場合もボディの質量・形状・材質などがその音質に大きく影響します。

楽器の分類としては、ピアノを代表とする打弦楽器 (Struck String Instrument)、ギター・ハープ・チェンバロなど弦をはじく撥弦楽器(Plucked String Instrument)、バイオリンのように弦をこする擦弦楽器(Rubbed String Instrument)に分けられます。

気柱管振動と管楽器

開管の共鳴周波数は、最も低いもの(基本周波数)が、 f = c /(2l) で、この整数倍の周波数の発振が可能です。
c  は音速、l は管長であり、管長が短いほど共鳴周波数は高くなります。
(閉管の場合は f = c /(4l) で、この奇数倍の周波数が発振可能)。
管楽器の振動は、基本的には息を吹き込むという直流エネルギーの供給によって持続する振動で、これを自励振動といいます(自励振動は管楽器の他、バイオリンのような擦弦楽器にも見られます)。

管 楽器はその大半が両端が解放された開管で、気柱の縦振動が音源となり、
指孔や管端から音波を外部へ放射します。
管の一端には直流のエネルギーを振動エネル ギーに変換するきっかけをつくるリード(Reed)が必要で、その種類によってエアリード楽器・ダブルリード楽器・シングルリード楽器・リップリード楽器 に分類されます(ちなみに、シングルリード楽器は閉管とほぼ同様で奇数倍音列の発振となります)。

エア・ダブル・シングルリード形式の三者は木管楽器 (Wood Wind Instrument)に分類され、例えばフルート・リコーダー・尺八・日本の各種横笛など、オーボエ・ファゴット・雅楽のひちりきなど、クラリネット・ サキソホンなどがそれぞれに該当します。またリップリードの楽器はほぼ金管楽器(BrassWind Instrument)とイコールで、トランペット・トロンボーン・ホルンなどがそれにあたります。

剛体・膜の振動と打楽器

すべての「物」は力学的な衝撃を加えると振動し、音を出します。弦や管が発生する「楽音」以外のこの衝撃音はみな「非楽音」で、打楽器はこれを原理としています。
打楽器の振動体は棒・板・塊・膜で、それぞれ例えば、トライアングルや木琴、シンバルや鐘、カスタネットやウッドブロック、ドラムや鼓などが、それに該当します。

こ の種の楽器が発生する「非楽音」は、周期性のない振動を基にしていて、音程は特定できず、スペクトルパターンも広範囲の連続的な分布かあるいは非整数倍の 成分を多くもつ離散的な分布をなします。「楽音」のように整数次の倍音が並ぶものではないため、いわゆる和音も濁ったものになります。
|  PAGE TOP |

KEYWORD LINKS

ジョセフ・キャンベル
神話・物語の構造