LogoMark.png

視聴覚情報論/2020/0701

第10回 画像・音声の入力と記録

視聴覚情報論/2020 2020.07.01

前回の講義:視聴覚情報論/2020/0624

今週末に関する確認事項


第10回目の展開と要件



以下、目次を見て本日の講義の全体像を把握してから、順に読み進めて下さい。



本日のメニュー


はじめに

前回まで、人間の視聴覚に関連して、心理学的な視点でお話してきましたが、今回からは、画像・音響工学的な視点で、機械の目・耳・記憶(記録)、また機械による画像や音の生成についてお話しします。

今回は、機械の目であるカメラ、機械の耳であるマイク、そして、それらを記録するシステムについて、光学系・音響系、処理系、記録系と大きく3つの枠組みで概説します。

==第10回 画像・音声の入力と記録|2020.07.01==
===フィルムカメラとデジタルカメラの違い===
* ◯◯◯◯◯◯、◯◯◯◯◯◯◯◯◯◯◯◯、◯◯◯◯◯◯◯◯◯。
* ◯◯◯◯◯◯◯◯◯、◯◯◯◯◯◯◯◯◯◯◯◯。
<br>
===レコードとCDの違い===
* ◯◯◯◯◯◯、◯◯◯◯◯◯◯◯◯◯◯◯、◯◯◯◯◯◯◯◯◯。
* ◯◯◯◯◯◯◯◯◯、◯◯◯◯◯◯◯◯◯◯◯◯。
<br>
<br>




1. 視覚情報の入力システム

静止画像の記録に用いられるカメラの基本は「針穴をあけた暗い部屋」、いわゆるカメラ・オブスキュラです。針穴のかわりに凸レンズをつけると集光面積が大きくなり、出来上がる倒立像も明るくなります。これがカメラの基本構造です。

1.1. レンズ

カメラという機械にとって最も重要な光学系を構成するのがレンズです。レンズの材質は光学硝子という良質の硝子ですが、一般的にはクラウンガラス(K)、それに鉛を加えて屈折率を上げたフリントガラス(F)の二つになります。光学硝子は当然無色透明で均質であり、光の透過に関して等方であること、またレンズの設計に必要な光学常数、すなわち精巧な屈折率と分散率をもつことが要求されます。実際には、一枚の凸レンズだけでは光の波長による屈折率の差、いわゆる色収差が避けられないため、複数のレンズを群に構成して単体のレンズに見立てています。

レンズには Fナンバーという数値があり、それらもレンズの性能に関係します。略説すると、Fナンバーは「焦点距離/レンズの有効径」を表わす値(暗さの尺度と言えます)で、レンズの口径が大きくなり Fナンバーが小さくなるほど「明るいレンズ」ということになります。レンズは口径の大きなものほど分散・収差が大きくなりその分良質のレンズの製造が難しいため、一般的なレンズで Fナンバー1.4~2.8 程度、ズームレンズでは f4~f5.6 あたりが主流です。

「メディアの目」であるカメラの意義が、世界を客観的にボトムアップすることにあるとすれば、世界を細部まであざやかに写取ることのできるレンズはそれだけで価値があります。

しかし、「メディアの耳」であるマイクの場合と同様で、ムラがなくバランスのよい空間周波数特性*1が得られるということと、美的な映像を写し出すということとは必ずしもイコールではありません。技術的な成果が美的要求をすべて満たすものではないということは、どの世界にも言えることです。「レンズの味」という言葉もあるように、様々な収差によるボケぐあいというものがレンズの個性であり、私たちはそうした「味」を必要に応じて選択するという思考法も大切にしなければなりません。

1.2. 焦点距離

焦点距離はレンズの主点(後ろ側主点)から焦点面(フィルム面)までの距離のことですが、カメラの機能の問題として焦点距離が重要なのは、この値が画角(具体的には主点から画面の対角線の両端とを結ぶ線のなす角)に直接関わるという点です。例えば 35㎜フィルムの場合は、サイズ 36×24㎜で対角線 43.2㎜ですから、焦点距離 50㎜で画角 46度となります。

焦点距離が短くなれば画角は大きく(ワイドに)なり、長くなれば画角は狭く(望遠に)なります。人間の眼に自然に見える角度がほぼ50度であることから50㎜のレンズは標準レンズ、28㎜ や 35㎜は広角レンズ、じっと見つめる画角にあたる 85㎜ はポートレートレンズ、135㎜や200㎜などは望遠レンズと呼ばれます。この値が固定的なレンズを単焦点レンズ、この値を一定の範囲で変えられるものをズームレンズといいます。

ただし、同じ焦点距離何㎜と記載されていてもフィルムの大きさやCCDのサイズが変われば画角も変わるという点には注意が必要であす。例えば 6×6㎝のフィルムでは焦点距離 80㎜が標準画角となるし、35㎜よりサイズの小さい CCDを用いるデジタルカメラでは焦点距離が非常に短くても標準画角となる場合があります。様々なサイズの CCDを使用するデジタルカメラのカタログでは、物理的な焦点距離の記載が画角を説明するものとはならないため、従来のカメラの感覚で理解できるよう「35㎜カメラ換算で50㎜」などと記載されています。

1.3. 絞り

DOF.png

絞りはレンズの使用面積つまり明るさを調節する単純な機構です。絞り機構はレンズ群の中間にあって、複数枚の金属羽根で構成されています。レンズ鏡胴の絞りリングで開閉を調節しますが、リング上の目盛はレンズの解放F値から順に公比 √2 の等比数列で並んでいます。すなわち目盛を1段増やすごとに有効径が、1 / √2ずつ小さくなる(採光面積が半分になる)ことを意味します。これは主としてフィルムにあたる光の量を適正に調節するためのものですが、これは人間の目の虹彩と同様、絞れば被写界深度が深くなり前後のピントも合いやすくなるという映像表現上の効果の大きな機構です。

1.4. シャッタースピード

シャッターは、世界をとらえる「一瞬」というものにどの程度の時間を与えるかを決める機構であり、その選択可能性が大きなものほどカメラとしての機能は優れているといえます。一般的なスチールカメラでは4秒から1/4000秒までの間を1/2倍間隔で選択できるようになっていて、これは絞りの1段に対応してフィルムにあたる光の量を1/2ずつ調整する目的をもちます。「動くものを止めて写すか、動きを軌跡として写すか」といった、人間の目では直接見ることのできない視覚世界の表現に関わるものであり、写真メディアに特有のものです。

1.5. フレームレート

動く映像をとらえるカメラとなると、1秒あたり何枚の画像を撮影するかということも重要です。ただこの点については、高速度撮影カメラのような特殊なものを除いては、規格として決まっていて、フィルムを使う映画の撮影カメラでは秒間24フレーム(コマ)、NTSC信号をベースにしたテレビやビデオなどでは秒間30(正確には29.97)フレームです。人間の目がチラツキを感じずに自然な仮現運動が生じるのがこのあたりだと考えればよいでしょう。これより遅いと、動きが飛んだようなギクシャクしたものに見え、逆に早すぎでも残像がダブって見えてしまいます。

2. 聴覚情報の入力システム

視覚の世界のカメラに相当するものとして、聴覚の世界にはマイクロフォンとピックアップがあります。マイクロフォンは空気中の粗密波としての音をとらえるもの、ピックアップは空気以外の振動をとらえるものです。
ここでは、その構造と機能について概説します。

2.1. マイクロフォンの構造

マイクロフォンはスピーカと同様、基本的には電気音響変成器(可逆変換器)あるいは継電器(不可逆変換器)で、動電形・電磁形・静電形・圧電形・炭素形・半導体形 などがあります。特に動電形と静電形が一般的で、前者は電磁誘導すなわち、小さなマグネットのつくる磁界中で、電気導体である振動板が音波により振動する ことで起電力が生じることを利用するもので、後者はコンデンサの充放電電流を利用する、すなわち、導電性の振動板と固定極が向かい合ったコンデンサ様の構造に 直流電圧をかけておき、振動に応じた静電容量の変化から生じる充電・放電電流を得るというものです。それぞれダイナミックマイク、エレクトレットコンデンサマイクなどと呼ばれます。

また、かつての電話(黒電話)の送話器や放送用に使用された炭素形のカーボンマイクは、炭素粒の振動接触による抵抗値の変化を利用するもので、変換能率が非常によく(ただし不可逆)、イヤホン程度ならば増幅なしで直接音を再生できるという性能をもちます。

2.2. ピックアップの構造

ピックアップは、電流の変 化・磁界の変化・物体の動きなどを振動として拾う場合に利用されるもので、動電形・電磁形・半導体形などがあります。電磁気的な振動は「マグネットの芯のまわ りにコイルを巻く」という簡単な仕組で、電磁誘導による起電力を得ることができ、また物体の振動は、圧力をかけると抵抗値が変化するというピエゾ抵抗効果をもつ半導体(不可逆)を利用することで取り出すことができます。

2.3. ステレオ録音

さて、人間の聴覚が左右2つの耳から情報を入力するように、「メディアの聴覚」にも2つ (あるいはそれ以上)のマイクを用いる方法、すなわちステレオ(マルチ)録音の発想があります。セッティングの方法には、レベルや位相の差を考慮して、2 個 の単一指向性マイクを適当な間隔をあけて配置する「レベル・位相差方式」、2個の単一指向性マイクを一点に配置する「レベル方式」、多数のモノラルマイク の入力をそれぞれ適当に左右のチャンネルにふって、架空のステレオ音場をつくる「分岐方式」の3つの方式があります。2つ並べれば立体的に聴こえるという単純なものでもなく、特にマイクとマイクの距離を開ける(位相差を利用する)場合は、その距離には注意が必要です。

2.4. マイクロフォンの性能

マイクは音響を電気信号に変換する最初の砦であり、その良し悪しは後のすべての処理・記録に影響します。処理・記録系がどんなにすぐれてい ても、入力の段階で十分な素材が得られなければその先に限界を生じてしまうのです。
マイクの特性を表わす値には、感度・雑音・周波数特性・指向特性・最大無歪み音圧レベル・公称インピーダンス・共振周波数などがあります。

感度というのは聴覚で言う最小可聴値とは意味が異なり、1kHz・1μbar の平面波を正面から与えた場合に発生する電圧で、1Vを0dBとしたdB単位で表示します。通常-80dBから-45dB の間の値をとります。ただし、単に感度がよければよいというものではありません。適切な情報の記録には必要外の音を捨てるということも重要だからです。

雑音はそれ自体から発生するものを言い、音圧レベルに換算して表わします。これは当然小さな値であるほうが望ましいと言えます。

周波数特性とは、周波数領域における感度分布の ことです。一般的には低中音域でバランスのとれた静電形が良く、次に動電形、その他ではいわゆる良質な録音は望めないと言われます。しかし、全体にバラン スが良いということが美的に良い音につながるとは限りません。「機械」であるマイクは、その構成のしかたで様々な帯域に対応するものが実現できるわけで、 録音する用途によって適切な帯域をもつマイクを選択するということの方がむしろが重要です。例えば、帯域の広い音楽の録音の場合は 40Hz-15000Hz とほぼ可聴域全域が必要になりますが、音声の録音では 100-8000Hz に重点を置くなど、必要のない帯域をカットすることがS/N比向上の点からも望ましいといえます。

指向特性とは、音源の方向と感度との関係を表すもので、無指向性・単一指向性・両指向性・ライン・放物面(パラボラ)集音な どの分類があります。無指向性は全方向について均等な感度分布をもつもの、単一指向性はマイクを向けた側の約180 度の範囲について感度が高いもの、といったぐあいで、最も指向性の強いパラボラ集音では前面20度以下で、前方の集音距離は無指向性マイクの3倍以上とな ります。

マイクは「人」の聴覚とは異なり、ものによって様々な「個性」が存在するため、録音に際しては個々のマイクの特性をいかに適切に生かすかということが重要な問題となるでしょう。室内であれば残響の程度、屋外であれば風によるノイズの問題、テレビ・映画のロケではマイクの位置の制限など、状況に応じた 録音計画 が重要です。

補足になりますが、エレクトリックギターのピックアップなどは周波数特性のアンバランスさや歪み具合まで含めて楽器の個性を左右する重要な要素として位置付けられており、音を拾うというより音をつくるための要素と考えたほうがいいでしょう。分類上はたしかにピックアップであり、増幅処理を行う機器からみれば、その「聴覚」に相当するのですが、構造的にもギターの一部として音源に「寄生」している事実から、それは楽器の「声帯」として機能していると考えるべきでしょう。



3. A/D 変換

現代では、機械が視聴覚情報を扱う際には、アナログ信号をデジタルデータへと変換するのが一般的です。以下、そのプロセスといくつかのキーワードについて説明します。

3.1. 画像・映像のA/D変換

光学系あるいはさらに光電変換系によって得られた映像信号をデジタル化して処理・記録する場合は、A/D変換系が必要で、フィルムスキャナ・イメージスキャナ・ビデオキャプチャーなどと呼ばれるものがそれを行います。今日ではデジタルスチルカメラやデジタルビデオカメラなど、光学系・光電変換系及びA/D変換系を合わせ持つ機器が普通なので、アナログからデジタルへというプロセスを意識することが少なくなりましたが、世界を光の像としてとらえる光学系と、それを電気に変換する光電変換系、そしてさらにそれをデジタル情報へ変換するA/D変換系、この3つのブロック全てが、画像のクオリティーに関わっているということは、常に意識しておくべきでしょう。

デジタルデータとして扱われる画像のピクセル数と画面アスペクト比は事実上無限にあります。現在、流通している主な規格だけでも数十種類存在。

3.2. 音声のA/D変換

マイクロフォンやピックアップからの入力は、その処理・記録がデジタルとなる場合はA/D変換が必要となります。俗にサンプラーと呼ばれる音声のデジタル化マシンは音楽の分野から登場しましたが、現行の大半のデジタル機器はアナログ音声入力端子を持ち、その内部でA/D変換(俗に言うキャプチャー)ができるのが一般的です。

音声のデジタル化では、原音波形をどこまで忠実に再現するか、その必要性に応じて標本化周波数と量子化数と呼ばれるパラメータを決める必要があります。



4. 標本化(Sampling)

4.1. 画像データの標本化

画像の場合、縦横の画素数を決めることが標本化にあたり、この数はA/D変換系の限度内で自由に決めることができるのですが、問題は今述べたように光学系と光電変換系がどの程度のものであるかです。例えば原画像が35㎜フィルムによるものであれば、その画質は約2400万画素程度に相当しますが、例えば、フルHDのビデオ画像であれば約200万画素程度に相当します。原画像を超える解像度をもたせても特別な目的がないかぎり意味がないため、おのずとそれが標本化数の上限をきめることになります。

4.2. 音声データの標本化

標本化定理(sampling theorem)によれば、標本化周波数は、信号に含まれる最高周波数の2倍以上必要です。「人」の聴覚は20,000Hz=20kHzまでの帯域をもつので、標本化周波数が40kHz以上あれば、耳には十分忠実に再現されているように聴こえる‥・ということになります。実際には 44.1kHz・22.05kHz・11.025kHzといったレートのものが一般的に採用されており、順にCD・AMラジオ放送・電話のクオリティーと考えるとよいでしょう。

5. 量子化(Quantization)

5.1. 画像の量子化

画像の量子化数は色数に関わるもので、例えば量子化数 8 ビットであれば 256 色、24 ビットであれば 1677 万色となります。RGB各 8 ビット(256段)で24ビット量子化したものが、一般にフルカラー画像と呼ばれ、我々の視覚の能力はカバーされます(ただし、1ビット異なるだけでも、ある程度の面積で並べて見れば差は分かります)。

5.2. 音声の量子化

音声の量子化数は音の波形の振幅を何段階に分けるかに関わるもので、例えば量子化数 16 ビットであれば、音の強弱が216 = 65,536 段階で表現されます。一般にCDでは 16 ビット、マルチメディアコンテンツでは 16 ビットや 8 ビットが採用されています。もちろん、さらにモノラルかステレオかという選択が必要で、ステレオであれば当然2倍の情報量となります。

6. 視覚情報の記録システム

6.1. 銀塩方式

銀の光化学反応に着目し、カメラオブスキュラの像を定着させようとしていた化学者や画家の試行錯誤は、1826年ニエプス(J.N.Niepce)のヘリオグラフィー、1835年タルボット(W.H.F.Talbot)のネガポジ法*2、1839年ダゲール(L.J.M.Daguerre)のダゲレオタイプ、1841年タルボットのカロタイプの発表というかたちで、多くの成果を得ました。そして1888年イーストマン(G.Eastman)のロールフィルムの発明以来、現在にいたるまで「銀塩写真」はアナログ記録メディアとして重要な位置を占めています。

銀塩写真は、ハロゲン銀(AgX:塩化銀・臭化銀など)が光によって黒変することを利用するものです。ハロゲン銀を塗布した面に光像を結ぶと、光のあたった部分に銀核とよばれる黒点が形成されます(潜像)。このままでは像として使える状態ではないのですが、これをさらにモノメチルパラアミノ・フェノール硫酸塩やハイドロキノンを主薬とする現像液に浸すことで、銀核の周囲にAgが集結(数千万倍に増幅)して目に見える像が得られます。一定時間の現像反応の後、酢酸などによる反応の停止、チオ硫酸ナトリウム(ハイポ)などによる未露光AgXの除去、すなわち定着処理を終えて、像は永久化されます。一般にこの像はネガ像なので、別の感光面(印画紙)を用意し、そのネガを透過する光を感光させて同様の処理を行うことでポジ像を得ることができます。以上が写真の記録のおおよその原理です。

カラー写真の場合は、カプラーによる発色現像を行います。これは光をBGRの順に分離し、各々の補色にあたるYMCの3層の発色でネガ像を形成するというアイデアで、例えば、被写体の青い光は、フィルム上でB(Blue)に感光する層をY(Yellow)に染めてネガとなり、プリント段階でそれに白色光をあてると、RとGが透過して印画紙上のCとMを染め(すなわち印画紙上では青の色が出て)、ポジとなります。

一般的にはこのような原理で、ネガフィルムにネガ印画紙の組み合わせでプリント写真としますが、カプラーの発色をポジティブにするというタイプの、リバーサル(ポジ)フィルムもあり、スライド上映用や印刷物を作る場合の写真原稿として利用されていました(現在でも存在しています)。

6.2. イメージセンサ

イメージセンサはビデオカメラやデジタルカメラ等で光学像を電気信号に変換する部分であり、レンズ同様に最終的な画像の解像度や色調に大きく影響する重要な部分です。CCD や CMOS といった固体撮像素子が大半を占めていますが、現在では、カラーフィルタの不要な Foveon X3(CMOSの一種)、有機薄膜撮像素子、また背面照射型CCD なども開発されています。

固体撮像素子は大半のビデオカメラやデジタルスチルカメラが採用している半導体板のセンサで、1次元(ラインセンサ)または2次元(エリアセンサ)に並ぶ光センサの集合体を感光面としてもちます。これは網膜の状態に似ており、各センサが1画素という最小単位に相当するかたちで、光電変換・蓄積・走査の3つの役割を担います。解像度は並んでいる画素の数で決まるので、カメラの性能は「◯◯万画素」というスペックを見れば簡単に区別できます。

カラーの映像信号は基本的にRGB3種の信号に分離して取りだすことが必要で、その方法については、1系統のイメージセンサから取り出す方法と、光学的にRGBに分離して3系統のセンサで取り出す方法とがあります

映像信号は画素の情報を左から右へと(少し斜めに)走査します。左右へ走査すする線(走査線)の数は、現在では1080本ですが、上から順次送るタイプのものをプログレッシブ(ノンインターレース)、1,3,5,7・・と1本飛ばしで送って、つぎに2,4,6・・と補完するタイプのものをインターレースといいます。
一般にパソコンのモニターはプログレッシブ、テレビはインターレース、デジタルビデオカメラでは、撮影モードをいずれかに選択できるものがあります。


6.3. アナログ信号の記録

電気的な映像信号の記録は電磁気的な技術からスタートしました。現在ではほとんど使われない技術ですが、参考までにざっくりお読みください。 

映像信号は音声のそれに比べるとその周波数が高いために、より高速に読み書きする機構が必要です。はじめてのものはビング・クロスビー研究所の固定ヘッド型白黒で1951年、そしてテレビ局で最初に実用化されたのはアンペックス社の回転4ヘッド2インチ機で、テレビ放送よりおくれて1956年のことでした。家庭用のものでは1964年ソニーのオープンリール、1975・1976年のカセット式1/2インチのベータとVHS方式、1985年ソニーの8mm方式、そして1996年デジタルビデオ(MiniDV)へと次々に発展し、その後は磁気ディスク、メモリーメディア等にバトンタッチしました。

媒体としては、1/2インチのビデオテープでは一般にコバルト添加ガンマ酸化鉄の磁性体をポリエステルフィルムベース上に塗布したもの、また8㎜やデジタルではメタル磁性体のものが用いられていました。記録構造はそれぞれの方式で若干ずつ異なりますが、基本的にはテープの走行方向に対してヘッドを斜めに回転させ、1フレーム分の映像信号を2つのトラック(2フィールド分という意味で、テープ上では斜めの線分奇跡2本になる)に記録する、いわゆるヘリカル走査方式が基本でした(NTSC対応のビデオではヘッドは毎秒30回転している)。

磁気方式ではヘッドとテープの相対速度・周波数特性が関わる水平解像度、ビデオ S/N(輝度)、カラーS/N(色相・彩度)などが問題となります。水平解像度は、一画面で何本の縦縞を再現できるかを数値で表わすもので、画質競走のもっともわかりやすい指標です。垂直方向に関しては走査線の数以上の分解能は物理的に無理ですが、水平方向については信号(特に輝度信号)の高域が忠実に再現できれば解像度は上がります。しかし、どちらかというとこれはディスプレイの特性に依存するものです。

6.4. デジタルデータの記録

標本化・量子化そして何らかの方式で圧縮された静止画・動画のデジタルデータは、0.1. に対応する2値状態で媒体に記録されます。磁気記録方式を用いたテープ・ディスク、レーザーによって結晶の向きを読み書きするディスク、レーザによる加熱と磁性変化を利用したディスク、そして半導体を利用した固体のメモリーなどがありますが、現在では固体のもの(ソリッドメモリー)が主流です。

デジタルデータでは0と1がきちんと区別されて、安定して記録されるかということだけが重要で、それさえ正しく識別できれば、情報の質には影響しません。そのクオリティーは標本化周波数・量子化数の値および圧縮レートによって一義的に決まるもので、媒体の物理特性は無関係です。

さて、記録されるデータの形式についてですが、現在のデジタル静止画・動画を扱う場合の形式はPC上で読み書きできるものを含めるとかなりの数になります(後述)。特に動画の場合、コンテナフォーマットと各種のコーデックが組み合わさることで種類は非常に多くなります。したがってデータ交換する際は、双方の環境で正しくファイルの読み書きができるかといった確認が必要になります。最近では大半のソフトウエアがあらゆる方式をカバーできるようになってはいますが、この種の問題はデジタルデータを扱う場合に避けられない問題であり、ある意味では常識と考えて接した方がよいでしょう。

6.5. 画像・映像データのファイルフォーマット

7. 聴覚情報の記録システム

今日ある様々なメディアを見れば、音響は画像よりも簡単に扱えるような気がしますが、音響の記録は、実は画像の記録としての写真よりも歴史が浅いのです。蓄音機の発明者エジソン(1847-1931)も、彼が生まれたとき写真はすでに存在していました。映画についても始めはサイレント(無声映画)であり、いわゆるトーキーは1930年代から後のことです(トーキー第1作は、1927年アメリカ映画の『ジャズ・シンガー』)。音響は時間軸を基軸とする情報であるため、その記録再生にはリアルタイムで動作できる仕組が必要で、これはアナログにせよデジタルにせよ、高速で動作させるという技術の成熟を待たねばなりませんでした。

余談になりますが、歴史上の人物についても、写真よりも、肉声の記録の方が貴重です。我々はもともと、音声を記録するということを写真ほどには重視していないようです。

7.1. アナログ信号の記録

アナログ記録の原理は文字通りアナロジカル(類似的)で、要するに空気の振動の様子を、それに似た形で、物理的・化学的・光学的・電磁気的状態に置き換えて記録します。ただ、動きを止めるわけにはいかないので、記録には必然的に回転する機構が必要となり、現に私たちが眼にするアナログ記録媒体(テープやレコード)はすべてそのようにできています。

具体的な媒体としては、(現在では一部の人にしか縁がありませんが)硬質塩化ビニルに機械的に溝を掘ったアナログレコード、映画のサウンドトラックに見られる光学録音の媒体となるフィルム、そして(これも現在では利用者が少なくなりましたが)強磁性材を塗ったテープに電気信号を磁気の変化として記録する磁気録音テープなどがある。磁気テープ媒体には、ノーマル・ハイ・メタルなどの一般的なポジション区分で呼ばれる、ガマヘマタイト系・クローム系・メタル系のものがあり、順に高域での特性がよくなります。

7.2. デジタルデータの記録

標本化・量子化によって数値データとなった音声は、0.1. に対応する2値状態で媒体に記録されます。デジタル音声情報を記録媒体は、1980年代にオーディオCD(Compact Disc)、MD(Mini Disk)・DAT(Digital Audio Tape)といった音楽情報の記録を主目的とした記録媒体としてこの世に登場しましたが、現在では、身近にあるデジタルデバイスの大半が、音声ファイルの記録メディアとして使えます。

CD以外は過去の話となりますが、音楽情報の記録が主目的である前3者について、概要説明を残しておきましょう。

一方、汎用のデジタル記録メディアに記録される音声データについてですが、非圧縮型、不可逆圧縮型、可逆圧縮型の3つのタイプがあり、それぞれに複数の形式があります(後述)。クォリティーについては、標本化周波数44.1kHz、量子化16ビットはもちろん、用途に応じて数段階の選択肢があります。


7.3. 音声データのファイルフォーマット

8. 特設サイトにコメント

以下の2つの項目について、特設サイトにコメントをお願いします。

情報を類似的・連続的な量として扱うアナログ機器と、情報を数値的・離散的な量として扱うデジタル機器の違いについて、その特徴や、メリット・デメリットについて、思いつくことを自由に箇条書きして下さい。
 みなさんの世代は、アナログ媒体やアナログ機器の使用体験が少なく、ピンとこない話かもしれませんが、想像できる範囲で構わないので、その違いについて、この機会にぜひ考えてみて下さい。



以上、第10回目の授業、これにて終了とします。
次回は、画像・音声の生成と出力についてお話します。




PAGES

GUIDE

DATA


*1 一般に、レンズの描写力はMTF( Moduration Transfer Function )と呼ばれるもので評価されますが、これは画像の細かさに対してどの程度までコントラストが正確に再現できるかをグラフにする形で提示されます。単に解像力(本数/ミリ)の高さだけでなく、レンズの空間周波数特性の分布が重要だということを意味します。
*2 反転を利用するという、このネガ・ポジ法は「一枚のネガから複数のポジが得られる」という点で、グーテンベルクの活版印刷とならんで、今日の「複製芸術」社会のきっかけとなる重要な発明でした。その意味ではネガ・ポジ法を考案し、世界最初の写真集「自然の鉛筆」(1843)を作ったタルボットの業績は偉大です。
Last-modified: 2020-07-01 (水) 13:42:28