情報の整理
5つの帽子掛け
情報の整理には一般に以下の5つの視点があります。
リチャード・ソール・ワーマン
カテゴリー Category
共通の特徴をまとめた概念枠組で分類
*学部>学科>専攻・・などツリー状の階層構造になる
*全体を部分に区分けする方法は視点により様々
時間 Time
歴史年表、スケジュール、テレビ番組表など
位置(空間)Location
地図、サイトマップ
アルファベット順 Alphabet
五十音順、番号順など機械的順序
*紙媒体で検索がしやすく。辞書や事典の多くはこの方法を採用
連続量・階層 Hierarchy
人気順、価格順など何らかの価値の順
*各種のグラフはこの基準によって視覚化されている
情報の分類
複数の事物や現象を、一定の視点でグループに分けることを分類といいます。また、分類によってつくられたグループのことをカテゴリといいます。以下の2段階のプロセスがあります。
- 区分:対象を分ける
- 体系化:分けられた対象を体系的に配置(一般にツリー型)
何らかの情報を収集してそれらをWebサイトや冊子に掲載する場合は、漫然と羅列するのではなく、いくつかのカテゴリに分けて、目次やメニュー上に可視化することが必要です。
現代人は「検索すればヒットする」感覚に慣れすぎているせいか、物事をカテゴリに分け、整理しつつ保管するということを難しいと感じる方が多いようですが、身近な例では、部屋の模様替えや、机の引き出しや本棚を整理する際に無意識に行っている思考と同じです。
ちなみに、目の前に山積した物事を整理するには、はじめに「不要なもの」を「断捨離」することも必要です。
カテゴリ・ツリーについて
分類は「視点をどこに置くか」によって千差万別で「正しい分け方」が決まっているわけではありません。例えば、教室内の学生を2分する場合、正面から見れば「右と左」に分けるのが把握しやすく、側面から見れば「前と後ろ」に分ける方が把握しすくなります。
同様に、例えば A大学の学生をいくつかのグループに分けるには・・
- 学部>学科>学年
- 学年>学部>学科
- 学部>出身都道府県
など、分け方や階層の上下関係は様々に考えることができます。
ツリー状に整理格納する場合、階層が深くなるとデータの探索には時間がかかります。また、実際には一つのカテゴリに振り分けられない情報というものも存在します。であれば、情報をカテゴリ・ツリー上のどこかに割り付けるのではなく、個々の情報の方にカテゴリ名を付与する(一般的には、いずれかひとつのカテゴリ名をつけるべきですが、場合によっては複数のカテゴリ名を付与することもできる)という、逆転の発想で情報を整理する方が、柔軟な情報管理が可能になります。
言葉はそれ自体がカテゴリ
私たちが普段使っている「花」や「机」といった言葉は、それ自体がカテゴリです。「花」も「机」も、物理空間に存在する個体はすべて異なっているし、その色・カタチ・大きさなども連続的な分布をなしています。
データサイエンスの言葉を使えば、私たちは大量の事物に対する「クラスタリング(特徴の違うグループを見出す)」を行って、クラスターごとに「ネーミング」を行うことで世界を認識していると言えます。物理世界に「所与のもの」があってそれに名前をつけているのではなく、言葉(ネーミング)によるカテゴリ化によって「存在が喚起されている」わけです。
使う言語が異なれば、世界の見え方が変わります。「分類の方法は多様にある」という話は、そのまま「文化は多様である」という話につながります。
分類しない(あるいは分類を後回しにする)
分類・構造化には「完全な形」は無い・・ということを前提に、「アクセスのし易さのみを維持して、分類はしない」という発想も可能です。これは、情報をデジタルデータベース化することで可能になりました。
カテゴリツリーの中に情報を位置付けるのではなく 個々の情報にタグを付与するかたちで検索によって取り出す
以下、デジタル社会における情報の管理方法について概説します。
情報の管理法
私たちは情報を「図書館のように」カテゴリー・ツリーに整理する思考に慣れていますが、カテゴリーに収まらない情報の扱いや、検索効率の悪さなど、様々な問題があります。しかし、データベースの活用と、コンピュータによる検索を前提にすると、情報管理の発想を逆転させることができます。
書棚からDBへ
従来のように「書類をバインダーに綴じて棚に整理する」という発想ではなく、「書類に関連するカテゴリー名やタグを付けて保管しておけば、あとはシステムが自動的に引き出してくれる」、つまり「ツリー状の枠組みで物事を片付ける必要はく、情報にマーキングだけしておいて、あとは機械に探させればいい」という発想の転換をすることで、情報の管理は非常に楽になります。
WordPressのようなCMSは、記事情報をデータベース化し、そこから必要な情報を「問い合わせ」によって表示するシステムと言えます。
Webサイトは一般にグラフィックデザインの電子版のように捉えられがちですが、CMSによるWebサイトは、データベース管理システムのビジュアル版として理解する方がわかりやすいのかもしれません。
フォルダ(カテゴリ)とインデックス(タグ)
フォルダ(カテゴリー)は、一般にツリー型の分類構造を持ちます。例えば、Webサイトのサイトマップ(ナビゲーションメニューに反映)は、一般にカテゴリーツリーの形で構成されます。
一方インデックス(タグ)は、各情報に関連するワード「タグ」付けする・・というもので、ツリー状の分類とは無縁の存在です。例えば「犬の写真」には、「犬」と「写真」の2つのタグを付けておけば、閲覧者は「犬」からでも「写真」からでも目的のデータにたどり着くことができます。
参考:taxonomy
タクソノミー(taxonomy)とは、分類、分類学、分類法などの意味を持つ言葉ですが、IT分野では様々な情報やデータなどの分類方法を定義したものを意味します。CMSなどでは、ページや投稿をツリー状にカテゴリ分けしていく機能をタクソノミーといいます。
ストックとフロー
ストックとは、長期にわたって何度も閲覧される情報のことで、マニュアル、参考資料、文書フォームなどがこれに該当します。一方、フローとは、短期間で価値がなくなる情報で、お知らせ、募集告知などがこれにあたります。
伽藍とバザール
ページを独立させました > TheCathedralAndTheBazaar
ツリーとセミラティス
ページを独立させました > Semi-lattice
WikiとBlog
CMSの2大スタイルである Wiki と Blog は「ストック(カテゴリ)」に重点を置くか「フロー(タグ)」に重点を置くかの違いで説明することができます。
- Wiki:ページ単位として編集・更新。百科事典、まとめサイト・・
- Blog:記事を単位として投稿。最新の投稿が優先・・
APPENDIX
カテゴリとタグについての補足
ブログなどでよく見かける情報の分類法あるいは、手がかりについて・・・
Category
カテゴリとは、特定の観点で要素を分類した場合の分類名称です。一般にこれは階層構造を持ち、お互いにカブることはありません。
例えば、学生Aさんは、○○学部△△学科というカテゴリに所属しています。学生ごとに所属はひとつですから、学生(要素)は皆、学部・学科という階層的な分類によってきれいに仕分けられることになります。
さてここで問題です。一般にひとつの要素が、複数のカテゴリに属することはない・・・と言われますが、学生Aさんは、□□サークルにも所属しています。学部・学科という観点ではなく、サークルという観点で学生を眺めると、学生(要素)は、「帰宅部」も含めたサークル枠できれにに仕分けることができる・・・つまり、学生Aさんは、○○学部△△学科のカテゴリーにも属するし、□□サークルにも所属する・・・ということになってしまいます。
で、結論、これは構いません。例えばWebページのように、複数のメニューセットを同時に持つことができるような情報形態の場合は、観点の異なる複数のカテゴリー区分が共存しても問題はありません。
この場合、重要なことは、学部・学科分類メニューとサークル分類メニューとをごちゃまぜにしないことです。芸術学部と野球部がメニューの上で横に並んではいけません。学部メニューの中に経済・経営・商・工・・・・が並び、またサークルメニューの中には、野球・サッカー・ラグビー・・・などが並ぶ。というぐあいに観点(メニューセット)別に整理されるべきでしょう。
WordPressというCMSでは、投稿記事(情報要素)が複数のカテゴリに所属できるようになっています。あるカテゴリセットが学部・学科で区分され、別のカテゴリセットがサークルで区分されている・・・そのような2つの観点が共存しても構わないわけで、Aさんの記事は、○○学部△△学科の記事として、また□□サークルの記事としても、アプローチできるものになります。
TAG
タグとは、個々の情報要素にまつわるキーワード、あるいは目印のようなものと考えるといいでしょう。タグは「点」として存在するので、いくら集めても整理されることはないし、また階層構造もできません。
例えば、学生Aさんに付けるタグとしては、「(好きな食べ物)カレー」や「(趣味)バイク」、あるいは「(資格)色彩検定2級」は有効かもしれません。そもそも「好きな食べ物」や「趣味」などは、一人の人間に複数存在するもので、それで学生全体をきれいに仕分ける・・・ということはできません。このように、分類上の数が多すぎるもの、整理に適さないあいまいなもの・・などが、「タグ」にふさわしい・・ということになります。
「(好きな食べ物)カレー」や「(趣味)バイク」をキーとして、全学生の中から該当者を抽出する操作は、それなりに意味のあることです。グループができるきっかけになるかもしれません。つまり、「分類」は無理でも、当該キーワードに関わる要素を集めるということに意味が見いだせる場合には、そのキーワードをタグとして扱うとよいでしょう。
WordPressというCMSでは、投稿記事(情報要素)に複数のタグを付けることができるようになっていて、特定のタグをもつ記事を一挙に抽出できるようになっています。
以上、まとめると、以下のようになります。
- Category:
- 一定の観点から一挙に仕分けられるもので、階層構造を持つ
- 要素の集合を分類する観点(視点)は無限にある*1
- 観点(視点)を定めて要素を分類する際においては、
ひとつの要素が2つ以上のカテゴリーに重複して存在することはない
- TAG:
- 要素に関連する「目印」で、系統的に整理されるものではない
- タグは、分類上の「観点」とは無関係に存在する
- ひとつの要素には複数のタグをつけることができる
付記2:ポートフォリオサイトのページ構成について
授業課題、プロジェクト、公募、自主制作・・様々ある作品を掲載する際、例えばイラスト / グラフィック / CG などのページ区分を考えてはみるものの、そもそも境界がはっきりしない・・。また、アナログとデジタルという分け方もあるし、制作年ごとに整理するという方法もある。・・と、カテゴリー分けについて悩むことが多いと思います。そんなときは、「分類しない」つまり「1作品1ページ」で作ってしまう・・という方法も検討する価値があると思います。