カスタムできるBGMの配布サイト
本研究は、映像制作者が自らの作品に合わせて細部にまでこだわって編集できるBGM素材を、手軽に入手することが困難である、入手することができる環境が無い、という課題を解決するために、ステムデータ形式のBGMを配布するwebサイトを制作するプロジェクトである。
楽曲を構成する、ピアノ、ドラム、ギターなどの各パートを個別のオーディオファイルに分けたものを指す。
映像編集では、カメラで撮影した素材をもとに、色調を整えたり、エフェクトを加えたり、不要な部分をカットしたりと、さまざまな工程を経て最終的な映像を作る。ステムデータは、こうした映像の制作手法を音楽にも適用できるようにしたものだ。例えば、セリフと歌が重なって聞き取りづらいときには、歌の音量だけを下げるなど、映像制作の現場で音楽を柔軟に扱うことができる。逆に、迫力のあるシーンではドラムを強調して、より躍動感を出すことも可能だ。また、音楽の尺を調整したいときも、パートごとに編集できるため、自然な仕上がりになる。
テレビシリーズのアニメやドラマの制作現場では、ステムデータを活用し、セリフとの干渉を避けるために特定の音量を下げたり、シーンの感情に合わせて特定の楽器の音を強調したりといった、演出を行っていることが多い。しかしながら、一般的に利用できるBGM素材は、通常、単一のオーディオファイルとして提供されるため、映像の内容やテンポ、感情に合わせたきめ細やかな調整が困難である。
音楽にこだわりたいけど、どうこだわれば良いかわからない、編集の終盤にありもののBGMを当てはめるしかない。この現状は、こだわり方を知らないだけで、もし知っていればもっと深く関われるはず。ビジュアルとサウンドは、どちらも情報を伝えるための大切な要素であるため、その可能性を追求しないのはもったいないと考えた。
この課題を解決するため、映像制作者が自らの作品に合わせて細部にわたり自由に編集・調整できるBGMの利用環境を提供することが、本研究の目的である。
映像制作者にとって、ステムデータという概念は馴染みが薄く、その活用方法に戸惑う可能性が考えらるため、親しみやすく、技術的なハードルを感じづらいサイトであることに重点を置き、複雑な専門知識を要することなく、手軽にステムデータを入手できる環境を提供することを目指す。
その他プラグインなどは、別のページにまとめる予定です。
プロジェクトの期間|2025.04.11 -
ステムデータを編集する手法は、商業の限られた制作現場での慣習であり、小規模な映像制作ではあまり一般的ではなかった。その理由のひとつが、ステムで提供される音楽素材自体がほとんど存在しなかったこと、そして音楽の再構成に対する知識が共有されていなかったことである。
ステムデータを配信しているサイト
制作途中です。
制作途中です。
全体的なスケジュールの見直し、調整を行いました。
制作途中です。
全体的なスケジュールの見直し、調整を行いました。
制作途中です。
ニュースカテゴリがいらないという判断をしました。
左右反転させると、真ん中が三角になって再生ボタンに見えるかも?
ジャンルではなく、雰囲気やシーンで分ける方が良いと判断。
例えば
など…
ひろばと音が重要。ロゴマークとロゴタイプでセットにする方が適している。
素材が置いてある場所、ひろばの木にみんなが集まるイメージで。
ステムデータとは、1つの完成された音楽を、役割ごとに分けて書き出した音声ファイルの集まりのこと。例えば、歌、ドラム、低音楽器、弦楽器などのように、音楽の構成要素をパート別に分けて、それぞれ独立した音声ファイルにしたものを指す。
映像編集では、カメラで撮影した素材をもとに、色調を整えたり、エフェクトを加えたり、不要な部分をカットしたりと、さまざまな工程を経て最終的な映像を作る。ステムデータは、こうした映像の制作手法を音楽にも適用できるようにしたものだ。
通常、私たちが聴く音楽はすべての音がミックスされて1つの音声ファイルになっている。しかし、ステムデータではそれらが分かれているため、セリフと音楽が重なって聞き取りづらいときには、歌の音量だけを下げるなど、映像制作の現場で音楽を柔軟に扱うことができる。逆に、迫力のあるシーンではドラムや低音楽器を強調して、より躍動感を出すことも可能だ。また、音楽の尺を調整したいときも、パートごとに編集できるため、自然な仕上がりになる。
5つの事務作業を追加
プレビューもできました。
オーディオミキサーのプロトタイプでは、オーディオの制御をWeb Audio APIを使用し行っている。
元々、ステムデータでの音楽納品は、テレビシリーズのアニメやドラマなど継続的な映像制作の現場で使われてきた手法である。これは、毎話異なる演出や尺に対応するため、編集段階で音の構成を柔軟に調整できる必要があったことに起因している。シリーズ内でのサウンドの統一感を整えるためでもある。
たとえば、メロディだけを残して別の場面に流用する、ドラムを抜いて静かなシーンにする、同じ曲を短く再構成する、といった使い方が可能になるのが、ステムデータの大きな利点だ。
しかしこの手法は、商業の限られた制作現場に閉じた慣習であり、小規模な映像制作ではあまり一般的ではなかった。その理由のひとつが、ステムで提供される音楽素材自体がほとんど存在しなかったこと、そして音楽の再構成に対する知識が共有されていなかったことである。現在は、ステムで音楽素材を提供するサービスも増えている。
映像制作では、作品の見た目には強いこだわりがあっても、音楽へのこだわりが後回しになるケースが少なくない。音楽にこだわりたいけど、どうこだわれば良いかわからない、編集の終盤にありもののBGMを当てはめるしかない。この現状は、こだわり方を知らないだけで、もし知っていればもっと深く関われるはず。
ビジュアルとサウンドは、どちらも情報を伝えるための大切な要素である。その可能性を追求しないのはもったいない、と考えた。
現状の配布データより、より細かな編集ができるようなデータ、ステムデータを作ることで、こだわり方を知ってもらい、より良い作品作りに活かしてもらう。
どちらもステムでの配布はしてありそうだが、ステムでのプレビューはできない。
再生しているのはmp3ファイルだが、ダウンロードボタンを押すとwavファイルがダウンロードできるようになっている。
スマホ版では、パケット通信量の都合でダウンロードボタンを非表示にしている。
オーディオファイルをwavからmp3の変換する際、音質を下げることでファイル容量を削減できる。しかし、音質を下げすぎると、映像制作者側でシミュレーションがしにくくなる。
良いバランスをとるための検証を行った結果、サンプリングレートを44.1kHzに固定し、可変ビットレートによる音質と容量のテストを行ったところ、7を指定するのが一番良いとの結論に辿り着いた。変換はpythonで行う。
上記ソースコードのここで、可変ビットレートとサンプリングレートの値を変更する。
parameters=["-q:a", "7", "-ar", "44100"]
おといろひろばにする。
音で映像作品を彩ってほしい。その音素材が集まるひろばという意味です。
いらすとやからインスピレーションを受け、その音版をイメージしました。