楽器音合成AIデモバージョン
メインビジュアル、あるいは プロジェクトの最新の状態を視覚的に掲載
- 松本龍太郎
概要
これは何?
- 楽器音合成AIのデモバージョンです。
背景と目的
生演奏にはとてもコストがかかり、演奏者との繋がりなども必要だ。誰もが出来る環境にないにも関わらず、最終的な楽曲のクオリティには雲泥の差がある。
PCの性能や機械学習の技術が発展したことにより、その差を埋めることができるようになる。
コンセプト
- 誰もが生演奏に近い音を扱うことができるようになる楽器音合成AI
- デモバージョン
成果物の仕様
- Google Collaboratory(仮)
制作ツール
- Python
- Logic Pro X
プロジェクトの期間
2024.04.09 -
まとめ
調査
現状調査
- 一般の利用者には理解しにくい専門用語や複雑な表現で満ちており、情報の理解やアクセスが制限されている状況。
- 利用者とってわかりやすく作成することが必要。
先行事例
Melismaという楽器音合成AIがある。musicxml 形式の楽譜を入力するとヴァイオリンの音を合成してくれるAIである。中迫酒菜氏という作曲家の個人制作AIであるが、生演奏されたデータや現代の楽曲に頻出するフレーズを学習しているため、非常にクオリティの高いものとなっている。
- pythonで学ぶ音声合成 機械学習実践シリーズ
技法・技術情報
- Python
プロジェクト管理
スケジュール
ToDo
進捗記録
2024.04.30
- ロゴや名前があれば良い
- もう一度本を読み返してみる
- Tacotoronを一度日本語化していたが、そもそも日本語化する必要はないのでは?
2024.04.16
- テンソルサイズを揃えられた!やったぜ!
- npyの正規化できた!やったぜ!
- テンソルサイズを揃えなければならない。なぜできないのか分からない。
2024.04.09
- npyの正規化がうまくできない。沼にハマってしまった;;