概要
このプロジェクトは等身大美少女ロボット制作計画で開発中の人型ロボット「足立レイ」の、音声合成ソフトを作る事が目的です。目標金額が達成された場合、一般向けに販売します。
パッケージ版イメージ
足立レイ ロボット初期設計図
どんなソフト?
AI技術を用いたテキスト読み上げソフトです。株式会社エーアイ様が提供するA.I.VOICE(エーアイボイス)の技術を使用しています。ただ、その元となる音声は、声優の声ではなく、独自技術で生成された合成音で、合成音のさらにレプリカ、「レプリボイス(Replivoice) 」と名付けました。
クラウドファンディングが成功した場合、その名称で独自ブランドとして販売します。
(技術協力:株式会社エーアイ )
A.I.VOICE
特徴
大きな特徴として、いわゆる中の人(声優さん)がいません。
どういう事かというと、普通は声優さんの声を録音して合成音声の素材にしたり、声を機械学習させたりして声のモデルを作るのですが、この音声は元々正弦波合成で、100%人工的に音波を生成した音声だからです。
簡単に図解すると、こういう作り方になります。
波の合成で別の波(音声)ができる
作った音声をUTAUで喋らせたのがこちらです。
「合成音」感の強い声ではありますが、ちゃんと女の子の声には聞こえるようになっていると思います。また、「合成音感」が程よく強い声、というのを目指して作ってもいます。
これまでの経緯
ロボット開発の一環として、ロボット用の合成音声の開発も行ってきました。声はキャラクター用エンターテイメント向けロボットにとっては重要な要素で、完成には必ず必要と考えています。
開発中のロボットの上半身
開発中の脚部
足動作試験
その際、「せっかくロボットキャラなんだから声も一から人工的に生成したら面白いんじゃないか」と思って開発を始めたのがきっかけです。
そこで先ずは歌声合成ソフトUTAU用に足立レイのUTAU音源を作りました。(DLリンク)
【足立レイ】中の人のいない合成音声作った【UTAU音源配布】
UTAU音源を用いて喋らせられるソフトを使って、ロボットの開発実況なども行っています。
しかし歌声合成用のソフトを使って喋らせているため、特にイントネーションが不自然という問題がありました。
(※より詳細な経緯については、トップ画像にもリンクされているこちらの動画を見て頂けると幸いです。内容的には以降の記事とほぼ同一です)
そこで2年ほど前、テキスト読み上げソフトAITalkを提供している株式会社エーアイさんに連絡を取り、「人間の声じゃない合成音声ソフトからの声でもAITalkのライブラリにする事が可能か」というかなり無茶な問い合わせをしました。
普通、読み上げソフトを作る場合、音素バランス文と呼ばれるいろいろな声をバランスよく含んだ文章を500文くらい声優さんに読み上げてもらい、それを合成用の素材として使えるように分割していきます。 (ここからここまでが「か」の子音、ここからここまでが母音、というように)
音声タグ付け例
しかし今回はそもそもその元となる声優さんがいないため、「収録」できません。
そこで、合成音で喋らせた音声を使って、人間用のシステムをそのまま利用して「合成音声の合成音声ライブラリ」をつくれないか、3回ほどの試作と試行錯誤の末、それなりにちゃんとしゃべってくれるものができました。いわば「ロボットの声を収録して作ったロボットが中の人の合成音声」です。
ロボット搭載用としては目途が立ったわけですが、せっかくここまでできたので、ロボット専用のシステムとしてだけでなく、一般向けの販売もしてみたいと考えました。
そこでそのための資金を得るために今回のクラウドファンディングを計画しました!もし面白い、欲しいと思って頂けたら、ぜひご支援よろしくお願い致します。
また、これまでこのようなイレギュラーかつ、新開発の音声合成システムの方向性・コンセプトと、ある意味真逆の試みに快くご協力頂いております株式会社エーアイ様に深く感謝申し上げます。
リターン
リターンは足立レイの合成音声ソフト(A.I.VOICE)パッケージ版と、固有製造ナンバー入りの3Dモデル、その3Dモデルデータの入ったナンバー入りカード型USBメモリです。モデルはフルスクラッチで自作しました!
3Dモデルは通常版(00番)はすでに配布しています。ニコニ立体
支援者の方には胸のナンバーを固有のものに変更したモデルを配布します。今後ナンバー入りを作るかは分かりませんが、初期ロットとして今回のクラウドファンディング支援者の方のナンバーが何番までか発表します。形式はVRMとMMD用テクスチャです。
また、完成後の公式告知動画に支援者名をクレジットさせて頂きます。任意のハンドルネーム(もちろん本名も可)を備考欄に記入をお願い致します。
足立レイ 3Dモデル(0番)
固有製造ナンバー例
カード型USBメモリイメージ
また、10万円のプランとして製作中のロボットの開発過程で生じた、各身体パーツの実寸大の試作品を含めたリターンを用意してみました。各部1つ限定です。機械部品は高価で無理なので、3Dプリントの樹脂構造体パーツになります。
プリント中の試作顔パーツ
試作足パーツ
また、ロボットの3Dプリント骨材として採用しているカーボン(短繊維)入りのエンジニアリングプラスチックでできたキーホルダーもこちらのプランに入れます。(写真は実際のパーツです)
素材の値段も高くプリント難度も高いため大量には作れないのですが、記念品として作ってみようと思います。
ストレッチゴール
AITalk5の機能として、感情表現対応させることが可能です。これは話者適応という技術で、個別に新たな収録をすることなく、喜び・悲しみ・怒りの感情対応をさせる事が可能です。そこで450万円、550万円、650万円達成毎に感情パターンを追加します。
音声の感情機能はロボットのコミュニケーション用の用途としても期待でき、実現した場合は感情表現に対応したロボットの表情変化などの機能の実装を実現したいと考えています。
ロボット開発には多くの費用がかかりるため、多く達成された場合にはロボット開発に存分に使わせて頂こうと思っています。
余裕があればもっと挑戦的な開発ができるので、大きく達成できると嬉しいです!
達成後のスケジュール予定
クラウドファンディング終了:3月末
法人登記:4月中旬
感情決定・音声辞書制作開始:4月末
マスタ完成:7月初旬
パッケージ制作・メディア増産:7月中旬
パッケージ納品:8月中旬
発送開始:9月
一般への販売開始は10月以降になる予定です。
これまでの活動
2008年頃から、等身大のエンターテイメント向けキャラクターのロボットの開発を行ってきました。(当時の記事)2017年からは現在開発中の足立レイの開発を開始しました。同時に、2018年にそのロボット用合成音声としてUTAUライブラリの開発を行い、リリースしました。今回