皆さん、突然ですが!カラオケって素晴らしい発明だと思いませんか?
私は、日本人の発明のなかで最もカラオケが全世界で楽しまれている娯楽だと思っています。
いつかカラオケのような全世界で楽しんで使われるしくみを発案したいと思っていて、やっと今回これならカラオケを超えるんじゃないかと思う「音声合成のしくみ」を発案できたのでご提案させて頂きます。
改めまして、私はジャスト株式会社の古川と申します。大阪府高槻市で商社の代表取締役と企業内ベンチャーをしています。もと技術者です。
今回音声合成の可能性を広げたくプロジェクトを立ち上げました。音声合成を使用したい方だけでなく、技術者の方にも見ていただけたら嬉しいです、よろしくお願いいたします!
アニメの声優や歌手、映画スターが亡くなったりしても未来永劫喋り歌うことができる音声合成の「応用特許」 の技術を広めて今後様々なサービスに活用していけるのではないかと考えました。
”改良発明”と呼ばれ、他人の発明(技術)や自分の発明(技術)に改良を加えて完成した発明のことを言います。誰かの特許にその特許申請した人が思いもつかない発明をすることで、より利便性が高まることも多くあります。
例えばA社がストローを開発し、特許を取りました。A社の発明に基づいてB社が蛇腹の曲がるストローを開発しました。この場合、その改良点が新しいものであれば特許(応用特許)を受けることができます。
このように、特許を保有するそれぞれの権利者が「クロスライセンス」(相互に実施権を許諾)を契約することで権利関係の制約が緩和され、製品を製造しやすくなります。例えば身近なところでいうと、お掃除ロボットもそれにあたります。
どんなに素晴らしいアイデアであってもアイデアだけでは全世界で楽しんでもらうことができません。
さらに、どんなに素晴らしいアイデアであってもより多くの方々に、知ってもらい、気付いてもらい、喜んで使ってもらわなければ存在価値がありません。
とある昔のゲームのユーザコメントで「〇〇(ゲーム名)がある時代に生まれて良かった」とあった。メーカの立場(ゲームを創った立場)からすると、最大級のお褒めの言葉であります。
このように日本人のみならず全世界の方々から「この音声合成がある時代に生まれて本当に良かった」「この音声合成がないと生きていけない」と言ってもらえるようにしたい!
そう言ってもらうために、以下の最小限のことができるプラットフォームを構築することを実現したいです。
AIの技術の発達により特定話者が声を70〜100文ほど発することでその人の声をデータ化することが可能になっています。ただ残念なことに、声の情報をデータ化することはできても、しゃべらせる時にテキストの文章の喜怒哀楽情報は再現することはできません。
ずいぶん滑らかになってはきましたが、カーナビや電話のアナウンスなどのように、、まだまだどこか機械的なイメージが残ってしまいます。
なぜロボット感が出てしまうかと言うと、それは無理やりに喜怒哀楽情報を作っているからです。
電話や電車、バスなどのアナウンスや商品紹介などの音声であれば単調な話し方でも問題はないのですが、これをアニメや映画などに取り入れるにはまだまだ違和感があります。
これからはYouTubeなども取り入れていくことで新しいジャンルが切り開かれていくのではないかと考えています。
そのためには、不特定話者がしゃべった文章から喜怒哀楽情報だけを取り出して、次に喋らせたい人の音声情報