08:00〜 30分 + ライブQ&A

表現と話者を操る音声合成に向けた研究開発

既存の音声合成では生成したい人の声の長時間の録音がなければまともな品質にすることは難しかったため、様々な人の声を出そうとするとかなりの手間が必要だった。今回はこれまで取り組んできた様々な研究の一部として、非常に少量のデータからでも制御性の高い音声合成を実現した自分の研究を紹介するほか、社内の巨大な広告音声を活用することで広告話者埋め込みを作り、広告で使われるような様々な声を生成した結果を報告する。