CyberAgent Developer Conference 2022

30分 + ライブQ&A

AI

表現と話者を操る音声合成に向けた研究開発

既存の音声合成では生成したい人の声の長時間の録音がなければまともな品質にすることは難しかったため、様々な人の声を出そうとするとかなりの手間が必要だった。今回はこれまで取り組んできた様々な研究の一部として、非常に少量のデータからでも制御性の高い音声合成を実現した自分の研究を紹介するほか、社内の巨大な広告音声を活用することで広告話者埋め込みを作り、広告で使われるような様々な声を生成した結果を報告する。

  • 登壇スライド

登壇者

  • 吉本 暁文の写真

    吉本 暁文

    AI事業本部 リサーチサイエンティスト

    2017年新卒入社後、自然言語処理を応用した広告製品開発に従事。2020年より音声研究に着手し、現在は音声合成・声質変換・音声認識に関する研究開発を中心にしつつ、対話研究や応用領域の拡大に取り組んでいる。

関連リンク

同じカテゴリーのセッション

AI

すべてのセッションをみる
プライバシーポリシー
行動規範
お問い合わせ

Copyright © CyberAgent, Inc.