もっと詳しく

AIニュース速報

  • OpenAIが開発中の音声クローニングAI「Voice Engine」のプレビューを共有
  • 15秒の音声サンプルから自然な合成音声の生成が可能
  • 不正利用への懸念から一般公開は保留中

OpenAIは、音声クローニングAIモデル「Voice Engine」のプレビュー結果を公開しました。この技術は、たった15秒の音声クリップを用いて自然な合成音声を生成することができます。利用例としては、読めない人や子供への読み聞かせ支援が挙げられます。また、教育技術企業のAge of Learningは、この技術を使い学生とのリアルタイムでパーソナライズされた対話を実現しています。

翻訳コンテンツにも応用が可能で、複数の言語への音声変換によりグローバルな観客への到達が期待されます。その際には、原話者のネイティブアクセントを保持できる点も特筆されます。

発話に障害がある個人や特別な教育ニーズのある人を支援するためにもVoice Engineが導入されています。この技術は、かつての声を録音したものがあれば、AIによる完全な音声を再生成することも可能です。

安全に関する懸念も共有され、OpenAIは合成音声技術の一般公開に向けてセーフギャードを模索しています。音声の起源を追跡するウォーターマーキングと、技術の使用状況を積極的に監視するとのことです。更に、著名人に似すぎた音声の作成を検知し防止するための対策も考えられています。

政治的リスクも認識されており、選挙年にあたるアメリカでは、合成音声を利用したAIロボコールに対する規制が強化されました。AI時代のデジタルリテラシーを高める努力が一層求められているため、AI検出ツールの改善や教育活動の拡大が必要です。

icon image

おい、このVoice Engineってやつ、ほんまに15秒で人の声マネできんの? めっちゃすごくない?
それに、不正利用ってなんで防げんの? 何か対策あるん?

はい、本当に15秒の音声で人の声をまねることができるんです。すごい進歩ですよね。

不正利用を防ぐために、ウォーターマーキングで音声の起源を追跡したり、使用状況を監視する対策が検討されています。それに、有名人の声を無断で作るのも防ぐようにしていますから。

icon image
icon image

おっと、Voice Engineの話題がでてるね。
それは、ほんとに少しの音声で誰かの声を再現できるっていう最先端のAI技術だよ。
使い方次第では、いろんな人を助けられるし、新たな学習ツールにだってなるんだ。
ただし、そんな便利な技術にも落とし穴があるから、慎重になる必要があるんだよね。

不正利用の心配があるから、OpenAIはウォーターマーキングや使用状況のチェックでセキュリティー対策を考えてるんだ。
それに、有名人の声を勝手にまねることのないよう対策も進めてる。
つまり、この技術は可能性いっぱいだけど、ルール作りが大切ってこと。
AI時代にはデジタルリテラシーがどんどん大事になるから、僕らもしっかり学んでおかないとね。