失った声を音声合成で取り戻す「ボイスバンク」

この記事をtweetする このエントリーをはてなブックマークに追加

流行りモノから新技術まで! 5分でわかる最新キーワード解説

失った声を音声合成で取り戻す「ボイスバンク」

2015/09/02


 今回のテーマは、多くの人の声をもとに、筋萎縮性側索硬化症(ALS)やがんによる喉頭摘出などで声が出せないことに悩む人の「本人の声」を取り戻そうという、音声合成技術を背景にした研究プロジェクト「ボイスバンク」です。長時間の録音が必要だった古い音声合成技術とは一線を画した「声の関数化」技術により、数分程度の録音音声があれば、本人の健常時の声に近い音声合成ができますが、多くの患者のための音声合成システムを作るには、多くの人の声を統計処理した「平均声」がさらに必要です。そのために様々な人の声を集めようというのがこのプロジェクト。今回はプロジェクトの背後にある最新音声合成技術にも注目して解説していきます。

ボイスバンク

※「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介します。会員登録を行い、 ログインすると、「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事全文がお読みいただけます。

会員登録はこちら(無料)



1

「ボイスバンク」って何?

 国立情報学研究所の山岸順一准教授が推進している、正しい発音ができなくなった、声を出しにくくなった、もしくは、声が出せなくなったというような声の障害を持つ人のために健常時の声を再現するプロジェクト。同プロジェクトでは、多数のボランティアが録音した音声を統計処理して関数化した「平均声」を作成したうえ、数分程度の本人の声(健常時に録音されたもの)を利用することで、健常時の本人の声に近い音声を合成する技術を開発した。この技術による音声合成システムを作成し、ALSなど進行性の病気による構音障碍者やがんなどによる喉頭切除者などに試用しもらい、性能評価を行うのが当面の目標だ。

図1 ボイスバンクプロジェクトの概要
図1 ボイスバンクプロジェクトの概要

 その音声合成システムのデータ量は数MB程度でよく、コンパクトなソフトウェアと合わせてPCやタブレットなど身近なデバイスに搭載して利用できるため、発声できない人や構音障碍を持つ人などが、テキスト入力あるいはボタン操作など本人の状態に合った手段で文章を入力すれば、デバイスが本人の声に近い音声を合成して出力してくれる(図2)。

図2 タブレットのボタン操作で合成音声を出力するシステムの例
図2 タブレットのボタン操作で合成音声を出力するシステムの例
資料提供:国立情報学研究所

 現在のところは基礎研究段階として国内のボランティア対象の声の収集がいったん終了し、研究に協力してくれる発語に障碍を持つ人を数名募っている段階だ。

1-1

これまでの音声合成技術の課題は?

 ボイスバンクプロジェクトの発端は、山岸准教授が進めてきた音声の数理的な分析と合成の研究だ。その紹介の前に、少し音声合成の歴史を振り返りたい。
 1950年代から始まった音声合成の研究は、最初は音と音とのつながりのルールを発見して、そのルールに基づいて音をつなげるルールベースの音声合成から始まった。これは今でも時々TV番組や演芸で「宇宙人の声」や「ロボットの声」として滑稽なものとして演じられることがあるほど、不自然でぎこちないものだった。

■音声合成普及のきっかけは「波形接続合成」から

 それが今、電話やカーナビの音声案内などで聞かれるような、かなり自然な声音で流暢な発音になったのには、ITの発展により、膨大な量の音声データを取り扱えるようになったことが背景にある。これらの音声合成には、特定の人の音声を録音し、そこから単音ばかりでなく単語や文章などを切り出して、テキストと対応するようにデータベース化した「音声コーパス」を作り、発声させたいテキストに合わせて必要な部分を抽出して接続する「波形接続合成」技術が使われている。1980年代に生まれたこの波形接続技術が、現在の音声合成普及の原動力になった。「初音ミク」などのボーカロイドが人気を博しているが、これも波形接続合成技術の応用の1例だ。

図3 波形接続合成技術のイメージ
図3 波形接続合成技術のイメージ

 しかしこの技術の課題は、ある人の声を再現しようと思うと、その人の声を長時間スタジオ録音する必要があることだ。自由に書かれた文章を発声させるには、10時間を超える録音データが必要になり、スタジオで録音し、後処理を加えてデータベース化して使えるようになるまで最低でも100万円程度、場合によってはその10倍もコストがかかるとも言われている。だいたい現在発語が困難な患者の健常時の声をこの技術で再現するのには無理がある。また大サイズのデータベースを使うため、音声合成処理をユーザーの手元の端末で行うには容量・性能的にも問題があった。

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

キーマンズポイントで今応募できるプレゼントはこちら!(2017/3/31まで)

ITキャパチャージに解答いただくとポイントがたまります。
たまったポイント数に応じて、以下、A〜E賞の各賞品に応募することができます。

●B賞:抽選で1名様
 Lenovo 2 in 1タブレット「YOGA BOOK with Windows」 
●A賞:抽選で1名様
 ZEROTECH 小型セルフィードローン「Dobby Deluxe D100B-H」 
●C賞:抽選で1名様
 harman/kardon ワイヤレスホームスピーカーシステム「AURA PLUS」 
●D賞:抽選で1名様
 THANKO iPhoneケース型「モバイルDLPプロジェクター」 
●E賞:抽選で2名様
 キングジム コンパクトにたためるパソコン「PORTABOOK XMC10」 

このページの先頭へ
関連キーワード

ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「ボイスバンク」関連情報をランダムに表示しています。

「その他情報共有システム関連」関連の製品

Web社内報 企画・編集サービス(クオリア) 【ウインズ】 セキュアな音声書き起こしサービス VoiShredder 【フュートレック】 ビジネスコミュニケーション ProgOffice Enterprise 【NTTソフトウェア】
その他情報共有システム関連 その他情報共有システム関連 その他情報共有システム関連
モバイルメディアの特徴を生かし、動画・音声・アニメーションなどを活用した社内報を企画・取材・編集して提供するサービス。 独自の音声分割(シュレッダー)技術を用いることで、機密情報を保持しながら音声データの書き起こしを行ってくれるサービス。 社内外の連絡先(アドレス帳)データに、クラウドサービスのスケジュールや営業情報を連携して表示。最新の状況を確認しながら相手に連絡できる。

「その他情報共有システム関連」関連の特集


情報システム部門が抱える情報共有とナレッジマネジメントの課題を調査。「問題点」「解決したい内容」など…



クリニックミーティングの最後の段階「クロージング段階」について解説します。



着実に企業に浸透するブログやSNS、Wikiといった「Web2.0的」な技術やツール。今回はそれらが…


「その他情報共有システム関連」関連のセミナー

【福岡】デスクネッツ ネオ & チャットラック体験セミナー 【ネオジャパン/九州日立システムズ】 注目 

開催日 2月7日(火),2月7日(火)   開催地 福岡県   参加費 無料

1人1台のパソコン環境で操作性や機能をご体験いただきながら、満足度No.1グループウェア(※)「desknet's NEO」とビジネスチャットシステム「Chat…

ビジネスチャット チャットラック オンラインセミナー 【ネオジャパン】  

開催日 2月21日(火)   開催地 オンラインセミナー   参加費 無料

通信技術の進歩やモバイルデバイスの普及に伴い、コミュニケーションのあり方も大きく変わろうとしています。そんな中でひときわ注目を浴びているのが「ビジネスチャット」…

「情報共有システム・コミュニケーションツール」関連 製品レポート一覧

このページの先頭へ

ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事の続きがお読みいただけます。


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


ページ: 1 | 2 | 3


30007811


IT・IT製品TOP > 情報共有システム・コミュニケーションツール > その他情報共有システム関連 > その他情報共有システム関連のIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ