失った声を音声合成で取り戻す「ボイスバンク」

この記事をtweetする このエントリーをはてなブックマークに追加

流行りモノから新技術まで! 5分でわかる最新キーワード解説

失った声を音声合成で取り戻す「ボイスバンク」

2015/09/02


 今回のテーマは、多くの人の声をもとに、筋萎縮性側索硬化症(ALS)やがんによる喉頭摘出などで声が出せないことに悩む人の「本人の声」を取り戻そうという、音声合成技術を背景にした研究プロジェクト「ボイスバンク」です。長時間の録音が必要だった古い音声合成技術とは一線を画した「声の関数化」技術により、数分程度の録音音声があれば、本人の健常時の声に近い音声合成ができますが、多くの患者のための音声合成システムを作るには、多くの人の声を統計処理した「平均声」がさらに必要です。そのために様々な人の声を集めようというのがこのプロジェクト。今回はプロジェクトの背後にある最新音声合成技術にも注目して解説していきます。

ボイスバンク

※「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介します。会員登録を行い、 ログインすると、「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事全文がお読みいただけます。

会員登録はこちら(無料)



1

「ボイスバンク」って何?

 国立情報学研究所の山岸順一准教授が推進している、正しい発音ができなくなった、声を出しにくくなった、もしくは、声が出せなくなったというような声の障害を持つ人のために健常時の声を再現するプロジェクト。同プロジェクトでは、多数のボランティアが録音した音声を統計処理して関数化した「平均声」を作成したうえ、数分程度の本人の声(健常時に録音されたもの)を利用することで、健常時の本人の声に近い音声を合成する技術を開発した。この技術による音声合成システムを作成し、ALSなど進行性の病気による構音障碍者やがんなどによる喉頭切除者などに試用しもらい、性能評価を行うのが当面の目標だ。

図1 ボイスバンクプロジェクトの概要
図1 ボイスバンクプロジェクトの概要

 その音声合成システムのデータ量は数MB程度でよく、コンパクトなソフトウェアと合わせてPCやタブレットなど身近なデバイスに搭載して利用できるため、発声できない人や構音障碍を持つ人などが、テキスト入力あるいはボタン操作など本人の状態に合った手段で文章を入力すれば、デバイスが本人の声に近い音声を合成して出力してくれる(図2)。

図2 タブレットのボタン操作で合成音声を出力するシステムの例
図2 タブレットのボタン操作で合成音声を出力するシステムの例
資料提供:国立情報学研究所

 現在のところは基礎研究段階として国内のボランティア対象の声の収集がいったん終了し、研究に協力してくれる発語に障碍を持つ人を数名募っている段階だ。

1-1

これまでの音声合成技術の課題は?

 ボイスバンクプロジェクトの発端は、山岸准教授が進めてきた音声の数理的な分析と合成の研究だ。その紹介の前に、少し音声合成の歴史を振り返りたい。
 1950年代から始まった音声合成の研究は、最初は音と音とのつながりのルールを発見して、そのルールに基づいて音をつなげるルールベースの音声合成から始まった。これは今でも時々TV番組や演芸で「宇宙人の声」や「ロボットの声」として滑稽なものとして演じられることがあるほど、不自然でぎこちないものだった。

■音声合成普及のきっかけは「波形接続合成」から

 それが今、電話やカーナビの音声案内などで聞かれるような、かなり自然な声音で流暢な発音になったのには、ITの発展により、膨大な量の音声データを取り扱えるようになったことが背景にある。これらの音声合成には、特定の人の音声を録音し、そこから単音ばかりでなく単語や文章などを切り出して、テキストと対応するようにデータベース化した「音声コーパス」を作り、発声させたいテキストに合わせて必要な部分を抽出して接続する「波形接続合成」技術が使われている。1980年代に生まれたこの波形接続技術が、現在の音声合成普及の原動力になった。「初音ミク」などのボーカロイドが人気を博しているが、これも波形接続合成技術の応用の1例だ。

図3 波形接続合成技術のイメージ
図3 波形接続合成技術のイメージ

 しかしこの技術の課題は、ある人の声を再現しようと思うと、その人の声を長時間スタジオ録音する必要があることだ。自由に書かれた文章を発声させるには、10時間を超える録音データが必要になり、スタジオで録音し、後処理を加えてデータベース化して使えるようになるまで最低でも100万円程度、場合によってはその10倍もコストがかかるとも言われている。だいたい現在発語が困難な患者の健常時の声をこの技術で再現するのには無理がある。また大サイズのデータベースを使うため、音声合成処理をユーザーの手元の端末で行うには容量・性能的にも問題があった。

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

キーマンズポイントで今応募できるプレゼントはこちら!(2016/12/31まで)

ITキャパチャージに解答いただくとポイントがたまります。
たまったポイント数に応じて、以下、A〜E賞の各賞品に応募することができます。

●B賞:抽選で1名様
 象印マホービン 圧力IH炊飯ジャー「極め炊き NP-YB10」 
●A賞:抽選で1名様
 HUAWEI Windows 10 Pro搭載 2in1デバイス「HUAWEI MateBook M3」 
●C賞:抽選で1名様
 iRobot 床拭きロボット「ブラーバ ジェット240」 
●D賞:抽選で1名様
 プリンセス 大皿みたいな白いホットプレート「Table Grill Pure」 
●E賞:抽選で2名様
 ASUS 毎日の健康をスマートに記録「VivoWatch」 

このページの先頭へ
関連キーワード

ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「ボイスバンク」関連情報をランダムに表示しています。

「その他情報共有システム関連」関連の製品

ビジネス専用メッセンジャー direct エンタープライズ版 【L is B】 グローバルコミュニケーションIT基盤 導入支援ソリューション 【三菱電機インフォメーションシステムズ】 セキュアな音声書き起こしサービス VoiShredder 【フュートレック】
その他情報共有システム関連 その他情報共有システム関連 その他情報共有システム関連
現場スタッフと社内のコミュニケーションを素早く安全に行う、マルチデバイス対応ビジネス専用メッセンジャー。
チャットのほか写真・動画・位置情報共有など機能も多彩。
社員が我先に使うコミュニケーション基盤へと定着化するには? 独自の音声分割(シュレッダー)技術を用いることで、機密情報を保持しながら音声データの書き起こしを行ってくれるサービス。

「その他情報共有システム関連」関連の特集


今回、訪問したのは全世界に350以上の拠点を持つ世界有数の事業用不動産サービス会社であるCBREの東…



クリニックミーティングの「アプローチ段階」の第2段階である「アタック段階」のポイントを見ていきます。



 前回はOtoOマーケティングを踏まえたソーシャルメディア活用術を説明しました。オンラインであるネッ…


「その他情報共有システム関連」関連のセミナー

BCP訓練の始め方・情報共有ツールの使い方セミナー 【日本ユニシス】 締切間近 

開催日 12月15日(木)   開催地 東京都   参加費 無料

熊本の震災や度重なる大型台風、噴火・大雪・火災などを受け、今、多くの企業が事業継続計画(BCP)を策定されています。しかし、大量の情報が一気に押し寄せる非常時に…

スマートロボット 活用セミナー/東京 【サテライトオフィス】 締切間近 

開催日 12月15日(木)   開催地 東京都   参加費 無料

〜企業でスマートロボットを使っていくユースケースを紹介いたします。スマートロボットの現状のパフォーマンスと 開発イメージをご紹介いたします。〜【企業向けスマート…

「情報共有システム・コミュニケーションツール」関連 製品レポート一覧

このページの先頭へ

ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事の続きがお読みいただけます。


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


ページ: 1 | 2 | 3


30007811


IT・IT製品TOP > 情報共有システム・コミュニケーションツール > その他情報共有システム関連 > その他情報共有システム関連のIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ