失った声を音声合成で取り戻す「ボイスバンク」

この記事をtweetする このエントリーをはてなブックマークに追加

流行りモノから新技術まで! 5分でわかる最新キーワード解説

失った声を音声合成で取り戻す「ボイスバンク」

2015/09/02


 今回のテーマは、多くの人の声をもとに、筋萎縮性側索硬化症(ALS)やがんによる喉頭摘出などで声が出せないことに悩む人の「本人の声」を取り戻そうという、音声合成技術を背景にした研究プロジェクト「ボイスバンク」です。長時間の録音が必要だった古い音声合成技術とは一線を画した「声の関数化」技術により、数分程度の録音音声があれば、本人の健常時の声に近い音声合成ができますが、多くの患者のための音声合成システムを作るには、多くの人の声を統計処理した「平均声」がさらに必要です。そのために様々な人の声を集めようというのがこのプロジェクト。今回はプロジェクトの背後にある最新音声合成技術にも注目して解説していきます。

ボイスバンク

※「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介します。会員登録を行い、 ログインすると、「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事全文がお読みいただけます。

会員登録はこちら(無料)



1

「ボイスバンク」って何?

 国立情報学研究所の山岸順一准教授が推進している、正しい発音ができなくなった、声を出しにくくなった、もしくは、声が出せなくなったというような声の障害を持つ人のために健常時の声を再現するプロジェクト。同プロジェクトでは、多数のボランティアが録音した音声を統計処理して関数化した「平均声」を作成したうえ、数分程度の本人の声(健常時に録音されたもの)を利用することで、健常時の本人の声に近い音声を合成する技術を開発した。この技術による音声合成システムを作成し、ALSなど進行性の病気による構音障碍者やがんなどによる喉頭切除者などに試用しもらい、性能評価を行うのが当面の目標だ。

図1 ボイスバンクプロジェクトの概要
図1 ボイスバンクプロジェクトの概要

 その音声合成システムのデータ量は数MB程度でよく、コンパクトなソフトウェアと合わせてPCやタブレットなど身近なデバイスに搭載して利用できるため、発声できない人や構音障碍を持つ人などが、テキスト入力あるいはボタン操作など本人の状態に合った手段で文章を入力すれば、デバイスが本人の声に近い音声を合成して出力してくれる(図2)。

図2 タブレットのボタン操作で合成音声を出力するシステムの例
図2 タブレットのボタン操作で合成音声を出力するシステムの例
資料提供:国立情報学研究所

 現在のところは基礎研究段階として国内のボランティア対象の声の収集がいったん終了し、研究に協力してくれる発語に障碍を持つ人を数名募っている段階だ。

1-1

これまでの音声合成技術の課題は?

 ボイスバンクプロジェクトの発端は、山岸准教授が進めてきた音声の数理的な分析と合成の研究だ。その紹介の前に、少し音声合成の歴史を振り返りたい。
 1950年代から始まった音声合成の研究は、最初は音と音とのつながりのルールを発見して、そのルールに基づいて音をつなげるルールベースの音声合成から始まった。これは今でも時々TV番組や演芸で「宇宙人の声」や「ロボットの声」として滑稽なものとして演じられることがあるほど、不自然でぎこちないものだった。

■音声合成普及のきっかけは「波形接続合成」から

 それが今、電話やカーナビの音声案内などで聞かれるような、かなり自然な声音で流暢な発音になったのには、ITの発展により、膨大な量の音声データを取り扱えるようになったことが背景にある。これらの音声合成には、特定の人の音声を録音し、そこから単音ばかりでなく単語や文章などを切り出して、テキストと対応するようにデータベース化した「音声コーパス」を作り、発声させたいテキストに合わせて必要な部分を抽出して接続する「波形接続合成」技術が使われている。1980年代に生まれたこの波形接続技術が、現在の音声合成普及の原動力になった。「初音ミク」などのボーカロイドが人気を博しているが、これも波形接続合成技術の応用の1例だ。

図3 波形接続合成技術のイメージ
図3 波形接続合成技術のイメージ

 しかしこの技術の課題は、ある人の声を再現しようと思うと、その人の声を長時間スタジオ録音する必要があることだ。自由に書かれた文章を発声させるには、10時間を超える録音データが必要になり、スタジオで録音し、後処理を加えてデータベース化して使えるようになるまで最低でも100万円程度、場合によってはその10倍もコストがかかるとも言われている。だいたい現在発語が困難な患者の健常時の声をこの技術で再現するのには無理がある。また大サイズのデータベースを使うため、音声合成処理をユーザーの手元の端末で行うには容量・性能的にも問題があった。

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

キーマンズポイントで今応募できるプレゼントはこちら!(2018/6/30まで)

ITキャパチャージに解答いただくとポイントがたまります。
たまったポイント数に応じて、以下、A〜E賞の各賞品に応募することができます。

●B賞:抽選で2名様
 ASUS タブレット「ZenPad 10 Z301M-WH16」  
●A賞:抽選で1名様
 ダイソン 空気清浄機能付ヒーター 「HP 00 WS」 
●C賞:抽選で1名様
 Google Home 
●D賞:抽選で1名様
 酒グラスコレクション 冷酒セット(金箔)  
●E賞:抽選で5名様
 Amazon 使える商品は1億種以上「Amazonギフト券 5000円分」 

このページの先頭へ
関連キーワード

ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「ボイスバンク」関連情報をランダムに表示しています。

「その他情報共有システム関連」関連の製品

Web社内報 企画・編集サービス(クオリア) 【ウインズ】 「デジタル化/ペーパーレス化」意識調査で見えた、消費者ニーズと経営層の課題 【ドキュサイン・ジャパン】
その他情報共有システム関連 その他情報共有システム関連
モバイルメディアの特徴を生かし、動画・音声・アニメーションなどを活用した社内報を企画・取材・編集して提供するサービス。 「デジタル化/ペーパーレス化」意識調査で見えた、消費者ニーズと経営層の課題

「その他情報共有システム関連」関連の特集


情報システム部門が抱える情報共有とナレッジマネジメントの課題を調査。「問題点」「解決したい内容」など…



マネージャーは、様々な場面で部下を説得する機会が多いです。部下の考え方や態度を変えさせる場合、説明で…



今回、訪問したのは全世界に350以上の拠点を持つ世界有数の事業用不動産サービス会社であるCBREの東…


「その他情報共有システム関連」関連のセミナー

【5/29東京開催】働き方改革ソリューションセミナー 【日本電気】  

開催日 5月29日(火)   開催地 東京都   参加費 無料

■働き方改革ソリューションセミナー 〜始めてみませんか?「働き方改革」へのAI&RPA活用〜少子高齢化による労働人口の減少、長時間労働の是正といった社会課題に対…

ビジュアル情報共有システム xSyncシリーズ体験セミナー 【ブイキューブ】  

開催日 5月18日(金)   開催地 東京都   参加費 無料

対象:企業・地方自治体における防災、危機管理対策ご担当者様ライフライン系企業の防災、危機管理対策ご担当者様災害発生時の情報共有に課題はございませんか?本セミナー…

「情報共有システム・コミュニケーションツール」関連 製品レポート一覧

このページの先頭へ

ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事の続きがお読みいただけます。


Myリストへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


ページ: 1 | 2 | 3


30007811


IT・IT製品TOP > 情報共有システム・コミュニケーションツール > その他情報共有システム関連 > その他情報共有システム関連のIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ