失った声を音声合成で取り戻す「ボイスバンク」

この記事をtweetする このエントリーをはてなブックマークに追加

流行りモノから新技術まで! 5分でわかる最新キーワード解説

失った声を音声合成で取り戻す「ボイスバンク」

2015/09/02


 今回のテーマは、多くの人の声をもとに、筋萎縮性側索硬化症(ALS)やがんによる喉頭摘出などで声が出せないことに悩む人の「本人の声」を取り戻そうという、音声合成技術を背景にした研究プロジェクト「ボイスバンク」です。長時間の録音が必要だった古い音声合成技術とは一線を画した「声の関数化」技術により、数分程度の録音音声があれば、本人の健常時の声に近い音声合成ができますが、多くの患者のための音声合成システムを作るには、多くの人の声を統計処理した「平均声」がさらに必要です。そのために様々な人の声を集めようというのがこのプロジェクト。今回はプロジェクトの背後にある最新音声合成技術にも注目して解説していきます。

ボイスバンク

※「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介します。会員登録を行い、 ログインすると、「ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」の記事全文がお読みいただけます。

会員登録はこちら(無料)



1

「ボイスバンク」って何?

 国立情報学研究所の山岸順一准教授が推進している、正しい発音ができなくなった、声を出しにくくなった、もしくは、声が出せなくなったというような声の障害を持つ人のために健常時の声を再現するプロジェクト。同プロジェクトでは、多数のボランティアが録音した音声を統計処理して関数化した「平均声」を作成したうえ、数分程度の本人の声(健常時に録音されたもの)を利用することで、健常時の本人の声に近い音声を合成する技術を開発した。この技術による音声合成システムを作成し、ALSなど進行性の病気による構音障碍者やがんなどによる喉頭切除者などに試用しもらい、性能評価を行うのが当面の目標だ。

図1 ボイスバンクプロジェクトの概要
図1 ボイスバンクプロジェクトの概要

 その音声合成システムのデータ量は数MB程度でよく、コンパクトなソフトウェアと合わせてPCやタブレットなど身近なデバイスに搭載して利用できるため、発声できない人や構音障碍を持つ人などが、テキスト入力あるいはボタン操作など本人の状態に合った手段で文章を入力すれば、デバイスが本人の声に近い音声を合成して出力してくれる(図2)。

図2 タブレットのボタン操作で合成音声を出力するシステムの例
図2 タブレットのボタン操作で合成音声を出力するシステムの例
資料提供:国立情報学研究所

 現在のところは基礎研究段階として国内のボランティア対象の声の収集がいったん終了し、研究に協力してくれる発語に障碍を持つ人を数名募っている段階だ。

1-1

これまでの音声合成技術の課題は?

 ボイスバンクプロジェクトの発端は、山岸准教授が進めてきた音声の数理的な分析と合成の研究だ。その紹介の前に、少し音声合成の歴史を振り返りたい。
 1950年代から始まった音声合成の研究は、最初は音と音とのつながりのルールを発見して、そのルールに基づいて音をつなげるルールベースの音声合成から始まった。これは今でも時々TV番組や演芸で「宇宙人の声」や「ロボットの声」として滑稽なものとして演じられることがあるほど、不自然でぎこちないものだった。

■音声合成普及のきっかけは「波形接続合成」から

 それが今、電話やカーナビの音声案内などで聞かれるような、かなり自然な声音で流暢な発音になったのには、ITの発展により、膨大な量の音声データを取り扱えるようになったことが背景にある。これらの音声合成には、特定の人の音声を録音し、そこから単音ばかりでなく単語や文章などを切り出して、テキストと対応するようにデータベース化した「音声コーパス」を作り、発声させたいテキストに合わせて必要な部分を抽出して接続する「波形接続合成」技術が使われている。1980年代に生まれたこの波形接続技術が、現在の音声合成普及の原動力になった。「初音ミク」などのボーカロイドが人気を博しているが、これも波形接続合成技術の応用の1例だ。

図3 波形接続合成技術のイメージ
図3 波形接続合成技術のイメージ

 しかしこの技術の課題は、ある人の声を再現しようと思うと、その人の声を長時間スタジオ録音する必要があることだ。自由に書かれた文章を発声させるには、10時間を超える録音データが必要になり、スタジオで録音し、後処理を加えてデータベース化して使えるようになるまで最低でも100万円程度、場合によってはその10倍もコストがかかるとも言われている。だいたい現在発語が困難な患者の健常時の声をこの技術で再現するのには無理がある。また大サイズのデータベースを使うため、音声合成処理をユーザーの手元の端末で行うには容量・性能的にも問題があった。

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

キーマンズポイントで今応募できるプレゼントはこちら!(2018/3/31まで)

ITキャパチャージに解答いただくとポイントがたまります。
たまったポイント数に応じて、以下、A〜E賞の各賞品に応募することができます。

●B賞:抽選で1名様
 パナソニック ステレオヘッドホン RP-HD10-K  
●A賞:抽選で1名様
 バルミューダ 気化式加湿器 Rain 
●C賞:抽選で1名様
 ユーイング 水耕栽培機GreenFarm UH-A01E1 
●D賞:抽選で1名様
 GARMIN リストバンド型活動量計 vivofit2 
●E賞:抽選で5名様
 Amazon 使える商品は1億種以上「Amazonギフト券 5000円分」 

このページの先頭へ
関連キーワード

ボイスバンク/失った声を音声合成で取り戻す「ボイスバンク」」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「ボイスバンク」関連情報をランダムに表示しています。

「その他情報共有システム関連」関連の製品

これまでのUCとどう違う? 「インテリジェントコミュニケーション」とは何か 【日本マイクロソフト】 インカムシステム 【NTTテクノクロス】 根強い「Microsoft Office」の人気、情報共有ツールのクラウド活用は進むのか 【アイティメディア株式会社】
その他情報共有システム関連 その他情報共有システム関連 その他情報共有システム関連
働き方改革にコミュニケーションの改善は不可欠だ。現在の有力手段は「ユニファイドコミュニケーション」(UC)だが、限界も顕在化し始めた。求められる新たな手段とは。 IPベースのインカムシステムで、スムーズな情報共有を実現するリアルタイムコミュニケーションツール。 根強い「Microsoft Office」の人気、情報共有ツールのクラウド活用は進むのか

「その他情報共有システム関連」関連の特集


 手帳というと皆さん、紙の手帳を使われている方も多いのでは?使い慣れた紙の手帳も確かに良いのですが、…



着実に企業に浸透するブログやSNS、Wikiといった「Web2.0的」な技術やツール。今回はそれらが…



マネージャーは、あらゆる場面で仕事の内容について部下に説明する機会がありますが、そのやり方が一方通行…


「その他情報共有システム関連」関連のセミナー

【2/20東京開催】働き方改革 ソリューションセミナー 【日本電気】  

開催日 2月20日(火)   開催地 東京都   参加費 無料

■働き方改革 ソリューションセミナー 〜働き方を変える!ICT活用事例のご紹介〜少子高齢化による労働人口の減少、長時間労働の是正といった社会課題に対し、政府の旗…

【1/26東京開催】総務・人事様向け 働き方改革セミナー 【日本電気】 締切間近 

開催日 1月26日(金)   開催地 東京都   参加費 無料

〜2018年1月26日(金) 東京開催〜NECはこのたび、『総務・人事様向け 働き方改革セミナー〜減らない残業、増えない有給取得への対策をICTでご支援〜』(無…

日立システムズ 総務部門向けITフェア 2018 【日立システムズ】 締切間近 

開催日 1月25日(木)   開催地 東京都   参加費 無料

このたび、日立システムズは、総務部門向けお役立ち製品・ITソリューションをご紹介する展示イベントを開催します。総務部門の方々は、社内のすべての部署と関係を持つ非…

「情報共有システム・コミュニケーションツール」関連 製品レポート一覧

このページの先頭へ

ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「ボイスバンク/ 失った声を音声合成で取り戻す「ボイスバンク」」の記事の続きがお読みいただけます。


Myリストへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


ページ: 1 | 2 | 3


30007811


IT・IT製品TOP > 情報共有システム・コミュニケーションツール > その他情報共有システム関連 > その他情報共有システム関連のIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ