音声インデクシング技術●音の検索が可能に!

この記事をtweetする このエントリーをはてなブックマークに追加


5分でわかる最新キーワード解説
今週のキーワードはこれだ! 掲載日:2004/05/26
音声インデクシング技術ってなんだ

 日々進歩するIT技術は、ともすると取り残されてしまいそうな勢いで進化の速度を高めています。そこでキーマンズネット編集部がお届けするのが「5分でわかる最新キーワード解説」。このコーナーを読めば、最新IT事情がスラスラ読み解けるようになることうけあい。忙しいアナタもサラっと読めてタメになる、そんなコーナーを目指します。
 今回のテーマは「音声インデクシング技術」。音声認識、自然言語処理技術を使い、音声や動画を含む映像コンテンツの内容を示す「メタデータ」を高精度に付与する技術です。今後ますますニーズが高まる、ネットワーク上での映像コンテンツの流通のキーとなる技術として期待されています。

5分でわかるイメージ図
音声インデクシング技術とは?
 映像に含まれている音声データから、話されている内容をテキスト化すると同時に、XMLによるメタデータ化を全自動で行なうことで、映像コンテンツの一覧性や検索性を高める技術のこと。メタデータとは、「コンテンツに関するデータ」であり、コンテンツに対してさまざまな観点から情報が付与される。メディアのタイプ、データサイズ、最終更新日などの形式的な情報から、本質的なコンテンツの意味内容に関する情報はもちろんのこと、著作権や利用条件などにかかわる付帯情報なども含まれる。こうしたメタデータを適切にコンテンツに付与する作業は、これまで人手に頼るところが多く、それを効率化する技術が求められてきた。高度なコンピュータ処理を駆使した音声インデクシング技術により、音声や画像といった「ディジタル信号」から、メタデータという「内容を記述したデータ」を自動的に作成することが可能になるのだ。
 コンテンツのメタデータの自動生成を、テレビニュース映像を例に説明する。ニュース映像のコンテンツを再生(読み込み)させると、リアルタイムで話されている言葉が次々とテキストとなって画面に現れる。一通り映像の読み込みが終わると、ニュース映像がストーリー(ニュース項目)ごとに一覧表示される。表示内容は、ストーリーの要約、ジャンル分類、ストーリーに含まれるキーワードリンク、それに代表的な映像場面をクリップしたサムネイル画像だ。ユーザーは表示されたサムネイル画像やキーワードリンクをクリックすることにより、目的のニュースストーリーを指定して再生することができるのだ。
 インターネットの普及によりネットワーク経由で映像コンテンツを閲覧することが容易になっている現在、無限に近い広がりを見せるインターネット中のいったいどこに有用な映像コンテンツがあるのかを見つけ出すためのキーとなるのが映像情報のメタデータ化だ。この処理が自動化されることで、より幅広い映像コンテンツの活用が可能となる。


各画面をクリックすると拡大画面がご覧頂けます。
システム画像1   システム画像2   システム画像3  

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

キーマンズポイントで今応募できるプレゼントはこちら!(2017/3/31まで)

ITキャパチャージに解答いただくとポイントがたまります。
たまったポイント数に応じて、以下、A〜E賞の各賞品に応募することができます。

●B賞:抽選で1名様
 Lenovo 2 in 1タブレット「YOGA BOOK with Windows」 
●A賞:抽選で1名様
 ZEROTECH 小型セルフィードローン「Dobby Deluxe D100B-H」 
●C賞:抽選で1名様
 harman/kardon ワイヤレスホームスピーカーシステム「AURA PLUS」 
●D賞:抽選で1名様
 THANKO iPhoneケース型「モバイルDLPプロジェクター」 
●E賞:抽選で2名様
 キングジム コンパクトにたためるパソコン「PORTABOOK XMC10」 

このページの先頭へ

キーマンズネットの新着情報を、お届けします

新着製品レポート

単なるセキュリティ監視ではない MSSを選ぶための10のポイント 【SecureWorks Japan】 良い人材を採るチャンスを増やす、求人管理システムで採用を強化 【Donuts】 勤怠・シフトを一元管理、多機能ツールでコストを一気に削減 【Donuts】
セキュリティ診断 人事管理システム 勤怠管理システム
単なるセキュリティ監視ではない――「MSS」を選ぶための10のポイント 「良い人材を採る」チャンスを増やす、求人管理システムで採用活動を強化 勤怠・シフトを一元管理、多機能ツールでコストの無駄を一気に削減

新着特集


社内SNSは単に従業員同士の情報共有を効率的に行うツールではありません。他のツールと連携することで、…



2016年度の市場規模は85億2000万円と見込まれるワークフロー。パッケージを主体とする市場で、2…



ログイン画面や機密性の高い情報を入力させる場合に必須のSSLサーバ証明書。だが、Webサイトの全てを…


新着セミナー

Linux基礎講座 【エパノ プログラミングスクール/運営:オフィス24】 締切間近 

開催日 1月31日(火)〜2月1日(水)   開催地 東京都   参加費 有料 5万8968円(税込)

Linuxの基本操作からネットワーク管理までを2日間でマスター。Linuxの基本操作やサーバ構築に必須の知識を習得します。前半はLinuxでのファイル操作(検索…

Linuxサーバ構築マスター講座 【エパノ プログラミングスクール/運営:オフィス24】  

開催日 2月23日(木)〜2月24日(金)   開催地 東京都   参加費 有料 5万8968円(税込)

Linuxを用いた各種サーバの構築を2日間でマスター。イントラネットやインターネットで使用される各種のサーバを独力で構築できる知識を習得します。前半はLinux…

専門店企業様向けセミナー 【富士通】  

開催日 2月8日(水)   開催地 東京都   参加費 無料

本セミナーでは第1部 13:30〜14:20米国シリコンバレーにも拠点をおくニフティより、シリコンバレーで起きている流通業のビジネスモデルの変化や、IoTを活用…

このページの先頭へ

音声インデクシング技術/音声インデクシング技術●音の検索が可能に!」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「音声インデクシング技術/音声インデクシング技術●音の検索が可能に!」の記事の続きがお読みいただけます。


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


30000709



このページの先頭へ

キーマンズネットとは

ページトップへ