神戸デジタル・ラボ、NICTの言語資源を利用し自社サービスを強化

この記事をtweetする このエントリーをはてなブックマークに追加


神戸デジタル・ラボ、NICTの言語資源を利用し自社サービスを強化


掲載日:2013/06/11


News

 株式会社神戸デジタル・ラボ(KDL)は、独立行政法人情報通信研究機構(NICT)ユニバーサルコミュニケーション研究所 情報分析研究室が、高度言語情報融合フォーラム(ALAGIN)で公開している大規模かつ高品質な言語資源を自社サービスで利用することで、NICTの持つ言語資源の実用化を推進すると発表した。

 NICTユニバーサルコミュニケーション研究所 情報分析研究室は、Webなどに存在する大量のテキストや画像などを深く意味的に分析し、情報の価値ある組み合わせや、価値ある仮説を柔軟な入力を元に提示できる技術を開発している。ALAGINは、人間同士あるいは人間と機械の“言葉の壁”、Web情報に内在する“量や質の壁”を克服する“スーパー・コミュニケーション技術”の研究開発とその利用を促進するため、2011年に設立された産学官連携の組織。

 KDLはALAGIN設立初年度よりフォーラムへ参加している。様々な言語処理を必要とする自社サービスを強化するにあたり、自然言語処理に対応できるデータを必要としていた。しかし、企業単体では質・量ともに優良なデータ取得は限界があり、言語資源の利用を検討していた。今回のALAGINの言語資源の導入によって、自然言語処理に対応できるワードが拡大されるほか、ユーザによる辞書登録の手間を削減できるとしている。

 今後同社では、言語資源のサービス事例としての実用化を推進するため、高度かつ膨大な自然言語処理を自社サービスの機能向上に繋げ、ユーザへ還元していくという。

 同社では、ALAGIN会員向けに公開されている以下3種の言語資源を自社サービスへ導入し、7月の公開を目標に開発を進めていくとしている。

 1つは文脈類似語DBで、100万語の名詞に対して約1億ページのWeb文書上での文脈が類似している名詞を類似度とともに順に最大500個列挙したDB、2つめは日本語パターン言い換えDBで、約170万パターンを収録し、“AがBの原因となる”というような、文内で任意の名詞AとBを結ぶ表現パターンの言い換えDB、3つめは日本語異表記対DBで、約5万ペアを収録しており、日本語の語句のレベルでの編集距離の近い異表記対を集めたDBであるという。



関連キーワード

  ※製品ニュースに関するお問合せ : 企業サイトへ


  ※関連キーワードのリンクは自動で行っているため、適切でない可能性があります。ご了承ください。


図解でわかりやすいIT技術の解説記事2000本
ITセミナー400件、IT製品情報1000件以上!

キーマンズネットは、アイティメディア株式会社が運営する「企業向けIT関連情報サービス」です。会社で導入するIT関連製品の検討・選定にお役立ていただける情報サービスです。情報量・登録料ともに無料です。安心してご利用下さい。

キーマンズネットの新着情報を、お届けします

新着製品レポート

機械学習で高精度な検知&隔離、モスフードサービスの次世代マルウェア対策とは 【日立ソリューションズ】 「働き方改革」と「Web会議」に関するアンケート 【レノボ・ジャパン】 万が一に備える――紛失やのぞき見からPCを守る方法 【レノボ・ジャパン株式会社】 現場の負担なくFAX受注をクラウド化、受注業務を効率化するシステムの効果とは 【エディックワークス】 FAX受注業務の「ここがつらい」 現場の10大課題を解消する方法とは? 【エディックワークス】
アンチウイルス Web会議 フィルタリング FAXサービス FAXサービス
機械学習で高精度な検知&隔離、モスフードサービスの次世代マルウェア対策とは 「ThinkPad X280」が当たる:働き方改革とWeb会議に関するアンケート 万が一に備える――紛失やのぞき見からPCを守る方法 現場の負担なくFAX受注をクラウド化、受注業務を効率化するシステムの効果とは FAX受注業務の「ここがつらい」 現場の10大課題を解消する方法とは?
このページの先頭へ


Myリストへ

この記事をtweetする このエントリーをはてなブックマークに追加


掲載されておりますサービス内容・料金などは掲載日時点のものです。変更となる場合がございますのでご了承下さい。


20047628



このページの先頭へ

キーマンズネットとは

ページトップへ