神戸デジタル・ラボ、NICTの言語資源を利用し自社サービスを強化

この記事をtweetする このエントリーをはてなブックマークに追加


神戸デジタル・ラボ、NICTの言語資源を利用し自社サービスを強化


掲載日:2013/06/11


News

 株式会社神戸デジタル・ラボ(KDL)は、独立行政法人情報通信研究機構(NICT)ユニバーサルコミュニケーション研究所 情報分析研究室が、高度言語情報融合フォーラム(ALAGIN)で公開している大規模かつ高品質な言語資源を自社サービスで利用することで、NICTの持つ言語資源の実用化を推進すると発表した。

 NICTユニバーサルコミュニケーション研究所 情報分析研究室は、Webなどに存在する大量のテキストや画像などを深く意味的に分析し、情報の価値ある組み合わせや、価値ある仮説を柔軟な入力を元に提示できる技術を開発している。ALAGINは、人間同士あるいは人間と機械の“言葉の壁”、Web情報に内在する“量や質の壁”を克服する“スーパー・コミュニケーション技術”の研究開発とその利用を促進するため、2011年に設立された産学官連携の組織。

 KDLはALAGIN設立初年度よりフォーラムへ参加している。様々な言語処理を必要とする自社サービスを強化するにあたり、自然言語処理に対応できるデータを必要としていた。しかし、企業単体では質・量ともに優良なデータ取得は限界があり、言語資源の利用を検討していた。今回のALAGINの言語資源の導入によって、自然言語処理に対応できるワードが拡大されるほか、ユーザによる辞書登録の手間を削減できるとしている。

 今後同社では、言語資源のサービス事例としての実用化を推進するため、高度かつ膨大な自然言語処理を自社サービスの機能向上に繋げ、ユーザへ還元していくという。

 同社では、ALAGIN会員向けに公開されている以下3種の言語資源を自社サービスへ導入し、7月の公開を目標に開発を進めていくとしている。

 1つは文脈類似語DBで、100万語の名詞に対して約1億ページのWeb文書上での文脈が類似している名詞を類似度とともに順に最大500個列挙したDB、2つめは日本語パターン言い換えDBで、約170万パターンを収録し、“AがBの原因となる”というような、文内で任意の名詞AとBを結ぶ表現パターンの言い換えDB、3つめは日本語異表記対DBで、約5万ペアを収録しており、日本語の語句のレベルでの編集距離の近い異表記対を集めたDBであるという。



関連キーワード

  ※製品ニュースに関するお問合せ : 企業サイトへ


  ※関連キーワードのリンクは自動で行っているため、適切でない可能性があります。ご了承ください。


図解でわかりやすいIT技術の解説記事2000本
ITセミナー400件、IT製品情報1000件以上!

キーマンズネットは、アイティメディア株式会社が運営する「企業向けIT関連情報サービス」です。会社で導入するIT関連製品の検討・選定にお役立ていただける情報サービスです。情報量・登録料ともに無料です。安心してご利用下さい。

キーマンズネットの新着情報を、お届けします

新着製品レポート

“緩やかなネットワーク分離”をかなえる「ISFW」とは 【ネットワールド】 高度なマルウェア対策「データ無害化」「マルチスキャン」とは 【ラネクシー】 文書管理システム DocuMaker Office 【ファインデックス】 ハンディ端末とスマートフォンを1台に統合した倉庫管理システム 【パナソニック株式会社】 複数のデバイスやアプリを使った働き方に最適な環境や管理とは? 【ヴイエムウェア株式会社】
ファイアウォール アンチウイルス 文書管理 SCM VDI
利便性を犠牲にしない“緩やかなネットワーク分離”をかなえる「ISFW」とは? 自治体並みのマルウェア対策を実現する「データ無害化」「マルチスキャン」とは 紙で運用している文書やシステムで記載している文書、Word・Excelで作成している文書などの作成、活用、保存を一元的に統合管理できる文書管理システム。 現場と経営陣の距離を縮める「SAP ERP+スマートフォン」の倉庫管理術 成果の出る職場は「どのデバイスからでも、すべてのアプリが使える」、どう実現
このページの先頭へ


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


掲載されておりますサービス内容・料金などは掲載日時点のものです。変更となる場合がございますのでご了承下さい。


20047628



このページの先頭へ

キーマンズネットとは

ページトップへ