NTTレゾナント、日本語ビッグデータの解析を支援するAPIを公開

この記事をtweetする このエントリーをはてなブックマークに追加


NTTレゾナント、日本語ビッグデータの解析を支援するAPIを公開


掲載日:2014/12/04


News

 NTTレゾナント株式会社は、Web検索「goo」の技術やノウハウを順次公開する。第1弾として、ビッグデータ解析などの要素技術である日本語解析技術に関するAPI「語句類似度算出」「ひらがな化」「固有表現抽出」「形態素解析」の4種を公開した。

 「語句類似度算出」は、2つの語句(キーワード)に対して、構成単語や音素の情報を踏まえて、その類似度合いを算出できる。例えば、トーキョー/東京や、phablet/ファブレットといった似通った発音を持つ違う表記の語句を、類似度合いにより同じ語句と見なせる。目視や辞書を使って行なっていたデータの統合作業を自動化でき、データ分析の精度と生産性の向上を図れる。

 「固有表現抽出」は、トレンドや評判の解析に求められる、人名や地名、組織名などを抽出できる。例えば、『鈴木さんがきょうの9時30分に横浜に行きます。』という文字列から、人名“鈴木”、地名“横浜”、日付表現“きょう”、時刻表現“9時30分”がそれぞれ抽出され、分類/集計することでSNS上の投稿の中で最近話題になっているスポットを発見するといった分析を容易に行なえる。

 「ひらがな化」は、漢字混じりで書かれた文字列を“ひらがな”または“カタカナ”に変換できる。例えば、『漢字が混ざっている文章』を『かんじが まざっている ぶんしょう』と変換できる。読みやすいように文中の適切な位置に半角スペースが挿入されるため、子供向けコンテンツの作成などに利用できる。

 「形態素解析」は、日本語の文字列を、“形態素”単位に分割できる。例えば『この商品が大好きです』という文字列を、この/商品/が/大好き/です、というように分割できる。この解析結果を集計することで、自社製品のレビュー記事からどのような表現でよく評価されているかといった分析を容易に行なえる。

 今回公開されるAPIを活用することで、分析対象となるビックデータが日本語で書かれた文章の場合、単なる文字列の集計だけではなく、内容に基づいて分析できる。


出荷日・発売日 −−−
価格 −−−

関連キーワード

  ※製品ニュースに関するお問合せ : 企業サイトへ


  ※関連キーワードのリンクは自動で行っているため、適切でない可能性があります。ご了承ください。


図解でわかりやすいIT技術の解説記事2000本
ITセミナー400件、IT製品情報1000件以上!

キーマンズネットは、アイティメディア株式会社が運営する「企業向けIT関連情報サービス」です。会社で導入するIT関連製品の検討・選定にお役立ていただける情報サービスです。情報量・登録料ともに無料です。安心してご利用下さい。

◆関連記事を探す

「ビッグデータ」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「ビッグデータ」関連情報をランダムに表示しています。

「ビッグデータ」関連の製品

SAS Event Stream Processing 【SAS Institute Japan】 SAS Event Stream Processing 【SAS Institute Japan】 インメモリー・データ・プラットフォーム 【インテル】 SAS Visual Analytics 【SAS Institute Japan】 インテルITセンター 【インテル】
ビッグデータ ビッグデータ ビッグデータ ビッグデータ ビッグデータ
ビッグデータを基に瞬時に意思決定――リアルタイム分析に必要な機能とは IoTの次なる活用法――データストリームのリアルタイム分析とは? リアルタイム分析で意思決定を加速、インテルが目指したサプライチェーン最適化 データ視覚化の基礎知識――チャート作成からビッグデータ処理まで 「ビッグデータ分析」実践ガイド:導入と活用を成功させるプランニング

「データ分析」関連 製品レポート一覧

このページの先頭へ


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


掲載されておりますサービス内容・料金などは掲載日時点のものです。変更となる場合がございますのでご了承下さい。


20059198


IT・IT製品TOP > データ分析 > ビッグデータ > ビッグデータのITニュース > ニュース詳細

このページの先頭へ

キーマンズネットとは

ページトップへ