ビッグデータ活用はデータの見極めから

この記事をtweetする このエントリーをはてなブックマークに追加

掲載日 2012/08/08

ザ・キーマンインタビュー 

テラデータは、データウェアハウス(DWH)を事業の中心に据える企業として、中核であるRDBMS製品に取り組みつつ、以前から大規模データを高速に扱える超並列処理システムやデータ分析ツールなども手がけてきた。そして、顧客の中には数年前からペタバイトクラスのDHWを構築していた企業もいるという。同社では現在のいわゆる「ビッグデータ」を取り巻く動きをどう見ているのか。マーケティング統括部の中村博氏に伺った。

日本テラデータ株式会社 企業サイトへ

中村 博 氏


マーケティング統括部
統括部長 中村 博 氏

ペタバイトクラスを現実のビジネスで活用するTeradataユーザは数年前から存在

Question

データウェアハウス(DWH)を事業の中心に据えつつ、古くから超並列処理システム、データ分析ツールなども手がけてきた立場から見て、現在のいわゆる「ビッグデータ」を取り巻く動きに対しては、どのような印象をお持ちでしょうか?

Answer

日本テラデータ株式会社:中村 博 氏

ビッグデータに取り組もうという流れ自体は、非常にいいことだと思います。企業システムなどで発生する、過去を意味するトランザクションデータだけではなく、分析の対象をより大きく多様なデータ、例えばインタラクションデータへと拡大して、事前の将来予測や、ビジネス動向の把握に役立てようというのは非常に意味があることであり、実際のビジネスでも有効なことだと思います。

 農業のしかたが変わるとか、医療分野や環境保全に有効、あるいは、何か買い物のスタイルが変わるといったかたちで、一般のテレビの報道・情報系番組などでも取り上げられていますが、一方ではプライバシーが侵害されるといった見地で伝えられる場合もあるなど、その活用方法を巡っては多種多様な議論が出てきており、それゆえに、一般企業の方々からは「実際に自社ではどう活用すればいいか、よく分からない」という声を聞くのも事実です。「クラウド」と同じく、「ビッグデータ」はアンブレラタームで、様々な要素を包含していることもたしかなので、混乱が深まらないようにすべきですね。

Question

貴社の顧客には、比較的早い時期から大規模なデータを扱ってきた企業も多いのではないでしょうか?

Answer

テラデータにはワールドワイドで展開するユーザ会「Teradata User Group」が存在し、世界的な規模のDWHカンファレンスとして「PARTNERS」というイベントを毎年開催しています(今年10月にも「2012 Teradata PARTNERS User Group Conference & Expo」として開催される)。少し古い話で恐縮ですが、2008年に開催されたPARTNERSにおいて、ペタバイトを超える大規模DHWを構築していた企業が、“ペタバイトクラブ”の初代メンバーとして表彰されました。弊社の企業名は“テラデータ”ですが、お客様は4年以上前から“ペタバイト”の世界に突入していたわけです。

 当時、最も大きな物理容量を持っていたのがeBayで、既に5ペタバイトに達していましたが、現在では更にその10倍程度まで拡大しているのではないでしょうか。eBayはご存じのとおり、ネット通販/オークションのマーケットプレースを運営している企業で、商取引の規模が大きいため、発生するトランザクションデータも非常に大きいというわけです。更に、それに加えてユーザの購買行動や嗜好などの分析も行っていますが、その際、同社では特に構造化データと非構造化データを別物として扱うのではなく、非構造化データやそれに近いデータも、変換することで“構造化”にできますので、ほとんどすべての情報を構造化データのほうへ持ってくる。そうしたかたちで、大規模なデータのかたまりを活用して、日常のビジネスを回すということに、古くからずっと取り組まれています。日本の場合は数百テラバイトあると大規模の部類になりますが、海外では既に数十ペタバイトが現実の世界になっており、これほどのデータ量ですらも、いわゆる構造化データであれば、既に本番環境でシングルインスタンスとして現実に動いているというわけです。


このページの先頭へ

“非構造化データ”に含まれる“構造化データ”をしっかり見極めるべき

Question

実際にビッグデータを活用するためには、単に大規模なデータを扱うということ以外にも、どういう意識が必要だと言えるでしょうか?

Answer

日本テラデータ株式会社:中村 博 氏

やはり漠然とビッグデータというものを検討するだけでは意味がなく、発生してくるデータをどのように活用するのかを意識し、目的を持ってデータを見にいく、探しにいくということが重要だと感じます。弊社は金融、流通、製造、通信といった業種を主な対象としてビジネスを展開していますが、そうした分野のお客様は「売り上げを伸ばす、利益を上げる」「コストを下げる」「サプライチェーンを最適化する」といったことを目的に置いてデータを活用し、それによって成長していくことを考えられています。

 例えば、流通業で「売り上げを伸ばす」とはどういうことかと考えると、「消費者のサポートをする」というとらえ方もあります。売り上げというものは、企業が消費者のサポートをきちんとできている証であり、企業がお客様から支持されている証だというわけです。では、そのためにデータというものをどのように使えばいいか、どう分析すべきか。そうした切り口で考えていくことで、地に足の着いた、実情に沿ったアイデアが沸いてくると言えるでしょう。

Question

データの活用という部分では、具体的にどう取り組んでいけばよいのでしょうか?

Answer

基本的にはまず既存のトランザクションデータを十分に管理し、きちんと使いこなす。つまり、まず、データを統合して企業として情報を見えるようにした上で、必要であれば、それに付随するものとして、ビッグデータへの取り組みを始めていくというかたちであれば、非常に意味のある活用が行えると思います。ただ、実際には手段が目的になりがちな傾向も強く、本来は方法論であるはずの、例えばHadoopがいいとか悪いとかという議論が先行してしまい、結局それで何がやりたいのかという部分がないまま、表面にさらっと触れるだけで、本質に迫れないまま終わってしまうことを懸念しています。

 目的が見えていれば、そこから様々な方法論を検討していけるのですが、まず方法論が目的と化してしまっては余計に混乱してしまうのも無理はないでしょう。Hadoopも実際のところ、いい部分も悪い部分もあるわけで、皆さんお分かりのとおり、要は使い方次第です。欧米などでは以前からデータをきちんと活用して、分析への取り組みも着々と行ってきました。その中で明確な目的を持ち、本質を押さえた上で、「限られた人だけで使うのでもかまわないが、なるべく安価なテクノロジーで大規模なデータを扱えるテクノロジーとは?」ということを議論した結果、出てきたのがHadoopですから。

Question

ビッグデータという概念においては、非構造化データの扱いが重要になるということがよく言われますが、その点についてはどのようにとらえていますか?

Answer

基本的には構造化データと非構造化データに分けるのが、最もシンプルな考え方だとは思います。ただ、非構造化と一般的に言われますが、テラデータでは、十把一絡げに非構造化データと言われているものの中にも様々なデータの種類が存在し、パターン的には同じ範疇に収まるものもあると考えています。つまり、多構造化と呼ぶべきではないかということですね。

 もちろん、一般的には“非構造化”というとらえ方が主流ですし、ソーシャル系のデータなど、それに属するものは今後更に増えていくこともたしかです。ただ、それらをよく見極めていくことも必要だと感じています。SQLで扱うのは到底難しいとか、構造化するにも量が多すぎてあまり意味をなさないなど、様々なものが混在しているのが事実でしょう。

 弊社としては、構造化してきちんと処理できるのであれば、Teradataデータベースに取り込んで処理すればいいというのが基本的な考え方です。先ほど紹介したように、数十ペタバイトというクラスでも実際に動いているので、扱うデータ量が大規模になろうと何ら問題はないですから。その一方で、SQL以外で処理すべきもの、新しいデータタイプのものもありますから、そこの部分はHadoopに任せてもいいし、弊社でも非構造化/多構造化データ分析に特化したソフトウェア「Teradata Aster」を提供することで対応しています。

図1 ビッグデータ・アーキテクチャを適材適所で活用
図1 ビッグデータ・アーキテクチャを適材適所で活用
出典:日本テラデータ

このページの先頭へ

既存製品でのサポートを強化しつつ、ビッグデータ活用を広める製品も新たに提供

Question

「Teradata Aster」はどのような考えのもとで提供される製品なのでしょうか?

Answer

データ活用技術に長けた人だけではなく、より多くのビジネスパーソンがビッグデータ分析を扱えるよう、MapReduceの導入を簡素化し、多構造化データを容易に表示・検索・理解できるようにするものです。つまり、SQLを利用してMapReduceを生成し、処理するための機能を備えた製品ですね。更に、代表的な分析のパターンが定義づけられた関数をあらかじめ用意しているので、特にプログラミングができなくても、データさえ入れてやれば、分析や視覚化をすぐに行えるようになっています。

Question

貴社のビッグデータに対する戦略の柱となる製品ということでしょうか?

Answer

日本テラデータ株式会社:中村 博 氏

従来からサポートしてきたビッグデータ活用を広める、ビッグデータをブームに終わらせずに実際のビジネスに根付かせるという意味で有効な製品と言えますね。また、弊社のビッグデータに対する取り組みはそれだけではなく、Teradataデータベースに関しても、最新の「Teradata Database 14」では、カラム(列)ベースでの物理データベース設計に対応し、水平的な行と垂直的な列によるハイブリッドなパーティションを実現可能です。アプリケーションに応じて、列指向と行ベースの物理ストレージを組み合わせることが可能なので、I/Oを大幅に削減し、パフォーマンスを向上できるほか、自動圧縮機能も備えていますから、従来にもまして、より大規模なデータを高速に扱えるようになっています。

 そのほかにも、パフォーマンスは必要ないものの大量のデータをできるだけ低コストで蓄積したい、あるいは、SSDをフルに活用して更なる高速化を実現するなど、企業の多様な要求に応じられるように幅広い製品を揃えていますし、自社だけではなく、パートナーとの連携も積極的に図っています。

Question

ある意味では、ビッグデータ活用に関しては様々なベンダが同じようなソリューションや戦略を展開しているようにも見えますが、その中で貴社ならではの強みとなるのは、どのような点なのでしょうか?

Answer

弊社はソフトウェアやハードウェアといった“モノ”も提供しますが、同時に、実際のビジネスに即してどのように構築すべきか、そして、どう活用すればいいのかということも併せて提案したり、関連サービスを提供するという取り組みを過去からずっと続けてきています。それがわれわれの一番の強みだと自負していますし、今後も続けるべき点だと思っています。いくら性能が優れていようとも、いくら速くとも、結局その製品をビジネスに生かせなければ意味がないでしょう。それこそが、弊社がこれまでデータベース/DWH分野でお客様とともに培ってきた財産ですし、ビッグデータであろうとも、そうした考え方や取り組み方は変わりません。


●ありがとうございました。


取材協力

日本テラデータ株式会社 企業サイトへ

ビジネスの意思決定を支援するためのデータ基盤、データウェアハウス(DWH)を提供することに特化したデータウェアハウス専業企業。強力な検索能力やスケーラビリティを実現するリレーショナル・データベース・マネージメント・システム(RDBMS)Teradataデータベースとプラットフォーム群を中核に、DWHを運用するために必要なツールやユーティリティ群、更に各業種に特化したモデル、アプリケーション、各業界に精通したコンサルタントによるコンサルティング・サービスなどを提供している。


このページの先頭へ



◆関連記事を探す

データウェアハウス/ビッグデータ活用はデータの見極めから」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「データウェアハウス」関連情報をランダムに表示しています。

データウェアハウス」関連の製品

ビッグデータ分析プラットフォーム Data Platform for Analytics 【NEC】 Webレポーティングソリューション 「CROWNIX Report & ERS」 【日本エムツーソフト】 ナレッジ共有型BIツール「Data Knowledge」 【クロスユーアイエス】
DWH BI BI
「超高速」「簡単導入」「低コスト」のデータ分析DWHアプライアンス。圧倒的なパフォーマンスを持ちながらもチューニングの手間は最小限。多種多様な分析を瞬時で実行。 業務帳票、管理帳票から半定型分析レポートまでカバーする出力ツール。DB環境は問わず、様々なデータソースと連携できBIツールのような検索・抽出も可能。出力形式も多様。 簡単操作でDBからデータを抽出し、集計・加工・出力処理できる「全社員のデータ活用を実現するため」のBIツール。ナレッジ/情報共有機能など、現場で役立つ機能を搭載。

データウェアハウス」関連の特集


景気回復とともに投資が増え拡大した同市場。特定業務のビジネスアナリティックのための技術力などが評価さ…



本田技研工業では、約10年前から対応カーナビでユーザの走行データを収集しビッグデータ分析を行っている…



SONYにマクニカ、Comcastはもう実践中!異なる環境に保存されたデータが一覧でき、分析が可能に…


データウェアハウス」関連のセミナー

次世代DWH「SAP HANA」がもたらす真の価値とは? 【SAPジャパン/日本ヒューレット・パッカード/インターネットイニシアティブ/インテル】  

開催日 1月19日(木)   開催地 大阪府   参加費 無料

8月〜10月に東京・大阪・名古屋・福岡で開催をし、満席・大好評でありました『SAP HANA 都市伝説』を解明する!!セミナーの追加講演を多くのお客様のご要望に…

「データ分析」関連 製品レポート一覧

このページの先頭へ

Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


30005002


IT・IT製品TOP > ビッグデータ > データ分析 > ビッグデータ > ビッグデータのIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ