ビッグデータ時代に考える!DWH構築の秘訣

この記事をtweetする このエントリーをはてなブックマークに追加

製品の基礎から選び方までをサポート! IT導入完全ガイド

ビッグデータ時代に考える!DWH構築の秘訣

2013/04/01


 急速に変化する消費者の嗜好や市場動向をより正確に把握するために、最近ではWebログやソーシャルメディア、センサなどから得られる膨大な非構造化データを収集、分析して企業活動に役立てようという動きが出てきている。こうしたビッグデータ活用は主に経営企画やマーケティングなどの現場部門が中心となるものの、未整理データの収集やDB化など企業データの整合性を取りながら、データ活用のための環境を整備すること自体は、情報システム部門の役割となるケースが多い。大容量データを効果的に格納してストレスのないデータ処理速度をいかに確保するか、情報システム部門の管理下にあり、そのデータ蓄積先でもある「データウェアハウス(DWH)」の選定や運用方法にもビッグデータ活用を見据えた要件が必要だと思われる。
 そこで今回の特集では、データウェアハウスの概要をおさらいし、ビッグデータの活用を視野に入れた構築のポイントとIT部門の果たすべき役割、最新動向について紹介する。

データウェアハウス

※「データウェアハウス/ビッグデータ時代に考える!DWH構築の秘訣」の記事を一部ご紹介します。会員登録を行い、 ログインすると、「データウェアハウス/ビッグデータ時代に考える!DWH構築の秘訣」の記事全文がお読みいただけます。

会員登録はこちら(無料)



1
1-1

「データウェアハウス」とは

 データウェアハウスとは、時系列に沿って随時更新されていく基幹系システムのデータベースとは異なり、一定の期間ごとに切り出したデータを正規化して、上書きすることなく蓄積していくためのデータベースだ。データは追加されるのみで、更新や削除は行われない。こうして蓄積された過去から現在に至るまでのデータを対象に分析を行うことで、企業活動の可視化や事業の将来予測といった収益向上のための施策に結び付けていくことができる。データの蓄積期間は3〜5年、あるいは目的に応じて7年といった長期にわたる場合もある。
 データウェアハウスの活用にあたっては、ETL(Extract/Transform/Load:抽出/変換/ロード)ツールを使って企業内の各種システムからデータを抽出し、データウェアハウスに蓄積、BI(ビジネスインテリジェンス)ツールを使って分析作業を進めていくことになる。
 また実装にあたっては、通常汎用サーバにデータウェアハウス用データベースを組み合わせて実現するが、最近では各ベンダからデータウェアハウスを搭載した専用マシン(=データウェアハウスアプライアンス)も提供され始めている。

■データウェアハウスを構築/活用する際の4つのアーキテクチャ

 データウェアハウスの構築/活用に当たっては、様々な実現方法がある。
 一番オーソドックスな方法が、データ分析の目的別にデータマートを構築し、部門単位などで活用するものだ。データ収集の範囲が限定されるので構築もし易いが、社内に100種類以上ものデータマートが乱立し、メンテナンスに手が回らないといった企業もあるようだ。また1つひとつのデータマートに保守コストが発生し、それだけで年間数億円規模になる例もあるという。新しいニーズが発生した場合には、また新たなデータマートを構築する必要がある。現在のユーザ企業では、このデータマート中心型が一番多いとのことだ。
 2つ目が、ETLの処理をソフトウェアを使って実現する仮想/分散型で、データウェアハウスという容れ物自体を作らないやり方だ。データウェアハウスを構築しないので、コストをある程度抑えられる反面、ユーザが増えるにともなってパフォーマンスはどんどん落ちていくなどの問題点がある。
 3つ目がハブアンドスポーク型で、構築するデータウェアハウスは蓄積主体のもので、ここからデータマート中心型と同じく、目的別のデータマートを切り出す方法だ。データウェアハウスへのアクセスは原則としてパワーユーザに限定し、一般ユーザにはデータマートにアクセスさせる。柔軟なカスタマイズが可能だが、やはり管理対象は増え続け、運用コストは高止まりすることになる。
 そして4つ目がエンタープライズ統合型で、全社共通の統合データウェアハウスを1つ構築し、全てのユーザからのアクセスを許容するものだ。いわばデータマート中心型の対極に位置する方法で、実際に“もうこれ以上、データマートは増やせない”という企業が検討に乗り出すという。データの一貫性を担保でき、運用コストも抑えられるといったメリットがあるが、その構築に際しては全社視点からの組織横断的な取り組みが求められることになる。

図1 データウェアハウス構築時のアーキテクチャの比較
図1 データウェアハウス構築時のアーキテクチャの比較
資料提供:日本テラデータ

 究極的にはエンタープライズ型が目指すべき姿だと言えるかもしれないが、しかし全ての企業が一足飛びにここまで辿り着くことは難しいだろう。これからデータウェアハウスを構築しようと考えているユーザ企業なら、まずはデータマート中心型で小さく始めて、自社の活用状況を見ながらエンタープライズ統合型への道筋を付けていく、という進め方が現実的ではないだろうか。

図2 全社共通の統合データウェアハウス構築への実現ステップ
図2 全社共通の統合データウェアハウス構築への実現ステップ
資料提供:日本テラデータ

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

このページの先頭へ

データウェアハウス/ビッグデータ時代に考える!DWH構築の秘訣」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「データウェアハウス」関連情報をランダムに表示しています。

データウェアハウス」関連の製品

新発想のデータ活用「データレイク」を支えるストレージ条件とは 【日本アイ・ビー・エム】 Webレポーティングソリューション 「CROWNIX Report & ERS」 【日本エムツーソフト】 ナレッジ共有型BIツール「Data Knowledge」 【クロスユーアイエス】
NAS BI BI
IoT、ビッグデータ……次世代デジタルデータ分析に必要なストレージ条件とは 業務帳票、管理帳票から半定型分析レポートまでカバーする出力ツール。DB環境は問わず、様々なデータソースと連携できBIツールのような検索・抽出も可能。出力形式も多様。 簡単操作でDBからデータを抽出し、集計・加工・出力処理できる「全社員のデータ活用を実現するため」のBIツール。ナレッジ/情報共有機能など、現場で役立つ機能を搭載。

データウェアハウス」関連の特集


既にクラウド上で大規模データ高速分析基盤を提供済みのIIJが、スタートアップの支援を目的とした「II…



導入の失敗事例が少なくないBIツール…。失敗に陥らないためのソリューションやアドバイスを紹介します。



 今回は増収に繋がる「ITの活用」や「IT投資」がどうすれば実現できるのか、私が相談を受けてきた体験…


データウェアハウス」関連のセミナー

次世代DWH「SAP HANA」がもたらす真の価値とは? 【SAPジャパン/日本ヒューレット・パッカード/インターネットイニシアティブ/インテル】  

開催日 1月19日(木)   開催地 大阪府   参加費 無料

8月〜10月に東京・大阪・名古屋・福岡で開催をし、満席・大好評でありました『SAP HANA 都市伝説』を解明する!!セミナーの追加講演を多くのお客様のご要望に…

次世代DWH「SAP HANA」がもたらす真の価値とは? 【SAPジャパン/日本ヒューレット・パッカード/インターネットイニシアティブ/インテル】 締切間近 

開催日 12月8日(木)   開催地 東京都   参加費 無料

8月〜10月に東京・大阪・名古屋・福岡で開催をし、満席・大好評でありました『SAP HANA 都市伝説』を解明する!!セミナーの追加講演を多くのお客様のご要望に…

「データ分析」関連 製品レポート一覧

このページの先頭へ

データウェアハウス/ ビッグデータ時代に考える!DWH構築の秘訣」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「データウェアハウス/ ビッグデータ時代に考える!DWH構築の秘訣」の記事の続きがお読みいただけます。


Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


ページ: 1 | 2 | 3


30005831


IT・IT製品TOP > データ分析 > DWH > DWHのIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ