ビッグデータ時代に考える!DWH構築の秘訣

この記事をtweetする このエントリーをはてなブックマークに追加

製品の基礎から選び方までをサポート! IT導入完全ガイド

ビッグデータ時代に考える!DWH構築の秘訣

2013/04/01


 急速に変化する消費者の嗜好や市場動向をより正確に把握するために、最近ではWebログやソーシャルメディア、センサなどから得られる膨大な非構造化データを収集、分析して企業活動に役立てようという動きが出てきている。こうしたビッグデータ活用は主に経営企画やマーケティングなどの現場部門が中心となるものの、未整理データの収集やDB化など企業データの整合性を取りながら、データ活用のための環境を整備すること自体は、情報システム部門の役割となるケースが多い。大容量データを効果的に格納してストレスのないデータ処理速度をいかに確保するか、情報システム部門の管理下にあり、そのデータ蓄積先でもある「データウェアハウス(DWH)」の選定や運用方法にもビッグデータ活用を見据えた要件が必要だと思われる。
 そこで今回の特集では、データウェアハウスの概要をおさらいし、ビッグデータの活用を視野に入れた構築のポイントとIT部門の果たすべき役割、最新動向について紹介する。

データウェアハウス

※「データウェアハウス/ビッグデータ時代に考える!DWH構築の秘訣」の記事を一部ご紹介します。会員登録を行い、 ログインすると、「データウェアハウス/ビッグデータ時代に考える!DWH構築の秘訣」の記事全文がお読みいただけます。

会員登録はこちら(無料)



1
1-1

「データウェアハウス」とは

 データウェアハウスとは、時系列に沿って随時更新されていく基幹系システムのデータベースとは異なり、一定の期間ごとに切り出したデータを正規化して、上書きすることなく蓄積していくためのデータベースだ。データは追加されるのみで、更新や削除は行われない。こうして蓄積された過去から現在に至るまでのデータを対象に分析を行うことで、企業活動の可視化や事業の将来予測といった収益向上のための施策に結び付けていくことができる。データの蓄積期間は3〜5年、あるいは目的に応じて7年といった長期にわたる場合もある。
 データウェアハウスの活用にあたっては、ETL(Extract/Transform/Load:抽出/変換/ロード)ツールを使って企業内の各種システムからデータを抽出し、データウェアハウスに蓄積、BI(ビジネスインテリジェンス)ツールを使って分析作業を進めていくことになる。
 また実装にあたっては、通常汎用サーバにデータウェアハウス用データベースを組み合わせて実現するが、最近では各ベンダからデータウェアハウスを搭載した専用マシン(=データウェアハウスアプライアンス)も提供され始めている。

■データウェアハウスを構築/活用する際の4つのアーキテクチャ

 データウェアハウスの構築/活用に当たっては、様々な実現方法がある。
 一番オーソドックスな方法が、データ分析の目的別にデータマートを構築し、部門単位などで活用するものだ。データ収集の範囲が限定されるので構築もし易いが、社内に100種類以上ものデータマートが乱立し、メンテナンスに手が回らないといった企業もあるようだ。また1つひとつのデータマートに保守コストが発生し、それだけで年間数億円規模になる例もあるという。新しいニーズが発生した場合には、また新たなデータマートを構築する必要がある。現在のユーザ企業では、このデータマート中心型が一番多いとのことだ。
 2つ目が、ETLの処理をソフトウェアを使って実現する仮想/分散型で、データウェアハウスという容れ物自体を作らないやり方だ。データウェアハウスを構築しないので、コストをある程度抑えられる反面、ユーザが増えるにともなってパフォーマンスはどんどん落ちていくなどの問題点がある。
 3つ目がハブアンドスポーク型で、構築するデータウェアハウスは蓄積主体のもので、ここからデータマート中心型と同じく、目的別のデータマートを切り出す方法だ。データウェアハウスへのアクセスは原則としてパワーユーザに限定し、一般ユーザにはデータマートにアクセスさせる。柔軟なカスタマイズが可能だが、やはり管理対象は増え続け、運用コストは高止まりすることになる。
 そして4つ目がエンタープライズ統合型で、全社共通の統合データウェアハウスを1つ構築し、全てのユーザからのアクセスを許容するものだ。いわばデータマート中心型の対極に位置する方法で、実際に“もうこれ以上、データマートは増やせない”という企業が検討に乗り出すという。データの一貫性を担保でき、運用コストも抑えられるといったメリットがあるが、その構築に際しては全社視点からの組織横断的な取り組みが求められることになる。

図1 データウェアハウス構築時のアーキテクチャの比較
図1 データウェアハウス構築時のアーキテクチャの比較
資料提供:日本テラデータ

 究極的にはエンタープライズ型が目指すべき姿だと言えるかもしれないが、しかし全ての企業が一足飛びにここまで辿り着くことは難しいだろう。これからデータウェアハウスを構築しようと考えているユーザ企業なら、まずはデータマート中心型で小さく始めて、自社の活用状況を見ながらエンタープライズ統合型への道筋を付けていく、という進め方が現実的ではないだろうか。

図2 全社共通の統合データウェアハウス構築への実現ステップ
図2 全社共通の統合データウェアハウス構築への実現ステップ
資料提供:日本テラデータ

…この記事の続きは、会員限定です。  会員登録はこちら(無料)

続きを読むには…
会員登録いただくと自動的にこの記事に戻り、続きが読めます。

会員登録(無料)・ログイン

このページの先頭へ

データウェアハウス/ビッグデータ時代に考える!DWH構築の秘訣」関連の情報を、チョイスしてお届けします

※キーマンズネット内の「データウェアハウス」関連情報をランダムに表示しています。

データウェアハウス」関連の製品

SQL Server+フラッシュストレージはどこまで「買い」か 【日本ヒューレット・パッカード+他】 Webレポーティングソリューション 「CROWNIX Report & ERS」 【日本エムツーソフト】 クラウドBIダッシュボード MotionBoard Cloud 【ウイングアーク1st】
NAS BI BI
中堅・中小企業のIT予算でも、フラッシュストレージを使った業務アプリのDB高速化が現実的に。大手SI企業が「これならば」と納得して推薦する製品は他と何が違うか。 業務帳票、管理帳票から半定型分析レポートまでカバーする出力ツール。DB環境は問わず、様々なデータソースと連携できBIツールのような検索・抽出も可能。出力形式も多様。 様々なデータソースからの情報を一元的に可視化するクラウド型BIツール。リアルタイムで自動集計されるデータを分かりやく可視化し、経営や現場の意思決定に活用できる。

データウェアハウス」関連の特集


BI導入の“失敗例”でよく聞くのが「活用されていない」という声。そんな声に対応し、現在のBIツールは…



IT担当者564人を対象に「BIツールの導入状況」を調査。満足度や重視ポイント、導入時の課題などから…



莫大なコストをかけて導入しても、結局使われなくなった「BIツール」…。珍しい話ではありません!Exc…


データウェアハウス」関連のセミナー

大規模データ・インテグレーション事例とETLツール比較 【主催:KSKアナリティクス 協力:オープンソース活用研究所】  

開催日 9月8日(金)   開催地 東京都   参加費 無料

【「当社も自社データをさらに活用するべきだ」で最初につまづく課題】近年、ビジネスのデジタル化が急速に進む中、「当社も自社データをさらに活用するべきだ」といったよ…

半日で体感!アシストが誇るデータ連携基盤製品のすべて 【アシスト】 締切間近 

開催日 8月22日(火)   開催地 大阪府   参加費 無料

ExcelとマスタDB、クラウド環境とオンプレミス環境、オープン環境とレガシー環境のデータ連携や、基幹システムからDWH・データレイクへの大量データ連携など、昨…

dashDBがDb2 Warehouse on Cloudに進化 【日本アイ・ビー・エム】 締切間近 

開催日 8月23日(水)   開催地 オンラインセミナー   参加費 無料

IBMはデータベース・ファミリーの名称を、DB2からDb2へと変更しました。今回のリブランディングは単なる名称変更ではありません。従来のDB2はデータベース製品…

「データ分析」関連 製品レポート一覧

このページの先頭へ

データウェアハウス/ ビッグデータ時代に考える!DWH構築の秘訣」の記事を一部ご紹介しました。
会員登録を行い、ログインすると、「データウェアハウス/ ビッグデータ時代に考える!DWH構築の秘訣」の記事の続きがお読みいただけます。


Myリストへ

この記事をtweetする このエントリーをはてなブックマークに追加


この記事に掲載している情報は、掲載日時点のものです。変更となる場合がございますのでご了承下さい。


ページ: 1 | 2 | 3


30005831


IT・IT製品TOP > データ分析 > DWH > DWHのIT特集 > 特集詳細

このページの先頭へ

キーマンズネットとは

ページトップへ