蘇れデータ!ETL基礎入門
ETLを理解してもらうために、まずデータウエアハウスの話から始めよう。データウエアハウスとはデータが沢山詰まった巨大倉庫のこと(もちろんコンピュータ上での話)で、1990年にビル・インモン氏により提唱され、国内では1996年に第1回のデータウエアハウスEXPOが開催されたころから認知され始めた。データをいろいろな角度から分析して経営に役立てようとするOLAPやデータマイングにとって、データウエアハウスは極めて重要な基盤になっている(OLAPは一定の仮説をもとにデータを分析すること、データマイニングは仮説を立てることなく膨大なデータから自動的に未知の法則を見つけ出すこと)。
そして、データウエアハウスを構築するには、基幹系システムなどからデータを集める作業が必要になるが、この作業のことをETLと呼ぶようになった。ETLのEはExtract(抽出)、TはTransform(変換)、LはLoading(格納)のことで、データウエアハウスが必要とするデータを、いろいろなデータソースから抽出し、適切な形式に変換し、必要に応じて参照整合性(参照される側と参照する側のテーブルの同期が取れていること)をチェックして、データ品質を保証してから格納するという役割を持つ。
さらに詳しい続きを読むには↓をクリック
蘇れデータ!ETL基礎入門
|