Programming/Notes

ETL(Extract, Transform, Load)

AubreyJeong 2019. 2. 12. 10:55

https://boxil.jp/mag/a2415/



ETLとは、データウェアハウスを構築するに当たって各基幹系にあたるシステムからデータを抽出し、適切な形式に変換、保存する一連の作業のことを示す。ETLのツールを使用することによりデータの移行にかかるコストや手間を削減することができ、開発において大きな手助けとなる。ETLのツールの出来によってデータウェアハウスの質が決まってくると言っても過言ではない。



ETLとは簡単にいえば、雑種多様な情報(Data source)をDWHにまとめる処理のことです。

*DWH : Data Ware House データがまとめられる倉庫のこと


具体的には、販売管理システム顧客管理システムといった情報システム(Data source)から各種データを取り出し、それらを加工しやすい状態にして「情報の倉庫(DWH)」にまとめて置いておくためのプロセスを指す言葉なのです。


ETLのプロセスを順番に並べると「抽出(Extract)」「変換(Transform)」「書き出し(Load)」となります。これらの頭文字をとって「ETL」と呼ばれています。

ETLというプロセスを経ることによって、本来ならばそれぞれ別個のシステムにバラバラに格納されていた情報が分析・加工しやすい状態になってまとめられます。これによって業務システムが大幅に改善されるようになるというわけです。それではETLのそれぞれの要素についてみてみましょう。


'Programming > Notes' 카테고리의 다른 글

[Azure] Azure function ; Azure 함수란?  (0) 2020.07.06
NuGet package 란?  (0) 2020.07.06
Master Data, Transaction Data  (0) 2019.02.12
개행코드 改行コード  (0) 2019.02.12
유니코드 BOM(Byte Order Mark)  (0) 2019.02.04