Selasa, 01 Oktober 2013

Resume Data Warehouse Pertemuan 4

Arsitektur Datawarehouse
Maksudnya adalah bagaimana datawarehouse dibangun, arsitektur tidak ada yang benar dan salah tetapi suatu arsitektur dibangun tergantung situasi dan kondisi. Arsitektur datawarehouse akan berpengaruh pada penggunaan dan pemeliharaan.
Lapisan-lapisan arsitektur datawarehouse :

1.    Operational database layer / Lapisan basis data operasional
a.    Sumber data (source) untuk datawarehouse
b.    Data lengkap, Data hari ke hari
c.    Mempunyai nilai saat ini/ data berarti.
d.    Tingkat kemungkinan data besar.

2.    Data Access Layer/ Lapisan Akses Data
a.    Tools untuk mengekstrak, mengubah dan mengambil(load) data.
b.    Meliputi karakteristik datawarehouse.

3.    Metadata Layer / Lapisan Metadata
a.    File data tersimpan / Direktori
b.    Lebih detil dari direktori data sistem, maksudnya lebih mendalam dari file data yang tersedia sebelumnya.
c.    Ada pentunjuk untuk keseluruhan warehouse dan ada petunjuk data yang dapat diakses report khusus untuk di analisis.

4.    Informational access layer (lapisan akses informasi)
a.    Akses data dan juga tool untuk laporan dan analisis.
b.    Tools Business Intelligence masuk ke tahap ini.


Mari kita bahas sekilas mengenai keempat arsitektur data warehouse di atas:
  1. Enterprise Data Warehouse. Pada arsitektur ini, Data Warehouse merupakan satu-satunya penyimpanan data dari berbagai sumber di suatu organisasi. DWH ini juga yang dijadikan acuan utama dalam melakukan analisis, membuat laporan, dashboard, data mining, dan Business Intelligence. Kelebihan dari pendekatan ini adalah sumber data untuk analisis adalah hanya DWH ini, selain itu, kelebihannya yaitu semua data terintegrasi dengan baik (dengan syarat proses analisis dan perancangan DWH dilakukan dengan matang). Kekurangan pendekatan ini adalah ketika data yang dimiliki sudah sangat banyak, DWH dengan arsitektur Enterprise Data Warehouse bisa mengalami masalah kinerja, apalagi jika ditambah semakin banyaknya pengguna yang menembak DWH ini secara bersama-sama.
  2. Dependent Data Mart. Saya melihat arsitektur ini sebagai kelanjutan dari Enterprise Data Warehouse. Ketika DWH pada EDW sudah dianggap berat, ditambah effort untuk mengupgrade infrastruktur yang kadang tidak ekonomis, maka dibuatlah data mart-data mart di satu atau lebih departemen untuk mengakomodasi kebutuhan laporan di departemen yang bersangkutan . Kelebihan dari arsitektur ini adalah  kinerja DWH menjadi lebih ringan. Jika sebelumnya sehari ada 10,000 hit yang ditujukan ke data warehouse, dengan adanya data mart baru, sebagian porsi hit tersebut akan mengarah ke data mart, misalkan porsi data warehouse tinggal 8,000 hit dan yang 2,000 ditujukan ke data mart. Jika satu data mart masih dianggap kurang, maka bisa dibuat data mart berikutnya untuk departemen lain, misalkan penjualan. Pembuatan data mart baru tersebut mungkin bisa mengurangi hit data warehouse menjadi 6,000. Begitu seterusnya hingga dicapai nilai yang optimal. Disamping manfaat dari sisi kinerja, dependent data mart juga memungkinkan setiap departemen melakukan tuning lebih jauh terhadap struktur tabel dimensional. Tuning  dimaksudkan  untuk meningkatkan kinerja sistem secara keseluruhan dalam mengakomodasi kebutuhan analisis departemen yang mungkin belum diakomodasi oleh data warehouse. Dibandingkan arsitektur dengan data mart yang lainnya, alternatif ini memiliki karakteristik Enterprise Data, yaitu data yang terdapat di DWH dan DM memiliki cakupan validitas di tingkat enterprise/organisasi/perusahaan karena tingkat tersebut sudah didapatkan ketika memasuki DWH.
  3. Independent Data Mart. Meskipun sama-sama memiliki DM seperti pada arsitektur Dependent Data Mart, alternatif  ini tidak memiliki Data Warehouse di dalamnya. Setiap DM harus memiliki strategi integrasi yang tidak terkait. Hal itu dikarenakan nature dari pembangunan DM adalah karena tingginya kebutuhan data untuk analisis pada suatu departemen dan tidak optimal jika harus menunggu dibuatnya DWH di level organisasi/perusahaan.  Karena itulah satu departemen memutuskan membuat DM versi departemen itu. Jika ada departemen lain yang memiliki kebutuhan analisis yang tinggi juga, maka dimungkinkan dorongan untuk membuat DM di departemen tersebut juga tinggi, ditambah adanya contoh departemen lain yang sudah membangun DM versi departemennya. Hal pokok yang biasanya menjadi kekurangan di pendekatan ini adalah data yang dihasilkan cenderung belum menjadi  level enterprise, namun masih di tingkat departemen. Hal tersebut dikarenakan  pembangunan DM mungkin hanya melibatkan departemen pembuat, dengan sedikit sekali-atau tanpa-keterlibatan departemen lain, sehingga aspek integrasi format data dan formula tidak terpenuhi.
  4. Enterprise Data Mart. Ini merupakan alternatif solusi antara Dependent Data Mart dan Independent Data Mart. Adanya staging yang berada di level Enterprise adalah sebagai area integrasi data dari berbagai sistem. Dengan demikian, data lebih dekat ke level enterprise. Namun demikian, kendala integrasi kadang juga menjadi masalah di sini, yaitu jika ketika mengembangkan DM untuk departemen A, departemen-departemen lain yang ada di organisasi tidak banyak dilibatkan, atau bahkan tidak dilibatkan sama sekali.
 Karakterisitik arsitektur data warehouse (Poe) :
1.    Data diambil dari sistem asal (sistem informasi yang ada), database dan file. 
2.    Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya. 
3.    Data warehouse merupakan sebuah database terpisah bersifat hanya dapat dibaca  yang dibuat khusus untuk mendukung pengambilan keputusan
4.    Pemakai mengakses data warehouse melalui aplikasi front end too

Infrastruktur data warehouse adalah software, hardware, pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang dibutuhkan untuk mengimplementasikan data warehouse(Poe).
Salah satu instrumen yang mempengaruhi keberhasilan pengembangan data warehouse adalah pengidentifikasian arsitektur mana yang terbaik dan infrasruktur apa yang dibutuhkan. Arsitektur yang sama, mungkin memerlukan infrastruktur yang berbeda, tergantung pada lingkunan perusahaan ataupun organisasi.
Seperti yang kita lihat sebelumnya pada arsitektur data warehouse, ada beberapa struktur yang spesifik terdapat pada bagian warehouse manager. Bagian tersebut merupakan struktur data warehouse.
Menurut Poe, Vidette, data warehouse memiliki struktur yang spesifik dan  mempunyai perbedaan dalam tingkatan detail data  dan umur data.
Komponen dari struktur data warehouse adalah:
Ø   Current detail data
Current detail data merupakan data detil yang aktif saat ini,mencerminkan keadaan yang sedang berjalan dan merupakan level terendah dalam data warehouse. Didalam area ini warehouse menyimpan seluruh detail data yang terdapat pada skema basis data. Jumlah data sangat besar sehingga memerlukan storage yang besar pula dan dapat diakses secara cepat. Dampak negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal.
Berikut ini beberapa alasan mengapa current detail data menjadi perhatian utama :
1.    Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama
2.    Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan terendah.
3.    Hampir selalu disimpan dalam storage karena cepat di akses  tetapi mahal dan kompleks dalam pengaturannya.
4.    Bisa digunakan dalam membuat rekapitulasi sehingga current detail data  harus akurat.
 
Ø   Older detail data
Data ini merupakan data historis dari current detail data, dapat berupa hasil cadangan atau archive data yang disimpan dalam storage terpisah. Karena bersifat back-up(cadangan), maka biasanya data disimpan dalam storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang rendah. Penyusunan file atau directory dari data ini di susun berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan kembali.
Ø   Lighlty summarized data
Data ini merupakan ringkasan atau rangkuman dari current detail data. Data ini dirangkum berdasar periode atau dimensi lainnya sesuai dengan kebutuhan.
Ringkasan dari current detail data  belum bersifat total summary.Data-data ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse pada tingkat departemen. Tingkatan data ini di sebut juga dengan data mart. Akses terhadap data jenis ini banyak  digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.
Ø   Highly summarized data
Data ini merupakan tingkat lanjutan dari Lightly summarized data, merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan analisis menggunakan data multidimensi.
Ø   Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat jenis data diatas. Menurut Poe, metadata adalah ‘data tentang data’ dan menyediakan informasi tentang struktur data dan hubungan antara struktur data di dalam atau antara storage(tempat penyimpanan data).
Metadata berisikan data yang menyimpan proses perpindahan data meliputi database structure,contents,detail data dan summary data, matrics,versioning, aging criteria,versioning, transformation criteria. Metadata khusus dan memegang peranan yang sangat penting  dalam data warehouse.
Metadata sendiri mengandung :
Ø  Struktur data
Sebuah direktori yang membantu user untuk melakukan analisis Decission Support System dalam pencarian letak/lokasi dalam data warehouse.
Ø  Algoritma
Algoritma digunakan untuk summary data. Metadata sendiri merupakan panduan untuk algoritma dalam melakukan pemrosesan summary data antara current detail data dengan lightly summarized data dan antara lightly summarized data dengan hightly summaried data.
Ø  Mapping 
Sebagai panduan pemetaan(mapping) data pada saat data di transform/diubah dari lingkup operasional menjadi lingkup data warehouse.


sumber : 
- http://netindonesia.net/blogs/muhammadsubhan/archive/2009/11/07/arsitektur-datawarehouse.aspx
- http://noverino.wordpress.com/2011/03/18/4-alternatif-arsitektur-data-warehouse/
- http://calvingulo.blogspot.com/2012/10/arsitektur-dan-infrastruktur-data.html

Tidak ada komentar:

Posting Komentar