Maksudnya adalah bagaimana datawarehouse dibangun, arsitektur tidak ada yang benar dan salah tetapi suatu arsitektur dibangun tergantung situasi dan kondisi. Arsitektur datawarehouse akan berpengaruh pada penggunaan dan pemeliharaan.
Lapisan-lapisan arsitektur datawarehouse :
1. Operational database layer / Lapisan basis data operasional
a. Sumber data (source) untuk datawarehouse
b. Data lengkap, Data hari ke hari
c. Mempunyai nilai saat ini/ data berarti.
d. Tingkat kemungkinan data besar.
2. Data Access Layer/ Lapisan Akses Data
a. Tools untuk mengekstrak, mengubah dan mengambil(load) data.
b. Meliputi karakteristik datawarehouse.
3. Metadata Layer / Lapisan Metadata
a. File data tersimpan / Direktori
b. Lebih detil dari direktori data sistem, maksudnya lebih mendalam dari file data yang tersedia sebelumnya.
c. Ada pentunjuk untuk keseluruhan warehouse dan ada petunjuk data yang dapat diakses report khusus untuk di analisis.
4. Informational access layer (lapisan akses informasi)
a. Akses data dan juga tool untuk laporan dan analisis.
b. Tools Business Intelligence masuk ke tahap ini.
Mari kita bahas sekilas mengenai keempat arsitektur data warehouse di atas:
- Enterprise Data Warehouse. Pada arsitektur ini, Data Warehouse merupakan satu-satunya penyimpanan data dari berbagai sumber di suatu organisasi. DWH ini juga yang dijadikan acuan utama dalam melakukan analisis, membuat laporan, dashboard, data mining, dan Business Intelligence. Kelebihan dari pendekatan ini adalah sumber data untuk analisis adalah hanya DWH ini, selain itu, kelebihannya yaitu semua data terintegrasi dengan baik (dengan syarat proses analisis dan perancangan DWH dilakukan dengan matang). Kekurangan pendekatan ini adalah ketika data yang dimiliki sudah sangat banyak, DWH dengan arsitektur Enterprise Data Warehouse bisa mengalami masalah kinerja, apalagi jika ditambah semakin banyaknya pengguna yang menembak DWH ini secara bersama-sama.
- Dependent Data Mart. Saya melihat arsitektur ini sebagai kelanjutan dari Enterprise Data Warehouse. Ketika DWH pada EDW sudah dianggap berat, ditambah effort untuk mengupgrade infrastruktur yang kadang tidak ekonomis, maka dibuatlah data mart-data mart di satu atau lebih departemen untuk mengakomodasi kebutuhan laporan di departemen yang bersangkutan . Kelebihan dari arsitektur ini adalah kinerja DWH menjadi lebih ringan. Jika sebelumnya sehari ada 10,000 hit yang ditujukan ke data warehouse, dengan adanya data mart baru, sebagian porsi hit tersebut akan mengarah ke data mart, misalkan porsi data warehouse tinggal 8,000 hit dan yang 2,000 ditujukan ke data mart. Jika satu data mart masih dianggap kurang, maka bisa dibuat data mart berikutnya untuk departemen lain, misalkan penjualan. Pembuatan data mart baru tersebut mungkin bisa mengurangi hit data warehouse menjadi 6,000. Begitu seterusnya hingga dicapai nilai yang optimal. Disamping manfaat dari sisi kinerja, dependent data mart juga memungkinkan setiap departemen melakukan tuning lebih jauh terhadap struktur tabel dimensional. Tuning dimaksudkan untuk meningkatkan kinerja sistem secara keseluruhan dalam mengakomodasi kebutuhan analisis departemen yang mungkin belum diakomodasi oleh data warehouse. Dibandingkan arsitektur dengan data mart yang lainnya, alternatif ini memiliki karakteristik Enterprise Data, yaitu data yang terdapat di DWH dan DM memiliki cakupan validitas di tingkat enterprise/organisasi/perusahaan karena tingkat tersebut sudah didapatkan ketika memasuki DWH.
- Independent Data Mart. Meskipun sama-sama memiliki DM seperti pada arsitektur Dependent Data Mart, alternatif ini tidak memiliki Data Warehouse di dalamnya. Setiap DM harus memiliki strategi integrasi yang tidak terkait. Hal itu dikarenakan nature dari pembangunan DM adalah karena tingginya kebutuhan data untuk analisis pada suatu departemen dan tidak optimal jika harus menunggu dibuatnya DWH di level organisasi/perusahaan. Karena itulah satu departemen memutuskan membuat DM versi departemen itu. Jika ada departemen lain yang memiliki kebutuhan analisis yang tinggi juga, maka dimungkinkan dorongan untuk membuat DM di departemen tersebut juga tinggi, ditambah adanya contoh departemen lain yang sudah membangun DM versi departemennya. Hal pokok yang biasanya menjadi kekurangan di pendekatan ini adalah data yang dihasilkan cenderung belum menjadi level enterprise, namun masih di tingkat departemen. Hal tersebut dikarenakan pembangunan DM mungkin hanya melibatkan departemen pembuat, dengan sedikit sekali-atau tanpa-keterlibatan departemen lain, sehingga aspek integrasi format data dan formula tidak terpenuhi.
- Enterprise Data Mart. Ini merupakan alternatif solusi antara Dependent Data Mart dan Independent Data Mart. Adanya staging yang berada di level Enterprise adalah sebagai area integrasi data dari berbagai sistem. Dengan demikian, data lebih dekat ke level enterprise. Namun demikian, kendala integrasi kadang juga menjadi masalah di sini, yaitu jika ketika mengembangkan DM untuk departemen A, departemen-departemen lain yang ada di organisasi tidak banyak dilibatkan, atau bahkan tidak dilibatkan sama sekali.
1. Data diambil dari sistem asal (sistem informasi yang ada), database dan file.
2. Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya.
3. Data warehouse merupakan sebuah database terpisah bersifat hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan
4. Pemakai mengakses data warehouse melalui aplikasi front end too
Infrastruktur data warehouse adalah software,
hardware, pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang
dibutuhkan untuk mengimplementasikan data warehouse(Poe).
Salah satu instrumen yang mempengaruhi keberhasilan
pengembangan data warehouse adalah pengidentifikasian arsitektur mana
yang terbaik dan infrasruktur apa yang dibutuhkan. Arsitektur yang sama,
mungkin memerlukan infrastruktur yang berbeda, tergantung pada lingkunan
perusahaan ataupun organisasi.
Seperti yang kita lihat sebelumnya pada arsitektur data
warehouse, ada beberapa struktur yang spesifik terdapat pada bagian warehouse
manager. Bagian tersebut merupakan struktur data warehouse.
Menurut Poe, Vidette, data warehouse memiliki struktur
yang spesifik dan mempunyai perbedaan
dalam tingkatan detail data dan
umur data.
Komponen dari struktur data warehouse adalah:
Ø Current detail
data
Current detail data merupakan data detil
yang aktif saat ini,mencerminkan keadaan yang sedang berjalan dan merupakan
level terendah dalam data warehouse. Didalam area ini warehouse
menyimpan seluruh detail data yang terdapat pada skema basis data. Jumlah data
sangat besar sehingga memerlukan storage yang besar pula dan dapat
diakses secara cepat. Dampak negatif yang ditimbulkan adalah kerumitan untuk
mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal.
Berikut ini beberapa alasan mengapa current detail
data menjadi perhatian utama :
1.
Menggambarkan kejadian yang baru terjadi dan selalu
menjadi perhatian utama
2.
Sangat banyak jumlahnya dan disimpan pada tingkat
penyimpanan terendah.
3.
Hampir selalu disimpan dalam storage karena cepat
di akses tetapi mahal dan kompleks dalam
pengaturannya.
4.
Bisa digunakan dalam membuat rekapitulasi sehingga current
detail data harus akurat.
Ø Older detail
data
Data ini merupakan data historis dari current detail
data, dapat berupa hasil cadangan atau archive data yang disimpan dalam storage
terpisah. Karena bersifat back-up(cadangan), maka biasanya data
disimpan dalam storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang
rendah. Penyusunan file atau directory dari data ini di susun
berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau
pengaksesan kembali.
Ø Lighlty
summarized data
Data ini merupakan ringkasan atau rangkuman dari current
detail data. Data ini dirangkum berdasar periode atau dimensi lainnya
sesuai dengan kebutuhan.
Ringkasan dari current detail data belum bersifat total summary.Data-data
ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse
pada tingkat departemen. Tingkatan data ini di sebut juga dengan data
mart. Akses terhadap data jenis ini banyak
digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.
Ø Highly
summarized data
Data ini merupakan tingkat lanjutan dari Lightly
summarized data, merupakan hasil ringkasan yang bersifat totalitas, dapat
di akses misal untuk melakukan analisis perbandingan data berdasarkan urutan
waktu tertentu dan analisis menggunakan data multidimensi.
Ø Metadata
Metadata bukan merupakan data hasil kegiatan
seperti keempat jenis data diatas. Menurut Poe, metadata adalah ‘data tentang
data’ dan menyediakan informasi tentang struktur data dan hubungan antara
struktur data di dalam atau antara storage(tempat penyimpanan data).
Metadata berisikan data yang menyimpan proses
perpindahan data meliputi database structure,contents,detail data dan summary
data, matrics,versioning, aging criteria,versioning, transformation criteria.
Metadata khusus dan memegang peranan yang sangat penting dalam data warehouse.
Metadata sendiri mengandung :
Ø Struktur data
Sebuah
direktori yang membantu user untuk melakukan analisis Decission Support
System dalam pencarian letak/lokasi dalam data warehouse.
Ø Algoritma
Algoritma
digunakan untuk summary data. Metadata sendiri merupakan panduan untuk
algoritma dalam melakukan pemrosesan summary data antara current
detail data dengan lightly summarized data dan antara lightly
summarized data dengan hightly summaried data.
Ø Mapping
Sebagai
panduan pemetaan(mapping) data pada saat data di transform/diubah dari
lingkup operasional menjadi lingkup data warehouse.
sumber :
- http://netindonesia.net/blogs/muhammadsubhan/archive/2009/11/07/arsitektur-datawarehouse.aspx
- http://noverino.wordpress.com/2011/03/18/4-alternatif-arsitektur-data-warehouse/
- http://calvingulo.blogspot.com/2012/10/arsitektur-dan-infrastruktur-data.html
Tidak ada komentar:
Posting Komentar