Selasa, 08 Oktober 2013

Resume Data Warehouse Pertemuan 5

Dimension Tables

Sebuah tabel dimensi adalah tabel dalam skema bintang dari data warehouse. Sebuah toko tabel dimensi atribut, atau dimensi, yang menggambarkan objek dalam tabel fakta.
Dalam data warehouse, dimensi adalah kumpulan referensi informasi tentang peristiwa terukur. Peristiwa ini dikenal sebagai fakta dan disimpan dalam tabel fakta. Dimensi mengkategorikan dan menggambarkan fakta data warehouse dan tindakan dengan cara yang mendukung jawaban yang berarti untuk pertanyaan bisnis. Mereka membentuk inti dari pemodelan dimensi.


Data Multidimensi

data multidimensi adalah ketika kita dapat melihat sebuah data dari berbagai sudut pandang atau dimensi. Sebagai contoh, penjualan buku dapat dilihat dari segi lokasi Buku, waktu, lokasi penjualan / toko dan sebagainya.

Skema Bintang (Star Schema) 



Dalam data warehouse, data-datanya akan disimpan dalam tabel fakta dan tabel dimensi. Tabel fakta akan menyimpan data-data utama sementara tabel dimensi mendeskripsikan setiap nilai dari suatu dimensi dan dapat direlasikan ke tabel fakta jika diperlukan. Data fakta merupakan data yang terukur besarannya, semisal jumlah siswa, banyaknya rupiah yang diperoleh, rata-rata IPK, dan sejenisnya.  Untuk lebih menjelaskan data fakta, maka kondisi saat data tersebut diukur turut disampaikan. Data kondisi inilah yang dipetakan dalam bentuk data dimensi. Kondisi yang dipetakan dalam dimensi umumnya berupa kondisi waktu, kondisi produk atau item, dan kondisi geografinya. Mendesain struktur star schema, dimulai dengan menentukan data apa yang ingin dilihat oleh pengguna (besarannya) dan bagaimana pengguna melihat  data tersebut (kondisi atau dimensinya).
Tabel dimensi memiliki primary key sederhana yang mengandung hanya satu atau dua kolom saja. Namun, tabel fakta akan memiliki sekumpulan foreign key yang disusun dari primary key komposit dan merupakan gabungan kolom-kolom tabel dimensi yang berelasi.

skema Snowflake (Snowflake Schema)

Struktur basis data ini lebih kompleks dari pada star schema, dengan menormalisasi tabel-tabel dimensi yang berukuran besar dengan satu atau lebih kolom yang memiliki duplikasi data. Tabel dimensi dinormalisasi untuk mengurangi redudansi data (duplikasi), sehingga struktur tabelnya akan lebih ramping. Dengan pengelompokan ini, data akan lebih mudah dibaca dan membantu pengembang aplikasi untuk menata desain antarmuka sistem dan filtering data. Struktur ini akan menghemat kapasitas storage, namun waktu eksekusi data akan lebih lama mengingat jumlah tabel dimensi yang direlasikan lebih banyak dan membutuhkan tambahan relasi foreign key. Kueri yang terbentuk lebih kompleks, yang mengakibatkan kinerja kueri menurun. Pada penerapan yang lebih umum, tabel dimensi tidak diturunkan dengan lebih banyak tabel dimensi lain dan pengaturan UI atau pengelompokan data diatur secara hard-coded di kode program aplikasinya.



Sumber :
- http://searchdatamanagement.techtarget.com/definition/dimension-table
- http://www.gudangmateri.com/2010/04/data-multidimensi.html
- http://nanang.lecture.ub.ac.id/2010/04/17/skema-star-dan-snowflake/

Tidak ada komentar:

Posting Komentar