Mata kuliah : Data Warehouse
Dosen : I Putu Agus Eka Pratama, S.T., M.T.
Mahasiswa : I Putu Bayu Wira Brata — 1708561018
Program Studi : Informatika, Fakultas MIPA, Universitas Udayana
Konsep dasar Data Warehouse adalah untuk memfasilitasi satu versi kebenaran bagi perusahaan untuk pengambilan keputusan dan peramalan. Data warehouse adalah sistem informasi yang berisi data historis dan komutatif dari satu atau beberapa sumber. Konsep Data Warehouse, menyederhanakan proses pelaporan dan analisis organisasi.
Definisi
Arsitektur adalah sekumpulan atau struktur yang memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk.
Arsitektur Data adalah menyediakan kerangka dengan mengidentifikasi dan memahami bagaimana data akan pindah melalui sistem dan digunakan dalam perusahaan.
Karakteristik
- Data diambil dari source system, database, dan file
- Data dari source system diintegrasikan dan ditransformasikan sebelum disimpan ke dalam Database Management System (DBMS) seperti : Oracle, SQL Server, Sy Base
- DWH adalah database read only yang terpisah yang dibuat khusus untuk pengambilan keputusan
- User mengakses DWH melalui tool front end atau aplikasi
Arsitektur Data Warehouse
merupakan sistem informasi yang berisi data historis dan komutatif dari berbagai sumber. Ada 3 pendekatan untuk membangun gudang data: Tingkat Tunggal, Dua Tingkat dan Tiga Tingkat
Arsitektur satu tingkat
Tujuan dari satu lapisan adalah untuk meminimalkan jumlah data yang disimpan. Tujuan ini untuk menghapus redundansi data. Arsitektur ini jarang digunakan dalam praktiknya.
Arsitektur dua tingkat
Arsitektur dua lapis memisahkan sumber yang tersedia secara fisik dan gudang data. Arsitektur ini tidak dapat diperluas dan juga tidak mendukung banyak pengguna akhir. Ini juga memiliki masalah konektivitas karena keterbatasan jaringan.
Arsitektur tiga tingkat
Ini adalah arsitektur yang paling banyak digunakan.
Terdiri dari Tingkat Atas, Tengah dan Bawah.
- Tingkat Bawah: Database server Datawarehouse sebagai tingkat bawah. Ini biasanya merupakan sistem database relasional. Data dibersihkan, diubah, dan dimuat ke lapisan ini menggunakan alat back-end.
- Tingkat Tengah: Tingkat menengah di Data warehouse adalah server OLAP yang diimplementasikan menggunakan model ROLAP atau MOLAP. Untuk pengguna, tingkat aplikasi ini menyajikan tampilan database yang diabstraksikan. Lapisan ini juga bertindak sebagai mediator antara pengguna akhir dan database.
- Tingkat Atas: Tingkat atas adalah lapisan klien front-end. Tingkat atas adalah alat dan API yang Anda sambungkan dan dapatkan data dari gudang data. Ini bisa berupa alat Kueri, alat pelaporan, alat kueri terkelola, alat Analisis, dan alat Penambangan data.
Komponen Data Warehouse Menurut Connoly And Begg
Arsitektur data warehouse terdiri dari struktur dan komponen yang saling berhubungan satu sama lain dalam membangun data warehouse.
Menurut Connoly dan Begg (2010:1204), arsitektur data warehouse dapat dijelaskan pada gambar berikut ini :
1. Operasional Data
- Berfokus pada fungsi-fungsi transaksional
- Merupakan bagian dari infrastruktur perusahaan
- Detail, tidak ada redudansi, dapat diupdate
- Merefleksikan nilai sekarang
2. Operasional Data Store
- Tempat penyimpanan sementara dari data operasional saat ini
- Menyuplai data yang sudah diekstrak dari sistem sumber dan dibersihkan
- Menyederhanakan proses integrasi dan restrukturisasi data di data warehouse
3. Load Manager
- Menampilkan semua operasi yang terkait dengan ekstrak dan load data ke dalam data warehouse
- Data bisa diekstrak langsung dari sumber data atau ODS
4. Warehouse Manager
Menampikan semua operasi yang terkait dengan manajemen data dari data warehouse:
- Analisis data untuk menjamin konsistensi
- Transformasi dan penggabungan sumber data dari ODS ke table data warehouse
- Pembuatan indeks dan view pada table base
- Membuat Denormalisasi dan Agregasi, jika diperlukan
- Backing up dan Archiving Data
5. Query Manager
- Menampilkan semua operasi yang terkait dengan manajemen query pengguna
- Mengarahkan query pada table yang cocok
- Menjadwalkan pelaksanaan query
6. Detailed Data
- Current Detail Data adalah Langsung dari operasional database dan mengacu pada data perusahaan sekarang
contoh : profil pelanggan, data aktivitas pelanggan, data sales, data demografis - Komponen yang menyimpan detail data dalam skema database
- Old Detail Data à Current Detail Data yang berumur atau histori dari subyek area
7. Lightly dan Highly Summarized Data
- Menyimpan semua data Lightly dan Highly Summarized yang sudah terdefinisi sebelumnya yang dibuat oleh Warehouse Manager
- Tujuan : meningkatkan performance query
8. Back Up Data/Archive Data
- Menyimpan Detailed Data dan Summarized Data dengan tujuan mengarsip dan melakukan backup
9. Metadata
- Digunakan untuk membangun, memelihara, mengatur, dan menggunakan data warehouse
- Mengandung lokasi dan deskripsi :
- Komponen data warehouse (nama, definisi, struktur, dan isi dari data warehouse dan end user view)
- Identifikasi dari pembuat sumber data (record system)
- Aturan-aturan integrasi dan transformasi yang digunakan untuk mempopulasikan data warehouse
- Histori dari update dan refresh data warehouse
- Pola-pola matriks yang digunakan untk performa menganalisa data warehouse
10. End User Access Tools
- Komponen yang menyediakan informasi dari data warehouse yang ada bagi user dalam membantu mengambil keputusan
- Tools mencakup :
- Reporting dan Query Tool
Reporting : Menghasilkan laporan operasional yang teratur
Query : Relasi data warehouse untuk dapat menerima SQL atau untuk menghasilkan pernyataan SQL agar dapat melakukan query pada data yang disimpan dalam data warehouse - Application Development Tools
Dirancang untuk kebutuhan Client Server - Executive Information System (EIS) Tool
Mendukung pengambilan tingkat tinggi - OLAP Tool
Konsep multidimensi
Mengizinkan pengguna untuk menganalisis data menggunakan view yang kompleks - Data Mining Tool
Proses menemukan korelasi, pola, dan gaya baru yang bermanfaat dengan ‘menggali’ data dalam jumlah yang banyak dengan menggunakan teknik statistika dan matematika
Referensi
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017
Connolly, T. M., and Carolyn Begg. “Database Systems: A Practical Approach to Design, Implementation.” And Management. Boston: Pearson Education (2010).
Devlin, Barry, and Lynne Doran Cote. Data warehouse: from architecture to implementation. Addison-Wesley Longman Publishing Co., Inc., 1996.