Arsitektur dan Sumber Data pada Data Warehouse

Nama                                       :  Ni Luh Putu Giri Gita Saraswati

NIM                                          : 1605551102

Mata Kuliah                          : Data Warehouse

Dosen                                      : I Putu Agus Eka Pratama ST.,MT.

Jurusan/Fakultas/Universitas   : Teknologi Informasi/Teknik/Udayana

    Data Warehouse adalah sekumpulan data yang memiliki enam buah sifat atau karakteristik berupa berorientasi objek (subject oriented), terintegrasi (integrated), berorientasi kepada proses (process oriented), time variant, dapat diakses dengan mudah, dan bersifat Non volatile (W. H. Inmon). Data Warehouse juga dapat dikatakan sebagai sebuah sistem untuk mengumpulkan data transaksional dari berbagai sumber data, yang mengutamakan dua hal yakni: Query dan analisa data (Ralph Kimball). Berdasarkan kedua definisi diatas dapat ditarik sebuah kesimpulan bahwa data warehouse adalah kumpulan sejumlah data dari berbagai sumber data yang digudangkan (disalin atau ditransfer) dari data- data transaksional, yang menganut konsep OLTP (On Line Transactional Processing) dan kemudian akan dianalisis menggunakan OLAP (On Line Analytical Processing) memanfaatkan query pada database serta proses analisa dan didukung oleh enam karakteristik yang dimilikinya yakni, berorientasi objek (subject oriented), terintegrasi (integrated), berorientasi kepada proses (process oriented), time variant, dapat diakses dengan mudah, dan bersifat Non volatile.

    Database biasa dan  Data Warehouse merupakan media penyimpanan data yang berbeda. Setiap data yang di-entry (pengeditan atau pembaharuan) pada table dalam database biasa akan menumpuk. Jadi database biasa tidak memiliki historis data. Sedangkan pada Data Warehouse, entry data (pengeditan/perubahan) ke n, akan disimpan sebagai entry ke n+1 dengan disertai catatan waktu, proses, dan subjeknya. Jadi admin bisa mengetahui historis data. Untuk memudahkan pemahaman pengembang dalam menerapkan sistem Data warehouse, pemeliharaan sistem, serta kemudahan dalam memahami dan menggunakan sistem maka diperlukan adanya arsitekture Data warehouse. Menurut Oracle, terdapat tiga jenis arsitektur pada Data Warehouse, yakni:

  1. Basic Architecture

   Basic Architecture merupakan bentuk arsitektur paling sederhana pada Data Warehouse. Dalam arsitektur ini pengguna dapat mengaksses data secara langsung dimana data yang didapatkan berasal dari berbgai sumber data yang terkumpul menjadi satu. Arsitektur ini memiliki tiga bagian utama, yakni:

  • Data Source

     Sumber data yang dimaksudkan dapat berupa database, aplikasi (software), repository, dan flat  file. Sumber- sumber data ini kemudian disimpan pada Summary Data pada Data Warehouse.

  • Warehouse

     Warehouse bertidak sebagai gudang penyimpanan data. Warehouse memuat Metadata, Summary Data, dan Raw Data. Summary data memegang peranan paling penting jika dibandingkan dengan metadata dan Raw Data. Hal ini karena Summary Data berisi data yang belum dikomputasi dan masih utuh.

  • User

     User merupakan pengguna dari Data Warehouse. Berdasarkan kegiatan yang dilakukan, user pada Data Warehouse terdiri atas tiga kelompok, yakni Analysis (menganalisis dan memanfaatkan data dengan menggunakan konsep OLAP), Mining (menggali data untuk memperoleh knowledge dalam bentuk informasi), dan Reporting (melaporkan hasil data secara digital hasil analisa dan mining baik dalam bentuk data maupun informasi).

    Untuk lebih jelas dapat dilihat pada gambar dibawah sebagai pengilustrasian mengenai Basic Architecture

tugas2_1

  1. Staging Area Architecture

     Konsep dasar pada Staging Area Architecture adalah adanya penambahan Staging Area yang berfungsi sebagai tempat penampungan sementara untuk data- data transaksional sebelum diteruskan ke warehouse. Data transaksional yang berasal dari Data Source akan dirapikan, dibersihkan, dan diproses terlebih dahulu di dalam Staging Area agar data yang masuk kedalam Warehouse adalah data yang benar- benar diperlukan dalam proses analisis.

tugas2_2

 

   Dalam penerapannya, Staging Area diwujudkan secara programmatically (pemrograman) maupun dengan penambahan modul pada sistem Data Warehouse. Namun Staging Area juga dapat disediakan langsung dalam Warehouse, guna terbentuknya Summary Data dan manajemen Warehouse yang baik.

  1. Staging Area and Data Mart Architecture

    Konsep dasar pada Staging Area dan Data Mart Architecture adalah adanya penambahan Data Mart yang dikombinasikan dengan Staging Area. Data Mart merupakan sebuah data warehouse berskala kecil yang ditujukan untuk organisasi bisnis dengan kebutuhan khusus seperti keperluan menganalisis data marketing, penjualan, distribusi, dan lain- lain. Arsitekktur jenis ini sangat cocok digunakan pada organisasi yang terdiri dari sejumlah unit kerja yang memiliki kebutuhan masing-masing. Arsitektur memiliki kemampuan untuk melakukan pemilahan data dan kostumisasi sesuai dengan kebutuhan pengguna.

tugas2_3

     Dapat dilihat pada gambar bahwa Data Mart diletakan diantara bagian Warehouse dan User dan terdiri dari beberapa sub bagian, sub- sub bagian ini menyatakan bahwa data- data pada Data Warehouse telah dikelompokan secara spesifik dalam bentuk Data Mart yang sesuai dengan kebutuhan pengguna.

     Sebuah Data Warehouse dikatakan berfungsi apabila tersimpan data- data yang telah dikumpulkan didalamnya. Data tersebut berasal dari berbagai sumber data. Jika dilihat dari sumber- sumber data, maka dapat dikelompokan menjadi dua yakni sumber data internal dan eksternal.

tugas2_4

 

  • Sumber Data Internal

Sumber data ini berasal dari data – data sistem transaksional bagian internal orgnisasi yang menerapkan Data Warehouse. Sumber data dapat berupa file scan, dokumen office, file teks, flat file, dan lain- lain.

  • Sumber Data Ekternal

Sumber data ini berasal dari komputer/server yang terhubung melalui jaringan publik (internet) untuk kemudian digudangkan ke dalam sistem Data Warehouse di jaringan lokal (intranet) perusahaan. .Pada beberapa kasus, dikombinasikan dengan Cloud.

 

Referensi:

I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017).

Tinggalkan komentar