datawarehouse-101117181535-phpapp01

105
 DATA WAREHOUSE Presented by : Helmy Faisal M Adam Mukharil B Adib Toriq

Transcript of datawarehouse-101117181535-phpapp01

Page 1: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 1/105

 

DATA WAREHOUSEPresented by :

Helmy Faisal M

Adam Mukharil B

Adib Toriq

Page 2: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 2/105

 

1. Why we need data warehouse?

2. Konsep data warehouse.

3. Data Transformation.

4. Perancangan data warehouse.

5. Query Language dan OLAP.

Page 3: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 3/105

 

Why we need Data

Warehouse

Page 4: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 4/105

 

Fenomena Di Dunia Nyata

Page 5: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 5/105

 

Fenomena Di Dunia Nyata

Customer mana

yang memilikitingkat margin

yang paling

tinggi?

Siapa saja yang

menjadicustomer dari

perusahaan

saya?Barang apa saja

yang banyak

dibeli oleh

customer saya

tahun ini?

Cara distribusi

seperti apa yang

cocok untuk

menaikkan

keuntungan?

Produk baru apa

yang memberikan

pengaruh

terhadap

perusahaan

Saya butuh data

untuk

mengetahui ..

Page 6: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 6/105

 

Fenomena Di Dunia Nyata

Saya butuh data yang konsisten untuk

mengambil keputusan strategi bisnis

perusahaan di masa yang akan datang !!

Page 7: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 7/105

Fenomena Di Dunia Nyata (cont’d) 

 

Page 8: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 8/105

Fenomena Di Dunia Nyata (cont’d) 

 

Page 9: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 9/105

Gimana caranya saya bisa dapatdata yang saya butuhkan ??

Fenomena Di Dunia Nyata (cont’d) 

 

Page 10: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 10/105

Fenomena Di Dunia Nyata (cont’d) 

• GoT Corp.

• Cabang: bandung, jakarta, palembang, dan

papua.• Manager butuh laporan penjualan berkala.

• Setiap cabang memiliki sistem operasional

terpisah.

 

Page 11: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 11/105

Fenomena Di Dunia Nyata (cont’d) 

Jakarta

Bandung

Palembang

Penjulan per item per

cabang untuk kurun waktu

pertama

Manajer

Penjualan

Papua

 

Page 12: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 12/105

GoT Corp butuh solusi !!

  

Page 13: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 13/105

Solusi Permasalahan 1

Jakarta

Bandung

Papua

Palembang

Data

Warehouse

Manajer

Penjualan

Query &

Analisis tools

Laporan

 

Page 14: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 14/105

Solusi Permasalahan 2

Database

Operasional

Cabang ...

Data

Warehouse

Extract

data

Operator

Data Entry

Operator

Data Entry

Manajer

Penjualan

Laporan

Transaksi

 

Page 15: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 15/105

Kesimpulan

GoT Corp butuh data

warehouse

 

Page 16: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 16/105

Konsep Data

Warehouse

 

Page 17: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 17/105

Pengertian Data Warehouse

Sebuah tempat penyimpanan data yang lengkap dan konsisten yang

berasal dari sumber-sumber yang berbeda dibuat untuk

penggunanya agar mereka dapat mengerti dan menggunakannya

dalam konteks bisnis.

[Barry Davlin]

 

Page 18: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 18/105

Pengertian Data Warehouse

(cont’d) 

Sebuah proses transformasi data ke dalam sebuah informasi dan

membuat informasi ini dapat diakses oleh penggunanya tepat

waktu untuk membuat perubahan-perubahan (strategi bisnis).

[Forrester Research, 1996]

 

Page 19: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 19/105

Pengertian Data Warehouse

(cont’d) 

1. Berorientasi subjek,

2. Diintegrasikan,

3. Time-variant,

4. Nonvolatile,

Koleksi data untuk medukung proses pembuatan manajemen

pengambilan keputusan.

[Bill Inmon]

 

Page 20: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 20/105

Subject Oriented

1. Data warehouse diorganisasikan dalam lingkup subjek, sebagai

contoh: Penjualan, Produk, dan Pelanggan.

2. Berfokus ke dalam pemodelan dan analisis data untuk pihak-

pihak pembuat keputusan.

3. Memisahkan data yang tidak berguna di dalam proses

pendukung keputusan.

 

Page 21: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 21/105

Subject Oriented (cont’d) 

 

Page 22: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 22/105

Integrated

1. Data warehouse dikonstruksikan dengan cara mengintegrasikan

sejumlah sumber data yang berbeda.

2. Data preprocessing diaplikasikan untuk meyakinkan

kekonsistensian data.

 

Page 23: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 23/105

Integrated (cont’d) 

Trust Credit cardSavings Loans

Same datadifferent name

Different dataSame name

Data found herenowhere else

Different keyssame data

 

Page 24: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 24/105

Integrated (cont’d) 

Encoding

Structures

Measurement

of attributes

MultipleSources

Data Type

Formats

 

Page 25: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 25/105

Integrated (cont’d) 

appl A - balanceappl B - balappl C - currbalappl D - balcurr

appl A - pipeline - cmappl B - pipeline - inappl C - pipeline - feet

appl D - pipeline - yds

appl A - m,f appl B - 1,0

appl C - x,yappl D - male, female

Data Warehouse

 

Page 26: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 26/105

Time-Variant

1. Menghasilkan informasi dari sudut pandang historical (misal:

5-10 tahun yang lalu).

2. Setiap struktur kunci mengandung elemen waktu.

 

Page 27: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 27/105

Time-Variant (cont’d) 

 

Page 28: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 28/105

Time-Variant (cont’d) 

 

Page 29: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 29/105

Nonvolatile

1. Sekali data direkam maka data tidak bisa diupdate.

2. Data warehouse membutuhkan dua operasi pengaksesan data,

yaitu:

a. Initial loading of data

b. Akses data

 

Page 30: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 30/105

Nonvolatile (cont’d) 

 

Page 31: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 31/105

Membentuk Data Warehouse

Data

Source cleaning Transformation

Data

Warehouse

New

Update

 

Page 32: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 32/105

Arsitektur Data Warehouse

1. Data warehouse server

Pada umumnya berbentuk DBMS relasional, jarang berbentuk

file biasa.

2. OLAP Server

Mendukung dan mengoperasikan dalam bentuk struktur multi-

dimensional data.

 

Page 33: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 33/105

Arsitektur Data Warehouse (cont’d) 

3. Clients

a. Tools untuk Query dan Pelaporan

b. Tools untuk menganalisis

c. Tools untuk data mining.

 

Page 34: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 34/105

Arsitektur Data Warehouse (cont’d) 

4. Metadata Repository

Tempat menyimpan informasi tentang data yang ada di

datawarehouse.

  

Page 35: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 35/105

Arsitektur Data Warehouse (cont’d) 

Data WarehouseEngine

Optimized Loader 

ExtractionCleansing

Metadata Repository 

RelationalDatabases

LegacyData

PurchasedData

ERPSystems

AnalyzeQuery

 

Page 36: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 36/105

Data Transformation

 

Page 37: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 37/105

Data Transformation

Fase yang terjadi ketika mengintegrasikan data ke dalam data

warehouse.

 

Page 38: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 38/105

Aturan-Aturan Data Transformation

1. Extracting

2. Conditioning

3. Scrubbing

4. Merging

5. Householding

6. Enrichment

7. Scoring

8. Loading

9. Validating

10. Delta Updating

 

Page 39: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 39/105

Extracting

1. Mengambil data dari sumber operational dalam “as is” status. 

2. Sumber-sumber data berasal dari mainframes yang hampir

seluruhnya berupa database relasional.

 

Page 40: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 40/105

Conditioning

Perubahan tipe data dari sumber data ke target data (data

warehouse) tetap dalam bentuk database relasional.

 

Page 41: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 41/105

Scrubbing

1. Digunakan untuk “membersihkan”/meningkatkan kualitas data. 

2. Contoh: Adam M.B., Adam MB, Adam Mukharil B. Adalah orang

yang sama.

 

Page 42: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 42/105

Scrubbing (cont’d) 

 

Page 43: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 43/105

Merging

Proses penggabungan data dengan memperhatikan aturan-aturan

dalam mengintegrasikan data.

 

Page 44: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 44/105

Householding

1. Mengidentifikasi semua anggota dari household (berada di

alamat yang sama) untuk mengirimkan report.

2. Menjamin hanya satu jenis dokumen saja yang dikirimkan

kepada setiap household karena mengirimkan multiple report

akan mengakibatkan naiknya “cost” pada data warehouse. 

 

Page 45: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 45/105

Householding (cont’d) 

 

Page 46: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 46/105

Enrichment

Mengambil data dari sumber data eksternal (di luar data source

yang seharusnya) untuk memperkaya data operasional yang sudah

ada.

 

Page 47: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 47/105

Scoring

Komputasi probabilitas tentang sebuah event, sebagai contoh

menghitung kemungkinan pelanggan membeli produk baru.

 

Page 48: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 48/105

Loading

1. Proses menambah atau menyisipkan data baru.

2. Teknik:

a. Menggunakan SQL untuk menambah atau menyisipkan data

baru

b. Menggunakan batch load utility.

 

Page 49: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 49/105

Validating

Proses pemeriksaan kebenaran suatu data yang dihasilkan dari

penggabungan.

 

Page 50: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 50/105

Delta Updating

Proses update yang hanya akan mengupdate data baru saja tanpa

menghasilkan duplikasi record.

 

Page 51: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 51/105

Refresh

1. Proses yang mempropagasi terjadinya proses pengupdatean

dari sumber data ke data warehouse.

2. Pertanyaan yang sering muncul:

a. Kapan harus melakukan refresh

b. Bagaimana cara melakukan refresh.

 

Page 52: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 52/105

Kapan Harus Refresh?

1. Secara Periodik (setiap malam, setiap minggu) atau setelah

event-event yang signifikan.

2. Ketika data warehouse membutuhkan data yang bersangkutan.

3. Berdasarkan kebijakan refresh yang dibuat oleh administrator

berdasarkan kebutuhan pengguna dan traffic.

 

Page 53: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 53/105

Bagaimana Teknik untuk Refresh?

1. Full extract dari tabel-tabel dasar

Kekurangan:

a. “Mahal” 

b. Hanya untuk “legacy systems”. 

2. Mendeteksi perubahan.

 

Page 54: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 54/105

Mendeteksi Perubahan

1. Membuat snapshot dari tabel log yang menyimpan perubahan

pada sumber data.

2. Setiap perubahan record akan memicu update ke dalam

snapshot log table.

 

Page 55: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 55/105

Perancangan Data

Warehouse

 

Page 56: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 56/105

Pendekatan Perancangan

1. Pendekatan normalisasi

2. Pendekatan dimensional.

 

Page 57: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 57/105

Pendekatan Perancangan

1. Pendekatan normalisasi

2. Pendekatan dimensional.

 

Page 58: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 58/105

Pendekatan Normalisasi

1. Data dalam data warehouse disimpan berdasarkan aturan

normalisasi data.

2. Kelebihan: mudah untuk menambahkan informasi ke dalam

database.

3. Kekurangan: banyak tabel yang terlibat sehingga akan

menimbulkan kesulitan dalam penggabungan data.

 

Page 59: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 59/105

Pendekatan Dimensional

1. Data transaksi dipartisi menjadi fakta (data transaksi numerik)

dan dimensi (refernsi informasi dari fakta).

2. Kelebihan: data warehouse akan lebih mudah dimengerti oleh

penggunanya.

3. Kekurangan: susah mempertahankan integritas dari fakta dan

dimensi.

 

Page 60: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 60/105

Mana Yang Digunakan???

Pendekatan dimensional lebih sering digunakan walaupun

terkadang di dalam pendekatannya tetap membutuhkan

normalisasi.

 

Page 61: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 61/105

Perancangan Skema

1. Harus mirip seperti alur bisnis nyatanya.

2. Harus dikenal oleh pelaku bisnis.

3. Memiliki pendekatan dari sisi pelaku bisnis.

4. Harus SIMPEL.

 

Page 62: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 62/105

Tabel Dimensi

1. Small tables.

2. Direlasikan dengan tabel fakta oleh foreign key.

3. Memiliki indeks.

4. Memiliki tipikal berupa dimensi seperti: periode waktu,

geographic region, product, dan pelanggan.

 

Page 63: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 63/105

Tabel Fakta (Fact Tables)

1. Central table.

2. Kebanyakan berisi item-item numerik yang masih mentah.

3. Memiliki jumlah baris yang banyak.

4. Diakses via tabel dimensi.

 

Page 64: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 64/105

Tabel Dimensional

Kode Produk Kode Waktu Kode Agen Penjualan Jumlah

Info Produk 

Info Waktu 

. . .

Ukuran numerikdari tabel fakta

Kolom-kolom kunci dari tabel fakta juga kunci dari tabel-tabel dimensi Info Agen 

. . .. . .. . .. . .

Tabel-tabel

dimensi

Tabel fakta 

 

Page 65: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 65/105

Skema Data Warehouse

1. Skema Star.

2. Skema Fact Constellation.

3. Skema Snowflake

 

Page 66: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 66/105

Skema Star

1. Sebuah fact table yang besar dan tersentralisasi.

2. Satu tabel untuk setiap dimensi.

3. Setiap fact points untuk satu tuple dalam setiap dimensinya dan

memiliki atribut tambahan.

4. Mudah dimengerti dan mengurangi jumlah dari “physical joins”. 

5. Mudah untuk mendefinisikan hirarkinya.

 

Page 67: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 67/105

Skema Star (cont’d) 

T i 

m e 

p r o 

c u 

s t 

f a c t 

date, custno, prodno, cityname, ...

i t y 

 

Page 68: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 68/105

Skema Star (cont’d) 

Store Key

Product Key

Period KeyUnits

Price

Time Dimension

Product Dimension

Store Key

Store Name

City

State

Region

Period Key

Year

Quarter

Month

Product KeyProduct Desc

Store Dimension Fact Table

 

Page 69: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 69/105

Skema Fact Constellation

1. Beberapa fact tables berbagi tabel dimensi.

2. Ditampilkan sebagai koleksi dari kumpulan skema bintang yang

sering disebut sebagai skema galaxy.

3. Dibutuhkan oleh aplikasi yang canggih.

 

Page 70: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 70/105

Skema Fact Constellation (cont’d) 

Hotels 

Travel Agents 

Promotion 

Room Type 

Customer 

Booking  Checkout  

 

Page 71: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 71/105

Skema Fact Constellation (cont’d) 

Store Key

Product Key

Period Key

UnitsPrice

Store Dimension

Product Dimension

Sales Fact Table

Store KeyStore Name

City

State

Region

Product Key

Product Desc

Shipper Key

Store Key

Product Key

Period Key

Units

Price

Shipping Fact Table

 

Page 72: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 72/105

Skema Snowflake

1. Merupakan variant dari model skema star.

2. Sebuah fact tables yang besar dan tersentralisasi serta satu atau

lebih tabel untuk setiap dimensi.

3. Tabel dimensi dinormalisasi dengan cara men-split data pada

tabel dimensi ke dalam tabel tambahan.

4. Mudah untuk maintenance dan menghemat storage.

 

Page 73: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 73/105

Skema Snowflake (cont’d) 

T i 

p r o 

c u s 

c i t 

f a c t 

date, custno, prodno, cityname, ...

r e g i o n 

 

Page 74: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 74/105

Skema Snowflake (cont’d) 

Store Key

Product Key

Period Key

Units

Price

Time Dimension

Product Dimension

Fact Table

Store Key

Store NameCity Key

Period Key

Year

Quarter

Month

Product KeyProduct Desc

City Key

City

State

Region

City Dimension

Store Dimension

 

Q L &

Page 75: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 75/105

Query Language &

OLAP

 

Page 76: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 76/105

Keterbatasan SQL

Mari kita lihat tabel penjualan berikut:

 

Page 77: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 77/105

Keterbatasan SQL (cont’d) 

Berikutnya kita lihat tabel produk:

 

( )

Page 78: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 78/105

Keterbatasan SQL (cont’d) 

Berikutnya... Tabel Gudang:

 

b ( ’d)

Page 79: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 79/105

Keterbatasan SQL (cont’d) 

Terakhir... Tabel Kota:

 

b ( ’d)

Page 80: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 80/105

Keterbatasan SQL (cont’d) 

ERD:

 

b ( ’d)

Page 81: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 81/105

Keterbatasan SQL (cont’d) 

Masalah query:

Berapa banyak Colgate toothpaste yang dijual di kota kecil

(berdasarkan populasi) kemarin dan di hari yang sama sebulan yang

lalu?

 

K b SQL ( ’d)

Page 82: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 82/105

Keterbatasan SQL (cont’d) 

Query Pemecahan:

select sum(sales.quantity_sold)

from sales, products, stores, cities

where products.manufacturer_id = 68 -- restrict to Colgate-

and products.product_category = 'toothpaste‘ 

and cities.population < 40000

and sales.datetime_of_sale::date = 'yesterday'::date

and sales.product_id = products.product_id

and sales.store_id = stores.store_id

and stores.city_id = cities.city_id

 

PEMECAHAN

Page 83: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 83/105

PEMECAHAN

O L A P(Online Analytical Processing)

 

OLAP

Page 84: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 84/105

OLAP

1. Merepresentasikan data dengan kubus multidimensional lebih mudah

dimengerti.

2. OLAP memberikan jawaban terhadap query analytic untuk data

multidimensional.

3. Aspek: ukuran (besaran data) dan dimensi (parameter bisnis).

4. Contoh melihat penjualan (ukuran) menurut wilayah, waktu dan

produk (dimensi). 

OLAP ( t’d)

   

Page 85: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 85/105

OLAP (cont’d) 

Kubus 3-dimensi:Tabel fakta:

sale  prod-Id  store-Id  tgl  jumlah 

p1  s1  1  12 p2  s1  1  11 p1  s3  1  50 p2  s2  1  8 p1  s1  2  44 p1  s2  2  4 

tgl 2 s1 s2 s3

p1 44 4p2 s1 s2 s3

p1 12 50

p2 11 8

tgl 1

 

O i OLAP

Page 86: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 86/105

Operasi OLAP

1. Slice and dice

2. Role up dan drill down

3. Pivot

Pelanggan

Senin

Rabu

Selasa

Produk

850

001

002

003

Penjualan

323 714

 

Sli i d Di i

Page 87: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 87/105

Slicing and Dicing

Mengambil potongan kubus berdasarkan nilai tertentu pada satu

dimensi atau beberapa dimensinya.

 

Sli i d Di i ( t’d)

 

Page 88: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 88/105

Slicing and Dicing (cont’d) 

tgl 2 s1 s2 s3

p1 44 4

p2 s1 s2 s3p1 12 50p2 11 8

tgl 1

s1 s2 s3

p1 12 50p2 11 8

WAKTU = tanggal 1 

 

Pi ti

Page 89: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 89/105

Pivoting

1. Menampilkan nilai-nilai ukuran dalam tata letak tabel yang

berbeda.

2. Mengatur kembali dimensi dalam sebuah kubus data.

 

Pi ti ( t’d)

Page 90: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 90/105

Pivoting (cont’d) 

 

Sli i d Pi ti

Page 91: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 91/105

Slicing and Pivoting

ProdukTgl-1 Tgl-2

Toko t1 Electronics $5.2

Toys $1.9

Clothing $2.3

Cosmetics $1.1

Toko t2 Electronics $8.9

Toys $0.75Clothing $4.6

Cosmetics $1.5

ProdukToko t1 Toko t2

Toko t1 Electronics $5.2 $8.9

Toys $1.9 $0.75

Clothing $2.3 $4.6

Cosmetics $1.1 $1.5

Toko t2 Electronics

ToysClothing

(juta $)

Tgl-1

Penjualan

(juta $)

Waktu

Penjualan

 

Roll Up

Page 92: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 92/105

Roll Up

1. Generalisasi satu atau beberapa dimensi dengan merangkum

nilai-nilai ukurannya

2. Generalisasi: naik ke tingkat yang lebih umum dalam hirarki

dimensi.

 

Roll Up (cont’d)

  

Page 93: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 93/105

Roll Up (cont’d) 

tgl 2 s1 s2 s3

p1 44 4p2 s1 s2 s3

p1 12 50p2 11 8

tgl 1

s1 s2 s3p1 56 4 50

p2 11 8

s1 s2 s3

sum 67 12 50

sum

p1 110

p2 19

129

. . .

Contoh: penghitungan total

 

Drill Down

Page 94: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 94/105

Drill Down

1. Mendapatkan lebih detail tentang dimensi.

2. Navigasi dari tingkat yang lebih umum ke tingkat yang lebih

spesifik.

 

Drill Down (cont’d)

Page 95: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 95/105

Drill Down (cont d) 

 

Data Agregat

Page 96: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 96/105

Data Agregat

1. Penggabungan beberapa data yang digunakan untuk

mempermudah pembuatan query.

2. Data agregat disimpan dalam tabel fakta.

 

Data Agregat (cont’d)

   

Page 97: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 97/105

Data Agregat (cont d) 

* s1 s2 s3 *

p1 56 4 50 110

p2 11 8 19* 67 12 50 129

tgl 2 s1 s2 s3 *

p1 44 4 48p2* 44 4 48

s1 s2 s3 *

p1 12 50 62

p2 11 8 19* 23 8 50 81

tgl 1 penjualan(*,p2,*) 

 

Query Operation

Page 98: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 98/105

Query Operation

1. Create Dimension

2. Pengelompokkan Cube (kubus)

3. Operator Analisis

 

Create Dimension

Page 99: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 99/105

Create Dimension

Ditujukan untuk pembuatan dimensi,

penentuan dimensi yang spesifik dan

general.

 

Create Dimension (cont’d)

Page 100: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 100/105

Create Dimension (cont d) 

CREATE DIMENSION StoreDimLEVEL StoreId IS Store.StoreId

LEVEL City IS Store.StoreCityLEVEL State IS Store.StoreState

LEVEL Zip IS Store.StoreZipLEVEL Nation IS Store.StoreNationLEVEL DivId IS Division.DivId

HIERARCHY CityRollup (StoreId CHILD OFCity CHILD OFState CHILD OFNation )

HIERARCHY ZipRollup (StoreId CHILD OFZip CHILD OF

State CHILD OFNation )

HIERARCHY DivisionRollup (StoreId CHILD OFDivIdJOIN KEY Store.DivId REFERENCES DivId )

ATTRIBUTE DivId DETERMINES Division.DivName

ATTRIBUTE DivId DETERMINES Division.DivManager ;

Pembuatan Dimensi

Penentuan spesifikdan general

 

Pengelompokan Data Cube

Page 101: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 101/105

Pengelompokan Data Cube

Pengelompokan data dalam kubus

dimensional untuk mempermudah analisis

data.

 

Pengelompokan Data Cube (cont’d)

Page 102: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 102/105

Pengelompokan Data Cube (cont d) 

SELECT StoreZip, TimeMonth,

SUM(SalesDollar) AS SumSales

FROM Sales, Store, Time

WHERE Sales.StoreId = Store.StoreId

AND Sales.TimeNo = Time.TimeNo

AND (StoreNation = 'USA'

OR StoreNation = 'Canada')

AND TimeYear = 2002

GROUP BY CUBE (StoreZip, TimeMonth)

Digrupkan dalam bentukcube (dimensional)

 

Operasi OLAP

Page 103: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 103/105

Operasi OLAP

Cari total amounts untuk hari pertama:

SELECT sum(amt ) FROM SALE  WHERE date=1

sale  prodId  storeId  date  amt 

p1  s1  1  12 p2  s1  1  11 p1  s3  1  50 p2  s2  1  8 p1  s1  2  44 p1  s2  2  4 

81

 

Operasi OLAP (cont’d)

Page 104: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 104/105

Operasi OLAP (cont d) 

Total amounts menurut tanggal:

SELECT date,sum(amt ) FROM SALE  GROUP BY date

result date sum

1 81

2 48

sale prodId storeId date amt

p1 s1 1 12p2 s1 1 11p1 s3 1 50

p2 s2 1 8p1 s1 2 44p1 s2 2 4

 

Page 105: datawarehouse-101117181535-phpapp01

5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com

http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 105/105

Question PLEASE!!!