datawarehouse-101117181535-phpapp01
-
Upload
septa-rindu -
Category
Documents
-
view
96 -
download
0
Transcript of datawarehouse-101117181535-phpapp01
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 1/105
DATA WAREHOUSEPresented by :
Helmy Faisal M
Adam Mukharil B
Adib Toriq
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 2/105
1. Why we need data warehouse?
2. Konsep data warehouse.
3. Data Transformation.
4. Perancangan data warehouse.
5. Query Language dan OLAP.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 3/105
Why we need Data
Warehouse
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 4/105
Fenomena Di Dunia Nyata
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 5/105
Fenomena Di Dunia Nyata
Customer mana
yang memilikitingkat margin
yang paling
tinggi?
Siapa saja yang
menjadicustomer dari
perusahaan
saya?Barang apa saja
yang banyak
dibeli oleh
customer saya
tahun ini?
Cara distribusi
seperti apa yang
cocok untuk
menaikkan
keuntungan?
Produk baru apa
yang memberikan
pengaruh
terhadap
perusahaan
Saya butuh data
untuk
mengetahui ..
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 6/105
Fenomena Di Dunia Nyata
Saya butuh data yang konsisten untuk
mengambil keputusan strategi bisnis
perusahaan di masa yang akan datang !!
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 7/105
Fenomena Di Dunia Nyata (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 8/105
Fenomena Di Dunia Nyata (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 9/105
Gimana caranya saya bisa dapatdata yang saya butuhkan ??
Fenomena Di Dunia Nyata (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 10/105
Fenomena Di Dunia Nyata (cont’d)
• GoT Corp.
• Cabang: bandung, jakarta, palembang, dan
papua.• Manager butuh laporan penjualan berkala.
• Setiap cabang memiliki sistem operasional
terpisah.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 11/105
Fenomena Di Dunia Nyata (cont’d)
Jakarta
Bandung
Palembang
Penjulan per item per
cabang untuk kurun waktu
pertama
Manajer
Penjualan
Papua
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 12/105
GoT Corp butuh solusi !!
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 13/105
Solusi Permasalahan 1
Jakarta
Bandung
Papua
Palembang
Data
Warehouse
Manajer
Penjualan
Query &
Analisis tools
Laporan
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 14/105
Solusi Permasalahan 2
Database
Operasional
Cabang ...
Data
Warehouse
Extract
data
Operator
Data Entry
Operator
Data Entry
Manajer
Penjualan
Laporan
Transaksi
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 15/105
Kesimpulan
GoT Corp butuh data
warehouse
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 16/105
Konsep Data
Warehouse
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 17/105
Pengertian Data Warehouse
Sebuah tempat penyimpanan data yang lengkap dan konsisten yang
berasal dari sumber-sumber yang berbeda dibuat untuk
penggunanya agar mereka dapat mengerti dan menggunakannya
dalam konteks bisnis.
[Barry Davlin]
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 18/105
Pengertian Data Warehouse
(cont’d)
Sebuah proses transformasi data ke dalam sebuah informasi dan
membuat informasi ini dapat diakses oleh penggunanya tepat
waktu untuk membuat perubahan-perubahan (strategi bisnis).
[Forrester Research, 1996]
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 19/105
Pengertian Data Warehouse
(cont’d)
1. Berorientasi subjek,
2. Diintegrasikan,
3. Time-variant,
4. Nonvolatile,
Koleksi data untuk medukung proses pembuatan manajemen
pengambilan keputusan.
[Bill Inmon]
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 20/105
Subject Oriented
1. Data warehouse diorganisasikan dalam lingkup subjek, sebagai
contoh: Penjualan, Produk, dan Pelanggan.
2. Berfokus ke dalam pemodelan dan analisis data untuk pihak-
pihak pembuat keputusan.
3. Memisahkan data yang tidak berguna di dalam proses
pendukung keputusan.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 21/105
Subject Oriented (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 22/105
Integrated
1. Data warehouse dikonstruksikan dengan cara mengintegrasikan
sejumlah sumber data yang berbeda.
2. Data preprocessing diaplikasikan untuk meyakinkan
kekonsistensian data.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 23/105
Integrated (cont’d)
Trust Credit cardSavings Loans
Same datadifferent name
Different dataSame name
Data found herenowhere else
Different keyssame data
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 24/105
Integrated (cont’d)
Encoding
Structures
Measurement
of attributes
MultipleSources
Data Type
Formats
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 25/105
Integrated (cont’d)
appl A - balanceappl B - balappl C - currbalappl D - balcurr
appl A - pipeline - cmappl B - pipeline - inappl C - pipeline - feet
appl D - pipeline - yds
appl A - m,f appl B - 1,0
appl C - x,yappl D - male, female
Data Warehouse
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 26/105
Time-Variant
1. Menghasilkan informasi dari sudut pandang historical (misal:
5-10 tahun yang lalu).
2. Setiap struktur kunci mengandung elemen waktu.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 27/105
Time-Variant (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 28/105
Time-Variant (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 29/105
Nonvolatile
1. Sekali data direkam maka data tidak bisa diupdate.
2. Data warehouse membutuhkan dua operasi pengaksesan data,
yaitu:
a. Initial loading of data
b. Akses data
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 30/105
Nonvolatile (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 31/105
Membentuk Data Warehouse
Data
Source cleaning Transformation
Data
Warehouse
New
Update
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 32/105
Arsitektur Data Warehouse
1. Data warehouse server
Pada umumnya berbentuk DBMS relasional, jarang berbentuk
file biasa.
2. OLAP Server
Mendukung dan mengoperasikan dalam bentuk struktur multi-
dimensional data.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 33/105
Arsitektur Data Warehouse (cont’d)
3. Clients
a. Tools untuk Query dan Pelaporan
b. Tools untuk menganalisis
c. Tools untuk data mining.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 34/105
Arsitektur Data Warehouse (cont’d)
4. Metadata Repository
Tempat menyimpan informasi tentang data yang ada di
datawarehouse.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 35/105
Arsitektur Data Warehouse (cont’d)
Data WarehouseEngine
Optimized Loader
ExtractionCleansing
Metadata Repository
RelationalDatabases
LegacyData
PurchasedData
ERPSystems
AnalyzeQuery
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 36/105
Data Transformation
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 37/105
Data Transformation
Fase yang terjadi ketika mengintegrasikan data ke dalam data
warehouse.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 38/105
Aturan-Aturan Data Transformation
1. Extracting
2. Conditioning
3. Scrubbing
4. Merging
5. Householding
6. Enrichment
7. Scoring
8. Loading
9. Validating
10. Delta Updating
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 39/105
Extracting
1. Mengambil data dari sumber operational dalam “as is” status.
2. Sumber-sumber data berasal dari mainframes yang hampir
seluruhnya berupa database relasional.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 40/105
Conditioning
Perubahan tipe data dari sumber data ke target data (data
warehouse) tetap dalam bentuk database relasional.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 41/105
Scrubbing
1. Digunakan untuk “membersihkan”/meningkatkan kualitas data.
2. Contoh: Adam M.B., Adam MB, Adam Mukharil B. Adalah orang
yang sama.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 42/105
Scrubbing (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 43/105
Merging
Proses penggabungan data dengan memperhatikan aturan-aturan
dalam mengintegrasikan data.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 44/105
Householding
1. Mengidentifikasi semua anggota dari household (berada di
alamat yang sama) untuk mengirimkan report.
2. Menjamin hanya satu jenis dokumen saja yang dikirimkan
kepada setiap household karena mengirimkan multiple report
akan mengakibatkan naiknya “cost” pada data warehouse.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 45/105
Householding (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 46/105
Enrichment
Mengambil data dari sumber data eksternal (di luar data source
yang seharusnya) untuk memperkaya data operasional yang sudah
ada.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 47/105
Scoring
Komputasi probabilitas tentang sebuah event, sebagai contoh
menghitung kemungkinan pelanggan membeli produk baru.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 48/105
Loading
1. Proses menambah atau menyisipkan data baru.
2. Teknik:
a. Menggunakan SQL untuk menambah atau menyisipkan data
baru
b. Menggunakan batch load utility.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 49/105
Validating
Proses pemeriksaan kebenaran suatu data yang dihasilkan dari
penggabungan.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 50/105
Delta Updating
Proses update yang hanya akan mengupdate data baru saja tanpa
menghasilkan duplikasi record.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 51/105
Refresh
1. Proses yang mempropagasi terjadinya proses pengupdatean
dari sumber data ke data warehouse.
2. Pertanyaan yang sering muncul:
a. Kapan harus melakukan refresh
b. Bagaimana cara melakukan refresh.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 52/105
Kapan Harus Refresh?
1. Secara Periodik (setiap malam, setiap minggu) atau setelah
event-event yang signifikan.
2. Ketika data warehouse membutuhkan data yang bersangkutan.
3. Berdasarkan kebijakan refresh yang dibuat oleh administrator
berdasarkan kebutuhan pengguna dan traffic.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 53/105
Bagaimana Teknik untuk Refresh?
1. Full extract dari tabel-tabel dasar
Kekurangan:
a. “Mahal”
b. Hanya untuk “legacy systems”.
2. Mendeteksi perubahan.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 54/105
Mendeteksi Perubahan
1. Membuat snapshot dari tabel log yang menyimpan perubahan
pada sumber data.
2. Setiap perubahan record akan memicu update ke dalam
snapshot log table.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 55/105
Perancangan Data
Warehouse
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 56/105
Pendekatan Perancangan
1. Pendekatan normalisasi
2. Pendekatan dimensional.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 57/105
Pendekatan Perancangan
1. Pendekatan normalisasi
2. Pendekatan dimensional.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 58/105
Pendekatan Normalisasi
1. Data dalam data warehouse disimpan berdasarkan aturan
normalisasi data.
2. Kelebihan: mudah untuk menambahkan informasi ke dalam
database.
3. Kekurangan: banyak tabel yang terlibat sehingga akan
menimbulkan kesulitan dalam penggabungan data.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 59/105
Pendekatan Dimensional
1. Data transaksi dipartisi menjadi fakta (data transaksi numerik)
dan dimensi (refernsi informasi dari fakta).
2. Kelebihan: data warehouse akan lebih mudah dimengerti oleh
penggunanya.
3. Kekurangan: susah mempertahankan integritas dari fakta dan
dimensi.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 60/105
Mana Yang Digunakan???
Pendekatan dimensional lebih sering digunakan walaupun
terkadang di dalam pendekatannya tetap membutuhkan
normalisasi.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 61/105
Perancangan Skema
1. Harus mirip seperti alur bisnis nyatanya.
2. Harus dikenal oleh pelaku bisnis.
3. Memiliki pendekatan dari sisi pelaku bisnis.
4. Harus SIMPEL.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 62/105
Tabel Dimensi
1. Small tables.
2. Direlasikan dengan tabel fakta oleh foreign key.
3. Memiliki indeks.
4. Memiliki tipikal berupa dimensi seperti: periode waktu,
geographic region, product, dan pelanggan.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 63/105
Tabel Fakta (Fact Tables)
1. Central table.
2. Kebanyakan berisi item-item numerik yang masih mentah.
3. Memiliki jumlah baris yang banyak.
4. Diakses via tabel dimensi.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 64/105
Tabel Dimensional
Kode Produk Kode Waktu Kode Agen Penjualan Jumlah
Info Produk
Info Waktu
. . .
Ukuran numerikdari tabel fakta
Kolom-kolom kunci dari tabel fakta juga kunci dari tabel-tabel dimensi Info Agen
. . .. . .. . .. . .
Tabel-tabel
dimensi
Tabel fakta
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 65/105
Skema Data Warehouse
1. Skema Star.
2. Skema Fact Constellation.
3. Skema Snowflake
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 66/105
Skema Star
1. Sebuah fact table yang besar dan tersentralisasi.
2. Satu tabel untuk setiap dimensi.
3. Setiap fact points untuk satu tuple dalam setiap dimensinya dan
memiliki atribut tambahan.
4. Mudah dimengerti dan mengurangi jumlah dari “physical joins”.
5. Mudah untuk mendefinisikan hirarkinya.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 67/105
Skema Star (cont’d)
T i
m e
p r o
d
c u
s t
f a c t
date, custno, prodno, cityname, ...
C
i t y
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 68/105
Skema Star (cont’d)
Store Key
Product Key
Period KeyUnits
Price
Time Dimension
Product Dimension
Store Key
Store Name
City
State
Region
Period Key
Year
Quarter
Month
Product KeyProduct Desc
Store Dimension Fact Table
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 69/105
Skema Fact Constellation
1. Beberapa fact tables berbagi tabel dimensi.
2. Ditampilkan sebagai koleksi dari kumpulan skema bintang yang
sering disebut sebagai skema galaxy.
3. Dibutuhkan oleh aplikasi yang canggih.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 70/105
Skema Fact Constellation (cont’d)
Hotels
Travel Agents
Promotion
Room Type
Customer
Booking Checkout
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 71/105
Skema Fact Constellation (cont’d)
Store Key
Product Key
Period Key
UnitsPrice
Store Dimension
Product Dimension
Sales Fact Table
Store KeyStore Name
City
State
Region
Product Key
Product Desc
Shipper Key
Store Key
Product Key
Period Key
Units
Price
Shipping Fact Table
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 72/105
Skema Snowflake
1. Merupakan variant dari model skema star.
2. Sebuah fact tables yang besar dan tersentralisasi serta satu atau
lebih tabel untuk setiap dimensi.
3. Tabel dimensi dinormalisasi dengan cara men-split data pada
tabel dimensi ke dalam tabel tambahan.
4. Mudah untuk maintenance dan menghemat storage.
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 73/105
Skema Snowflake (cont’d)
T i
m
e
p r o
d
c u s
t
c i t
y
f a c t
date, custno, prodno, cityname, ...
r e g i o n
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 74/105
Skema Snowflake (cont’d)
Store Key
Product Key
Period Key
Units
Price
Time Dimension
Product Dimension
Fact Table
Store Key
Store NameCity Key
Period Key
Year
Quarter
Month
Product KeyProduct Desc
City Key
City
State
Region
City Dimension
Store Dimension
Q L &
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 75/105
Query Language &
OLAP
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 76/105
Keterbatasan SQL
Mari kita lihat tabel penjualan berikut:
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 77/105
Keterbatasan SQL (cont’d)
Berikutnya kita lihat tabel produk:
( )
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 78/105
Keterbatasan SQL (cont’d)
Berikutnya... Tabel Gudang:
b ( ’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 79/105
Keterbatasan SQL (cont’d)
Terakhir... Tabel Kota:
b ( ’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 80/105
Keterbatasan SQL (cont’d)
ERD:
b ( ’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 81/105
Keterbatasan SQL (cont’d)
Masalah query:
Berapa banyak Colgate toothpaste yang dijual di kota kecil
(berdasarkan populasi) kemarin dan di hari yang sama sebulan yang
lalu?
K b SQL ( ’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 82/105
Keterbatasan SQL (cont’d)
Query Pemecahan:
select sum(sales.quantity_sold)
from sales, products, stores, cities
where products.manufacturer_id = 68 -- restrict to Colgate-
and products.product_category = 'toothpaste‘
and cities.population < 40000
and sales.datetime_of_sale::date = 'yesterday'::date
and sales.product_id = products.product_id
and sales.store_id = stores.store_id
and stores.city_id = cities.city_id
PEMECAHAN
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 83/105
PEMECAHAN
O L A P(Online Analytical Processing)
OLAP
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 84/105
OLAP
1. Merepresentasikan data dengan kubus multidimensional lebih mudah
dimengerti.
2. OLAP memberikan jawaban terhadap query analytic untuk data
multidimensional.
3. Aspek: ukuran (besaran data) dan dimensi (parameter bisnis).
4. Contoh melihat penjualan (ukuran) menurut wilayah, waktu dan
produk (dimensi).
OLAP ( t’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 85/105
OLAP (cont’d)
Kubus 3-dimensi:Tabel fakta:
sale prod-Id store-Id tgl jumlah
p1 s1 1 12 p2 s1 1 11 p1 s3 1 50 p2 s2 1 8 p1 s1 2 44 p1 s2 2 4
tgl 2 s1 s2 s3
p1 44 4p2 s1 s2 s3
p1 12 50
p2 11 8
tgl 1
O i OLAP
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 86/105
Operasi OLAP
1. Slice and dice
2. Role up dan drill down
3. Pivot
Pelanggan
Senin
Rabu
Selasa
Produk
850
001
002
003
Penjualan
323 714
Sli i d Di i
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 87/105
Slicing and Dicing
Mengambil potongan kubus berdasarkan nilai tertentu pada satu
dimensi atau beberapa dimensinya.
Sli i d Di i ( t’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 88/105
Slicing and Dicing (cont’d)
tgl 2 s1 s2 s3
p1 44 4
p2 s1 s2 s3p1 12 50p2 11 8
tgl 1
s1 s2 s3
p1 12 50p2 11 8
WAKTU = tanggal 1
Pi ti
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 89/105
Pivoting
1. Menampilkan nilai-nilai ukuran dalam tata letak tabel yang
berbeda.
2. Mengatur kembali dimensi dalam sebuah kubus data.
Pi ti ( t’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 90/105
Pivoting (cont’d)
Sli i d Pi ti
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 91/105
Slicing and Pivoting
ProdukTgl-1 Tgl-2
Toko t1 Electronics $5.2
Toys $1.9
Clothing $2.3
Cosmetics $1.1
Toko t2 Electronics $8.9
Toys $0.75Clothing $4.6
Cosmetics $1.5
ProdukToko t1 Toko t2
Toko t1 Electronics $5.2 $8.9
Toys $1.9 $0.75
Clothing $2.3 $4.6
Cosmetics $1.1 $1.5
Toko t2 Electronics
ToysClothing
(juta $)
Tgl-1
Penjualan
(juta $)
Waktu
Penjualan
Roll Up
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 92/105
Roll Up
1. Generalisasi satu atau beberapa dimensi dengan merangkum
nilai-nilai ukurannya
2. Generalisasi: naik ke tingkat yang lebih umum dalam hirarki
dimensi.
Roll Up (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 93/105
Roll Up (cont’d)
tgl 2 s1 s2 s3
p1 44 4p2 s1 s2 s3
p1 12 50p2 11 8
tgl 1
s1 s2 s3p1 56 4 50
p2 11 8
s1 s2 s3
sum 67 12 50
sum
p1 110
p2 19
129
. . .
Contoh: penghitungan total
Drill Down
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 94/105
Drill Down
1. Mendapatkan lebih detail tentang dimensi.
2. Navigasi dari tingkat yang lebih umum ke tingkat yang lebih
spesifik.
Drill Down (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 95/105
Drill Down (cont d)
Data Agregat
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 96/105
Data Agregat
1. Penggabungan beberapa data yang digunakan untuk
mempermudah pembuatan query.
2. Data agregat disimpan dalam tabel fakta.
Data Agregat (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 97/105
Data Agregat (cont d)
* s1 s2 s3 *
p1 56 4 50 110
p2 11 8 19* 67 12 50 129
tgl 2 s1 s2 s3 *
p1 44 4 48p2* 44 4 48
s1 s2 s3 *
p1 12 50 62
p2 11 8 19* 23 8 50 81
tgl 1 penjualan(*,p2,*)
Query Operation
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 98/105
Query Operation
1. Create Dimension
2. Pengelompokkan Cube (kubus)
3. Operator Analisis
Create Dimension
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 99/105
Create Dimension
Ditujukan untuk pembuatan dimensi,
penentuan dimensi yang spesifik dan
general.
Create Dimension (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 100/105
Create Dimension (cont d)
CREATE DIMENSION StoreDimLEVEL StoreId IS Store.StoreId
LEVEL City IS Store.StoreCityLEVEL State IS Store.StoreState
LEVEL Zip IS Store.StoreZipLEVEL Nation IS Store.StoreNationLEVEL DivId IS Division.DivId
HIERARCHY CityRollup (StoreId CHILD OFCity CHILD OFState CHILD OFNation )
HIERARCHY ZipRollup (StoreId CHILD OFZip CHILD OF
State CHILD OFNation )
HIERARCHY DivisionRollup (StoreId CHILD OFDivIdJOIN KEY Store.DivId REFERENCES DivId )
ATTRIBUTE DivId DETERMINES Division.DivName
ATTRIBUTE DivId DETERMINES Division.DivManager ;
Pembuatan Dimensi
Penentuan spesifikdan general
Pengelompokan Data Cube
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 101/105
Pengelompokan Data Cube
Pengelompokan data dalam kubus
dimensional untuk mempermudah analisis
data.
Pengelompokan Data Cube (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 102/105
Pengelompokan Data Cube (cont d)
SELECT StoreZip, TimeMonth,
SUM(SalesDollar) AS SumSales
FROM Sales, Store, Time
WHERE Sales.StoreId = Store.StoreId
AND Sales.TimeNo = Time.TimeNo
AND (StoreNation = 'USA'
OR StoreNation = 'Canada')
AND TimeYear = 2002
GROUP BY CUBE (StoreZip, TimeMonth)
Digrupkan dalam bentukcube (dimensional)
Operasi OLAP
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 103/105
Operasi OLAP
Cari total amounts untuk hari pertama:
SELECT sum(amt ) FROM SALE WHERE date=1
sale prodId storeId date amt
p1 s1 1 12 p2 s1 1 11 p1 s3 1 50 p2 s2 1 8 p1 s1 2 44 p1 s2 2 4
81
Operasi OLAP (cont’d)
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 104/105
Operasi OLAP (cont d)
Total amounts menurut tanggal:
SELECT date,sum(amt ) FROM SALE GROUP BY date
result date sum
1 81
2 48
sale prodId storeId date amt
p1 s1 1 12p2 s1 1 11p1 s3 1 50
p2 s2 1 8p1 s1 2 44p1 s2 2 4
5/11/2018 datawarehouse-101117181535-phpapp01 - slidepdf.com
http://slidepdf.com/reader/full/datawarehouse-101117181535-phpapp01 105/105
Question PLEASE!!!