2012-1-01025-IF Bab2001.BI
-
Upload
nisaulfanurjanah -
Category
Documents
-
view
17 -
download
0
description
Transcript of 2012-1-01025-IF Bab2001.BI
7
BAB 2
LANDASAN TEORI
2.1 Pendekatan Data warehouse
2.1.1 Data dan Informasi
2.1.1.1 Data
Menurut Connolly (2010, p70), data adalah komponen yang
paling penting dalam DBMS. Berasal dari sudut pandang end-user, data
bertindak sebagai jembatan yang menghubungkan antara komponen
mesin dengan komponen pengguna.
Menurut Hoffer (2009, p46), data adalah representasi dari objek
dan peristiwa yang memiliki arti dan kepentingan dalam lingkungan
pemakai.
2.1.1.2 Infomasi
Menurut Hoffer (2009, p47), Informasi adalah sebuah data yang
telah di proses dengan suatu cara untuk meningkatkan pengetahuan dari
seseorang yang menggunakan data tersebut.
Menurut Inmon(2005, p498), informasi adalah data yang dapat
dipahami oleh manusia dan dievaluasi untuk menyelesaikan masalah
atau membuat suatu keputusan.
8
Dengan kata lain informasi adalah hasil dari pengolahan data yang
dapat membantu manusia dalam memecahkan masalah dan
mengambil sebuah keputusan atau kesimpulan.
2.1.2 Pengertian Database
Menurut Connolly (2010, p65), database adalah sekumpulan data logikal
yang saling berhubungan dan deskripsi suatu data, yang dirancang untuk
memenuhi kebutuhan informasi dari suatu organisasi.
2.1.3 Data warehouse
Menurut inmon (2005, p29), data warehouse adalah sekumpulan data
yang Subject Oriented (orientasi subjek), integrated (integrasi), Non-
Volatile (tidak berubah), dan time variant yang mendukung keputusan
manajemen.
Cui, Widom. (2003:p41) Sistem data warehouse mengintegrasi informasi
dari sumber data operasional ke dalam pusat penyimpanan data untuk
memungkinkan adanya sebuah analisis dan mining berdasarkan informasi yang
terintegrasi. Selama proses intergrasi, sumber data biasanya memiliki
serangkaian transformasi, yang bervariasi dari operasi aljabar yang sederhana
atau suatu agregasi ke ‘data cleansing’ dengan prosedur yang kompleks.
9
Dari definisi diatas, dapat disimpulkan bahwa data warehouse adalah
sekumpulan data yang memiliki karakteristik orientasi subjek,
terintegrasi, time-variant, dan Non-Volatile yang digunakan
untuk mendukung pengambilan keputusan.
2.1.4 OLTP (Online Transaction Processing)
Menurut Connolly dan Begg (2010, p1199), OLTP adalah sebuah sistem
yang digunakan untuk melayani transaksi dalam jumlah yang besar,
terorganisir, berulang, dan mengalami perubahan secara intensif. Data pada
OLTP diatur sesuai transaksi terkait dengan aplikasi bisnis dan mendukung
keputusan pengguna operasional setiap harinya dalam jumlah yang besar.
2.1.5 Perbandingan Data warehouse dengan OLTP
Menurut Connolly dan Begg (2010, p1199), perbedaan sistem OLTP dan
sistem data warehouse adalah :
Tabel 2.1 Perbandingan Data warehouse dengan OLTP
Karakteristik OLTP Data warehouse
Tujuan utama Mendukung proses operasional Mendukung proses analisis
Umur data Saat ni Bersifat historis (tetapi data
10
yang saat ini juga termasuk)
Latency data Real-time Tergantung dari panjangnya
siklus data tambahan ke data
warehouse (tetapi data yang
real-time juga termasuk
Granularity data Detail data Detail data, tinggi dan
rendahnya rangkuman data
Pemrosesan data Pola dari pemasukan,
penghapusan, pembaharuan,
dan queries data yang dapat
diprediksi.
Level transaksi : High
Pola dari proses query data
kurang bisa diprediksi.
Level transaksi : medium - low
Reporting Dapat diprediksi, satu dimensi,
data bersifat tetap, statis, dan
relatif
Tidak dapat diprediksi,
multidimensi, laporan bersifat
dinamis
Pengguna Melayani pengguna operasional
dalam jumlah yang besar
Melayani pengguna manajerial
dalam jumlah yang kecil (tapi
juga mendukung kebutuhan
analisis bagi pengguna
operasional)
11
2.1.6 Data Mart
Menurut W.H. Inmon (2005, p494), Data Mart adalah bagian dari
struktur pengembangan data pada data warehouse dimana data di-denormalisasi
sesuai dengan kebutuhan informasi departemen.
Menurut Hoffer (2009, p509), data diperoleh dengan memilih dan
merangkum data pada sebuah data warehouse atau dari proses ETL (extract,
transform, load) yang terpisah dari sumber sistem data.
2.1.7 Karakteristik Data warehouse
2.1.7.1 Subject Oriented
Karakteristik pada data warehouse yang pertama adalah subject
oriented. Berorientasi terhadap subject maksudnya adalah data
warehouse dirancang untuk menganalisa data berdasarkan subject-
subject yang ada.
12
Gambar 2.1 Subject Orientation (sumber : Inmon, 2005, p30)
2.1.7.2 Integrated
Karakteristik data warehouse yang kedua adalah Integrated.
Data-data yang tersimpan dalam data warehouse berasal dari berbagai
sumber data operasional yang memiliki variabel yang berbeda. Oleh
karena itu, agar data operasional tersebut dapat saling ter-integrasi maka
13
sebelum dimasukkan ke dalam data warehouse, data tersebut harus di-
encode terlebih dahulu.
Contoh pada gambar 2.2 adalah tipe variabel pada atribut jenis
kelamin karyawan dimana pada data operasional, atribut jenis kelamin
karyawan pada data operasional adalah male dan female sedangkan
pada data warehouse menggunakan inisial m,f. Maka agar dapat ter-
integrasi penamaan jenis kelamin pada data operasional harus di- encode
terlebih dahulu menjadi m,f, kemudian dimasukkan ke dalam data
warehouse.
Gambar 2.2 Integrated dari Data warehouse (sumber : Inmon, 2005, p31)
14
2.1.7.3 Time variant
Karakteristik data warehouse yang ketiga adalah Time variant.
Data pada data warehouse dapat dikatakan valid jika data tersebut
memiliki jangka waktu 5-10 tahun.
Gambar 2.3 Time Variancy (sumber : Inmon, 2005, p32)
15
2.1.7.4 Non-Volatile
Karakteristik data warehouse yang keempat adalah Non-Volatile,
maksudnya adalah data pada data warehouse tidak dapat di-update dan
di-delete tetapi data hanya dapat di-refresh untuk memperbarui data
warehouse dan data lama akan tetap tersimpan.
Gambar 2.4 Nonvolatile (sumber : Inmon, 2005, p32)
2.1.8 Struktur Data warehouse
Menurut Inmon (2005, p34), struktur data warehouse terdiri dari
beberapa elemen seperti pada gambar berikut :
16
Gambar 2.5 Struktur Data warehouse (sumber : Inmon, 2005, p34)
2.1.8.1 Current Detail Data
Merupakan level terendah dari data warehouse yang
mencerminkan keadaan yang sedang berjalan saat ini. Data ini jumlahnya
sangat banyak sehingga masih sulit dilakukan analisa untuk mengambil
suatu keputusan.
17
2.1.8.2 Old Detail Data
Merupakan data history dari Current Detail Data. Data ini adalah
data cadangan(back-up) dan biasanya umur datanya sudah lama. Pada
saat penyusunan file atau direktori data ini harus disusun berdasarkan
umur datanya agar mudah diakses kembali.
2.1.8.3 Lightly Summarized Data
Evaluasi data yang dirangkum dengan menghapus satu atau
beberapa karakteristik data dari primary key fokus data. Lightly
summarized data memiliki tingkat granularitas yang baik.
2.1.8.4 Highly Summarized Data
Evaluasi data yang dirangkum dengan menghapus banyak
karakteristik data dari primary key fokus data. Highly Summarized Data
memiliki tingkat kedetailan yang sangat tinggi karena meerupakan hasil
ringkasan dari Lightly Summarized Data.
2.1.8.5 Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat
jenis data diatas. Menurut Poe, Metadata adalah ‘data tentang data’ dan
18
menyediakan informasi tentang struktur data dan hubungan antara
struktur data di dalam atau antara storage(tempat penyimpanan data).
Metadata berisikan data yang menyimpan proses perpindahan data
meliputi database structure,contents,detail data dan summary data,
matrics, versioning, aging criteria, versioning, transformation criteria.
Metadata khusus dan memegang peranan yang sangat penting dalam
data warehouse.
Metadata sendiri mengandung :
Struktur data
Sebuah direktori yang membantu user untuk melakukan
analisis Decission Support System dalam pencarian
letak/lokasi dalam data warehouse.
Algoritma
Algoritma digunakan untuk summary data. Metadata
sendiri merupakan panduan untuk algoritma dalam
melakukan pemrosesan summary data antara Current
Detail Data dengan Lightly Summarized Data dan antara
Lightly Summarized Data dengan highly summaried data.
19
Mapping
Sebagai panduan pemetaan(mapping) data pada saat data
di transform/diubah dari lingkup operasional menjadi
lingkup data warehouse.
2.1.9 Perencanaan dan Perancangan Data warehouse
Ada beberapa faktor yang harus diperhatikan dalam perencanaan data
warehouse, yaitu :
1. Tujuan pembangunan data warehouse harus memenuhi kriteria :
~ Meningkatkan kemampuan akses informasi.
~ Meningkatkan kualitas keputusan yang diambil.
2. Kriteria fasilitas yang dapat diberikan oleh data warehouse :
~ Navigasi yang memudahkan pemakai untuk mencari data.
~ Akses informasi yang mudah dan cepat.
~ Akuisi data yang dapat mendukung integrasi data.
2.1.10 Peralatan dalam Perancangan Data warehouse
Dalam perancangan data warehouse, peralatan yang digunakan adalah :
~ SQL Server 2008 untuk membuat database-nya
~ Visual Studio 2008 untuk merancang star skema dan lain-lain
20
~ Visual Basic.Net 2010 untuk menampilkan aplikasinya.
2.1.11 Arsitektur Data warehouse
Arsitektur data warehouse menurut Connolly dan Begg (2010, p1204),
adalah sebagai berikut :
Gambar 2.6 Arsitektur Data warehouse (sumber : Connoly dan Begg, 2010, p1204)
Menurut Connolly dan Begg (2010, p1204), arsitektur data warehouse
terdiri dari :
2.1.11.1 Data Operasional
Sumber data pada data warehouse disediakan dari :
21
1. Mainframe data operasional disimpan dalam hirarki generasi
pertama dan jaringan database.
2. Data antar bagian departemen disimpan dalam file sistem, seperti
VSAM, RMS, relasional DBMS seperti Informix dan Oracle.
3. Data internal disimpan dalam workstation dan server internal.
4. Sistem eksternal seperti internet, database yang tersedia secara
komersial atau database yang berhubungan dengan supplier
organisasi dan pelanggan.
2.1.11.2 Operational Data Store
Adalah Sebuah penyimpanan data operasional adalah tempat
penyimpanan dari data operasional terbaru dan data operasional yang
telah digabungkan dan digunakan untuk analisa. Biasanya tersusun dan
tersedia dalam cara yang sama seperti data dalam warehouse, tetapi
mungkin faktanya bertindak hanya sebagai daerah tumpuan bagi data
untuk dipindahkan ke dalam data warehouse.
2.1.11.3 ETL Manager
ETL manajer melakukan semua operasi yang berhubungan
dengan ETL data ke dalam warehouse. Data akan diambil langsung dari
sumber data atau, lebih umumnya dari Operational Data Store.
22
2.1.11.4 Warehouse Manager
Warehouse Manager melakukan semua operasi yang
berhubungan dengan pengelolaan data di warehouse. Operasi yang
dilakukan oleh Warehouse Manager meliputi :
1. Analisis data untuk memastikan konsistensi.
2. Transformasi dan penggabungan sumber data dari
penyimpanan sementara ke tabel data warehouse.
3. Penciptaan indeks dan pandangan pada tabel dasar.
4. Backup Data dan pengarsipan data.
5. Pembuatan denormalisasi (jika dibutuhkan)
6. Pembuatan agregasi
2.1.11.5 Query Manager
Melakukan semua operasi yang berhubungan dengan pengelolaan
user queries. Kompleksitas Query Manager ditentukan oleh fasilitas
yang disediakan oleh End-User Access Tools dan database.
2.1.11.6 Detailed Data
Tempat dari gudang penyimpan semua detail data dalam skema
database. Dalam banyak kasus, detail data tidak disimpan secara online
23
tetapi dibuat tersedia dengan menggabungkan data ke tingkat detail
berikutnya.
2.1.11.7 Lightly dan Highly Summarized Data
Tempat dari gudang penyimpan semua Lightly dan highly
summarized (agregat) data dihasilkan oleh Warehouse Manager. Bagian
dari tempat ini adalah bersifat sementara, karena akan berubah secara
terus-menerus untuk merespon perubahan query profile.
2.1.11.8 Archive / Backup Data
Bagian dari gudang penyimpanan data yang detail dan diringkas
untuk pengarsipan dan backup. Meskipun ringkasan data dihasilkan dari
data detail, mungkin perlu untuk melakukan backup ringkasan data secara
online jika data tetap melampaui masa penyimpanan bagi detail data.
2.1.11.9 Metadata
Simmhan, Y L., Plale B., Gannon D. (2005:p31) Metadata
menjelaskan mengenai produk data yang digunakan dan dihasilkan oleh
sebuah aplikasi yang sangat penting untuk menelusuri adanya data yang
disambiguate dan memungkinkan data untuk digunakan kembali. Data
24
asal merupakan salah satu jenis dari metadata, yang berkaitan dengan
sejarah derivasi dari sebuah produk data yang dimulai dari sumber asli
data tersebut.
Bidang dari gudang penyimpanan semua Metadata (data tentang
data) ketentuan digunakan oleh semua proses-proses dalam gudang.
Metadata digunakan untuk berbagai tujuan, termasuk :
1. Extractions dan loading proses-Metadata digunakan untuk
memetakan sumber data ke sebuah pandangan umum dari
data di dalam gudang.
2. Pengelolaan gudang proses-Metadata digunakan untuk
mengotomatisasikan produksi dari tabel rinci.
3. Sebagai bagian dari permintaan manajemen proses-
Metadata digunakan untuk mengarahkan sebuah
permintaan ke sumber data yang paling tepat.
2.1.11.10 End-User Access Tools
Tujuan utama dari data warehousing adalah untuk mendukung
para pembuat keputusan. Pengguna-pengguna ini berinteraksi dengan
gudang menggunakan End-User Access Tools. Gudang data harus
mendukung ad hoc dan analisa rutin secara efisien.
25
Kami mengkatagorikan alat-alat ini ke dalam empat kelompok
penting :
1. Pembuatan laporan dan query tools
2. Alat pengembangan aplikasi
3. OLAP tools
4. Data mining tools
2.1.12 Data Flow dalam Data warehouse
Menurut Connolly dan Begg (2005, p1161-1165), data warehouse fokus
pada lima arus data primer, yaitu :
2.1.12.1 Inflow
Berhubungan dengan pengekstrakan, pembersihan, dan pemuatan
data dari sumber data ke dalam data warehouse.
2.1.12.2 Upflow
Proses yang terhubung dengan menambahkan nilai ke data di
dalam warehouse melalui peringkasan, pemadatan, dan pendistribusian
data.
26
2.1.12.3 Downflow
Berhubungan dengan penyimpanan dan Backup Data dalam data
warehouse.
2.1.12.4 Outflow
Berhubungan dengan membuat data tersedia bagi end user.
2.1.12.5 Meta-flow
Merupakan proses memindahkan Metadata (data mengenai flow
lainnya).
2.1.13 Sketsa Data warehouse
2.1.13.1 Tabel Fakta
Menurut Kimball dan Ross (2010, p30), tabel fakta adalah dasar
dari data warehouse. Tabel-tabel itu mengandung ukuran fundamental
dari perusahaan, dan tabel-tabel itu adalah target utama dari sebagian
besar data warehouse query.
Menurut Inmon(2005, p497), tabel fakta adalah pusat dari tabel
star join dimana data memiliki banyak kejadian yang dapat dialokasikan.
27
2.1.13.2 Tabel Dimensi
Menurut Inmon (2005, p495), tabel dimensi adalah tempat dimana
data tambahan yang berhubungan dengan tabel fakta ditempatkan dalam
tabel multidimensi.
2.1.13.3 Pemodelan dalam Dimensional
Dimensional modeling adalah sebuah disiplin desain yang
mencakup model relasional resmi serta realita teknik dari teks dan jumlah
data.
2.1.13.4 Keuntungan dari Penggunaan Pemodelan Dimensional
Menurut Connolly dan Begg (2010, p1227), masing-masing tabel
dimensional memiliki primary key yang sederhana dan berhubungan
dengan tepat ke satu dari komponen composite key di tabel fakta. Dengan
kata lain primary key dari tabel fakta yang terdiri dari dua atau lebih
foreign key.
2.1.13.5 Skema Bintang
Menurut Hoffer (2009, p521), skema bintang adalah sebuah
desain database sederhana dimana dimensional data terpisah dari fakta
28
atau data transaksi. sebutan lain untuk dimensional model adalah skema
bintang.
Menurut Inmon (2005, p503), skema bintang adalah struktur data
dimana data yang didenormalisasi untuk mengoptimalisasi akses data.
Merupakan dasar dari multidimensional Data Mart design.
Gambar 2.7 Contoh Skema Bintang (sumber : Connoly dan Begg, 2010, p1228)
2.1.13.5.1 Keuntungan Menggunakan Skema Bintang
Beberapa keuntungan dalam menggunakan skema bintang
adalah :
1. Proses query dan waktu respon yang cepat.
29
2. Menyerhanakan pemahaman dan penelusuran
Metadata bagi pemakai dan pengembang.
3. Lebih simpel.
4. Mudah dipahami.
2.1.13.5.2 Perancangan Skema Bintang
Dalam perancangan skema bintang, terdiri dari beberapa
tabel dan alur gabungan yang dirumuskan dengan baik.
2.1.13.5.3 Skema Bintang Sederhana
Dalam skema bintang ini, setiap tabel harus memiliki
primary key yang terdiri dari satu kolom atau lebih. Primary key
dari tabel fakta terdiri dari satu atau lebih foreign key.
Gambar 2.8 Contoh Skema Bintang Sederhana
30
2.1.13.5.4 Skema Bintang dengan Banyak Tabel Fakta
Variasi lain dari skema bintang adalah skema bintang
dengan banyak tabel fakta. Skema bintang seperti ini biasanya
dibangun untuk meningkatkan kinerja atau untuk alasan lain
seperti menentukan lebih dari satu tabel fakta dalam skema
bintang yang diberikan.
Gambar 2.9 Contoh Skema Bintang dengan Banyak Tabel Fakta
(sumber : Hoffer, 2005, p473)
2.1.13.5.5 Skema Bintang Majemuk
Menurut Poe (2001, p100), dalam skema bintang ini
foreign key menggunakan tabel dimensi sebagai referensi dan
31
primary key terdiri dari satu atau lebih identifier yang unik untuk
masing-masing baris. Ciri utama dalam skema bintang majemuk
adalah primary key dan foreign key yang tidak sama.
2.1.13.6 Skema Snowflake
Menurut Inmon (2005, p361), sebagai sebuah aturan, pada star
join adalah satu tabel fakta. Tetapi lebih dari satu tabel fakta dapat
dikombinasi di sebuah database design untuk membuat sebuah struktur
gabungan yang disebut Snowflake structure. Dalam skema Snowflake,
tabel fakta yang berbeda yang terhubung dengan membagi satu atau lebih
dimensi umum disebut conformed dimensions.
Menurut Hoffer (2009, p532), skema Snowflake adalah versi
dari skema bintang yang diperluas dimana tabel dimensi dinormalisasi ke
dalam beberapa tabel yang saling berhubungan.
32
Gambar 2.10 Contoh Skema Snowflake (sumber : Connoly dan Begg, 2005, p1185)
2.1.13.6.1 Keuntungan Menggunakan Skema Snowflake
1. Pemakaian space yang lebih sedikit.
2. Update dan maintenance yang lebih mudah.
2.1.13.6.2 Kerugian Menggunakan Skema Snowflake
1. Model lebih kompleks dan rumit.
2. Proses query lebih lambat.
3. Performance yang kurang bagus.
33
2.1.14 Agregasi
Menurut W.H Inmon (2005, p.114), ada banyak kasus dimana data di
dalam data warehouse tidak memenuhi kriteria stabilitas dan jarang berubah.
Pada beberapa kasus, jumlah isi data menjadi terlalu banyak. Dikasus
lainnya dapat dilakukan agregasi yang mengelompokkan beberapa data detil
operasional yang berbeda ke dalam record tunggal. Record tunggal ini
disebut sebagai profile record atau agregate record.
Agregasi dari data operasional ke dalam sebuah record tunggal pada data
warehouse dapat dilakukan dengan menggunakan cara, seperti :
1. Nilai – nilai yang diambil dari data operasional dapat
diringkas.
2. Unit – unit data operasional dapat dihitung dan dijumlahkan,
dimana jumlah dari unit data disimpan.
3. Unit – unit data dapat diproses untuk menentukan yang
paling tinggi, paling rendah, rata – rata, dan sebagainya.
4. Kemunculan awal dan akhir data dapat ditangkap.
5. Data dari berbagai jenis, jatuh ke dalam batasan – batasan
dari beberapa parameter, dapat diukur.
6. Data yang efektif pada saat tertentu dapat ditangkap.
7. Data yang paling baru dan yang paling lama dapat ditangkap.
34
2.1.15 Metadata
Menurut Inmon (2005, p261), Metadata merupakan komponen penting
dari data warehouse dalam setiap skenario, tetapi Metadata mengambil
dimensi yang berbeda dalam penyimpanan dan pengelolaan eksternal data.
Menurut Hoffer (2009, p261), Metadata adalah data yang
menggambarkan sifat atau karakteristik dari end-user data, dan konteks pada
data.
Menurut Kimball (2010, p567), Metadata terbagi menjadi dua yaitu front
room Metadata dan back room Metadata. Front room Metadata lebih deskriptif
dan membantu dalam query tools dan berfungsi untuk memperlancar penulisan
laporan. Back room Metadata adalah proses relasi dan petunjuk extraction.
pembersihan dan proses loading. Beberapa fungsi Metadata adalah sebagai
berikut :
1. Membuat daftar anotasi yang baik dari semua itu.
2. Menentukan seberapa penting masing-masing bagian.
3. Bertanggung jawab untuk hal itu.
4. memutuskan apa yang merupakan set yang konsisten dan
set dari pekerjaan itu.
5. Memutuskan apakah akan membuat atau membeli.
6. Menyimpannya pada suatu tempat untuk proses backup
dan recovery.
35
7. Membuatnya tersedia untuk orang-orang yang
membutuhkannya.
8. Menjamin kualitas dan membuatnya lengkap serta up to
date.
9. Mengendalikan tugasnya dari suatu tempat.
10. Mendokumentasikan semua tanggung jawab yang cukup
baik untuk menyerahkan pekerjaan ini (secepatnya).
2.1.16 Granularity
Menurut Inmon (2005, p41), mengacu pada tingkat kedetailan suatu data
atau summarization dari unit data dalam data warehouse. Semakin tinggi
kedetailan data maka semakin rendah tingkat Granularity nya. Semakin rendah
tingkat kedetailannya, maka semakin tinggi level Granularity nya.
Gambar 2.11 Contoh Granularity (sumber : Inmon, 2005, p46)
36
2.1.17 Denormalisasi
Menurut Inmon (2005, p495), denormalisasi adalah teknik penempatan
normalisasi data pada lokasi fisikal yang mengoptimalkan kinerja sistem.
2.1.18 Metodologi Perancangan Data warehouse
Menurut Kimball (Connolly dan Begg. 2010, p1231-1238), metodologi
perancangan data warehouse, yaitu :
1. Menentukan Proses
Prosesnya menghasilkan Data Mart, Data Mart yang dibangun
harus data-data yang on-time dan berkaitan dengan budget serta
dapat menjawab pertanyaan-pertanyaan komersial dalam bisnis.
2. Menentukan Grain
Menentukan apa yang direpresentasikan dalam sebuah tabel fakta
dengan kata lain fakta-fakta apa saja yang akan ditampilkan dalam
tabel fakta.
3. Mengindentifikasi dan Membuat Dimensi yang Sesuai
Dimensi-dimensi menetapkan konteks untuk mengajukan
pertanyaan tentang fakta di tabel fakta. Dimensi-dimensi dapat
37
dibangun dengan baik dan mudah digunakan sewaktu
diimplementasi ke dalam Data Mart.
4. Menentukan Fakta
Grain dari tabel fakta menentukan fakta apa yang digunakan di
dimensional model.semua fakta harus diekspresikan pada tingkat
yang ada didalam grain. Selain itu, isisnya harus numerik dan
aditif.
5. Menyimpan Pre-kalkulasi dalam Tabel Fakta
Setelah tabel fakta dipilih, dilakukan pengecekan kembali untuk
mengetahui apakah ada aditif yang diperlukan lagi.
6. Menambahkan Atribut yang Dibutuhkan dalam Tabel
Dimensi
Menambahkan deskripsi teks pada dimensi. Deskriptif teks harus
intuitif dan dapat dimengerti oleh pengguna.
7. Menentukan Durasi Database
Mengukur seberapa jauh ke belakang tabel fakta dapat beroperasi.
8. Menelusuri Perubahan dari Dimensi Secara Perlahan
Mengecek penyebab keterlambatan load data. Ada beberapa tipe
penyebab keterlambatan load data, yaitu : tipe pertama, atribut
38
yang sudah ada ditimpah oleh atribut yang baru. Tipe kedua,
perubahan data atribut karena adanya dimensi atribut baru. Tipe
ketiga, data yang lama dan baru secara bersama-sama diakses oleh
data record yang baru.
9. Menentukan Prioritas Query dan Tipe Query
Mempertimbangkan perancangan fisik yang berkaitan dengan
backup, performance, security, administration, indexing, dan lain-
lain.
2.1.19 Keuntungan Penggunaan Data warehouse
Keuntungan penggunaan data warehouse Menurut Connolly dan Begg
(2010, p1198), adalah :
a) Pengembalian modal yang cepat.
b) Daya saing tinggi karena mempunyai informasi lebih banyak dan
akurat.
c) mendukung produktivitas dalam pengambilan keputusan.
2.1.20 EIS (Executive Information System)
EIS (eksekutif information system) sebagai sistem informasi manajemen
yang umumnya dirancang untuk ditekankan pada tampilan grafis dan interface
yang sangat mudah dan menarik untuk digunakan karena hal ini diasumsikan
39
akan digunakan untuk mendukung dan memfasilitasi informasi dan
pengambilan keputusan sebuah kebutuhan dari eksekutif senior.
2.1.21 ETL (Extract, Transform, Loading)
Menurut Kimball (2010, p442), sistem ETL adalah pembagian yang
paling memakan waktu dan mahal dalam membangun suatu data warehouse dan
memberikan business intelegence untuk sebuah komunitas.
Menurut Inmon (2005, p497), proses pencarian data, pengintegrasian
data, dan penempatan data dalam data warehouse.
2.1.21.1 Keuntungan dari ETL
1. Visual flow dan dokumentasi diri. Keuntungan tunggal
yang terbesar dari ETL tools adalah bahwa ia
menyediakan visual flow dari logikal sistem.
2. Sistem desain yang terstruktur. Peralatan ETL dirancang
untuk masalah spesifik untuk mengisi data warehouse.
3. Fungsi pembersihan data yang canggih. Sebagian besar
sistem ETL terstruktur secara kompleks dengan banyak
sumber dan target.
4. Memiliki performance yang baik.
40
2.1.22 OLAP (Online Analytical Processing)
Menurut Hoffer (2009, p540), OLAP adalah Penggunaan dari satu set
graphic tool yang mendukung pengguna dengan pandangan multidimensional
melalui data mereka sendiri dan juga mengijinkan mereka untuk menganalisis
data tersebut menggunakan simple windowing techniques.
Menurut Connolly dan Begg (2010, p1250), OLAP adalah perpaduan
dinamis analisis dan konsolidasi volume dari multidimensional data yang besar.
Menurut (Codd et al., 1995) OLAP adalah istilah yang menggambarkan
suatu teknologi yang menggunakan multidimensional view dari kumpulan data
yang mampu menyediakan akses yang cepat pada informasi untuk tujuan
analisis yang lebih lanjut.
Handojo, Rostianingsih. (2004:h54) Online Analytical Processing
(OLAP) merupakan salah satu tools yang digunakan untuk mengakses informasi
dalam data warehouse. Teknologi OLAP memungkinkan data warehouse
digunakan secara efektif untuk proses online analysis, memberikan respon yang
cepat terhadap analytical queries yang kompleks.
2.1.22.1 Macam-macam jenis OLAP
1. ROLAP (Relational OLAP)
Peralatan OLAP yang melihat database sebagai sebuah
relasional database di salah satu skema bintang atau
normalisasi lain atau set denormalisasi dari tabel.
2. MOLAP (Multidimentional OLAP)
41
Peralatan OLAP yang memuat ke dalam struktur
menengah, biasanya berupa susunan tiga dimensi atau
lebih.
2.1.22.2 Keuntungan dari OLAP
1. OLAP secara umum lebih banyak mendukung performance
daripada relasi pada saat cubes didesain dengan benar,
dengan sedikit peran untuk menjalankan performance yang
rumit untuk dibandingkan dengan relational.
2. OLAP memiliki kemampuan analisa yang sangat baik
daripada relational.
3. OLAP tidak memiliki masalah dengan simetri yang
membatasi SQL.
4. Industri vertikal tertentu, khususnya jasa finansial telah
mengalami perkembangan yang mengagumkan dengan
adanya solusi OLAP.
5. Pemuatan skenario-skenario tertentu bisa jadi sangat cepat.
2.2 Tools yang Digunakan
Dalam membangun data warehouse ada beberapa tools yang digunakan, seperti
diagraming tools dan software tools yang akan dijelaskan sebagai berikut :
42
2.2.1 Diagraming Tools
Pada diagraming tools terdapat beberapa diagram seperti DFD (Data
Flow Diagram), Flowchart, UML (Unfinied Modeling Language)
2.2.1.1 Data Flow Diagram (DFD)
Menurut Hall (2008, p58), Data Flow Diagram adalah diagram
yang menggunakan seperangkat simbol untuk menggambarkan proses,
sumber data, arus data, dan urutan proses dari sistem saat ini atau yang
diusulkan.
Satyanarayana, G R., Poorna C M., Srinivasu R., Reddy S R.
(2010:p2868) Data flows berisi dari satu atau lebih sumber database yang
menunjuk ke dalam daerah pemetaan menengah, dan akhirnya ke dalam
data warehouse atau tempat penyimpanannya. Pada setiap tahap terdapat
perangkat kualitas data yang tersedia di dalamnya dan proes dalam
mengubah data, sehingga meningkatkan kegunaan data setelah berada di
data warehouse
43
Gambar 2.12 Contoh Data Flow Diagram (sumber : Hall, 2008, p59)
2.2.1.2 Flowchart
Menurut Indrajani (2011, p22), flowchart merupakan
penggambaran secara grafik dari langkah-langkah dan urutan prosedur
suatu program. Biasanya mempermudah penyelesaian masalah khususnya
yang perlu dipelajari dan dievaluasi lebih lanjut.
44
2.2.1.3 Data Transformation Services
Handojo, Rostianingsih. (2004:h54) Data Transformation System
(DTS) menggunakan teknologi OLE DB untuk berhubungan dengan
berbagai sumber data yang digunakan oleh data warehouse. DTS dapat
menangani transaksi copy data biasa sampai validasi data dan translation
secara kompleks, sehingga data yang didapat sesuai dengan data
warehouse.
2.2.2 Software Tools
2.2.2.1 Microsoft SQL Server
Microsoft SQL Server adalah sebuah sistem manajemen basis
data relasional (RDBMS) produk Microsoft. Bahasa query utamanya
adalah Transact-SQL yang merupakan implementasi dari SQL standar
ANSI/ISO yang digunakan oleh Microsoft dan Sybase. Umumnya SQL
Server digunakan di dunia bisnis yang memiliki basis data berskala kecil
sampai dengan menengah, tetapi kemudian berkembang dengan
digunakannya SQL Server pada basis data besar. (sumber : wikipedia)
2.2.2.2 Visual Basic
Microsoft Visual Basic (sering disingkat sebagai VB saja)
merupakan sebuah bahasa pemrograman yang menawarkan Integrated
45
Development Environment (IDE) visual untuk membuat program
perangkat lunak berbasis sistem operasi Microsoft Windows dengan
menggunakan model pemrograman (COM).
Visual Basic merupakan turunan bahasa pemrograman BASIC
dan menawarkan pengembangan perangkat lunak komputer berbasis
grafik dengan cepat. (sumber : wikipedia)
2.2.2.3 Visual Studio
Microsoft Visual Studio merupakan sebuah perangkat lunak
lengkap (suite) yang dapat digunakan untuk melakukan pengembangan
aplikasi, baik itu aplikasi bisnis, aplikasi personal, ataupun komponen
aplikasinya, dalam bentuk aplikasi console, aplikasi Windows, ataupun
aplikasi Web. Visual Studio mencakup kompiler, SDK, Integrated
Development Environment (IDE) , dan dokumentasi (umumnya berupa
MSDN Library). Kompiler yang dimasukkan ke dalam paket Visual
Studio antara lain Visual C++, Visual C#, Visual Basic, Visual Basic
.NET , Visual InterDev, Visual J++, Visual J#, Visual FoxPro, dan Visual
SourceSafe .
Microsoft Visual Studio dapat digunakan untuk mengembangkan
aplikasi dalam native code (dalam bentuk bahasa mesin yang berjalan di
atas Windows) ataupun managed code (dalam bentuk Microsoft
46
Intermediate Language di atas .NET Framework). Selain itu, Visual
Studio juga dapat digunakan untuk mengembangkan aplikasi Silverlight,
aplikasi Windows Mobile (yang berjalan di atas .NET Compact
Framework). (sumber : wikipedia)
2.3 Interface Design
Dalam merancang data warehouse agar mudah digunakan oleh user diperlukan
interface design yang baik. Ada beberapa hal yang harus diperhatikan dalam membuat
interface design yang baik, yaitu eight golden rules dan lima faktor manusia terukur.
2.3.1 Eight Golden Rules of Interface Design
Menurut Shneiderman dan Plaisant (2010, p88-89), ada delapan aturan
emas dalam perancangan sebuah interface yaitu :
1. Berusaha untuk konsisten
Konsisten dalam setiap tampilan yang ada pada menu, prompt, layar,
bentuk, warna, tulisan, dan ukuran.
2. Memenuhi kegunaan yang universal
Kenali kebutuhan pengguna yang beragam dan desain sesuai dengan
kebutuhan pengguna.
47
3. Menawarkan umpan balik yang informatif
Untuk setiap tindakan pengguna, harus ada umpan balik sistem yang
informatif.
4. Desain dialog untuk menghasilkan penutupan
Sistem hendaknya memberikan kalimat penutup yang baik dan
informatif ketika pegguna telah selesai menggunakan aplikasi dan web
tersebut.
5. Mencegah kesalahan
Adanya validasi untuk pencegah kesalahan. Misalnya jika pengguna
salah memasukkan password, maka sistem akan memberi tahu bahwa
pengguna salah memasukkan password.
6. Memungkinkan pembalikan aksi yang mudah
Setiap tindakan yang dilakukan pengguna memungkinkan ada aksi
pembalikan (undo) untuk membantu pengguna dalam memperbaiki
kesalahan yang dibuatnya.
7. Mendukung pusat kendali internal
Sistem dapat dikontrol penuh oleh pengguna dan sistem menjalankan
apa yang pengguna inginkan, sehingga keduanya saling berhubungan.
48
8. Mengurangi beban memori jangka pendek
Desain antarmuka pengguna hendaknya hanya terdiri dari maksimal
tiga tingkatan, sehingga memudahkan pengguna dalam mengingat tata
letak antarmuka pengguna.
2.4 Metode Penyajian Data
2.4.1 Pie Chart
Pie chart adalah sebuah tampilan ilustrasi sederhana dari sebuah data.
Biasanya digunakan untuk menampilkan sebuah kuantitas sebagai presentase
jumlah dari total yang diberikan. Total area pie chart merepresentasikan 100%
dari kuantitasnya (jumlah dari nilai variabel seluruh kategori) dan ukuran dari
setiap potongan pie merupakan presentase dari total yang ingin direpresentasikan
dari masing-masing kategori. Pie chart biasanya digunakan untuk
merepresentasikan sebuah frekuensi atau data yang memiliki kategori, dengan
skala pengukuran yang dapat berupa nominal atau ordinal.
49
Gambar 2.13 Contoh Pie Chart
2.4.2 Table Pivot
Pivot table adalah sebuah table interactive yang dapat digunakan untuk
mengelompokkan dan meringkas banyak data secara ringkas, dalam bentuk
tabular format yang diperoleh dari kombinasi kolom data dalam tabel. Disebut
pivot table karena field dapat di drag dan drop untuk memutar sebuah ringkasan
field dan membuat cross tab. Dengan pivot table maka dapat dilakukan analisis,
meringkas dan memanipulasi data sehingga kita memperoleh informasi untuk
mengambil keputusan.
50
Gambar 2.14 Contoh Table Pivot
2.5 Pemahaman Objek Studi
2.5.1 Pengertian Pembelian
Menurut Mulyadi (2001, h299), sistem akuntansi pembelian
digunakan dalam perusahaan untuk pengadaan barang yang diperlukan
oleh perusahaan. Transaksi pembelian dapat digolongkan menjadi dua,
yaitu pembelian lokal dan pembelian impor. Pembelian lokal adalah
pembelian dari pemasok dalam negeri, sedangkan pembelian impor
adalah pembelian dari pemasok luar negeri.
Ada beberapa fungsi yang berkaitan dengan pembelian
(sumber : Mulyadi, 2001, h202), yaitu :
51
1. Fungsi Gudang
Dalam sistem akuntansi pembelian, fungsi gudang
bertanggung jawab untuk mengajukan permintaan pembelian
sesuai dengan posisi persediaan yang ada di gudang dan untuk
menyimpan barang yang telah diterima oleh fungsi penerimaan.
Untuk barang - barang yang langsung pakai (tidak
diselenggarakan persediaan barang di gudang), permintaan
pembelian diajukan oleh pemakai barang.
2. Fungsi Pembelian
Fungsi pembelian bertanggung jawab untuk memperoleh
informasi mengenai harga barang, menentukan pemasok yang
dipilih dalam pengadaan barang, dan mengeluarkan order
pembelian kepada pemasok yang dipilih.
3. Fungsi Penerimaan
Dalam sistem akuntansi pembelian, fungsi ini bertanggung
jawab untuk melakukan pemeriksaan terhadap jenis, mutu, dan
kuantitas barang yang diterima dari pemasok guna menentukan
dapat atau tidaknya barang tersebut diterima oleh perusahaan.
52
Fungsi ini juga bertanggung jawab untuk menerima barang dari
pembeli yang berasal dari transaksi retur penjualan.
4. Fungsi Akuntansi
Fungsi akuntansi yang terkait dalam transaksi pembelian
adalah fungsi pencatat utang dan fungsi pencatat persediaan.
Dalam sistem akuntansi pembelian, fungsi pencatat utang
bertanggung jawab untuk mencatat transaksi pembelian ke dalam
register bukti kas keluar dan untuk menyelenggarakan arsip
dokumen sumber (bukti kas keluar) yang berfungsi sebagai
catatan utang atau menyelenggarakan kartu utang sebagai buku
pembantu utang. Dalam sistem akuntansi pembelian, fungsi
pencatat persediaan bertanggung jawab untuk mencatat harga
pokok persediaan barang yang dibeli ke dalam kartu persediaan.
2.5.2 Pengertian Penjualan
Menurut Mulyadi (2001, h202), Kegiatan penjualan terdiri dari
transaksi penjualan barang atau jasa, baik secara kredit maupun secara
tunai. Dalam transaksi penjualan kredit, jika order dari pelanggan telah
dipenuhi dengan pengiriman barang atau penyerahan jasa, untuk jangka
waktu tertentu perusahaan memiliki piutang kepada
53
pelanggannya. Dalam transaksi penjualan tunai, barang atau jasa
baru diserahkan oleh perusahaan kepada pembeli jika perusahaan telah
menerima kas dari pembeli.
Prosedur penjualan menurut Mulyadi (2001, h6), yaitu :
1. Menulis data mengenai tanggal, kode barang, jenis, kuantitas,
harga satuan, harga total, nama pramuniaga.
2. Menggandakan faktur penjualan tunai dengan cara mengisi
formulir tersebut lebih dari satu lembar.
3. Menghitung perkalian harga satuan dengan kuantitas serta jumlah
harga yang harus dibayar oleh pembeli.
4. Memberi kode dengan cara mencantumkan kode buku pada
faktur penjualan tunai.
Ada beberapa fungsi yang berkaitan dengan penjualan
(sumber : Mulyadi, 2001, h204), yaitu :
1. Fungsi Penjualan
Fungsi Penjualan : Dalam sistem penjualan dengan kartu
kredit ini, fungsi penjualan bertanggung jawab melayani
kebutuhan barang pelanggan. Fungsi penjualan mengisi faktur
penjualan kartu kredit untuk memungkinkan fungsi gudang dan
54
fungsi pengiriman melaksanakan penyerahan barang kepada
pelanggan.
2. Fungsi Gudang
Dalam sistem penjualan ini, fungsi gudang menyediakan
barang yang diperlukan oleh pelanggan sesuai dengan yang
tercantum dalam tembusan faktur penjualan kartu kredit yang
diterima dari fungsi penjualan.
3. Fungsi Pengiriman
Fungsi ini bertanggung jawab untuk menyerahkan barang
yang kuantitas, mutu, dan spesifikasinya sesuai dengan yang
tercantum dalam tembusan faktur penjualan kartu kredit yang
diterima dari fungsi penjualan. Fungsi ini juga bertanggung jawab
untuk memperoleh tanda tangan dari pelanggan di atas faktur
penjualan kartu kredit sebagai bukti telah diterimanya barang
yang dibeli oleh pelanggan.
55
4. Fungsi Akuntansi
Fungsi ini bertanggung jawab untuk mencatat transaksi
bertambahnya piutang kepada pelanggan ke dalam kartu piutang
berdasarkan faktur penjualan kartu kredit yang diterima dari
fungsi pengiriman. Di samping itu, fungsi akuntansi bertanggung
jawab atas pencatatan transaksi penjualan di dalam jurnal
penjualan.
5. Fungsi Penagihan
Fungsi ini bertanggung jawab untuk membuat surat
tagihan secara periodik kepada pemegang kartu kredit.