Contoh Implementasi Data Mining

download Contoh Implementasi Data Mining

of 20

Transcript of Contoh Implementasi Data Mining

  • 7/26/2019 Contoh Implementasi Data Mining

    1/20

    TUGAS MATA KULIAH

    MANAJEMEN DATA

    Laporan Akhir Data Mining

    Diajukan sebagai salah satu tugas mata kuliah

    Manajemen Data

    OLEH:

    Dewan Rahadan ! "#$$#%&'

    Dien A(a)ia ! "#$$#%&"

    Dwike* No+i A,rika ! "#$$#%&-

    UNI.ERSITAS KOM/UTER INDONESIA 0ANDUNG

    &%$'

  • 7/26/2019 Contoh Implementasi Data Mining

    2/20

    Laporan Akhir Data Mining

    $1 0*,ine,, Under,tanding

    $1$1 Deter(ine 0*,ine,, O23e4ti+e,

    Latar 0e)akang

    Dalam industri kendaraan bermotor terutama mobil, ada berbagai hal yang

    dilakukan untuk menjaga kualitas produk. Salahsatunya adalah dengan kebijakan

    klasifikasi produk. Dengan klasifikasi, maka perusahaan akan mampu

    menentukan, jika perusahaan membuat sebuah produk dengan spesifikasi tertentu,

    apakah perusahaan akan mendapatkan produk dengan kualitas A atau B, atau

    bahkan C atau D. Sebagai perusahan yang bergerak di bidang produksi kendaraan

    bermotor yaitu mobil, perusahaan X sudah sepatut melakukan kebijakan ini.

    Dengan berbagai hal yang kami sebutkan sebelumnya, maka dari itu latar

    belakang penelitian kami adalah untuk membatu perusahaan X untuk

    mengklasifikasikan produk mobil yang diilikinya sesuai dengan standar

    spesisfikasi mobil.

    Kami akan membantu perusahaan X untuk menentukan klasifikasi kualitas

    produk beradasarkan kategori, yaitu !good "sangat baik#, good "baik#, fair

    "kurang baik#, dan bad "tidak baik#. Dengan memanfaatkan enam kriteria standar

    mobil yaitu buying, maint, doors, persons, luggage, dan safety kita akan men$oba

    membuat sebuah standar kriteria untuk menghasilkan tipe produk yaitu very

    good, good, fair, dan bad.

    %arapan kami, dengan penelitian ini, perusahaan X dapat menemukan $ara

    mengklasifikasikan produknya dengan baik, sehingga kedepan, jika perusahaan

    ingin meningkatkan dan memproduksi produk berdasarkan tingkatan dan kualitastertentu, perusahaan dapat menemukan ktiteria yang baik sesuai keinginan.

    Karena pada kenyataannya, tidak semua spesifikasi produk akan menghasilkan

    kualitas yang sama. Setiap kombinasi spesifikasi produk pasti akan menghasilkan

    kualitas yang berbeda. Semoga penelitian ini, dapat membuka pengetahuan baru

    bagi perusahaan dalam mengembangkan produk.

  • 7/26/2019 Contoh Implementasi Data Mining

    3/20

    $1&1 A,,e,, Sit*ation

    In+entor re,o*r4e,

    Sumber daya yang terlibat dalam proje$t data mining ini antara lain &

    a. 'ersonel ( data mining personil sebanyak ) orang

    b. Computing resour$es ( komputer*laptop

    $. Soft+are ( -KA, Mi$rosoft -$el /01)

    Re5*ire(ent6 a,*(,i dan 2ata,an

    Ada beberapa asumsi yang diterapkan pada proje$t data mining ini yaitu &

    a. Data yang digunakan adalah data dummy dari suatu perusahaan

    mobil

    b. 2umlah data training yang digunakan sekitar 1/11 data dan jumlah

    data testingsekitar 314 data dari data yang sama.

    $. 2umlah data testing yang dilakukan se$ara manual sebanyak 10

    data.

    d. Metode data mining yang digunakan adalah metode klasifikasi

    dengan algoritmaIterative Dichotomizer Three"5D)#.

    e. 2ika nilai 6ain dari suatu atribut bernilai sama, maka atribut yang

    diambil adalah atribut yang paling a+al mun$ul.

    f. %asil dari data mining adalah untuk mengklasifikasikan kualitas

    mobil yang akan diproduksi sesuai dengan standar spesifikasi

    mobil.

    g. Ada empat jenis kualitas mobil, diantaranya vgood "sangat baik#,

    good "baik#,fair"sedang#, bad"kurang baik#.

    h. Dalam uji $oba ini hanya menampilkan pohon keputusan dan tidak

    dijelaskan proses pengambilan keputusan.

    Re,iko dan Ke(*ngkinan

    7esiko yang mungkin terjadi dalam uji $oba ini adalah ketidaktepatan hasil

    klasifikasi. %al ini disebabkan oleh data yang mungkin tidak $o$ok dengan

    metode yang di implementasikan. 8ntuk menangani hal tersebut maka langkah

    yang dibutuhkan adalah&

    a. Menambah jumlah data training.

    b. Men$ari metode alternatif untuk kasus klasifikasi.

  • 7/26/2019 Contoh Implementasi Data Mining

    4/20

    Ter(ino)og

    Beberapa terminologi yang digunakan dalam laporan ini antara lain&

    a. Data & fiktip

    b. 'ersonil & orang yang terlibat dalam uji $oba

    Ke*nt*ngan

    Keuntungan yang diperoleh dari uji $oba data mining kualitas mobil yang akan

    diproduksi ini sebagai berikut&

    a. 'rodusen dapat memperkirakan mobil yang akan diproduksi berdasarkan

    kualitas mobil yang telah diklasifikasikan sebelumnya.

    b. 'rodusen dapat membuat standar 9uality tersendiri dari data histori yang

    terdapat pada perusahaan.

    $171 Deter(ine Data Mining Goa),

    T*3*an Data Mining

    :ujuan dari uji$oba data mining ini adalah untuk mengklasifikasikan mobil

    berdasarkan kualitasnya kedalam empat kriteria sehingga dapat memprediksi

    spesifikasi kualitas mobil selanjutnya.

    $181 /rod*4e /ro3e4t /)an

    /ro3e4t /)an,

    'erkiraan jad+al proje$t ini

    a. Business 8nderstanding & 1) ( /0 2anuari /01; "1 minggu#

    b. Data 8nderstanding & 1) ( /0 2anuari /01; "1 minggu#

    $. Data 'reparation & /0 ( /) 2anuari /01; ") hari#

    d. Modeling & /) ( )1 2anuari /01; "1 minggu#

    e. -!aluation & /) ( )1 2anuari /01; "1 minggu#

    f. Deployment & /) ( )1 2anuari /01; "1 minggu#

    /erkiraan too) dan teknik

    Tool yang akan dipergunakan pada uji $oba ini adalah -KA !ersi ).;.1).

    Algoritma yang digunakan pada metode klasifikasi ini adalah 5D) karena dari

    data training yang ada jumlah data dari jenis atribut klasifikasinya tidak seimbang

    sehingga metode 5D) $o$ok digunakan untuk kasus penentuan kualitas mobil.

    &1 Data Under,tanding

    &1$1 9o))e4t Initia) Data

  • 7/26/2019 Contoh Implementasi Data Mining

    5/20

    Data a+al yang digunakan adalah data spesifikasi mobil sebagai data training

    dan data testing. Data spesifikasi adalah dokumen yang berisi komponen yang

    pada mobil seperti banyaknya pintu, muatan mobil, ukuran bagasi, keamanan,

    biaya pemeliharaan dan biaya pembelian mobil. 2enis data yang digunakan pada

    kedua dokumen spesifikasi mobil adalah jenis file e$el "ekstensi yang

    digunakan adalah .ls# sehingga tidak perlu dilakukan integrasi data dari berbagai

    sumber data.

    &1&1 De,4ri2e Data

    Berikut ini adalah $ontoh data training dan data testing yang akan

    digunakan dalam melakukan data mining klasifikasi dengan menggunakan

    algoritma 5D)&

    6ambar 1 Data Spesifikasi Mobil

    'enjelasan isi dokumen&

    Atribut yang terdapat pada dokumen ini sebagai berikut&

    $: No

    Menyatakan nomor urutan dari data.

    2) Buying

    Merupakan biaya pembelian unit mobil. Atribut buying memiliki empat

    kelompok yaitu&

    Vhigh & menyatakan biaya pembelian yang sangat tinggi.

    High & menyatakan biaya pembelian yang tinggi.

    Med(Medium)& menyatakan biaya pembelian yang standar.

    Lo & menyatakan biaya pembelian yang rendah.

    3) Maint

  • 7/26/2019 Contoh Implementasi Data Mining

    6/20

    Merupakan biaya pemeliharaan unit mobil. Atribut maint memiliki empat

    kelompok yaitu&

    Vhigh & menyatakan biaya pemeliharaan yang sangat tinggi.

    High & menyatakan biaya pemeliharaan yang tinggi.

    Med(Medium)& menyatakan biaya pemeliharaan yang standar.

    Lo & menyatakan biaya pemeliharaan yang rendah.

    4) Doors

    Merupakan jumlah pintu dari setiap unit mobil. Atribut doors memiliki empat

    kelompok yaitu&

    / & menyatakan jumlah pintu yang dimiliki unit mobil tersebut adalah /

    pintu.

    ) & menyatakan jumlah pintu yang dimiliki unit mobil tersebut adalah )

    pintu.

    & menyatakan jumlah pintu yang dimiliki unit mobil tersebut adalah

    pintu.

    3 more & menyatakan jumlah pintu yang dimiliki unit mobil tersebut adalah 3

    pintu atau lebih.

    5) Persons

    Merupakan jumlah penumpang dari setiap unit mobil termasuk supir. Atribut

    !ersons memiliki tiga kelompok yaitu&

    / & menyatakan jumlah penumpang dalam satu unit mobil tersebut

    adalah / orang.

    & menyatakan jumlah penumpang dalam satu unit mobil tersebut

    adalah orang.

    more & menyatakan jumlah penumpang dalam satu unit mobil tersebut

    adalah lebih dari orang.

    6) Luggage

    Merupakan besarnya ukuran bagasi dari setiap unit mobil. Atribut luggage

    memiliki tiga kelompok yaitu&

    "ig & menyatakan ukuran bagasi yang besar.Med & menyatakan ukuran bagasi yang sedang.

    #mall & menyatakan ukuran bagasi yang ke$il.

    7) Safety

    Merupakan standar keamanan dari setiap unit mobil. Atributsafety memiliki

    tiga kelompok yaitu&

    High & menyatakan tingkat keamanan yang tinggi.

    Med & menyatakan tingkat keamanan yang sedang.

    Lo & menyatakan tingkat keamanan yang rendah.

    8) Quality

  • 7/26/2019 Contoh Implementasi Data Mining

    7/20

    Merupakan kualitas dari setiap unit mobil. Atribut $uality memiliki empat

    kelompok yaitu&

    Vgood& menyatakan kualitas yang sangat baik.

    %ood & menyatakan kualitas yang baik.

    &air & menyatakan kualitas yang sedang.

    "ad & menyatakan kualitas yang kurang baik.

    &171 .eri; Data

  • 7/26/2019 Contoh Implementasi Data Mining

    8/20

    71#1 =or(at Data

    Data disusun dengan aturan sebagai berikut&

    :able 1 >ormat Data

    0*ing Maint Door, /er,on, L*ggage Sa;et air

    ? ? ? ? ? ? @good

    ? ? ? ? ? ? 6ood

    ? ? ? ? ? ? Bad

    ? ? ? ? ? ? ?

    81 Mode)ing

    81$1 Se)e4t Mode)ing Te4hni5*e

    :eknik pemodelan yang dipilih untuk kasus ini adalah De$ision :ree "5D)#.

    5D) adalah model prediksi yang menggunakan struktur pohon atau struktur

    hirarki. Metode ini mengubah data menjadi pohon keputusan dan aturanaturan

    keputusan. Manfaat dari de$ision tree adalah kemampuan untuk menjabarkan

    proses pengambilan keputusan yang kompleks menjadi lebih sederhana sehingga

    pengambilan keputusan akan lebih menginterpretasikan solusi dari permasalahan.

    7umus digunakan pada teknik pemodelan ini adalah&

    Entropy ( S )=i=1

    c

    pi log2p i

    Keterangan&

    -ntropy & jumlah bit yang dibutuhkan untuk mengekstrak suatu kelas dari

    sejumlah data a$ak pada ruang sampel S.

    !i & probabilitas suatu atribut.

    Gain (S , A )=Entropy (S ) v values(A)

    |s

    v||S|Entropy ( sv)

    6ain & mengukur efekti!itas suatu atribut.

    A & Atribut

    ! & menyatakan suatu nilai yang mungkin untuk atribut A.

    !alues"A# & himpunan nilainilai yang mungkin untuk atribut A.

    -ntropy"s!# & entropy untuk sampelsampel yang memiliki nilai !.

    # & jumlah seluruh sampel data.

    sv & jumlah sampel untuk nilai !.

  • 7/26/2019 Contoh Implementasi Data Mining

    9/20

    9ontoh /erhit*ngan Man*a) Mengg*nakan A)gorit(a ID7

    Dimisalkan terdapat 10 data sebagai berikut&

    :able / 8ji Coba Data

    BUYI

    NG

    MAIN

    T

    DOOR

    S

    PERSO

    NS

    LUGGA

    GE

    SAFET

    Y

    QUALI

    TY

    vhigh vhigh 2 2 med med Bad

    vhigh vhigh 2 2 med high Bad

    vhigh low 5more more big high Fair

    high high 2 4 small high Fair

    med low 5more more big med good

    low med 2 4 small high good

    med med 5more 4 med high vgood

    med med 5more more big high vgood

    med low 2 4 big high vgood

    vhigh vhigh 2 2 small low bad

    Berikut adalah langkahlangkah perhitungan algoritma 5D)&

    1. Menghitung -ntropy"S#

    Entropy ( S )=3

    10 log2

    3

    102

    10log2

    2

    10

    2

    10log2

    2

    103

    10log2

    3

    10=0.97

    /. Menghitung 6ain dari masingmasig atribut

    a. 6ain Buying

    Gain (S , Buying)=1.97( 4100.81)+( 1

    100)+( 410 0.81)+(

    1

    100)=1.32

    entropy(vhigh) [bad 3 , fair 1, good , vgood !

    Entropy ( vhigh)=34 log2

    3

    4

    1

    4log2

    1

    4=0.81

    entropy(high) [bad , fair 1, good , vgood !

    Entropy (high )=11 log2

    1

    1=0

    entropy(med) [bad , fair , good 1, vgood 3!

    Entropy (med )=14 log2

    1

    43

    4log23

    4=0.81entropy(low) [bad , fair , good 1, vgood !

    Entropy ( low )=1

    1 log2

    1

    1=0

    b. 6ain Maint

    Gain (S , Maint)=1.97( 310 0)+(1

    100)+( 3100.92)+(

    3

    101.58)=1.22

    entropy(vhigh) [bad 3 , fair , good , vgood !

    Entropy ( vhigh)=33 log2

    3

    3=0

    entropy(high) [bad , fair 1, good , vgood !

  • 7/26/2019 Contoh Implementasi Data Mining

    10/20

    Entropy (high )=1

    1 log2

    1

    1=0

    entropy(med) [bad , fair , good 1, vgood 2!

    Entropy (med )=1

    3 log2

    1

    3

    2

    3log2

    2

    3=0.92

    entropy(low) [bad , fair 1, good 1, vgood 1!

    Entropy ( low )=1

    3 log2

    1

    3

    1

    3log2

    1

    31

    3log2

    1

    3=1.58

    $. 6ain Doors

    Gain (S , Doors )=1.97( 6101.79)+( 410 1.50)=0.29entropy(2) [bad 3 , fair 1, good 1, vgood 1!

    Entropy (2 )=36 log2

    3

    6

    1

    6log2

    1

    6

    1

    6log2

    1

    6

    1

    6log2

    1

    6=1.79

    entropy(5more) [bad , fair 1 , good 1, vgood 2!

    Entropy (2 )=14 log2

    1

    4 1

    4log2

    1

    42

    4log2

    2

    4=1.50

    d. 6ain 'ersons

    Gain (S , Persons )=1.97( 3100)+( 4101.50)+( 3101.58)=0.89entropy(2) [bad 3 , fair , good , vgood !

    Entropy (2 )=33 log2

    3

    3=0

    entropy(4) [bad , fair 1 , good 1, vgood 2!

    Entropy (4 )=1

    4

    log21

    4

    1

    4

    log21

    4

    2

    4

    log22

    4

    =1.50

    entropy(more) [bad , fair 1 , good 1, vgood 1!

    Entropy (more )=13 log2

    1

    3

    1

    3log2

    1

    3

    1

    3log2

    1

    3=1.58

    e. 6ain uggage

    Gain (S , Luggage )=1.97( 4101.50)+( 3

    100.92)+( 3101.58)=0.62

    entropy(Big) [bad , fair 1, good 1, vgood 2!

    Entropy (big )=14 log2

    1

    4

    1

    4log2

    1

    4

    2

    4log 2

    2

    4=1.50

    entropy("ed) [bad 2 , fair , good , vgood 1!

    Entropy (med )=23 log2

    23 1

    3log2

    13=0.92

    entropy(small) [bad 1 , fair 1 , good 1, vgood !

    Entropy ( small )=13 log2

    1

    3

    1

    3log2

    1

    31

    3log2

    1

    3=1.58

    f. 6ain Safety

    Gain (S , Luggage )=1.97( 7101.84)+( 2

    101)+( 1100)=0.48

    entropy(#igh) [bad 1 , fair 2, good 1, vgood 3!

    Entropy (high )=1

    7

    log21

    7

    2

    7

    log22

    7

    1

    7

    log21

    7

    3

    7

    log23

    7

    =1.84

  • 7/26/2019 Contoh Implementasi Data Mining

    11/20

    entropy("ed) [bad 1 , fair , good 1, vgood !

    Entropy (med )=1

    2 log2

    1

    21

    2log2

    1

    2=1

    entropy($ow) [bad 1 , fair , good , vgood !

    Entropy ( low )=11 log2 11=

    0

    ). Membandingkan hasil 6ain dari setiap atribut dan memilih 6ain yang

    paling besar untuk dijadikan root. 6ain yang paling besar adalah 6ain

    Buying dengan nilai 1.)/.

    'ohon yang terbentuk adalah sebagai berikut&

    6ambar / 'ohon Keputusan Dengan1oot 2 "uying

    Keterangan&

    Atribut high dan lo+ sudah mendapatkan hasil klasifikasinya karena nilai

    entorpy dari high dan lo+ sudah pasti. Sedangkan atribut !high dan med

    harus dihitung kembali untuk menentukan leaf selanjutnya.

    . akukan kembali perhitungan untuk menentukan leaf dari pohon

    keputusan tersebut.Menghitung -ntropy "S# berdasarkan atribut Buying "!high, med#.

    Buying, @high

    Entropy ( vhigh)=3

    4 log2

    3

    4

    1

    4log2

    1

    4=0.81

    a. 6ain Maint

    Gain (S , Maint)=0.81( 340)+(1

    40)=0.81

    entropy(vhigh) [bad 3, fair !

    Entropy ( vhigh)=33 log2

    3

    3=0

    entropy(low) [bad , fair 1!

    Entropy ( low )=1

    1 log2

    1

    1=0

    b. 6ain Doors

    Gain (S , Doors )=0.81(340)+(140)=0.81entropy(2) [bad 3, fair !

    Entropy (2 )=33 log2

    3

    3=0

    entropy(5 more) [bad , fair 1!

  • 7/26/2019 Contoh Implementasi Data Mining

    12/20

    Entropy (5more )=1

    1 log2

    1

    1=0

    $. 6ain 'ersons

    Gain(S , Persons

    )=0.81

    (3

    40

    )+(1

    40

    )=0.81

    entropy(2) [bad 3, fair !

    Entropy (2 )=33 log2

    3

    3=0

    entropy(more) [bad , fair 1!

    Entropy (more )=1

    1 log2

    1

    1=0

    d. 6ain uggage

    Gain (S , Luggage )=0.81(250)+( 250)+(150)=0.81entropy(small) [bad 2 , fair !

    Entropy ( small )=22 log2

    2

    2=0

    entropy(med) [bad 2 , fair !

    Entropy (med )=2

    2 log2

    2

    2=0

    entropy(big) [bad , fair 1!

    Entropy (big )=11 log2

    1

    1=0

    e. 6ain Safety

    Gain (S , Luggage )=0.81

    (2

    41

    )+

    (1

    4 0

    )+

    (1

    40

    )=0.31

    entropy(high) [bad 1 , fair 1 !

    Entropy (high )=12 log2

    1

    2

    1

    2log2

    1

    2=1

    entropy(med) [bad 1 , fair !

    Entropy (med )=1

    1 log2

    1

    1=0

    entropy(low) [bad 1 , fair !

    Entropy ( low )=11 log2

    1

    1=0

    3. Membandingkan hasil 6ain dari setiap atribut dan memilih 6ain yang

    paling besar untuk dijadikan leaf selanjutnya. Karena nilai 6ain antara

    maint, doors, persons dan luggage sama maka diambil nilai gain maint

    yaitu 0.41.

    'ohon yang terbentuk adalah sebagai berikut&

  • 7/26/2019 Contoh Implementasi Data Mining

    13/20

    6ambar ) 'ohon Keputusan Dengan leaf 2 Maint

    Keterangan&Atribut !high dan lo+ dari leaf maint sudah mendapatkan hasil klasifikasinya

    karena nilai entorpy dari !high dan lo+ sudah pasti maka tidak akan di$ari

    leaf untuk atribut maint.

    ;. akukan kembali perhitungan untuk menentukan leaf dari pohon

    keputusan tersebut.

    Menghitung -ntropy "S# berdasarkan atribut Buying "!high, med#.

    Buying, Med

    Entropy (med )=14 log2

    1

    4

    3

    4log2

    3

    4=0.81

    a. 6ain Maint

    Gain (S , Maint)=0.81( 240)+(240)=0.31entropy(med) [good , vgood 2 !

    Entropy (med )=2

    2 log2

    2

    2=0

    entropy(low) [good 1, vgood 1!

    Entropy ( low )=12 log2

    1

    2

    1

    2log2

    1

    2=1

    b. 6ain Doors

    Gain (S , Doors )=0.81(140)+(

    340.92)=0.12

    entropy(2) [good , vgood 1 !

    Entropy (2 )=1

    1 log2

    1

    1=0

    entropy(5 more) [good 1, vgood 2!

    Entropy (5more )=13 log2

    1

    3

    2

    3log2

    2

    3=0.92

    $. 6ain 'ersons

    Gain (S , Persons )=0.81

    (

    2

    4

    1

    )+

    (

    2

    4

    0

    )=0.31

  • 7/26/2019 Contoh Implementasi Data Mining

    14/20

    entropy(more) [good 1, vgood 1 !

    Entropy (more )=1

    2 log2

    1

    2

    1

    2log2

    1

    2=1

    entropy(4) [good , vgood 2!

    Entropy (4 )=22 log2 22=

    0

    d. 6ain uggage

    Gain (S,luggage )=0.81( 34 0.92)+(1

    40)=0.12

    entropy(big) [good 1, vgood 2 !

    Entropy (big )=1

    3 log2

    1

    3

    2

    3log2

    2

    3=0.92

    entropy(med) [good , vgood 1!

    Entropy (med )=11 log2

    1

    1=0

    e. 6ain Safety

    Gain (S , saety )=0.81(34 0)+(1

    40)=0.81

    entropy(high) [good , vgood 3 !

    Entropy(high)=33 log2

    3

    3=0

    entropy(med) [good 1, vgood !

    Entropy (med )=1

    1 log2

    1

    1=0

    . Membandingkan hasil 6ain dari setiap atribut dan memilih 6ain yang

    paling besar untuk dijadikan leaf selanjutnya.

  • 7/26/2019 Contoh Implementasi Data Mining

    15/20

    8ntuk melakukan pengujian terhadap desain pemodelan digunakan data :raining

    Set dan Cross @alidation. Metode klasifikasi akan menghasilkan prediksi

    klasifikasinya dengan baik jika menggunakan data :raining Set. Biasanya data

    training dan data testing dibagi menjadi 40&/0 dari data keseluruhan. Data

    training digunakan untuk men$ari pemodelan yang tepat sedangkan data testing

    digunakan untuk menguji pemodelan yang dihasilkan. Metode Cross @alidation

    membagi data menjadi dua bagian, yaitu data pelatihan dan data pengujian.

    Selanjutnya, setelah data diuji dilakukan proses silang dimana data pengujian

    lantas dijadikan data pelatihan ataupun sebaliknya, data pelatihan sebelumnya

    dijadikan kini menjadi data pengujian.

    8171 0*i)d Mode)

    Berikut adalah langkahlangkah pembangunan model menggunakan aplikasi

    -KA.

    1. Membuka aplikasi -KA sehingga mun$ul tampilan seperti berikut.

    6ambar 3 :ampilan A+al -KA

    /. Membuka >ile yang berektensi .$s! atau .arff untuk dilakukan training

    data.

  • 7/26/2019 Contoh Implementasi Data Mining

    16/20

    6ambar ; Membuka file Car.$s!

    ). :ampilan data yang siap di mining menggunakan -KA.

    6ambar :ampilan Data Eang Siap Di Mining

    . Memilih metode yang digunakan "5D)#

  • 7/26/2019 Contoh Implementasi Data Mining

    17/20

    6ambar 4 'emilihan Metode

    3. :ampilan 'engujian Metode 5D) Menggunakan :raining Set

    6ambar F :ampilan 'engujian :raining Set

  • 7/26/2019 Contoh Implementasi Data Mining

    18/20

    ;. :ampilan 'engujian Menggunakan Cross @alidation

    6ambar 10 :ampilan 'engujian Cross @alidation

    8181 A,,e,, Mode)

    %asil ketepatan dari masingmasing teknik dapat dilihat pada gambar 11 dan 1/.

    6ambar 11 :ampilan Akurasi Dengan :raining Set

  • 7/26/2019 Contoh Implementasi Data Mining

    19/20

    6ambar 1/ :ampilan Akurasi Dengan Cross @alidation

    #1 E+a)*ation

    #1$ E+a)*ate Re,*)t'roses modelling dilakukan dengan metode klasifikasi dengan algoritma

    De$ision :ree "5D)#. Dengan menggunakan 1/11 training data, proses modelling

    menghasilkan hasil sebagai berikut &

    :able ) :ingkat Akurasi Model 5D)

    Metode 8ji :raining Set Metode 8ji Cross @alidation

    De$ision :ree "5D)# 100 G 4F,3F G

    Dari hasil pengujian akurasi dari metode uji training set men$apai 100G, namun

    untuk pengujian akurasi dari metode uji $ross !alidation men$apai 4F,3FG. Dapat

    disimpulkan bah+a pengujian menggunakan training set lebih akurat.

    #1& Re+iew /ro4e,,

    'roses data mining klasifikasi kualitas mobil berdasarkan spesifikasinya

    dilakukan dalam langkahlangkah berikut &

  • 7/26/2019 Contoh Implementasi Data Mining

    20/20

    a. 0*,ine,, Under,tanding ( merupakan proses pemahaman terhadap domain

    permasalahana dan menentukan data yang akan digunakan dalam proses data

    mining.

    b. Data *nder,tanding( meliputi proses pengumpulan data,$. Data preparation( Meliputi proses $leaning data.

    d. Mode))ing ( dilakukan dengan menggunakan metode klasifikasi yaitu de$ision

    tree "5D)# dan / metode pengujian ":raining Set dan Cross @alidation#.

    e. E+a)*ation ( %asil dari modelling yang telah dilakukan bah+a metode

    klasifikasi menggunakan 5D) $o$ok untuk kasus mengklasifikasikan kualitas

    mobil dengan tingkat akurasi data sebesar 4F,3FG "$ross !alidation# dan tingkat

    akurasi data 100G"training set#.