Suharyadi Purwanto_statistika_14 BAB 15 Analisis Regresi Dan Korelasi
-
Upload
statistikbisnis -
Category
Documents
-
view
552 -
download
93
description
Transcript of Suharyadi Purwanto_statistika_14 BAB 15 Analisis Regresi Dan Korelasi
OUTLINE
2
Fungsi, Variabel, dan Masalah dalam
Analisis Regresi
Bagian I Statistik Induktif
Metode dan Distribusi Sampling
Teori Pendugaan Statistik
Pengujian hipotesis Sampel Besar
Pengujian hipotesis Sampel Kecil
Analisis Regresi dan Korelasi Linier
Analisis Regresi dan Korelasi Berganda
Pengertian Korelasi Sederhana
Kesalahan Baku Pendugaan
Perkiraan Interval dan Pengujian
hipotesis
Hubungan Koefisien Korelasi, Koefisien
Determinasi dan Kesalahan Baku
Pendugaan
Analisis Regresi: Metode Kuadrat Terkecil
Asumsi-asumsi Metode Kuadrat Terkecil
Uji Signifikansi Koefisien Korelasi
PENGERTIAN ANALISIS KORELASI
Analisis Korelasi
•Suatu teknik statistika yang digunakan untuk mengukurkeeratan hubungan ataukorelasi antara dua variabel.
3
HUBUNGAN POSITIF DAN NEGATIF
4
Hubungan Produksi danHarga Minyak Goreng
(Korelasi Positif)
0
100
200
300
400
500
600
700
637 740 722 781 849 881
Harga Minyak Goreng
Hubungan Inflasi dan SukuBunga (Korelasi Negatif)
0
5
10
15
20
25
30
35
2,01 9,35 12,55 10,33
Inflasi
Gambar pertama menunjukkan hubunganantara variabel inflasi dan suku bunga. Apabiladilihat pada gambar saat inflasi rendah, makasuku bunga tinggi dan pada saat inflasi tinggi, suku bunga rendah. Gambar tersebutmenunjukkan adanya hubungan antara inflasidan suku bunga yang bersifat negatif.
Gambar kedua memperlihatkan hubunganyang positif antara variabel produksi dan hargaminyak goreng yaitu apabila harga meningkat, maka produksi juga meningkat.
RUMUS KOEFISIEN KORELASI
5
Rumus di atas adalah rumus koefiseien regresi, di mana:
r : Nilai koefisien korelasi
ΣX : Jumlah pengamatan variabel X
ΣY : Jumlah pengamatan variabel Y
ΣXY : Jumlah hasil perkalian variabel X dan Y
(ΣX2) : Jumlah kuadrat dari pengamatan variabel X
(ΣX)2 : Jumlah kuadrat dari jumlah pengamatan variabel X
(ΣY2) : Jumlah kuadrat dari pengamatan variabel Y
(ΣY)2 : Jumlah kuadrat dari jumlah pengamatan variabel Y
n : Jumlah pasangan pengamatan Y dan X
2 22 2
n XY X Yr
n X X n Y Y
HUBUNGAN KUAT DAN LEMAHNYA SUATU KORELASI
6
0,0 0,5 1,0
Skala rKorelasi negatif Korelasi positif
Korelasi negatif
sempurnaKorelasi negatif
sedang
Korelasi negatifkuat
Korelasi negatiflemah
Korelasi positiflemah
Korelasi positifkuat
Korelasi positif
sedang
Korelasi positif
sempurnaTidak adaKorelasi
-0,5-1,0
CONTOH REGRESI LINIER
7
Tahun Produksi (juta ton) Harga (US $ per ton)
1997 4,54 271
1998 4,53 319
1999 5,03 411
2000 6,05 348
2001 6,09 287
2002 6,14 330
2003 6,37 383
2004 7,40 384
2005 7,22 472
2006 7,81 610
2007 8,49 640
Hubungan jumlah produksi dan harga minyak
CONTOH REGRESI LINIERHubungan jumlah produksi dan harga minyak
Rumus koefisien korelasi
8
2 22 2
n XY X Yr
n X X n Y Y
n Y X Y2 XY X2
1 4,54 271 20,61 1230,34 73441
2 4,53 319 20,52 1445,07 101761
3 5,03 411 25,30 2067,33 168921
4 6,05 348 36,60 2105,40 121104
5 6,09 287 37,09 1747,83 82369
6 6,14 330 37,70 2026,20 108900
7 6,37 383 40,58 2439,71 146689
8 7,40 384 54,76 2841,60 147456
9 7,22 472 52,13 3407,84 222784
10 7,81 610 61,00 4764,10 372100
11 8,49 640 72,08 5433,60 409600
12
PENGERTIAN KOEFISIEN DETERMINASI
Koefisien determinasiBagian dari keragaman total variabel tak bebas Y (variabel yang dipengaruhi atau dependent) yang dapat diterangkan atau diperhitungkanoleh keragaman variabel bebas X (variabel yang mempengaruhi atauindependent).
Koefisien determinasi r2
9
2
2
2 22 2
n XY X Yr
n X X n Y Y
RUMUS UJI t UNTUK UJI KORELASI
2
2
1
r nt
r
di mana:
t : Nilai t-hitung
r : Nilai koefisien korelasi
n : Jumlah data pengamatan
10
2-n
r-1
rt
2
atau
CONTOH UJI t UNTUK UJI KORELASI SOAL A
11
Ujilah apakah (a) nilai r = - 0,412 pada hubungan antara suku bunga dan investasi
dan (b) r = 0,86 pada hubungan antara harga minyak dan produksi kelapa sawit
sama dengan nol pada taraf nyata 5%?
1. Perumusan hipotesis:
hipotesis yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam populasi
dilambangkan dengan sedang pada sampel r.
H0 : r = 0
H1 : r ¹ 0
2. Taraf nyata 5% untuk uji dua arah (a/2=0,05/2=0,025) dengan derajat bebas (df) = n-k =
9 - 2 = 7. Nilai taraf nyata a/2= 0,025 dan df =7 adalah = 2,36. Ingat bahwa n adalah
jumlah data pengamatan yaitu = 9, sedangkan k adalah jumlah variabel yaitu Y dan X,
jadi k=2.
3. Menentukan nilai uji t
21,1
2-9
(,041)-1
0,41-
2-n
r-1
rt
22
CONTOH UJI t UNTUK UJI KORELASI
12
4. Menentukan daerah keputusan dengan nilai kritis 2,36
Daerah menolak Ho Daerah menolak Ho
–2,36 t = –1,21 2,36
Daerah tidak menolak Ho
5. Menentukan keputusan. Nilai t-hitung ternyata terletak pada daerah tidak
menolak H0. Ini menunjukkan bahwa tidak terdapat cukup bukti untuk menolak
H0, sehingga dapat disimpulkan bahwa korelasi dalam populasi sama dengan nol,
hubungan antara tingkat suku bunga dengan investasi lemah dan tidak nyata.
CONTOH UJI T UNTUK UJI KORELASI SOAL B
13
1.Perumusan hipotesis:
hipotesis yang diuji adalah koefisien korelasi sama dengan nol. Korelasi dalam
populasi dilambangkan dengansedang pada sampel r.
H0 : r = 0
H1 : r 0
2.Taraf nyata 5% untuk uji dua arah (a/2=0,05/2=0,025) dengan derajat bebas (df)
= n-k = 12 - 2 = 10. Nilai taraf nyata a/2=0,025 dan df =10 adalah = 2,23.
3. Menentukan nilai uji t
33,5
2-12
(0,86)-1
0,86
2-n
r-1
rt
22
RUMUS KOEFISIEN DETERMINASI
14
4. Menentukan daerah keputusan dengan nilai kritis 2,23
Daerah menolak HoDaerah tidak menolak Ho
Daerah menolak Ho
–2,23 t= 5,332,23
5. Menentukan keputusan. Nilai t-hitung berada di daerah menolak H0, yang berarti
bahwa H0 di tolak dan menerima H1. Ini menunjukkan bahwa koefisien korelasi
pada populasi tidak sama dengan nol, dan ini membuktikan bahwa terdapat
hubungan yang kuat dan nyata antara harga minyak dan produksi kelapa sawit.
RUMUS PERSAMAAN REGRESI
• Persamaan regresi
Suatu persamaan matematika yang mendefinisikan
hubungan antara dua variabel.
17
SCATTER DIAGRAM UNTUK MEMBANTU MENARIK GARIS REGRESI
18
Hubungan Inflasi dan Suku Bunga
0
5
10
15
20
25
30
35
2,01 9,35 12,55 10,33Inflasi
Scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut:
Gambar A
SCATTER DIAGRAM UNTUK MEMBANTU MENARIK GARIS REGRESI
19
Scatter diagram untuk hubungan antara inflasi dan suku bunga dapat digambarkan sebagai berikut:
Gambar B
Hubungan Inflasi dan Suku Bunga
0
5
10
15
20
25
30
35
2,01 9,35 12,55 10,33Inflasi
a
bd
c
CONTOH SELISIH ANTARA DUGAAN DAN AKTUAL LEBIH KECIL
20
Gambar A: selisih antara dugaan dan aktual lebih kecil
e1
Y1e2
Y2 e3
Y3
Y4
e4Y5
e5
Yn
en
0
5
10
15
20
25
30
35
2.01 9.35 12.55 10.33
Su
ku
Bu
ng
a
Inflasi
Hubungan Inflasi dan Suku Bunga
e1
Y1e2
Y2 e3
Y3
Y4
e4
Yn
en
CONTOH SELISIH ANTARA DUGAAN DAN AKTUAL LEBIH BESAR
21
e3
Y3
0
5
10
15
20
25
30
35
2.01 9.35 12.55 10.33
Su
ku
Bu
nga
Inflasi
Hubungan Inflasi dan Suku Bunga
e1
Y1
Y2e2
Y4e4
e5
Y5
Ynen
RUMUS MENCARI KOEFISIEN a DAN b
23
22 )X()X(n
)X)(X()XYna
b
)X(b
n
)Y(b
Y : Nilai variabel bebas Y
a : Intersep yaitu titik potong garis dengan sumbu Y
b : Slope atau kemiringan garis yaitu perubahan rata-rata pada untuk setiap unit
perubahan pada variabel X
X : Nilai variabel bebas X
n : Jumlah sampel
Y
CONTOH HUBUNGAN ANTARA PRODUKSI DENGAN HARGA MINYAK KELAPA SAWIT
24
= a + b X
Yi X = 2,8631 + 0,0086 X e=Y-
4,54 271 = 2,8631 + 0,0086 x 271 5.1853 -0.6453
4,53 319 = 2,8631 + 0,0086 x 319 5.5966 -1.0666
5,03 411 = 2,8631 + 0,0086 x 411 6.3850 -1.3550
6,05 348 = 2,8631 + 0,0086 x 348 5.8451 0.2049
6,09 287 = 2,8631 + 0,0086 x 287 5.3224 0.7676
6,14 330 = 2,8631 + 0,0086 x 330 5.6909 0.4491
6,37 383 = 2,8631 + 0,0086 x 383 6.1450 0.2250
7,40 384 = 2,8631 + 0,0086 x 384 6.1536 1.2464
7,22 472 = 2,8631 + 0,0086 x 472 6.9077 0.3123
7,81 610 = 2,8631 + 0,0086 x 610 8.0902 -0.2802
8,49 640 = 2,8631 + 0,0086 x 640 8.3473 0.1427
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y Y Y
Y
CONTOH HUBUNGAN ANTARA PRODUKSI DENGAN HARGA MINYAK KELAPA SAWIT
25
Persamaan = 2,8631 + 0,0086 X.
0
2
4
6
8
10
271 287 319 330 348 383 384 411 472 610 640
Harga Minyak
Pro
duksi
Y Y'
Y
Gambar A: Koordinat antara Y dan Y
CONTOH HUBUNGAN ANTARA PRODUKSI DENGAN HARGA MINYAK KELAPA SAWIT
26
0
2
4
6
8
10
271 287 319 330 348 383 384 411 472 610 640
Harga
Pro
duksi
Y = Y'
Persamaan = 2,8631 + 0,0086 X.
Gambar B: Koordinat antara Y dan , dimana Y =
Y
Y Y
DEFINISI STANDAR ERROR
Standar error atau kesalahan baku Pendugaan
Suatu ukuran yang mengukur ketidakakuratanpencaran atau persebaran nilai-nilai pengamatan (Y) terhadap garis regresinya (Ŷ).
27
Y
RUMUS STANDAR ERROR
28
22
22
n
)YY(
n
eSyx
Di mana:
Sy.xC : Standar error variabel Y berdasarkan variabel X yang diketahui
Y : Nilai pengamatan dari Y
: Nilai dugaan dari Y
n : Jumlah sampel, derajat bebas n-2 karena terdapat dua parameter
yang akan digunakan yaitu a dan b.
Y
YGaris regresi
Satu deviasistandar
Nilai tengah terletakpada garis regresi
X1 X2 X3 X
31
Beberapa asumsi penting metode kuadrat terkecil adalah sebagai berikut:
1. Nilai rata-rata dari error term atau expected value untuk setiap nilai X sama dengan nol. Asumsi inidinyatakan E(ei/Xi) = 0.
2. Nilai error dari Ei dan Ej atau biasa disebut dengan kovarian saling tidak berhubungan atauberkorelasi. Asumsi ini biasa dilambangkan sebagai berikut, Cov (Ei, Ej) = 0, di mana i ¹ j. Berdasarkan pada asumsi nomor 1, pada setiap nilai Xi akan terdapat Ei, dan untuk Xj akanada Ej, yang dimaksud dengan nilai kovarian = 0 adalah nilai Ei dari Xi tidak ada hubungandengan nilai Ej dari Xj.
.
ASUMSI METODE KUADRAT TERKECIL
32
3. Varian dari error bersifat konstan. Ingat bahwa varian dilambangkan dengan s2, sehinggaasumsi ini dilambangkan dengan Var (Ei/Ej) = E(ei – ej)2 = s2. Anda perhatikan pada gambardi atas bahwa nilai Ei (yang dilambangkan dengan tanda titik) untuk setiap X yaitu X1, X2 danX3 tersebar secara konstan sebesar variannya yaitu s2. Pada gambar tersebut nilai E tersebar1 standar deviasi di bawah garis regresi dan 1 standar deviasi di atas garis regresi. Seluruhsebaran nilai Ei untuk Xi dan Ej untuk Xj, di mana i ¹ j terlihat sama dengan ditunjukkan kurvayang berbentuk simetris dengan ukuran yang sama, hal inilah yang dikenal dengan variansdari error bersifat konstan.
4. Variabel bebas X tidak berkorelasi dengan error term E, ini biasa dilambangkan dengan Cov(Ei, Xi) = 0. Pada garis regresi Y=a + bxi + ei maka nilai Xi dan Ei tidak salingmempengaruhi, sebab apabila saling mempengaruhi maka pengaruh masing-masing yaitu X dan E tidak saling dapat dipisahkan. Ingat bahwa yang mempengaruhi Y selain X adalah pastiE yaitu faktor diluar X. Oleh sebab itu varians dari E dan X saling terpisah atau tidakberkorelasi.
ASUMSI METODE KUADRAT TERKECIL
n/)X(X
)XX(
n)S(tY yx 22
21
33
: Nilai dugaan dari Y untuk nilai X tertentu
t : Nilai t-tabel untuk taraf nyata tertentu
Sy.x : Standar error variabel Y berdasarkan variabel X yang diketahui
X : Nilai data pengamatan variabel bebas
X : Nilai rata-rata data pengamatan variabel bebas
n : Jumlah sampel
Y
RUMUS
34
Dengan menggunakan asumsi bahwa nilai Ei bersifat normal, maka hasil dugaan a danb juga mengikuti distribusi normal. Sehingga nilai t = (b – B)/b, juga merupakanvariabel normal. Dalam praktiknya nilai standar deviasi populasi b sulitdiketahui, maka standar deviasi populasi biasa diduga dengan standar deviasi sampelyaitu Sb, sehingga nilai t menjadi t = (b – B)/Sb. Selanjutnya probabilitasnyadinyatakan sebagai berikut:
P(-ta/2 (b – B)/Sb ta/2 ) = 1 - a
P(-ta/2. Sb (b – B) ta/2 . Sb) = 1 - a
Sehingga interval B adalah:(b -ta/2. Sb B b + ta/2 . Sb)
sedangkan dengan cara yang sama interval A adalah:(a -ta/2. Sa A a + ta/2 . Sa)
di mana Sa dan Sb adalah sebagai berikut:Sb = Sy.x / [ X2 – (X)2/n]Sa = (X2.Sy.x)/ (nX2 – (X)2)
PENDUGAAN INTERVAL NILAI KOEFISIEN REGRESI A DAN B
35
Di mana:
Y adalah nilai sebenarnya, adalah nilai regresi
e adalah error atau kesalahan
Analisis varians atau ANOVA merupakan alat atau peranti yang dapat menggambarkanhubungan antara koefisien korelasi, koefisien determinasi dan kesalahan bakupendugaan. Untuk mengukur kesalahan baku kita menghitung error yaitu selisih Y dengan atau dapat dinyatakan dalam bentuk persamaan:
e = Y –atau dalam bentuk lain yaitu
Y = + e
Y
Y
Y
ANALISIS VARIANS ATAU ANOVA