Statistik Terapan p.projo

64
STATISTIK STATISTIK TERAPAN TERAPAN Projo Danoedoro Jurusan Sains Informasi Geografis dan Pengembangan Wilayah

Transcript of Statistik Terapan p.projo

Page 1: Statistik Terapan p.projo

STATISTIK STATISTIK TERAPANTERAPAN

Projo Danoedoro

Jurusan Sains Informasi Geografis dan Pengembangan Wilayah

Page 2: Statistik Terapan p.projo

POKOK-POKOK MATERI

• Kuliah ini tidak membahas tentang dasar-dasar teori statistik, melainkan penerapan beberapa prinsip statistik dalam analisis geografis, khususnya dalam kaitannya dengan penggunaan peta (SIG dan PJ)

• Bersifat komplementer dengan Mata Kuliah Statistik dan Metode Penelitian SIGPW

Page 3: Statistik Terapan p.projo

Materi dari Projo:

• Error matrix untuk analisis akurasi peta/hasil interpretasi

• Aspek statistik pemrosesan citra

• Analisis Regresi untuk pemetaan kecenderungan (trend)

• Principal Component Analysis

• Beberapa aspek dari Geostatistik dan Trend Surface Analysis

Page 4: Statistik Terapan p.projo
Page 5: Statistik Terapan p.projo
Page 6: Statistik Terapan p.projo
Page 7: Statistik Terapan p.projo

Beberapa catatan• Prinsip yang sama dapat diterapkan untuk

mengevaluasi peta. Bukan hanya citra

• Untuk citra dan analisis digital, satuan perhitungan diberikan dalam piksel, sedangkan dalam analisis akurasi peta dengan SIG berbasis vektor, satuan ini bisa dalam satuan luas

• Untuk hasil interpretasi visual (misalnya foto udara) satuan yang biasa digunakan ialah jumlah satuan pemetaan tetapi metode ini sebenarnya mensyaratkan perlu-tidaknya penggabungan klas

Page 8: Statistik Terapan p.projo

Vektor nilai piksel

• Citra penginderaan jauh banyak yang dihasilkan dalam bentuk multispektral, sehingga setiap piksel setiap posisi baris i dan kolom j pada suatu saluran k akan mempunyai pasangan nilai lain pada saluran l dan seterusnya

• Suatu vektor nilai piksel disajikan dalam

bentuk: BVijk, yaitu nilai kecerahan pada baris

i, kolom j, saluran k.

Page 9: Statistik Terapan p.projo

Histogram citra

• Suatu citra yang tersusun atas sejumlah kolom dan baris piksel akan mempunyai distribusi frekuensi (kemunculan) nilai piksel, yang dapat disajikan dalam bentuk tabel maupun histogram

• Evaluasi atas citra dan upaya perbaikan kenampakannya --dalam hal tertentu-- dapat dilakukan tanpa melihat citranya, melainkan hanya dengan menganalisis histogramnya.

Page 10: Statistik Terapan p.projo

Rerata, kemencengan, kurtosis

• Mean (rerata) μ:

• Kemencengan:

(skewness)

• Kurtosis:

Page 11: Statistik Terapan p.projo

Tendensi sentral dan kemencengan (skewness)

Page 12: Statistik Terapan p.projo
Page 13: Statistik Terapan p.projo

• Histogram yang terdistribusi normal:• Kurtosis = 0 sempurna• Kurtosis >0 dan besar semakin curam• Kurtosis <0 dan kecil semakin landai

• Citra dengan kenampakan kontras antara dua jenis obyek yang secara spektral berbeda tajam tidak akan menyajikan histogram berkurva normal.

Contoh: citra inframerah dekat, tengah dan jauh untuk kenampakan darat dan tubuh air

Page 14: Statistik Terapan p.projo
Page 15: Statistik Terapan p.projo

Ukuran dispersi : variansi dan kovariansi

• Julat (range) : maxk – mink

• Variansi = (Sd)2 =

• Kovariansi

Page 16: Statistik Terapan p.projo
Page 17: Statistik Terapan p.projo
Page 18: Statistik Terapan p.projo

Mean =44.698477, Sd=32.388668 Mean =61.196332, Sd=13.541991

Page 19: Statistik Terapan p.projo
Page 20: Statistik Terapan p.projo
Page 21: Statistik Terapan p.projo

Mengukur kekuatan hubungan antar-variabel: korelasi

Tipe korelasi Skala pengukuran Karakteristik data

Product moment (r) Interval/ rasio Dapat digunakan untuk kedua macam skala

Spearman rank (rs) Ordinal Kedua variabel harus dinyatakan sebagai data berperingkat untuk kedua macam uji iniKendall’s tau () Ordinal

Biserial (rb) Nominal Salah satu merupakan variabel dikotomis, sedangkan yang lain punya > 2 macam nilai

Koefisien Phi ( atau r ) Nominal Kedua variabel harus dikotomis

Page 22: Statistik Terapan p.projo

Pustaka

• Shaw dan Wheeler (Wheeler). 1989 (1995). Statistical Techniques in Geographical Analysis. NY: John Wiley and Sons

• Watford, N. 1996. Geographical Data Analysis. NY: John Wiley and Sons

Page 23: Statistik Terapan p.projo

Pearson’s product moment

• Perhitungan melibatkan kovariansi• Kovariansi dapat dihitung dari populasi atau dari

sampel• Kovariansi populasi:

Kovariansi sampel:

Kovariansi dapat juga diartikan sebagai simpangan rerata dari satu himpunan observasi dari sentroid mereka (sentroid rerata)

Page 24: Statistik Terapan p.projo

• Rumus r (product moment) untuk N populasi:

• Rumus r (product moment) untuk n sampel:

• Rumus rs (spearman rank):

rs = 1 – (6D2)/N(N2-1)

Page 25: Statistik Terapan p.projo
Page 26: Statistik Terapan p.projo

rs = 1 – (6D2)/N(N2-1)

rs = 1- (6 x 5.5)/(50x(502-1)

= +0.9997

Net farm income

Page 27: Statistik Terapan p.projo

Koefisien Phi ()

• Digunakan untuk data tabel silang

• Hanya berlaku untuk dua variabel yang masing-masing bersifat dikotomis, disajikan dalam bentuk tabel kontingensi

• Rumus:

= AD – BC

[(A+B)(B+C)(A+C)(B+D)]

Page 28: Statistik Terapan p.projo

Tabel kontingensi untuk koefisien korelasi

Atribut a

Ada/setuju/ya, dsb. Tidak ada/ menolak/tidak, dsb

Atribut b

Ada/setuju/ya, dsb.

A B

Tidak ada/ menolak/tidak, dsb

C D

= AD – BC [(A+B)(B+C)(A+C)(B+D)]

Page 29: Statistik Terapan p.projo

ErosiAda Tidak ada

Lereng

Curam 11 13

Tidak curam

1 25

24

26

12 38 50

= AD – BC = (11x25) – (13 x 1) [(A+B)(B+C)(A+C)(B+D)] (24 x 14 x 12 x 38)

= + 0,4912

Page 30: Statistik Terapan p.projo

Peta batas administratif kecamatan

PETA PENGGUNAAN LAHAN KABUPATEN KARANGANYAR JAWA TENGAH

0 2 4 6 8 Km

Waduk

Batas Kecamatan

Batas Kabupaten

Batas Propinsi

Sungai

Legenda

N

EW

S

Sumber : Data Pokok Kabupaten Karanganyar Berupa Peta Digital Karakteristik Lahan

Kec. Colomadu

Kec. Gondangrejo

Kec. Jaten

Kec. Kebakkramat

Kec Tasikmadu

Kec.Mojogedang

Kec. Karanganyar

Kec. Kerjo

Kec. Jumantono

Kec. Matesih

Kec. Karangpandan

Kec. Jenawi

Kec. Ngargoyoso

Kec. Tawangmangu

Kec. JatiyosoKec. Jumapolo

Kec.Jatipuro

KAB. SUKOHARJO

KAB. SRAGEN

470000 mT

470000 mT

480000

480000

490000

490000

500000

500000

510000

510000

520000 mT

520000 mT

914

000

0 m

U

91400

00 mU

915

000

0 91500

00

916

000

0 91600

00

917

000

0 m

U

91700

00 mU

Prop. Jawa Tengah

Prop. DIY

Laut Jawa

Samudera Hindia

Kab. Karanganyar

Skala 1:180.000

Jenis analisis korelasi apa yang dapat kita lakukan dengan

dua macam peta ini?

Page 31: Statistik Terapan p.projo

Analisis Regresi

• Mengukur kekuatan hubungan dengan analisis korelasi

• Menerapan bentuk persamaan regresi yang sesuai

• Regresi linier berganda

• Beberapa catatan

Page 32: Statistik Terapan p.projo

Menganalisis hubungan: Beyond statistical consideration

• Menilai kekuatan hubungan tidak hanya bergantung pada observasi atas 2 variabel (x dan y) saja Perlu memperhatikan adanya pengaruh variabel lain

• Dengan mencoba ‘memecah’ data ke dalam ≥ 2 kategori, pengamatan mengenai ada-tidaknya hubungan bisa dikaji lebih mendalam dan akurat

Page 33: Statistik Terapan p.projo

ukuran rumah

pen

dap

atan

kel

uar

ga R =0,01

Pola permukiman teraturPola permukiman tidak teratur

ukuran rumah

pen

dap

atan

kel

uar

ga

ukuran rumah

pen

dap

atan

kel

uar

ga

R =0,75

R = -0,15

Page 34: Statistik Terapan p.projo

Menerapkan persamaan regresi

• Regresi linier: Y = a + bX + e• Y = variabel terikat• X = variabel bebas• a = intercept pada sumbu Y, yaitu nilai Y ketika X = 0• b = koefisien gradien/slope• e = error

a = (Y)(X2) – (X)(XY)

N X2 - (X)2

b = N XY - (X)(Y)

N X2 - (X)2

Page 35: Statistik Terapan p.projo

Contoh: persamaan regresi antara jumlah penduduk dengan jumlah toko (N=15)

Jumlah penduduk

(X)X2

Jumlah toko

(Y)Y2 XY

Wilayah A 9.204 84.713.616 95 9.025 874.380

Wilayah B 5.629 31.685.640 94 8.836 529.126

Wilayah C 17.883.

.

319.801.664.

.

271.

.

73.441.

.

4.846.293.

.

Wilayah O 14.830 219.928896 233 54.289 3.455.390

Jumlah 125.442 1.453.923.072 2.127 412.911 22.648.580

pddwil

Page 36: Statistik Terapan p.projo

Menerapkan persamaan regresi

Regresi linier: Y = a + bX + e

a = (2127)(1453923072) – (125442)(22648580) = 41.4

(15 x 1453923072) - 15735695360

b = (15) (22648580) - (125442)(2127) = 0,0120

(15 x 1453923072) - 15735695360

Persamaan regresi menjadi Y = 41,4 + 0,0120X

Page 37: Statistik Terapan p.projo
Page 38: Statistik Terapan p.projo
Page 39: Statistik Terapan p.projo

Regresi non linier?

• Bentuk umum:

• Logaritmik sederhana : Y = a + b.logX

• Eksponensial sederhana : Y = a.ebX

• Pangkat sederhana: Y = a.Xb

Tugas: Baca Shaw and Wheeler (1989) atau lainnya, untuk memahami model fungsi regresi non-linier

Page 40: Statistik Terapan p.projo

Regresi linier berganda

• Digunakan untuk menggambarkan hubungan matematis antara satu variabel terikat (Y) dengan beberapa variabel bebas (Xi)

• Menggunakan asumsi bahwa masing-masing variabel bebas Xi bersifat saling independen

Page 41: Statistik Terapan p.projo

• Bentuk umum:

Y = a + b1X1 + b2X2 + b3X3 + … + biXi + e

a = nilai intercept

b1 s/d bi = koefisien regresi parsial

e = error

• Tidak dapat digambarkan secara grafis, kecuali kalau hanya terdapat dua variabel bebas X1 dan X2.

• Pada kasus di mana hanya ada 2 variabel X1 dan X2, bentuk persamaan yang umum adalah

Page 42: Statistik Terapan p.projo

• Pada kasus di mana hanya ada 2 variabel X1 dan X2,

bentuk persamaan yang umum sebenarnya adalah

Y = a + b01.2 X1 + b02.1 X2 + edi mana b01.2 adalah koefisien regresi yang mewakili garis regresi Y vs X1, dengan asumsi X2 tetap (konstan). Begitu sebaliknya untuk b02.1.

• Bila persamaan di atas hanya digambarkan dengan b1 dan b2, maka perhitungan b1 dan b2 adalah sbb:

• b1 = (Y – Y)(X1 – X1)(X – X1) (X2-X2)2

Page 43: Statistik Terapan p.projo

• Korelasi berganda dan korelasi parsial

• Korelasi berganda : R =

• Korelasi parsial :

Page 44: Statistik Terapan p.projo

ANALISIS FAKTOR

• Analisis faktor diperlukan ketika dalam suatu penelitian ada ‘sejumlah besar’ variabel yang terlibat; khususnya ketika dalam mengamati variabel-variabel yang berpengaruh terhadap suatu fenomena Y, terdapat sejumlah besar Xi yang harus diperhitungkan kontribusinya

• Dalam analisis faktor, diasumsikan bahwa sejumlah besar variabel Xi tersebut belum tentu saling independen

Page 45: Statistik Terapan p.projo

ANALISIS FAKTOR• Analisis faktor juga diperlukan karena:

– Ada kebutuhan untuk mempelajari hubungan timbal-balik antar sejumlah besar variabel

– Untuk menilai masing-maisng faktor menurut keterkaitan variabel yang ada di dalam kelompoknya

– untuk digunakan sebagai dasar dalam ‘menyisihkan’ variabel yang tidak nyata

• Analisis faktor bertumpu pada data rasio/interval, yang besarannya dapat di’plot’ pada suatu sistem koordinat multi-dimensi. Perhatian utama analisis faktor adalah pada upaya penentuan sumbu-sumbu utama dari sejumlah variabel.

Page 46: Statistik Terapan p.projo

Beberapa jenis analisis faktor

TahapTahap Tipe pilihanTipe pilihan TerminologiTerminologi

Matriks korelasi (a) antar-variabel R-factoring

(b) Antar individu Q-factoring

Ekstraksi faktor inisial (a) Faktor yang terdefinisi

Principle Component

(b) Faktor terinferensi Factor analysis

Rotasi untuk mencapai faktor final

(a) Uncorrelated (tak-berkorelasi)

Ortogonal

(b) Correlated (berkorelasi)

Condong

Page 47: Statistik Terapan p.projo

Sumbu utama pertama

Sumbu utama kedua

Page 48: Statistik Terapan p.projo

Contoh analisis awal dengan melibatkan koefisien korelasi antar 3 variabel: Estimasi variabel rerata baru (atau ‘faktor’)

Lereng Elevasi Drainase permukaan

Lereng 1,0 0,6 0,7

Elevasi 0,6 1,0 0,8

Drainase permukaan 0,7 0,8 1,0

Jumlah korelasi= 2,3 2,4 2,5

Bobot faktor

(factor loadings)=

Jumlah setiap korelasi

(jumlah total korelasi)

Page 49: Statistik Terapan p.projo

VariabelVariabel Bobot faktorBobot faktor

(factor loading)(factor loading)

Kuadrat bobotKuadrat bobot

Lereng 2,3/(2,3+2,4+2,5) =

0,85

0,72

Elevasi 2,4/(7,2) =

0,89

0,79

Drainase permukaan 2,5/ (7,2) =

0,93

0,86

Nilai eigen (eigen value) =

(kuadrat bobot faktor)

2,37

Besarnya variansi faktor, dalam persen, adalah: (1/n), =nilai eigen

Sehingga untuk faktor I = 2,37/3 = 79%

Perhitungan untuk nilai eigen dan persentase faktor II, III dst biasanya tidak mungkin dilakukan secara manual, dan dilakukan secara iteratif (berulang) dengan komputer.

Page 50: Statistik Terapan p.projo

Sumbu utama pertama

Sumbu utama kedua

Nilai eigen

Total variansi:

% faktor

Page 51: Statistik Terapan p.projo

GEOSTATISTIKGEOSTATISTIK

• Concern utama: variabel acak yang terdistribusi dalam ruang, yang disebut sebagai ‘teregionalisasi’ (regionalized)

• Geostatistik dapat digunakan untuk melakukan ekstraksi sifat-sifat spasial dari variabel-variabel yang teregionalisasi

• Manfaat interpolasi klasifikasi

Page 52: Statistik Terapan p.projo

Analisis geostatistik

• Pioner: Krige (1951), di Afrika Selatan tambang emas

• Matheron dan Ghandin (1971) di Uni Soviet karakteristik tanah

• Konsep fundamental :

PRINSIP AUTOKORELASI SPASIAL

Page 53: Statistik Terapan p.projo

AUTOKORELASI DAN KRIGING

• Autokorelasi: hubungan statistik antar titik-titik yang diukur, di mana korelasi tergantung pada jarak dan arah yang memisahkan lokasi titik-titik tersebut.

• Prinsipnya: yang berdekatan lebih punya kemiripan daripada yang berjauhan. Semakin jauh, semakin tidak mirip

Page 54: Statistik Terapan p.projo

AUTOKORELASI: HUKUM GEOGRAFI YANG PERTAMA – MENURUT WALDO TOBLER

Page 55: Statistik Terapan p.projo

Autokorelasi dan Kriging

• Kriging memanfaatkan prinsip autokorelasi spasial, dan pada dasarnya merupakan ‘distance-weigthed interpolation’

• Kriging memberi bobot pada ruang di sekitar nilai-nilai yang diukur, untuk memprediksi nilai setiap titik pada lokasi baru

• Bobot tidak hanya pada titik-titik yang dievaluasi, melainkan juga titik yang akan diprediksi, dan juga susunan keruangan (spatial arrangement) –yaitu autokorekorelasi– titik-titik yang diukur

Page 56: Statistik Terapan p.projo

Kriging• Kriging menggunakan bobot berdasarkan

perhitungan statistik data, dan bukan bersifat a-priori (seperti pada scoring) menjadi pembeda kunci antara analisis deterministik (tradisional) dan analisis geostatistik

• Proses Kriging:– Kuantifikasi struktur spasial dari titik-titik data

di sekitar titik yang akan diprediksi– Menghasilkan prediksi pada suatu lokasi baru

Page 57: Statistik Terapan p.projo

Variografi, semivariogram• Variografi proses di mana model spasial

terplotkan secara tepat pada data, dan struktur spasialnya terkuantifikasi

• Semivariogram digunakan untuk mengkaitkan semivariansi dengan separasi spasial/ autokorelasi yang ada pada sampel

• Semivariansi memberikan deskripsi tak bias mengenai skala dan pola variabilitas spasial di seluruh wilayah kajian

Page 58: Statistik Terapan p.projo

Contoh komputasi semivariansi

• 12 nilai kecerahan secara individual (BV) yang terdapat pada suatu penampang/jalur

• (BV) z dari piksel x diekstrak dengan interval teratur z(x), di mana x = 1,2,3,…n

• Hubungan antara suatu pasangan piksel sejauh h interval dapat diberikan oleh nilai variansi rerata sepanjang penampang

• Ada m kemungkinan pasangan yang dipisahkan oleh lag distance h.

Page 59: Statistik Terapan p.projo

• Semivariogram (h) merupakan fungsi yang menkaitkan setengah dari pangkat perbedaan antara titik-titik sampel:

• Semivariansi rerata merupakan ukuran yang bagus untuk besarnya ketidakmiripan (dissimilarity) antar piksel-piksel yang secara spasial terpisah

Page 60: Statistik Terapan p.projo

Karakteristik terpenting dalam semivariogram:

Page 61: Statistik Terapan p.projo
Page 62: Statistik Terapan p.projo
Page 63: Statistik Terapan p.projo
Page 64: Statistik Terapan p.projo