MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data...
Transcript of MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data...
![Page 1: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/1.jpg)
MANAJEMEN DATA FRAME DALAM R
![Page 2: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/2.jpg)
Objek Data dalam R
Vector 1 dimensi Semua elemen memiliki tipe
data yg sama
Tipe data:
numeric, character
logical, factor
Matrix 2 dimensi
Array 2 atau lebih
dimensi
Data frame 2 dimens table-like data object allowing
different data types for
different columns
List Koleksi dari objek data, setiap elemen list
adalah objek data
![Page 3: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/3.jpg)
Manipulating Data Objects
Menciptakan c(), rep(), seq() numeric(),character(),factor(),logical()
matrix(), array(), data.frame(), list()
Menyimpan
Memanggil
save(), load()
(internal data file) Importing
Exporting
read.table(), write.table()
(external data file)
Converting as.numeric(),as.character(),as.factor(),as.logical()
as.matrix(), as.array(), as.data.frame(), as.list()
Naming
Indexing
Selecting
names(), clonames(), rownames()
[ i ] (for vector), [ i, j] (for matrix and data frame),
[ i, j, k, …] (for array), [ [ k ] ] (for list)
j, k, can be integer or character or logical index
Combining c(), paste(), cbind(), rbind(), merge()
Sorting sort(), order()
Misc. class(), length(), dim(), nrow(), ncol() ………
![Page 4: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/4.jpg)
Materi:
•Menciptakan variabel baru dalam dataframe
•Subsetting data
•Sorting data
•Recoding data
•Merging data
•Reshaping data
![Page 5: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/5.jpg)
Menciptakan Variabel Baru dalam Data Frame
• Lakukan seperti menciptakan vektor dengan menggunakan index atau operator seleksi
– dt$baru <- ekspresi
![Page 6: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/6.jpg)
Subsetting Data
• Hal penting untuk Subsetting data adalah membuat vektor logical seperti yg diinginkan.
• Harus dapat menterjemahkan idea rumit ke dalam vektor logic
• Fungsi yang digunakan :
==, !=, >, >=, <, <=, %in%, duplicated,
is.na, is.null, is.numeric, dll…
![Page 7: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/7.jpg)
Ilustrasi Subsetting Data
Misalkan diinginkan dataset baru yang memenuhi females di atas 7 pada v1 tetapi di bawah 10 pada v10, dan males jika non-missing pada v4
Original dataset, a
![Page 8: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/8.jpg)
Sorting Data
• Langkah 1 – Buat vektor numerik yang terurut dari data yang akan diurutkan
• Langkah 2 – Gunakan vektor ini sebagai index
• Fungsi yang berguna: order(), sort(), which(), rev(), unique()
![Page 9: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/9.jpg)
Ilustrasi Sorting Data
Dataframe:
Katakan akan diurutkan berdasarkan gender kemudian v1 jika male dan v2 apabila female secara ascending?
![Page 10: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/10.jpg)
• Langkah 1 - Buat vektor numerik yang terurut dari data yang akan diurutkan
• Step 2 - Gunakan vektor ini sebagai index
Ilustrasi Sorting
![Page 11: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/11.jpg)
Recoding Data
• Paling umum menggunakan logical:
dta$grupumur<-1*(dta$AGE<=30)+2*(dta$AGE>30)
• Dapat menggunakan fungsi ifelse
dta$grupumur<-ifelse(dta$AGE %in% 1:30,1,2)
• Menggunakan fungsi recode (ada dalam paket car):
dta$grupumur = recode(dta$AGE,’1:30=1; else=2’)
![Page 12: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/12.jpg)
Merging Data
• Menggunakan rbind atau cbind
• Lebih mudah menggunakan fungsi merge
![Page 13: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/13.jpg)
Ilustrasi Merging Data
![Page 14: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/14.jpg)
Reshaping Data
• Membentuk data set baru dengan cara:
– Long to wide data format
– Wide to long data format
• Menggunakan fungsi reshape()
![Page 15: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/15.jpg)
Ilustrasi: reshape(): long to wide data formats
df3 is in ‘long’ format
You must use two arguments:
•idvar = 1+ variables in long format identifying rows that are the same individual
•timevar = 1 variable that differentiates multiple records from same individual
‘wide’ format
![Page 16: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/16.jpg)
Ilustrasi: reshape(): long to wide data formats
df3 is in ‘long’ format
•idvar = 1+ variables in long format identifying rows that are the same individual
•timevar = 1 variable that differentiates multiple records from same individual
An alternative ‘wide’ format
![Page 17: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/17.jpg)
Ilustrasi: reshape(): wide to long data formats
wd is in ‘wide’ format
•varying = a LIST of column names in wide format that will be the same columns in the long format
•v.names = a vector of names of the new columns in the long format
![Page 18: MANAJEMEN DATA FRAME DALAM R 2...Objek Data dalam R Vector 1 dimensi Semua elemen memiliki tipe data yg sama Tipe data: numeric, character logical, factor Matrix 2 dimensi Array 2](https://reader036.fdocuments.net/reader036/viewer/2022071301/609711d98c97cb70977f8452/html5/thumbnails/18.jpg)
TUGAS
• Lakukan merging dua data set A dan B tanpa menggunakan fungsi merge