Pengantar Analisis Peubah Ganda - PDII

Report
ANALISIS MULTIVARIATE
Oleh :
Dewi Harfina S. SSi., MSi.
Pusat Penelitian Kependudukan LIPI
Metode Penelitian Bidang Dokumentasi dan Informasi
Untuk Pustakawan LIPI
PDII – Jakarta, 15 – 16 Desember 2014
Analisis Multivariate


Variabel bebas/independence (X)
berjumlah lebih dari satu, sebanyak
n
Variabel tidak bebas/dependence (Y)
berjumlah lebih dari satu, sebanyak
m.


Dimana jumlan n> m
Jenis variabel bisa kategorik (nominal
dan ordinal) maupun numerik (interval
dan rasio)
Mengapa menggunakan analisis
multivariate ?


Dalam kenyataanya, untuk
menggambarkan suatu
permasalahan tidak cukup hanya
menggunakan satu variabel.
Suatu masalah sering dipengaruhi
oleh beberapa variabel, baik
variabel bebas maupun variabel
tidak bebas
Ilustrasi

Keselamatan bayi di Indonesia


Variabel Tidak bebas :Jumlah bayi yang
meninggal dari seorang ibu dan jumlah
bayi lahir selamat dari seorang ibu
Variabel Bebas : Jumlah anak yang
dilahirkan seorang ibu, kualitas dan
keberadaan tenaga kesehatan, dan
tingkat pendidikan ibu.
Teknis Multivariate

Teknik Dependence


Untuk menyelesaikan permasalahpermasalah mengenai hubungan antar
dua kelompok variabel
Teknik Interpendence


kedudukan variabel sama, tidak ada
ada variabel terikat.
Untuk melihat saling keterkaitan
hubungan antar semua variabel tanpa
memperhatikan bentuk variabel yang
dilibatkan.
Skema Teknis Analisis Multivariate
Regresi
Berganda
Analisis
Dependence
Diskriminan
Korelasi Kanonik
Manova
Analisis
Multivariate
Numerik
Faktor
Kluster
Multiidemisonal
Multideminsional
Scalling
Scalling
Analisis
Interpendence
Kategorik
Korespondensi
Regresi Linear Berganda




Melibatkan 1 variabel tidak bebas (Y=
numerik), dan > 1 variabel bebas (X =
numerik/kategorik)
Tujuan untuk memperkirakan/ meramalkan
nilai Y, jika X diketahui.
Hubungan antar variabel bersifat linear,
semua variabel X berpengaruh terhadap Y
dengan arah yang sama.
Antara X1 dan Xn tidak boleh berkorelasi
terlalu tinggi atau terlalu rendah
Regresi Linear Berganda
Ilustrasi:
 PT. CEMERLANG dalam beberapa bulan
gencar mempromosikan sejumlah peralatan
elektronik dengan membuka outlet di
berbagai daerah. Data yang dikumpulkan
meliputi jumlah penjualan (Y), biaya
Promosi (X1) dan Luas Outlet (X2) yang
berasal dari 15 daerah di Indonesia.
Perusahaan tersebut ingin memprediksi
penjualan, jika biaya promosi dan luas
outlet diketahui.
Analisis Diskriminan


Untuk memprediksi probabilitas
obyek penelitian menjadi 2 atau lebih
kategori dari variabel tidak bebas
(Y=kategorik/skala nominal)
berdasarkan beberapa variabel bebas
(X1, .... Xn) = numerik/skala interval.
Linear Discriminant, Quadratic
Discriminat, Canonical Discriminant,
Logistic Regression, Non-Parametric
Discriminant
Analisis Diskriminan
Ilustrasi :
 Jenis pelanggan kereta api dibagi
dua, yaitu mereka yang pengguna
jasa kereta api eksekutif dan
bisnis/ekonomi.
 Studi ini ingin mengetahui faktorfaktor yang berpengaruh terhadap
pembuatan klasifikasi tsb. Dan
apakah pengelompokan tersebut
signifikan atau tidak.
Analisis Korelasi Kanonik


Untuk melakukan analisis keterkaitan
antara dua gugus varibel yang terdiri dari
beberapa variabel.
untuk melihat hubungan liniearitas antara
variable-variabel tidak bebas dengan
beberapa variable bebas.
 Variabel bebas : lebih dari 2 berskala
interval.
 Variabel tidak bebas : lebih dari 2
berskala interval.
Analisis Korelasi Kanonik
Ilustrasi :
 Penelitian ini ingin mengetahui hubungan
korelasi antar sekumpulan variabel perilaku
(pembuatan daftar belanja, jumlah toko
yang dikunjungi, dan frekuensi belanja
dalam satu minggu) sebagai kriteria (Y)
dengan beberapa variable mengenai
personalitas (X), dan bagaimana beberapa
karakteristik personalitas tersebut
mempengaruhi perilaku berbelanja.
MANOVA



MANOVA = Multivariate Analysis of
Variance
Analog dengan ANOVA (analysis of
variance) pada analisis variabel
tunggal
Digunakan untuk membandingkan
rata-rata secara bersama antar
kelompok untuk dua atau lebih
variabel tidak bebas (Y1,...,Ym =
numerik/skala interval atau rasio)
MANOVA
Ilustrasi
 Sebuah studi ingin membandingkan
apakah ada perbedaan hasil panen
tiga buah varietas padi (A, B dan
C).
 Respon yang diamati adalah tinggi
tanaman ketika panen, bobot 100
butir padi, umur panen, panjang
galur.
Analisis Faktor



Untuk mereduksi variabel
Menghasilkan variabel baru yang
disebut FAKTOR atau VARIABEL
LATEN
Banyak digunakan di bidang
terapan sosial karena sulit
melakukan pengukuran secara
langsung terhadap variabel yang
diinginkan
Analisis Faktor
Ilustrasi :
 Penelitian ini ingin mengetahui sikap-sikap apa
saja yang mendasari orang mau memberikan
jawaban terhadap pertanyaan-pertanyaan
dalam suatu survei politik?
 Dari hasil penelitian didapatkan adanya
tumpang tindih antara berbagai sub-kelompok
butir-butir pertanyaan, misalnya pertanyaanpertanyaan mengenai masalah perpajakan
cenderung berkorelasi satu dengan lainnya,
masalah militer saling berkorelasi, masalah
ekonomi juga demikian.
Analisis Kluster



Digunakan untuk mengelompokkan
objek-objek
Kemiripan antar objek ditentukan
oleh nilai-nilai pengamatan variabel
bebas lebih dari dua.
Dikenal teknik berhirarki dan takberhirarki
Analisis Kluster
Ilustrasi
 Pemberian program bantuan
pengembangan sekolah tidak bisa
disamakan di setiap sekolah.
Berdasarkan karakteristik sekolah
(fasilitas, input siswa, mutu pengajar,
dukungan masyarakat), DEPDIKNAS
melakukan pengelompokan sekolah
sehingga diperoleh 4 kelompok SMU dan
4 jenis paket program pengembangan
SMU.
Multi Dimensional Scaling



Menghasilkan peta atau gambar posisi
objek berdasarkan matriks jarak yang
diketahui
Peta dihasilkan pada dimensi rendah
(umumnya dimensi dua) sehingga mudah
menginterpretasikan kedekatan antar
objek
Metric MDS vs Non-Metric MDS,
tergantung tipe peubahnya
Multi Dimensional Scaling
Ilustrasi :
 Responden diminta untuk menilai kemiripan
karakteristik antara mobil Honda dengan
mobil Suzuki, dilihat dari kemiripan
komponen-komponen sikap. Keterbukanya
komponen-komponen sikap tersebut akan
membantu menerangkan mengapa obyekobyek tersebut dinilai mempunyai
kemiripan/perbedaan antara keduannya.
Multi Dimensional Scaling

Peta Dua Dimensi
Analisis Korespondensi



Teknik eksplorasi yang diterapkan
untuk melihat asosiasi kategori
variabel kategorik
Menggunakan konsep Generalized
Singular Value Decomposition
Banyak digunakan di dunia riset
pemasaran
Ilustrasi

Melihat bagaimana citra
bank-bank yang berada di
lima kota besar (Jakarta,
Surabaya, Medan,
Bandung dan Semarang)
dengan menggunakan
metode korespondensi.
Sumber data


Data ini adalah data primer hasil
survei PT. Marketing Research
Indonesia (MRI) tentang citra
masyarakat terhadap bank-bank di
Indonesia pada bulan Januari 1997.
Target respondennya adalah:



Pria dan wanita berusia 15-60 tahun
Penghasilan minimum Rp 150.000,00
Menjadi nasabah di suatu bank
Bank-bank yang menjadi target
Bank Pemerintah
1.
Bank BNI’46
2.
Bank BRI
3.
Bank BDN
4.
Bank Exim
5.
Bank BTN
6.
Bank Bapindo
7.
Bank BPD
Bank Swasta
1.
Bank BCA
2.
Bank Lippo
3.
Bank Niaga
4.
Bank Danamon
5.
Bank Bali
6.
Bank BII
7.
Bank Duta
8.
Bank Bira
9.
Bank Utama
10.
Bank Universal
Bank Swasta
1. Bank Buana
2. Bank Modern
3. Bank SBU
4. Bank Tamara
5. Bank BUN
6. Bank Panin
7. Bank BHS
8. Bank Bukopin
9. Bank Pacific
10. Bank BDNI
Bank Asing
1. Citibank
2. Standard Chartered Bank
3. American Express Bank
Atribut Untuk Mengukur Citra Bank
Lokasinya strategis
B. Pelayanannya Profesional
C. Pelayanannya Cepat
D. Pelayanan staff-nya ramah
E. Produknya bervariasi
F. Memiliki fasilitas modern
G. Memiliki layanan
pembayaran rekening
tertentu
H. Memberikan
hadiah/undian
I.
Memberikan bunga lebih
tinggi
A.
J.
K.
L.
M.
N.
O.
P.
Q.
R.
S.
Setoran awal/ minimalnya
kecil
Biaya administrasinya
rendah
Cabangnya banyak
Bank yang terpercaya
Keamanannya terjamin
Didukung oleh grup yang
kuat
Bank-nya terkenal
Ada teman/saudara di
bank tersebut
Iklannya bagus
Bank yang sesuai untuk
saya
Plot Korespondensi
Interpretasi Gambar
Atribut terbagi menjadi 5 kelompok besar, yaitu:
1.
Atribut A,B,C,D,Q dan S bergerombol berdekatan
dengan hampir semua bank yang ada.
2.
Atribut I dan R terlihat bergerombol dan relatif
dekat dengan bank Danamon, Citibank dan
Universal.
3.
Atribut E,F,O dan H terlihat bergerombol dan relatif
dekat dengan bank BCA, Bali, American Express
dan Lippo.
4.
Atribut G,P dan L terlihat bergerombol dan relatif
dekat dengan bank BCA, BRI dan BNI.
5.
Atribut J,K,M dan N terlihat bergerombol dan relatif
dekat dengan bank BRI dan BNI
Analisis Korespondensi
Ilustrasi
Segmentasi produk bisa dilakukan
berdasarkan variabel demografi
konsumen. Melalui analisis ini bisa
diketahui konsumen utama produk
kita dari kelompok usia berapa, jenis
kelamin apa, tinggal dimana, dan
sebagainya.
Analisis Biplot



Merupakan analisis eksplorasi untuk
melihat (1) kedekatan antar objek (2)
karakteristik atau peubah penciri setiap
objek, dan (3) keterkaitan antar peubah
Menggunakan konsep penguraian nilai
singular
Bermula di dunia pertanian, sekarang
lebih banyak dipakai di riset pemasaran
Analisis Biplot
Ilustrasi
 Perencanaan layanan perbankan
memerlukan informasi mengenai posisi
bank kita dibandingkan bank-bank
pesaing. Untuk itulah dilakukan survei
pasar mengenai persepsi nasabah
mengenai berbagai atribut layanan
perbankan, sehingga bisa kita ketahui
atribut mana saja yang perlu ditingkatkan
dan siapa pesaing terdekat yang harus
diantisipasi.
Analisis Biplot
Ilustrasi berikut memberikan
penerapan BIPLOT untuk menilai
posisi relatif sembilan negara ASEAN
menurut indikator pembangunan
berkelanjutan (sustatinable
development indicators). Ada 9
variabel yang dimasukkan. Data yang
tercatat tercantum pada Tabel 1.
Tabel 1. Data Indikator Pembangunan
Berkelanjutan Negara-Negara ASEAN
Hasil Biplot
Interpretasi Hasil






Singapura merupakan negara dengan penduduk yang
semuanya tinggal di kota dan memiliki jaringan telepon
tertinggi, namun juga emisi CO2 yang besar
Bruney dan Malaysia merupakan dua negara dengan
indikator yang hampir mirip
Sedangkan Indonesia, Philipina dan Thailand
membentuk kelompok tersendiri
Laos dan Kamboja merupakan kelompok dengan ciri
persentasi nilai tambah pertanian yang tinggi, serta laju
kematian bayi dan laju kematian balita yang besar
Nilai tambah industri dan nilai tambah pertanian,
keduanya berhubungan negatif
Laju kematian bayi dan balita dengan tingkat harapan
bayi lahir hidup mempunyai hubungan yang negatif
TERIMA KASIH

similar documents