Rabu, 02 Desember 2015

Analisis Biplot



Berikut ini merupakan data Kepadatan Penduduk, IPM, Laju Pertumbuhan Ekonomi dan Jumlah Penduduk Miskin kabupaten/kota di Sumatera Selatan tahun 2012.

Kabupaten/Kota
Kepadatan Penduduk
(jiwa/km2)
IPM
LPE
(persen)
Jumlah Penduduk  Miskin
(000jiwa)





OKU
120,57
74,01
7,32
37,6
OKI
43,52
71,45
6,57
109,8
Muara Enim
85,17
71,65
5,42
98,5
Lahat
91,88
72,29
6,04
66,4
Musi Rawas
44,14
69,01
5,49
96,2
Musi Banyuasin
40,1
73,15
4,00
106,9
Banyuasin
62,79
70,70
6,23
87,6
OKUS
58,3
72,29
6,51
34,6
OKUT
181,65
70,72
7,17
56,4
OI
154,08
70,52
6,91
50,3
Empat Lawang
87,13
69,69
6,16
30,7
Palembang
3961,75
77,38
8,86
206,1
Prabumulih
396
75,45
5,69
19,8
Pagar Alam
220,5
74,15
6,33
11,7
Lubuk Linggau
490,91
71,46
6,52
29,1

Dari data di atas, kita akan membuat analisis biplot yang bertujuan untuk meringkas informasi dari suatu matriks data yang besar, yaitu menyajikan matriks data yang berisi baris dan kolom ke dalam suatu plot yang berdimensi dua. Selain menyajikan posisi relatif objek beserta variabel, metode biplot juga menyajikan ragam dan korelasi antar variabel. Sebelum memulai analisis biplot, langkah pertama yang harus terpenuhi adalah terpenuhinya asumsi normalitas untuk data multivariate. 

Pengujian kenormalan distribusi multivariate

Untuk menguji kenormalan data multivariate di atas, kita bisa menggunakan minitab dengan membuat macro. Caranya adalah sebagai berikut :

* Masukkan syntax qq pada macro minitab. Program Files - Minitab - English - Macro. 



* Buka program minitab. Jangan lupa mengaktifkan Enable Commands pada menu editor.



 * Ketik perintah untuk memanggil syntax qq plot 

MTB > %qq.txt c2-c5

Lalu setelah ditekan enter, akan muncul outputnya.


Dari output di atas: Data memiliki distribusi normal multivariate.

Selain dengan menggunakan qq plot, uji normalitas pada data multivariate juga dapat menggunakan syntax mardia yang dapat diunduh pada link berikut : https://laci.bps.go.id/index.php/s/htaLpycQiiNHA6r 

Cara-cara untuk menjalankan macro mardia sama dengan qq plot. Terakhir, ketik syntax untuk memanggil macro mardia :

MTB > %mardia.txt c2-c5

diperoleh output sebagai berikut :




Multivariate skewness

Data Display

b1        15,4084
z1        49,9733
pvalue    0,000223435

Multivariate kurtosis

Data Display

b2        27,3081
z2        0,924654
pvalue    0,355146

H0 : Data berdistribusi normal multivariate
H1 : Data tidak berdistribusi normal multivariate
Tolak H0 : p-value < α

Berdasarkan output Minitab diatas, p-value untuk multivariate skewness adalah 0.000223435 dimana p-value < α (0.05) sehingga dapat disimpulkan bahwa data multivariate diatas tidak berdistribusi multinormal.

Hasil uji kenormalan antara dua metode, yaitu Q-Q Plot (normal probability quantile-vs-quantile) dan Mardia menghasilkan keputusan yang berbeda. Tetapi berdasarkan hasil simulasi, uji kenormalan multivariate menggunakan Mardia Skewness dan Kurtosis merupakan uji yang paling stabil dan handal. Salah satu sebab data tidak menyebar normal adalah karena adanya data oulier. Oleh karena itu, akan dideteksi outlier.

Syntax outlier dapat diunduh pada link : https://laci.bps.go.id/index.php/s/1GSpZ2JyM3LDpnS

MTB > %outlier.txt c1-c5

Data Display

Row  Kabupaten/Kota        d  f_value     sig_f
  1  OKU              5,1433    1,623  0,243330
  2  OKI              4,5081    1,317  0,328516
  3  Muara Enim       1,5928    0,347  0,840253
  4  Lahat            0,3101    0,061  0,992074
  5  Musi Rawas       3,7939    1,023  0,441272
  6  Musi Banyuasin   7,5992    3,475  0,050124
  7  Banyuasin        1,1037    0,231  0,914892
  8  OKUS             0,6537    0,132  0,967189
  9  OKUT             1,8344    0,408  0,798843
 10  OI               1,4508    0,312  0,863389
 11  Empat Lawang      4,0368    1,118  0,401065
 12  Palembang       12,9609  306,455  0,000000
 13  Prabumulih       5,1804    1,642  0,238824
 14  Pagar Alam       2,7809    0,676  0,623876
 15  Lubuk Linggau    3,0510    0,762  0,573501

Terdapat satu kabupaten/kota yang dianggap outlier yaitu Kota Palembang. Hasil uji normal dengan Mardia memberi hasil bahwa data tidak multinormal. Hal ini kemungkinan karena adanya data outlier. Untuk membuktikan hal ini, kita perlu melakukan kembali uji kenormalan dengan Mardia.

Pengujian Kenormalan by Mardia setelah Data Outlier dihilangkan
Output Minitab:

MTB > %outlier.txt c1-c5

Data Display

b1        7,73208
z1        23,8126
pvalue    0,250676

Multivariate kurtosis

Data Display

b2        22,4376
z2        -0,421908
pvalue    0,673092

Berdasarkan output Minitab diatas, p-value untuk multiivariate skewness adalah 0,250676 dimana p-value > α (0.05) sehingga dapat disimpulkan bahwa data multivariate diatas berdistribusi multinormal. Hal ini menjelaskan bahwa penyebab data tidak multinormal adalah karena adanya data outlier.

ANALISIS BIPLOT 
Analisis Biplot dilakukan dengan menggunakan software SAS. Syntax biplot dapat diunduh pada link https://laci.bps.go.id/index.php/s/mT6esPXfbySJZNB

Langkah-langkah analisis biplot:
* Buka program SAS dan copy-kan syntax Biplot pada menu editor

* Dannn taraaa... output dan grafik biplotpun langsung muncul.

Dari grafik biplot di atas, ada beberapa hal yang dapat kita analisis :

Kedekatan Antar Obyek
Kedekatan antar obyek dapat digunakan sebagai dasar untuk pengelompokkan. Artinya obyek-obyek yang letaknya berdekatan memiliki karakteristik yang hampir sama, sehingga dapat dikelompokkan ke dalam satu kelompok. Pada grafik diatas, terlihat Lubuk Linggau, Prabumulih dan Pagar Alam berdekatan (ketiga wilayah ini berstatus ‘kota’ di Provinsi Sumatera Selatan), artinya ketiga kota ini memiliki karakteristik yang hampir sama.

Panjang Vektor
Panjang Vektor menyatakan varian dari masing-masing variabel. Pada grafik diatas terlihat bahwa Kepadatan penduduk memiliki panjang vektor yang terpanjang. Artinya kepadatan penduduk dari ke-15 kabupaten/kota di Provinsi Sumatera Selatan memiliki keragaman yang tinggi, terutama di Kota Palembang yang merupakan ibukota dari Provinsi Sumatera Selatan. Sementara untuk Jumlah Penduduk Miskin juga memperlihatkan keragaman yang cukup tinggi. Sementara untuk variabel IPM dan LPE menunjukkan varians yang sangat kecil.

Nilai Sudut Antar Dua Peubah
Besar dari koefisien antar kedua vektor dapat diketahui dengan menghitung nilai cosinus dari sudut yang dibentuk oleh kedua vektor tersebut. Pada grafik terlihat bahwa nilai IPM dan LPE berhimpit (cos 0 = 1). Artinya terdapat korelasi positif yang sempurna antara IPM dan LPE. Sementara variabel Kepadatan Penduduk dan Jumlah Penduduk Miskin membentuk sudut sekitar 900 (cos 90 = 0), artinya tidak terdapat korelasi antara Kepadatan Penduduk dengan Jumlah Penduduk Miskin di Sumatera Selatan.



2 komentar:

  1. Hallo, saya mau tanya
    biplot itu merupakan stat non-parametrik, dan stat non-parametrik itu tidak terikat dengan dist normal
    dan menurut analisis diatas dilakukan uji dist normal itu tujuannya supaya apa ya? trimakasi

    BalasHapus
  2. HALO INI ANALISIS BIPLOT NYA PAKE ALFA BRP YA?

    BalasHapus