Multidimensional Scaling (MDS)

Tujuan dari mMDSultidimensional scaling (MDS) adalah untuk memberikan gambaran visual dari pola kedekatan yang berupa kesamaan atau jarak diantara sekumpulan objek-objek. Penerapan MDS dapat dijumpai pada visualisasi ilmiah dan data mining dalam ilmu kognitif, informasi, pemasaran maupun ekologi.

Misalnya ketika konsumen  potensial diminta untuk membandingkan produk dan melakukan penilaian mengenai kesamaan produk tersebut. MDS dapat menunjukkan dimensi penilaian dari responden secara langsung ke dalam pola visualisasi kedekatan mengenai kesamaan produk, berbeda dengan analisis faktor atau diskriminan yang melibatkan penilaian dari si peneliti. Karena keunggulan inilah MDS merupakan suatu alat yang paling umum digunakan dalam pemetaan perceptual (perceptual mapping).

MDS sangat popular dalam penelitian bidang pemasaran untuk perbandingan brand, dan pada psikologi ia digunakan untuk mempelajari dimensi ciri-ciri pribadi. Penggunaan lain MDS adalah pada aplikasi yang menggunakan ranking, rating, pembedaan persepsi, atau dalam pengambilan suara (voting).

Ilustrasi Analisis MDS Berbasis Atribut

Dari survey yang dilakukan terhadap konsumen susu dari beberapa merk, maka dapat diketahui beberapa atribut susu, antara lain: (a) rasa, (b) kekentalan, (c) kandungan gizi, (d) warna, (e) kemasan, (f) kelengkapan informasi pada kemasan, (g) manfaat yang dirasakan, dan (h) kemudahan memperoleh produk.

Posted in Uncategorized | Leave a comment

Analisis Konjoin (Lanjutan 2 – Habis)

Berikut adalah output hasil dari software SPSS.

konjoin3

Hasil perhitungan nilai R = 0,967  adalah sama dengan harga Pearson R pada analisis konjoin. Perhitungan utility setiap level dalam suatu attribut berhubungan dengan hasil estimasi koefisien regresi yang diperoleh. Koefisien regresi yang diperoleh adalah :

b0 = 4,222       b1 = 1,000       b2 =  -0,333     b3 = 1,000       b4 = 0,667
b5 = 2,333       b6 = 1,333

Berikut ini adalah hasil perhitungan utility.

1. Attribut sol  :

a11 + a12 + a13          = 0
a11 – a13                    = b1
a12 – a13                    = b2

 Maka,

a11 – a13                    = 1,000 atau  a11 = 1,000 + a13
a12 – a13                    = -0,333 atau a12 = -0,333 + a13
a11 + a12 + a13          = (1,000 + a13) + (-0,333 + a13) + a13 = 0

= 0,667 + 3.a13 = 0 => a13 = -0,667/3 = -0,222

a11                              = 1,000 – 0,222 = 0,778
a12                              = -0,333 – 0,222 = -0,555

2. Attribut upper  :

a21 + a22 + a23          = 0
a21 – a23                    = b3
a22 – a23                    = b4

 Maka,

a21 – a23                    = 1,000 atau  a21 = 1,000 + a23
a22 – a23                    = 0,667 atau a22 = 0,667 + a23
a21 + a22 + a23          = (1,000 + a23) + (0,667 + a23) + a23 = 0

= 1,667 + 3.a23 = 0 => a23 = -1,667/3 = -0,557

a21                              = 1,000 – 0,557 = 0,443
a22                              = 0,667 – 0,557 = 0,110

3. Attribut price  :

a31 + a32 + a33          = 0
a31 – a33                    = b5
a32 – a33                    = b6

 Maka,

a31 – a33                    = 2,333 atau  a31 = 2,333 + a33
a32 – a33                    = 1,333 atau a32 = 1,333 + a33
a31 + a32 + a33          = (2,333 + a33) + (1,333 + a33) + a33 = 0

= 3,666 + 3.a33 = 0 => a33 = -3,666/3 = -1,222

a31                              = 2,333 – 1,222 = 1,111
a32                              = 1,333 – 1,222 = 0,111

Perhitungan di atas adalah sama dengan hasil analisis konjoin. Model analisis konjoin yang dihasilkan adalah :

Y = 4,222 + 1,000X1  – 0,333X2 + 1,000X3 + 0,667X4 + 2,333X5+ 1,333X6

Nilai prediksi preferensi dari persamaan regresi ini digunakan untuk menghitung koefisien korelasi Kendall’s tau. Perhitungan korelasi Kendall’s tau dilakukan dengan terlebih dahulu menghitung rangking dari data preferensi dan prediksi preferensi. Dalam software SPSS koefisien ini bisa diperoleh dari menu Analyze | Descriptive Statistics | Crosstabs. Aktifkan Suppres table, untuk tidak menampilkan tabel tabulasi silang. Masukkan ranking preferensi ke rows dan rangking prediksi preferensi ke column. Klik sub menu Statistics, aktifkan Kendall’s tau-b maka akan dihasilkan output seperti pada gambar berikut. Koefisien korelasi Kendall’s tau yang dihasilkan adalah 0,937.

konjoin4Tabel berikut adalah data prediksi preferensi dan ranking kedua variabel untuk menghitung korelasi Tau Kendall.

Profile

Y

Unstandardized Predicted Value

RANK of Y

RANK of PRE_1

RA

RB

1

9

8.55556

9.000

9.000

0

0

2

7

7.22222

7.500

7.500

1

0

3

5

5.22222

2.000

2.500

6

1

4

6

6.22222

5.000

5.500

3

1

5

5

4.55556

2.000

1.000

7

0

6

6

6.22222

5.000

5.500

3

1

7

5

5.22222

2.000

2.500

6

0

8

7

7.22222

7.500

7.500

1

0

9

6

5.55556

5.000

4.000

3

0

LAMPIRAN

Command lengkap untuk analisis konjoin

Conjoint Command Syntax

 CONJOINT [PLAN=file]
   [/DATA=file]
    /{SEQUENCE}=varlist
     {RANK    }
     {SCORE   }
   [/SUBJECT=variable]
   [/FACTORS=varlist['labels']
       ([{DISCRETE[{MORE}]}][values['labels']])]
                   {LESS}
         {LINEAR[{MORE}]  }
                 {LESS}
         {IDEAL           }
         {ANTIIDEAL       }
           varlist...
  [/PRINT={ALL**     }[SUMMARYONLY] ]
          {ANALYSIS  }
          {SIMULATION}
          {NONE      }
  [/UTILITY=file]
  [/PLOT={SUMMARY}]
         {SUBJECT}
         {ALL    }
         {NONE** }
**Default if the subcommand is omitted.
Default for PLAN and /DATA is the working data file.
Posted in Multivariate, Regresi, Uncategorized | 1 Comment

Analisis Konjoin (Lanjutan 1)

Pentingnya suatu attribut dihitung dengan menghitung selisih utility maksimum terhadap minimum, yang dihitung dengan rumus :

Ii = (max αij – min αij ) …………………………………………………………(1)

Kepentingan attribut  sole       :  Isol          = 0,7778 – (-0,5556) = 1,3334

Kepentingan attribut  upper     :  Iupper      = 0,4444 – (-0,5556) = 1,0000

Kepentingan attribut  price      :  Iprice        = 1,1111 – (-1,2222) = 2,3333

Pentingnya attribut ini dinormalkan, dalam kaitannya dengan kepentingan relatif terhadap attribut lainnya (Wi).

Wi = Ii / Σ Ii     …………………………………………………………………………….(2)

dan

Σ Wi = 1      ………………………………………………………………………………..  (3)

Jumlah pentingnya ketiga attribut adalah :

1,3334 + 1,0000 + 2,3333 = 4,6667

Sehingga :

Wsole    = 1,3334 / 4,6667 = 0,2857

Wupper  = 1,0000 / 4,6667 = 0,2143

Wprice   = 2,3333 / 4,6667 = 0,5000

Dengan demikian hubungan relatif yang terpenting dari ketiga attribut di atas adalah harga (50,00%), sol (28,57%) dan penutup atas (21,43%). Karena harga merupakan faktor yang sangat penting dalam pemilihan sepatu, maka bagi sebuah sepatu harga adalah suatu hal yang sangat sensitif.

Koefisien korelasi Pearson R sebesar  0,967 (significance = 0,0000) menjelaskan bahwa hubungan nilai preferensi konsumen dengan hasil prediksi preferensi dari model yang dihasilkan pada analisis konjoin adalah sebesar 0,967. Hasil ini diaplikasikan jika pengukuran dilakukan dengan rating preferensi. Model konjoin yang signifikan menjelaskan bahwa tingkat kesukaan konsumen terhadap produk sepatu memang dapat dijelaskan oleh attribut sol, penutup atas dan harga. Koefisien korelasi Kendall’s tau sebesar 0,937 (significance = 0,0006) memiliki fungsi yang sama dengan koefisien korelasi Pearson R.

Nilai konstanta sebesar 6,2222 menjelaskan bahwa rata-rata preferensi terhadap sembilan profile sepatu yang ditawarkan adalah 6,2222. Pada preferensi dengan skala 1 – 9. nilai rata-rata sebesar 6,2222 memberikan indikasi bahwa kesembilan profile adalah cukup disukai.

Hubungan Analisis Konjoin Dengan Analisis Regresi Linier Berganda

Analisis konjoin dapat dihitung dengan menggunakan analisis regresi linier berganda. Pada mulanya adalah melakukan transformasi pada attribut menjadi variabel dummi. Berikut adalah tabel pembentukan variabel dummi pada ketiga attribut :

Sole

X1

X2

Upper

X3

X4

Price

X5

X6

Karet

1

0

Kulit

1

0

Rp 15.000,-

1

0

Polimer

0

1

Canvas

0

1

Rp 30.000.-

0

1

Plastik

0

0

Nylon

0

0

Rp 45.000,-

0

0

Format data dalam analisis regresi terdiri atas 6 variabel dummi dengan sebuah variabel dependen yang berisi data preferensi.

No

X1

X2

X3

X4

X5

X6

Y

1

1

0

1

0

1

0

9

2

1

0

0

1

0

1

7

3

1

0

0

0

0

0

5

4

0

1

1

0

0

1

6

5

0

1

0

1

0

0

5

6

0

1

0

0

1

0

6

7

0

0

1

0

0

0

5

8

0

0

0

1

1

0

7

9

0

0

0

0

0

1

6

Selanjutnya lakukan prosedur analisis regresi linier berganda dengan Y sebagai variabel dependen dan X1 hingga X6 menjadi variabel independen. Hasil nilai prediksi dari persamaan regresi diperlukan untuk dihubungan dengan koefisien korelasi Kendall’s tan. 

Posted in Multivariate, Regresi | Tagged , , | 1 Comment

ANALISIS KONJOIN

Pilihan produk apa yang lebih disukai konsumen? Sepatu apa yang banyak diminati? Apakah mutu sol, penutup atas atau harga yang menjadi penentu keputusan pembelian? Sehingga sepatu dengan komposisi pilihan seperti apa yang paling baik untuk ditawarkan? Persoalan ini dapat diselesaikan dengan menggunakan analisis konjoin.

Attribut dan Profile

 

Melakukan analisis dengan konjoin sangat erat kaitannya dengan pengetahuan seseorang terhadap analisis regresi berganda, variabel dummi, korelasi Pearson dan korelasi Tau Kendall. Format pengukuran terhadap konsumen (responden) dapat menggunakan isian ranking atau rating preference. Berikut ini adalah sebuah contoh kasus pemilihan produk sepatu yang diduga dipengaruhi oleh mutu sol (sole), penutup atas (upper) dan harga (price). Ketiga hal ini dalam analisis konjoin disebut dengan attribut. Pada setiap attribut minimal terdiri atas 2 level pilihan.  Kombinasi seluruh attribut yang dianalisis dinamakan dengan profile. Tabel berikut adalah komposisi attribut yang digunakan dalam analisis.

Attribut

No

Level

Sol

1

Karet

2

Polimer

3

Plastik

Penutup Atas

1

Kulit

2

Canvas

3

Nylon

Harga

1

Rp 15.000,-

2

Rp 30.000.-

3

Rp 45.000,-

Berdasarkan tabel di atas, kemungkinan profile sepatu yang bisa terjadi adalah 3 X 3 X 3 = 27 profile. Akan tetapi pada prakteknya tidak semua profile bisa dibuat, misalnya bahan dasar sol dengan karet yang berharga mahal tidak mungkin dijual dengan harga Rp 15.000,-. Sehingga dari 27 profile akan dipilih sebanyak p buah profile beberapa diantaranya untuk dianalisis. Pemilihan p buah profile ini harus bersifat ortogonal, pada umunya user akan menggunakan bantuan software untuk menghasilkan pilihan ini.

Data Kerja Analisis Konjoin Pada SPSS

 

Pada SPSS, menyusun profile yang ortogonal dapat dilakukan dengan memilih menu Data | Orthogonal Design | Generate. Tulis “sole” pada kotak Factor Name, tulis “Sol” pada Factor Label, klik Add maka dalam kotak akan muncul sole(?). Tanda (?) dimaksudkan untuk mengisi level-level pada attribut sole dengan cara klik attribut sole dan dilajutkan dengan klik Define Values. Isikan nomor dan label dari tiap-tiap level attribut. Lakukan hal yang sama untuk attribut upper dan price. Pada kotak Data File pilih Replace working data file jika profile yang dibuat berupa file baru. Jika total kombinasi attribut akan menghasilkan profile yang terlalu banyak, analisis dilanjutkan dengan memilih Option dan isi jumlah profile yang dikehendaki (dalam kasus ini adalah 9) pada isian Minimum number of cases to generate. Klik Continue.

Pembuktian bahwa profile yang dihasilkan adalah ortogonal dapat dilakukan dengan memunculkan matriks korelasi antara sole, upper dan price. Matriks korelasi yang ortogonal akan berbentuk seperti matriks identitas, yaitu matriks dengan elemen diagonal bernilai 1 dan 0 untuk elemen lainnya.

konjoin1

Hasil generate ini menjelaskan bahwa pada profile ke-1 adalah produk sepatu dengan sol karet, penutup atas dari kulit dan harga Rp 15.000,-. Pada profile ke-9 adalah produk sepatu dengan sol plastik, penutup atas dari Nylon dan harga Rp 30.000,-. Matriks korelasi antara ketiga faktor adalah ortogonal, karena berbentuk matriks identitas. Hasil desain ortogonal ini akan disimpan sebagai file tersendiri, katakanlah diberi nama DESAIN.SAV.

Selanjutnya, disiapkan file kedua yang merupakan hasil pengukuran konsumen (responden) terhadap sembilan profile yang ditawarkan. Secara berurutan kolom pertama adalah jawaban (respon) terhadap profile pertama. Berikut adalah contoh pengisian jawaban seorang responden terhadap sembilan profile sepatu. File ini diberi nama PREFERENSI.SAV.

Kolom

1

2

3

4

5

6

7

8

9

10

SUBJ

P1

P2

P3

P4

P5

P6

P7

P8

P9

1

9

7

5

6

5

6

5

7

6

Proses analisis konjoin dilakukan dengan posisi file yang aktif adalah file yang mengandung desain ortogonal (file  DESAIN.SAV).  Pada SPSS 20 menu pull-down belum tersedia, sehingga analisis konjoin dilakukan dengan menulis command di jendela syntax.

CONJOINT PLAN=*
/DATA=’PREFERENSI.SAV’
/FACTORS=SOLE UPPER PRICE
/SUBJECT=SUBJ
/SCORE=P1 TO P9
/PRINT=SUMMARYONLY.

Hasil running dari syntax mengandung beberapa hal penting antara lain importance dan averaged importance, utility dan standard error, nilai constant, korelasi Pearson’s R dan korelasi Kendall’s tau.  Importance adalah tingkat kepentingan relatif yang ada pada setiap attribut. Total importance adalah 100%. Pada bagian summary nilai diperoleh dari rata-rata importance (averaged importance). Nilai utility menjelaskan tingkat pilihan antar level dalam suatu attribut. Tanda positif menunjukkan level yang lebih banyak dipilih, sedangkan tanda negatif menunjukkan tidak banyak dipilih. Nilai utility pada setiap subject akan mengandung standard error (s.e), sedangkan pada summary hanya mengandung nilai rata-rata utility dari seluruh subject. Nilai constant menjelaskan nilai rata-rata prefensi untuk seluruh profile. Nilai Pearson’s R menjelaskan tingkat hubungan preferensi dengan hasil prediksi. Nilai ini memiliki arti interpretasi yang sama dengan multiple correlation dalam analisis regresi berganda dan diaplikasikan jika pengukuran dilakukan dengan rating preference. Nilai Kendall’s tau juga menjelaskan tingkat hubungan preferensi dengan hasil prediksi yang dihitung dengan korelasi Tau Kendall. Penggunaan nilai Kendall’s tau digunakan jika data diukur dengan ranking.  Berikut adalah hasil running dari syntax di atas.

konjoin2

Interpretasi Hasil Analisis

 

Interpretasi dari hasil-hasil analisis yang berhubungan dengan nilai utility dapat dijelaskan sebagai berikut :

  1. Konsumen paling suka memakai sepatu baru dengan sol terbuat dari karet (0,7778); pilihan kedua adalah sol dari plastik (-0,2222) dan ketiga sol dari polimer (-0,5556).
  2. Untuk penutup atas, konsumen lebih suka memakai sepatu dengan penutup atas terbuat dari kulit (0,4444); preferensi kedua adalah dari kanvas (0,1111) dan ketiga dari Nylon (-0,5556).
  3. Sedangkan mengenai harga, konsumen lebih suka pada sepatu dengan harga Rp 15.000,- (1,1111). Preferensi kedua dengan harga Rp 30.000,- (0,1111)  dan ketiga dengan harga Rp 45.000,- (-1,2222).

 

Posted in Multivariate, Regresi | Tagged , , , | 3 Comments

Menguji Distribusi Data dengan MINITAB

Menguji distribusi data, ibarat Anda sedang memilih baju yang cocok. Diantara sekian banyak kriteria, salah satunya adalah akan memilih baju yang “pas” atau “cocok”. Apa yang ada di dalam pikiran Anda bila seseorang yang sebenarnya kurus menggunakan baju yang cukup longgar. Sepintas Anda mungkin akan menduga orang tersebut berbadan gemuk, akan tetapi seandainya orang itu memakai baju yang “pas” dengan kondisi badannya, tentu dugaan Anda tidak akan keliru bahwa orang itu berbadan kurus. Menunjukkan baju yang “pas” bagi seseorang tidak cukup dengan memegang dan melihat baju itu, tetapi harus masuk ke “kamar pas” dan mencari baju yang tepat diantara sekian banyak pilihan. Begitu pula dengan data, distribusi atau sebarannya kadangkala dibutuhkan untuk diketahui. Hasil perhitungan yang berhubungan dengan nilai harapan atau nilai simpangan akan berbeda apabila dihitung dari distribusi yang berbeda.  Berikut adalah contoh kasus tentang menguji distribusi data curah hujan dengan software bantu MINITAB versi 16.

Uji distribusi dilakukan pada data curah hujan bulanan selama 29 tahun (348 bulan). Data curah hujan sangat beragam, dan dari hasil perhitungan mean serta standard deviation yang hampir sama memberikan indikasi bahwa dalam setiap tahun selalu akan dijumpai curah hujan yang bersifat ekstrim (sangat tinggi). Visualisasi dengan grafik boxplot seperti pada gambar dibawah ini merupakan bentuk lain untuk melihat gambaran data secara deskriptif  pada penelitian ini.

Boxplot pada data tahunan tampak bahwa nilai rata-rata yang ditunjukkan oleh tanda garis di tengah kotak selalu berada pada posisi bawah. Pola ini terbaca bahwa sebagian besar data berada di sisi kiri, sedangkan pada sebagian lainnya bernilai tinggi yang ekstrim dengan munculnya tanda ‘*’. Karakteristik data yang tidak simetris dengan proporsi data lebih banyak pada sisi kiri, maka diduga bahwa data curah hujan akan mengikuti distribusi large extreme value. Sebagai contoh bentuk distribusi ini dengan nilai paramater  location = 200 dan scale = 175 adalah gambar berikut.

DistribusiTeoriLargeExtreme

Bentuk histogram data curah hujan pada penelitian ini mempunyai pola distribusi yang hampir sama dengan distribusi large extreme value. Selanjutnya sebaran data ini akan diuji dengan beberapa distribusi lainnya sebagai pembanding yaitu : lognormal, weibull dan gamma.

HistLargeExtreme

Pada software MINITAB, prosedur pengujian distribusi data tersedia dalam menu utama Stat, dilanjutkan dengan sub menu Quality Tools, pilih Individual Distribution Identification. Teknik pengujian distibusi yang ada dalam software ini adalah uji Anderson Darling dengan hipotesis statistik :

H0       : Distribusi data sesuai dengan distribusi yang diuji

H1       : Distribusi data tidak sesuai dengan distribusi yang diuji

Pengujian distribusi data dengan tingkat kesalahan (α) sebesar 0,05 akan memberikan keputusan bahwa distribusi yang diuji cocok dengan distribusi data, apabila p-value yang terhitung bernilai lebih besar dari 0,05. Berikut ini adalah hasil uji pada keempat distribusi yang diduga cocok dengan distribusi data curah hujan :

 OutputMTBUjiDist

Hasil uji kecocokan model yang dilakukan dengan uji Anderson Darling (AD), disitrbusi largest extreme value memiliki p-value = 0,051 dan bernilai paling tinggi dibandingkan dengan distribusi lainnya. Sehingga hasil uji telah memberikan bukti yang cukup bahwa data curah hujan mengikuti distribusi  largest extreme value dengan parameter location = 225,72 dan scale = 172,42.  Kecocokan distribusi berdasarkan hasil uji ini selanjutnya akan digambarkan melalui “fit data” terhadap histogram

HistFITLargeExtreme

Posted in Statistika Deskriptif, Uncategorized | Tagged , , | Leave a comment

Tabulasi Silang : Hubungan Dua Variabel Kategori

cross signTentang tulisan ini, dalam ilmu statistika lebih dikenal dengan sebutan tabel silang (cross-tabulation), yaitu analisis yang ingin menguji apakah dua variabel yang bersifat ketegori bersifat independen (tidak berhubungan) atau dependen (berhubungan).

Contoh “rekaan berdasarkan kasus di atas, andai saja sampel PDAM = 100 dan HIPPAM = 200.  Seandainya hasilnya sebagai berikut :

  <= 47 tahun >  47 tahun Total
PDAM

100

0

100

HIPPAM

0

200

200

Total

100

200

Tabel ini, akan menjelaskan bahwa, semua yang menggunakan PDAM adalah penduduk berusia hingga 47 tahun, dan semua yang menggunakan HIPPAM adalah penduduk berusia lebih dari 47 tahun. Atau semua penduduk berusia hingga 47 tahun menggunakan PDAM, dan semua penduduk berusia lebih dari 47 tahun menggunakan HIPPAM. Maka pada kasus semacam ini berarti “ADA HUBUNGAN” antara usia dan air yang dipakai. Hubungan sempurna seperti ini mengakibatkan nilai chi kuadrat yang diperoleh adalah sebesar 300 (sama dengan jumlah sampel). Begitu pula bila tabelnya sebagai berikut :

  <= 47 tahun >  47 tahun Total
PDAM

0

100

100

HIPPAM

200

0

200

Total

200

100

Akan tetapi bila, komposisi hasil frekuensi adalah berimbang, seperti pada tabel berikut :

  <= 47 tahun >  47 tahun

Total

PDAM

50

50

100

HIPPAM

100

100

200

Total

150

150

 

Tabel ini bisa dibaca dari dua sisi :

Penduduk yang menggunakan PDAM, 50% berusia hingga 47 tahun, dan 50% berusia lebih dari 47 tahun. Sedangkan pada penduduk yang menggunakan HIPPAM, 50% berusia hingga 47 tahun, dan 50% berusia lebih dari 47 tahun. Artinya, tidak ada kecenderungan usia yang terlihat pada jenis air yang digunakan. Pilihan tersebar merata. Dapat pula di baca dari kolom sebagai berikut :

Pada penduduk berusia hingga 47 tahun, 33,33% memilih PDAM, sedangkan pada penduduk berusaia lebih dari 47 tahun, 33,33 % ,memilih HIPPAM.  Maka, pada tabel ini tidak terihat adanya hubungan antara usia dengan air yang dipakai. Pada tabel yang semacam ini akan menghasilkan nilai chi-square sebesar 0, artinya “TIDAK ADA HUBUNGAN” antara usia dan air yang dipakai.

 

Nah, bagaimana bila, hasil tabel silang yang diperoleh ternyata mempunyai sifat diantara kedua bentuk “ekstrem” ini? Tentu saja bila nilainya mendekati nol, maka kesimpulan akan mengarah pada “TIDAK ADANYA HUBUNGAN” kedua variabel, sedangkan bila nilainya mendekati ukuran sampel (pada contoh ini adalah 300), maka kesimpulan akan mengarah pada “ADANYA HUBUNGAN” kedua variabel. Sehingga dibutuhkan sebuah “nilai kritis” yang akan mempermudah pengambilan keputusan pada tingkat kesalahan sebesar alpha, dan terkoreksi oleh jumlah kategori untuk masing-masing variabel, yang disingkat dengan c2(a;(baris-1)(kolom-1)). Pada contoh ini karena kedua variabel memiliki dua kategori, maka simbol nilai kritisnya adalah : c2(0,05;(2-1)(2-1)) atau c2(0,05;1). Nilai kritis ini dapat dengan mudah dihitung melalui EXCELL dengan fungsi : =CHIINV(0.05,1) enter  (tanda sama dengan diketikkan dalam sel excell), akan menghasilkan nilai 3,841459  atau disingkat menjadi 3,84. Apabila nilai chi square sama dengan atau lebih kecil dari 3,84 maka diperoleh kesimpulan “TIDAK ADANYA HUBUNGAN”, sedangkan bila nilai chi square lebih besar dari 3,84 maka diperoleh kesimpulan “ADANYA HUBUNGAN” pada kedua variabel yang diuji.

Jadi pada contoh sesungguhnya seperti dalam gambar yang dikirim, nilai chi kuadrat (df=1, n=26)=0,008  adalah lebih kecil dari 3,84 memberikan kesimpulan bahwa “TIDAK ADA HUBUNGAN” yang signifikan antara usia dengan jenis air yang dipakai.

 

Posted in Analisis Hubungan | 1 Comment

Pengujian Hipotesis Statistik Dan Vonis Hakim

keadilanSiapa yang pernah datang ke ruang pengadilan? Tentu saja dengan tujuan ingin mendengarkan keputusan hakim atas sebuah perkara. Apa yang menarik? Dan apa hubungannya dengan pengujian hipotesis? Kesamaannya adalah teknik dan proses dalam mengambil keputusan dari hasil pengujian.

Perhatikan dengan baik bagaimana tahapan-tahapan hakim dalam memutuskan sebuah perkara pencurian. Pertama, apakah hakim mengetahui pasti bahwa terdakwa yang sedang duduk di depannya adalah seorang pencuri? Tentu hakim tidak tahu apakah orang tersebut seorang pencuri atau tidak. Pada titik ini hakim memilih untuk menganggap bahwa orang ini adalah bukan pencuri, atau biasa dikenal dengan sebutan praduga tidak bersalah.

Kedua, hakim akan mencermati seluruh barang bukti dan saksi yang dikenal dengan sebutan fakta persidangan. Fakta-fakta ini mengarah kemana, apabila dari pihak jaksa lebih kuat, maka hakim cenderung pada keputusan “memenjarakan”. Sebaliknya apabila pihak pembela yang lebih kuat, maka keputusan akan mengarah pada “membebaskan”.

Ketiga, apabila keadaan yang sesungguhnya pada terdakwa adalah bukan pencuri, dan kemudian hakim memberikna keputusan “membebaskan” karena fakta persidangan, maka dikatakan hakim memberikan keputusan yang benar. Sebaliknya apabila hakim memberikan keputusan “penjarakan”, maka hakim memberikan keputusan yang salah karena memasukkan ke dalam penjara seseorang yang tidak bersalah.

Keempat, konsep dan tahapan hakim dalam menjatuhkan keputusan adalah sangat kuat dipengaruhi oleh fakta persidangan yang dihadirkan dalam persidangan. Sehingga  dalam setiap keputusan, hakim akan selalu dibayang-bayangi oleh dua kesalahan : (1) memasukkan ke penjara seseorang yang tidak bersalah, atau (2) membebaskan seseorang yang bersalah.

Konsep yang ada di dalam pengujian statistika juga memiliki tahapan yang sama dengan keputusan hakim di pengadilan. Sebagai contoh sederhana akan dilakukan pembuktian fenomena bahwa prestasi mahasiswa ditentukan oleh berapa banyak buku teks kuliah yang dimiliki. Jumlah buku teks akan disebut sebagai variabel bebas (variabel X), sedangkan prestasi mahasiswa disebut variabel terikat (variabel Y). Pembuktian menggunakan analisis regresi akan diajukan hipotesis statistik :

H0       :  β = 0, melawan

H1       : β ¹ ≠ 0

Coba satu per satu akan dibanding proses keputusan dalam pengujian ini. Pertama, fenomena yang disebut itu mungkin benar (prestasi ditentukan oleh jumlah kepemilikan buku teks), mungkin juga salah  (prestasi tidak ditentukan oleh jumlah kepemilikan buku teks). Pada pilihan ini harus dipilih salah satu diantara dua ini sebagai asumsi awal. Proses penurunan rumus dalam pengujian akan lebih mudah dengan “menganggap” benar pada hipotesis null. Hal ini identik dengan konsep “praduga tidak bersalah”.

Kedua, dilakukan pengumpulan data dengan rancangan desain instrumen yang ketat sehingga seluruh hasil-hasil pengukuran yang teramati akan menjadi bahan-bahan utama dalam pengambilan keputusan. Hal ini identik dengan konsep “fakta persidangan”.

Ketiga, merancang penurunan rumus (biasanya pengguna statistik sudah tinggal menggunakan saja) untuk  mengambil keputusan. Data hasil pengamatan, CI1akan memberikan dua pilihan, yaitu : (1) “anggapan” benar pada hipotesis null, ternyata benar, sehingga akan memberikan kesimpulan bahwa jumlah kepemilikan buku teks tidak menentukan prestasi, atau (2) “anggapan” benar pada hipotesis null, ternyata salah, sehingga akan memberikan kesimpulan bahwa jumlah kepemilikan buku teks menentukan prestasi.

Keempat, dalam pengambilan keputusan, akan ada nilai alpha (α) sebagai sebuah besaran kesalahan bahwa “anggapan benar pada hipotesis null ternyata benar”. Sedangkan pada bagian lain akan menghasilkan nilai P atau p-value  sebegai sebuah besaran kesalahan bahwa “anggapan pada benar hipotesis null ternyata salah”. Inilah yang mendasari konsep teknis dalam pengujian statistik, bila p-value lebih kecil dari nilai alpha (α), maka hipotesis null akan ditolak, dan sebaliknya bila p-value lebih besar dari nilai alpha (α), maka hipotesis null akan diterima.

Posted in Regresi | Tagged , , , | 3 Comments