Menguji Distribusi Data dengan MINITAB

Menguji distribusi data, ibarat Anda sedang memilih baju yang cocok. Diantara sekian banyak kriteria, salah satunya adalah akan memilih baju yang “pas” atau “cocok”. Apa yang ada di dalam pikiran Anda bila seseorang yang sebenarnya kurus menggunakan baju yang cukup longgar. Sepintas Anda mungkin akan menduga orang tersebut berbadan gemuk, akan tetapi seandainya orang itu memakai baju yang “pas” dengan kondisi badannya, tentu dugaan Anda tidak akan keliru bahwa orang itu berbadan kurus. Menunjukkan baju yang “pas” bagi seseorang tidak cukup dengan memegang dan melihat baju itu, tetapi harus masuk ke “kamar pas” dan mencari baju yang tepat diantara sekian banyak pilihan. Begitu pula dengan data, distribusi atau sebarannya kadangkala dibutuhkan untuk diketahui. Hasil perhitungan yang berhubungan dengan nilai harapan atau nilai simpangan akan berbeda apabila dihitung dari distribusi yang berbeda.  Berikut adalah contoh kasus tentang menguji distribusi data curah hujan dengan software bantu MINITAB versi 16.

Uji distribusi dilakukan pada data curah hujan bulanan selama 29 tahun (348 bulan). Data curah hujan sangat beragam, dan dari hasil perhitungan mean serta standard deviation yang hampir sama memberikan indikasi bahwa dalam setiap tahun selalu akan dijumpai curah hujan yang bersifat ekstrim (sangat tinggi). Visualisasi dengan grafik boxplot seperti pada gambar dibawah ini merupakan bentuk lain untuk melihat gambaran data secara deskriptif  pada penelitian ini.

Boxplot pada data tahunan tampak bahwa nilai rata-rata yang ditunjukkan oleh tanda garis di tengah kotak selalu berada pada posisi bawah. Pola ini terbaca bahwa sebagian besar data berada di sisi kiri, sedangkan pada sebagian lainnya bernilai tinggi yang ekstrim dengan munculnya tanda ‘*’. Karakteristik data yang tidak simetris dengan proporsi data lebih banyak pada sisi kiri, maka diduga bahwa data curah hujan akan mengikuti distribusi large extreme value. Sebagai contoh bentuk distribusi ini dengan nilai paramater  location = 200 dan scale = 175 adalah gambar berikut.

DistribusiTeoriLargeExtreme

Bentuk histogram data curah hujan pada penelitian ini mempunyai pola distribusi yang hampir sama dengan distribusi large extreme value. Selanjutnya sebaran data ini akan diuji dengan beberapa distribusi lainnya sebagai pembanding yaitu : lognormal, weibull dan gamma.

HistLargeExtreme

Pada software MINITAB, prosedur pengujian distribusi data tersedia dalam menu utama Stat, dilanjutkan dengan sub menu Quality Tools, pilih Individual Distribution Identification. Teknik pengujian distibusi yang ada dalam software ini adalah uji Anderson Darling dengan hipotesis statistik :

H0       : Distribusi data sesuai dengan distribusi yang diuji

H1       : Distribusi data tidak sesuai dengan distribusi yang diuji

Pengujian distribusi data dengan tingkat kesalahan (α) sebesar 0,05 akan memberikan keputusan bahwa distribusi yang diuji cocok dengan distribusi data, apabila p-value yang terhitung bernilai lebih besar dari 0,05. Berikut ini adalah hasil uji pada keempat distribusi yang diduga cocok dengan distribusi data curah hujan :

 OutputMTBUjiDist

Hasil uji kecocokan model yang dilakukan dengan uji Anderson Darling (AD), disitrbusi largest extreme value memiliki p-value = 0,051 dan bernilai paling tinggi dibandingkan dengan distribusi lainnya. Sehingga hasil uji telah memberikan bukti yang cukup bahwa data curah hujan mengikuti distribusi  largest extreme value dengan parameter location = 225,72 dan scale = 172,42.  Kecocokan distribusi berdasarkan hasil uji ini selanjutnya akan digambarkan melalui “fit data” terhadap histogram

HistFITLargeExtreme

About Arif Kamar Bafadal

Dosen statistika dan operation research. Blog dibuat agar dapat berbagi pengetahuan tentang statistika dan operation research melalui pengalaman dan tulisan. Blog ini menyampaikan pesan "belajar lalu mengajar" agar selalu tercipta motivasi yang kuat untuk selalu mengikuti perkembangan ilmu pengetahuan secara khusus pada bidang statistika dan operation research, agar para mahasiswa tidak terjebak dengan sesuatu yang terbatas.
This entry was posted in Statistika Deskriptif, Uncategorized and tagged , , . Bookmark the permalink.

2 Responses to Menguji Distribusi Data dengan MINITAB

  1. selamat sore pak..
    saya ingin bertanya.
    jenis-jenis metode dalam pengujian distribusi apa-apa saja ya pak..
    terimakasih banyak sebelumnya

  2. utiii says:

    pak mau tanya.
    misalnya saya punya data historis kebakaran dalam 5 tahun terakhir. Contoh
    Tahun Jumlah kebakaran
    2008 4
    2009 2
    dst
    untuk data historis seperti itu bagaimana menentukan jenis distribusi dari data tersebut? apakah bisa menggunakan langkah seperti di atas? terimakasih banyak mohon bantuannya

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s