Penanganan Data Tidak Normal


Salah satu metode yang dapat mengatasi data terindikasi tidak normal adalah dengan cara transformasi data. Transformasi data dapat mengubah data tidak normal, menjadi terlihat mengikuti distribusi normal. Selain itu transformasi juga dapat menangani masalah yang berkaitan dengan keragaman data. Hal ini erat kaitannya dengan bentuk distribusi data dan kemiringan data. Dengan data positif, jika diperkirakan data tidak mengikuti distribusi yang simetris, maka pada kenyataanya akan memiliki kemiringan yang positif. Pada keadaan ini, transformasi yang umum digunakan adalah transformasi logaritma z = log y (basis 10 atau e) dan transformasi akar kuadrat z = y pangkat (1/2), namun untuk kasus khusus digunakan salah satu anggota transformasi power yang disimbolkan sebagai:
Pada prakteknya, ketika lambda bukan 0 penghitungan nilai z dilakukan tanpa pengurangan 1 dan pada buku lain terdapat penambahan faktor pembagi y^(λ-1). Transformasi log dan akar kuadrat lebih sering digunakan daripada transformasi lainnya, karena nilai tabel untuk transformasi tersebut sudah tersedia dan sekarang sudah banyak alat hitung maupun software yang memiliki program transformasi tersebut. Bentuk transformasi semacam ini dikembangkan oleh G.E.P Box dan D. Cox, sehingga sering disebut sebagai transformasi Box-Cox.
 
George Edward Pelham Box (kiri) dan David Cox (kanan)

Ada transformasi khusus lainnya yang berguna dalam analisis data seperti 1/(sin √(y ̂))untuk estimasi binomial dan 1/tanh(r) untuk sampel koefisien korelasi dari distribusi biavariat normal. Hal ini dibentuk untuk membuat varians dari estimator cukup bebas dari parameter yang tidak diketahui, dan pada saat yang sama bentuk tersebut dapat meningkatkan perkiraan normal.
Transformasi terkadang sangat membantu dalam menangani outlier, walaupun sebuah outlier terkadang akan tetap menjadi outlier, setelah dilakukan transformasi akar maupun logaritma. Transformasi dianggap sangat kuat untuk dapat menarik sebuah outlier ke dalam data sehingga menjadi bukan outlier. Penanganan yang lebih baik untuk menangani outlier adalah melalui metode nonparametrik atau estimasi robust. Walaupun begitu, perlakuan transformasi untuk mengatasi permasalahan normal terkadang menimbulkan masalah baru, yaitu tidak terpenuhinya asumsi lainnya. Dalam hal ini, pengalaman  analisis sangatlah berpengaruh untuk penanganan transformasi.

Kebanyakan tulisan ini bersumber dari :
www.york.ac.uk
www.wikipedia.com
Miller, R.G. 1986. Beyond ANOVA Basic Of Applied Statistics. John Wiley and Sons, Inc. Canada.
Rawlings J.O., Pantula S. G., and Dickey D.A. 1998. Applied Regression Analysis: A Research Tool Second Edition. Springer-Verlag New York, Inc.
Weisberg S. 2005. Applied Linear Regression Third Edition. John Wiley and Sons, Inc. Hoboken. New Jersey and Canada.

0 comments:

Post a Comment

 

Statistiser, all about statistics Of Galih_sp © 2011