Distribusi Normal


Distribusi normal sering kali digunakan sebagai asumsi dalam penelitian statistik. Ide ini pertama kali muncul tahun 1733 sebagai pendekatan peluang penjumlahan distribusi binomial yang disampaikan oleh Abraham De Moivre. Dalam perkembangannya, distribusi normal seringkali disebut sebagai distribusi gauss (bukan nama perintisnya). Hal ini dimungkinkan nama Carl Friedrich Gauss lebih populer di era modern dengan karyanya : Theoria Motus Corporum Coelestium.
 
Abraham De Moivre (kiri), Carl Friedrich Gauss (kanan)
Proses normalisasi dalam penelitian sangatlah penting, karena berbagai bentuk distribusi alam terkadang tidak dapat dievaluasi dalam bentuk asalnya, namun dapat  diperkirakan dan ini bukan hal yang menakjubkan karena banyak dari pendekatan adalah berdasar pada distribusi hukum normal. Distribusi normal memiliki bentuk persamaan peluang (pdf) sebagai
dengan
dan disimbolkan sebagai.
dimana x adalah distribusi normal dengan mean (miu) dan varian (sigma), berbagai cara manipulasi seringkali dilakukan untuk membuat sebuah penelitian berstandart normal atau memenuhi asumsi distribusi normal, N(0,1) dengan rata – rata bernilai 0 dan variasi bernilai 1. Perubahan dari bentuk normal umum variabel x menjadi standart normal variabel z dapat dilakukan dengan rumus
Dalam pengujian statistik (bisa jadi beberapa), perlakuan pengujian asumsi normal selalu ditujukan pada data residualnya dan bukan data sebenarnya. Hal ini dikarenakan karakteristik dari distribusi normal adalah jika terdapat penjumlahan X1, X2, … dst. maka hasil penjumlahan tersebut bisa dipastikan akan normal jika dan hanya jika X1, X2, … dst. tersebut memenuhi asumsi normal.
Salah satu karakteristik distribusi lainnya yang sering digunakan adalah ketika terdapat sebuah persamaan linier Y = a1x1+ a2x2+ … +anxn dengan populasi Y dikatakan normal, jika dan hanya jika variabel x merupakan sampel random dari sebuah populasi tertentu dan nilai a1, a2, …, an adalah nilai konstan bukan nol.

Sumber
- www.wikipedia.com
- Johnson, N.L., Kotz S., Balakrishnan N. 1994. Continuous Univariate Distributions Volume 1 Second Edition. John Wiley and Sons, Inc.
- Patel, J.K and Read, C.B .1982. Handbook of the normal distribution. Marcell Dekker, Inc. New York and Basel.
- Draper, N.R. and Smith, H. 1998. Applied regression analysis. John Wiley and Sons, Inc. Canada.

Minitab Software


Minitab adalah sebuah software yang tidak hanya memberikan analisis dan grafik statistik yang baik, namun minitab juga menyediakan fitur - fitur untuk Quality Improvement. Minitab secara khusus dirancang untuk membantu Anda sukses di setiap langkah analisis Anda. Beberapa fitur fungsional telah disediakan seperti.
Statistik Dasar
Melakukan akses lengkap dalam penghitungan statistik, termasuk statistik deskriptif, uji hipotesis, selang kepercayaan dan uji normalitas.

Regresi dan ANOVA
Menggambarkan hubungan antara variabel dan mengidentifikasi faktor-faktor penting yang mempengaruhi kualitas produk dan jasa.

Quality Tools
Mengetahui apakah sistem pengukuran sudah memadai, menilai seberapa baik proses dalam memenuhi batas spesifikasi, membuat rencana sampling, dan banyak lagi.

Desain Eksperimen
Menemukan pengaturan yang dapat mengoptimalkan proses menggunakan analisis Faktorial, Response Surface, Mixture dan desain Taguchi.

Quality Chart
Memantau proses dari waktu ke waktu dan mengevaluasi stabilitasnya.

Reliability and Survival
Menentukan karakteristik hidup produk dengan menggunakan berbagai alat termasuk Analisis Distribusi dan Accelerated Life Testing.

untuk download aplikasi ini klik link download.
DOWNLOAD

Tutorial Regresi dengan Minitab


Pada bahasan kali ini, kita akan mulai membuat pemodelan regresi untuk soal pada bagian sebelumnya. Seperti penjelasan sebelumnya, pemodelan regresi dapat dilakukan dengan manual maupun dengan bantuan software, dan kali ini kita akan membahas pemodelan regresi menggunakan software Minitab. (say thanks to Minitab Inc).
Ok, pertama masukkan data dalam minitab, kemudian pada menu toolbar klik stat – regression – regression. Seperti tampilan di bawah ini.
Setelah muncul tampilan di bawah ini, masukkan variabel respon dan prediktor ke dalam kolom respon dan prediktor yang sudah disediakan.
Untuk analisis sederhana anda bisa langsung meng-klik OK namun jika ingin melihat hasil yang detail, anda dapat memilih beberapa menu yang mendukung analisis anda.
Storage : merupakan pilihan menu yang dapat dipilih untuk mengeluarkan output berupa nilai dengan kriteria yang disediakan. Biasanya output ini digunakan untuk cek residual, pendeteksian multikolinier,  melihat hasil ramalan, dll.
Graphs : merupakan pilihan menu untuk mengeluarkan berbagai macam bentuk plot residual. Disediakan pilihan untuk menampilkan plot masing – masing atau plot dari secara kelompok.
Options : merupakan menu yang disediakan untuk menambah beberapa hasil analisis multikolinier dan membuat analisis regresi tandingan dengan menggunakan nilai pembobot.
Berikut ini hasil output regresi dengan menggunakan software minitab tanpa meng-klik satu menu pun (output standart).
Jika dibandingkan dengan output excel (dalam tutorial sebelumnya), maka output standart minitab tidak jauh berbeda dengan output standart excel. Namun minitab memiliki kelebihan lebih mudah digunakan, karena software ini memang diperuntukkan untuk tujuan analisis improvement. Interpretasi mengenai output minitab, akan dibahasa pada materi lainnya.

-terima kasih-

Tutorial Regresi dengan Excel


Pada bahasan kali ini, kita akan mulai membuat pemodelan regresi untuk soal pada bagian sebelumnya. Seperti penjelasan sebelumnya, pemodelan regresi dapat dilakukan dengan manual maupun dengan bantuan software, dan kali ini kita akan membahas sekilas pemodelan regresi menggunakan software microsoft excel. (say thanks to microsoft :) ).
Ok, pertama masukkan data dalam excel, kemudian klik pada toolbar “Data” kemudian klik “Data Analysis” pada bagian pojok paling kanan.

Sehingga akan muncul tampilan menu Data Analysis. Pada menu Data Analysis, terdapat beberapa analisis statistik yang sudah disediakan oleh excel. Untuk kasus sekarang ini pilih opsi “regression”, kemudian klik Ok.
Setelah opsi regresi di klik, akan muncul menu Regression. Di dalam menu tersebut, terdapat form yang harus diisi yang dijelaskan sebagai berikut.
  • Pada “Input Y Range” masukkan data respon / variabel dependen
  • Pada “Input Y Range” masukkan data prediktor / variabel independen
  • Centang opsi “Labels” jika pada input Y dan X disertakan nama variabel
  • Centang “Confidence Level” jika ingin merubah nilai default selang kepercayaan
  • Pada “Output Option” disediakan beberapa pilihan untuk menentukan letak output pemodelan.
  • Pada Opsi Residual dan Normal probability adalah pilihan – pilhan jika anda ingin mengeluarkan hasil terkait residual dan distribusi normal.

Arti pilihan menu pada output range :

  1. Pilihan “Output range” artinya output (hasil pemodelan) akan diletakkan pada lembar kerja (sheet) yang sama, dengan memberikan range output pada form isian disampingnya.
  2. Pilihan “New Worksheet” artinya hasil pemodelan akan diletakkan pada lembar kerja yang baru  (“Sheet” bagian bawah).
  3. Pilihan “New Workbook” artinya hasil pemodelan akan diletakkan pada file excel yang baru. Sehingga akan muncul tampilan windows excel yang baru.

Jika semua form pada menu Regression sudah diisi dan di klik OK, maka akan muncul hasil sebagai berikut. (pada latihan ini saya memilih output range pada sheet yang sama)
Output yang dikeluarkan excel cukup mewakili dalam interpretasi statistik, terdapat pula output berupa distribusi normal sebagai asumsi yang harus dipenuhi dalam pemodelan regresi. Interpretasi hasil menggunakan software excel akan dibahas pada tulisan berikutnya.

-terima kasih-

Tutorial Regresi (Case 1)


Dimisalkan akan diadakan sebuah riset marketing untuk mengetahui hubungan antara hasil penjualan dengan biaya promosi pada suatu perusahaan, karena pada hasil laporan perusahaan diketahui adanya hubungan besarnya promosi dengan besarnya penjualan. Hasil penelitian akan dipakai untuk mengetahui besarnya penjualan yang akan diperoleh perusahaan, jika menggunakan penambahan/pengurangan biaya promosi dengan satuan yang ditetapkan. Berikut data perusahaan yang digunakan.
 
Seperti penjelasan sebelumnya (pengantar regresi), analisis regresi yang baik menuntut adanya pemodelan dengan eror yang kecil. Sehingga dalam kasus ini sengaja dibuat data yang berbentuk linier agar memudahkan dalam latihan. Berikut ini plot yang dihasilkan dari data tersebut.
Nah, dari plot tersebut diketahui bahwa data yang digunakan adalah linier karena plot tersebut berbentuk garis lurus sehingga pendekatan model regresi sederhana yang mungkin diterapkan adalah pemodelan regresi linier sederhana. Pemodelan ini dapat dilakukan secara manual ataupun dengan software statistik seperti excel, minitab, spss, sas, maupun R.
Tutorial pemodelan bersambung pada tulisan berikutnya.
Pemodelan regresi dengan Excel
Pemodelan regresi dengan Minitab

~terima kasih~

Analisis Regresi (Pengantar)


Analisis ini pertama kali ditemukan oleh Sir Francis Galton pada tahun 1877 sehubungan dengan penelitiannya terhadap tinggi manusia, yaitu antara tinggi anak dan tinggi orang tuanya. Pada penelitiannya Galton mendapatkan bahwa tinggi anak dari orang tua yang tinggi cenderung meningkat atau menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan tersebut disebut garis regresi. (wikipedia)
Analisis regresi pada umumnya bertujuan untuk membuat sebuah pemodelan. Dari pemodelan tersebut akan dapat diketahui hubungan atau pengaruh antar variabel. Oleh karena itu, metode regresi seringkali digunakan sebagai alat untuk mengetahui hubungan antar variabel.

Metode regresi sudah mengalami banyak perkembangan, karena dalam pemodelan yang nyata selalu menuntut adanya kesalahan yang kecil. Salah satu metode yang sering digunakan sebagai pemodelan adalah metode regresi linier atau regresi linier berganda. Metode ini dianggap sebagai metode yang sederhana dan mudah diaplikasikan. Namun percobaan menggunakan metode lain (yang sudah dikembangkan seperti regresi ridge, regresi spline, regresi terboboti, dll.) bisa jadi akan memberikan hasil yang lebih baik, karena memang pada dasarnya kebutuhan akan suatu pemodelan sangat tergantung pada bentuk data yang diperoleh. Sebagai contoh sederhana, berikut ini diberikan model umum dari persamaan regresi linier Y terhadap X :
Y = a + b X (1)
Keterangan:
Y = variabel respon
X = variabel bebas
a = intersep
b = koefisien regresi/slop
model diatas (1) menggambarkan hubungan positif antara X dengan Y dimana setiap adanya satu satuan kenaikan X maka akan diikuti kenaikan Y sebesar ‘b’ (slop). Nilai Y akan sama dengan ‘a’ jika nilai X adalah nol.

Bayesian Model Averaging


Bayesian model averaging adalah metode yang dikembangkan oleh raftery dkk, dimana model ini memiliki bentuk model probabilistik. Model ini lebih dapat menangkap kasus dengan variasi data tinggi daripada peramalan deterministik. Peramalan deterministik sendiri adalah peramalan yang memberikan hasil ramalan berupa suatu titik (point). Berikut ini contoh peramalan deterministik (satu titik):
Peramalan satu titik hanya menggunakan satu model dasar saja, atau mengabaikan model lain yang sebenarnya signifikan. Padahal bisa jadi model lain dengan keakuratan yang berbeda memiliki hasil ramalan yang lebih mendekati nilai aslinya. Hal inilah yang menyebabkan peramalan deterministik kurang dapat menangkap pola data dengan variasi tinggi.
Sedangkan peramalan dengan menggunakan metode bayesian model averaging merupakan peramalan yang dapat menggabungkan beberapa model peramalan yang signifikan. Sehingga terkadang ada yang menyebutnya sebagai peramalan kombinasi atau gabungan. Sebuah data dengan variasi yang cukup tinggi akan memberikan model peramalan yang signifikan lebih dari satu. Hal ini dikarenakan pendekatan dalam memperoleh model berbeda beda. Gambar dibawah ini adalah contoh hasil peramalan bayesian yang sudah dikonversi menjadi peramalan titik.
Walaupun pada peramalan bayesian juga dapat diketahui nilai peramalan titiknya namun peramalan bayesian memiliki logika yang berbeda dengan peramalan titik. Perbedaan yang paling mencolok adalah adanya penggabungan lebih dari satu metode dalam pembentukan model bayesian selain itu peramalan bayesian melakukan pendekatan fungsi probabilitas.

Ms Access (Part 3 Query)


Query merupakan fitur Ms access yang memiliki kemampuan untuk menampilkan suatu data dari tabel-tabel yang ada di database. Tabel tersebut tidak semua ditampilkan, namun dapat diatur sesuai dengan yang kita ingin tampilkan. Sekarang akan dibuat Query dari kasus part 1.

Buat Query dengan klik tabel nilai dan tabel mahasiswa secara bersamaan (tahan CTRL) kemudian klik Query wizard.
Pilih simple query – klik next – kemudian pindahkan available field ke selected field

 
Klik next terus sampai muncul title query. Ubah nama query terserah anda. kali ini saya menggunakan nama “TABEL QUERY” untuk title query.

 
Setelah klik finish maka akan muncul tampilan dibawah ini. Kemudian pada kolom field isikan sesuai field yang akan ditampakkan. Untuk mudahnya sesuaikan dengan yang digambar.


Pada field nilai digunakan suatu fungsi “NILAI: [TES1]*0.2+[ETS]*0.3+[TES2]*0.2+[UAS]*0.3” dan untuk Huruf digunakan fungsi “HURUF:IIf([NILAI]>=81,'A',IIf([NILAI]>=71,'AB',IIf([NILAI]>=66, 'B',IIf([NILAI]>=41,'C',IIf([NILAI]>=31,'D','E')))))”.

Nantinya pada kolom nilai akan keluar suatu nilai keseluruhan dengan kriteria tes1 dan tes2 mendapat bobot 20% dan untuk ETS dan UAS mendapat bobot 30%. Sedangkan kolom huruf akan keluar huruf dengan kriteria
A = 81 – 100

AB = 71 – 80

B = 66 – 70

C = 41 – 65

D = 31 – 40

Selain itu E
 

Statistiser, all about statistics Of Galih_sp © 2011