Posts from the ‘Statistik penelitian’ Category

Penggunaan rumus dalam mencari sampel.


Jadi pertanyaan yang sering ditanyakan, berapa besar ukuran sampel yang sebaiknya harus diambil, agar sampel tersebut dapat mempresentasikan populasinya atau bisa diyakini benar.alasannya karena tidak semua anggot populasi diteliti, diyakini benar itu artinya seberapa tinggi hasil penelitian dari sampel itu taraf ”kebisa dipercayaannya” akan mencerminkan seluruh populasi. Walau bagaimanapun hasil penelitian itu tidak bisa diharapkan betu-betul benar, karena berbagai faktor, karena hasil penelitian itu dapat mengandung kesalahan (error, galat).seberapa besar taraf toleransi akan terjadinya kesalahan karena faktor kebetulan benar. Para ahli ilmu eksakta bersepakat sebesar 0.01 artinya hanya ada 0.01 atau 1% saja kesalahan karena kebetuluan itu terjadi. Dan diyakini sebesar 99% hasil penelitian itu benar. Sedangkan ilmu sosial disepakati yang terbaik itu sebesar 0.05, jadi hanya ada 0.05 atau 5% saja kesalahan karena kebetulan itu terjadi dan diyakini 95% hasil penelitian itu benar

Ada dua pendekatan, yaitu : a). Pendekatan statistika dan b). Pernekatan non-statistika. Pendekatan non-statistika lebih subjektif karena berdasarkan keinginan si peneliti, sehingga penggunaan penedkean sttaistik ada lkecendrungan lebih tinggi. Masalah lain masih banyak yang belum memahami statistika dengan baik dengan begutu banyaknya rumus yang digunakan. Sehingga ada kesan statistik itu rumit, sehingga membutuhkan pengobanan ektra sehingga dengan jalan pintas menngunakan statistik praktis dan sederhana yang terkadang penerapannya salah kaprah.

Berlandaskan tulisan karya Krejcie dan Morgan (1970), Sudjana (1989), Gaspersz (1991) dan Barlett, et.al (2001), ketika seorang peneliti dalam memutuskan untuk menggunakan pendekatan statistika dalam menentukan ukuran sampel, paling tidak harus sangat memperhatikan empat aspek mendasar yaitu :

  1. Apa tujuan penelitian yang akan dilaksanakan, apakah untuk menduga nilai rata-rata, total atau proporsi populasi dan bagaimana analisis data akan dilakukan, cukup deskript atau inferensi.
  2. Berapa besar tingkat keandalan pendugaan yang diinginkan yaitu dengan menetapkan nilai Z yang diambil dari tabel distribusi t atau X2 yang diambil dari tabel chi kuadrat berdasarkan pada nilai a tertentu.
  3. Berapa besar galat pendugaan yang akan ditolelir. Jika yang dikukur proporsi atau presentase, maka galat pendugaan dinyatakan dalam satuan persen sedangkan pengukuran lain disesuaikan dengan satuan yang dipakai.
  4. Bagaimanakah kondisi keragaman populasi yang akan diteliti.

Sehingga kita kenal rumus yang dikembangkan oleh Slovin[1], rumus lain kita temui berdasarkan indek tabel yang dikembangkan oleh Krejcie-Morgan[2] dimana peneliti bisa mengetahui langsung ukuran sampel (n) dengan mengetahui ukuran populasinya (N) dan ketika ingin menggunakan rumus tersebut agar tidak salah dalam menggunakannya maka peneliti harus mampu menjawab empat pertanyaan dasar sebagai berikut :

  1. Apakah rumus dan tabel tersebut diergunakan untuk penelitian yang ditunjukan mengukur rata-rata, total, proporsi populasi atau yang lainnya.
  2. Berapa nilai α yang digunakan dalam rumus dan tabel tersebut untuk menggambarkan tingkat kendalanya.
  3. Berap nilai galat pendugaan (d) yang dimasukan dalam perhitungan untuk memberi gambaran akbat dari kesalahan sampling.
  4. Berapa besar keragaman populasi yang dipakai dalam perhitungan dan bagaimana bentuknya, apakah varians atau proporsi P(1-P).

Rumus Slovin

Rumus Slovin[3] yang bisa dirumuskan :

n=N/(1 + N.e2 )

Keterangan :


[1] Hussein Umar, Metode Penelitian untuk Skripsi dan Tesis Bisnis, raja grafindo persada, Jakarta, 2004.

[2]Sugiono, Statistic Non-prametrik untuk Penelitian, alfabeta, bandung, 2009.

[3][3] Steph Ellen, eHow Blog, 2010 dari (rujukan principles and method of research, ariola, et.al, 2006)

[4] Toleransi terjadinya galat; taraf signifikansi, dengan ketentuan untuk social dan pendidikan lajimnya 0.05 atau 5% tingkat kesalahan.

Varian dan Standar Deviasi


Salah seorang pembaca blog ini bertanya tentang maksud dari standar deviasi serta bagaimana mencari standar deviasi dari suatu kelompok data. Berangkat dari pertanyaan tersebutlah maka postingan tentang varian dan standar deviasi ini dibuat.

Berbicara tentang standar deviasi atau simpangan baku dalam bahasa Indonesia tidak bisa lepas dari varians. Hal ini karena standar deviasi adalah akar kuadrat dari varians atau sebaliknya, varians adalah kuadrat dari standar deviasi.

Salah satu ukuran variabilitas (measure of dispersion) yang paling sering digunakan jika data yang diukur berskala interval adalah varians. Varians didefinisikan sebagai rata-rata dari skor penyimpangan kuadrat. Untuk mencari varians, dibedakan antara varians populasi yang dilambangkan dengan (σ2) dengan varians sample yang dilambangkan dengan (s2).

Untuk varians populasi, dapat dicari dengan rumus:
Dimana:
µ = rata-rata populasi
N = total jumlah populasi
Adapun varians untuk sample dapat dicari dengan rumus yang sama namun mengurangkan N dengan 1 sebagai berikut:


Dimana :
s = rata-rata sample
n = jumlah sampel yang digunakan
untuk lebih memperjelas, baiklah kita coba dengan menghitung varians untuk populasi jika kita memiliki data pengukuran tentang nilai 5 siswa pada mata pelajaran matematika sebagai berikut:
7 7 9 8 6
Untuk menghitung varians dari data di atas maka kita harus mencari dahulu berapa mean (rata-rata) dari. Dengan rata-rata 6,9 maka kita tinggal memasukkan data di atas sebagai berikut:


Dengan varian sebesar 1,3 maka untuk mencari standar deviasi kita tinggal mengakar kuadratkan 1,3 yang akan menghasilkan 1,14. Karena varian adalah ukuran keberagaman data, maka semakin besar angkat varians maka semakin beragamlah data yang kita miliki dan semakin kecil nilai varians maka semakin homogenlah data yang kita miliki.
Nah, jika seandainya nilai varians yang kita miliki ternyata adalah 0, maka dapat disimpulkan bahwa dalam populasi atau sampel yang kita miliki tidak terdapat variabilitas. Keadaan demikian dapat terjadi jika sekor untuk setiap sampel/populasi adalah sama.

Selain rumus di atas, kita juga dapat menggunakan rumus-rumus lain untuk mencari varians. Pada dasarnya, pemilihan rumus yang digunakan tergantung pengguna yang merasakan rumus manakah yang paling mudah digunakan. Rumus-rumus yang lain tersebut diantaranya adalah:
Untuk varians sampel:

STATISTIK NON-PARAMETRIK


Statistik Non-Parametrik merupakan alternatif dari statistik parametrik ketika asumsi-asumsi yang mendasari dalam statistik parametrik tidak dapat terpenuhi. Untuk mengenal lebih jauh mengenai statistik non-parametrik. Sebelum berbicara mengenai statistik nonparametrik, ada baiknya kita bahas apa itu statistik parametrik.

Pada umumnya, setelah data dikumpulkan, langkah selanjutnya adalah mencari nilai tengahnya (mean) dan  simpangannya (variance), kemudian dilakukan uji-z atau uji-t. Semua tindakan yang dilakukan  di atas merupakan prosedur umum statistik parametric yang mengacu pada suatu parameter yang dipunyai oleh sebuah distribusi.

Berbeda dengan statistik parametrik, statistik nonparametrik adalah prosedur statistik yang tidak mengacu pada parameter tertentu. Itulah sebabnya, statistik nonparametrik sering disebut sebagai prosedur yang bebas distribusi (free-distibution procedures).

Banyak orang berpendapat, jika data yang dikumpulkan terlalu kecil maka prosedur statistik nonparametrik lebih baik digunakan. Pendapat ini bisa benar dan bisa pula salah. Masalahnya adalah, bagaimana mendefinisikan besar-kecilnya suatu data? Bukankah hal ini sangat relatif? Yang jelas, kita pasti menggunakan statistik nonparametrik bila kita tidak mengetahui dengan pasti distribusi dari data yang kita amati.

Namun jika kita yakin data yang diamati berdistribusi normal, misalkan dibuktikan dengan memakai uji statistik, maka kita bisa memakai prosedur statistik parametrik untuk distribusi normal. Sebaliknya, walaupun data yang dikumpukan berjumlah besar, tetapi tidak dapat dipastikan distribusinya, maka sebaiknya dipakai prosedur statistik nonparametrik.

Statistik nonparametrik mempunyai beberapa kelebihan dan kekurangan. Kelebihannya antara lain adalah:

  1. Tingkat kesalahan penggunaan prosedur statistik nonparametrik relatif kecil karena statistik jenis ini tidak memerlukan banyak asumsi.
  2. Perhitungan yang harus dilakukan pada umumnya sederhana dan mudah, khususnya untuk data yang kecil.
  3. Konsep dalam statistik nonparametrik mudah untuk dimengerti.
  4. Dapat digunakan untuk menganalisa data yang berbentuk hitungan maupun peringkat (rank).

Sebaliknya, kekurangan statistik nonparametrik yang paling utama adalah hasil tidak selalu sesuai dengan yang diharapkan karena kesederhanaan perhitungannya. Namun, walaupun perhitungan dalam statistik nonparametrik sangat sederhana, bila jumlah datanya sangat besar maka dibutuhkan perhitungan yang sangat lama. Untuk kasus yang demikian, prosedur statistik parametrik lebih tepat untuk digunakan.

Berikut adalah beberapa uji statistik yang biasa dipakai. Kolom pertama menguraikan uji statistik parametrik, sementara kolom kedua menampilkan uji statistik nonparametrik yang sepadan.

Uji Parametrik (menggunakan asumsi distribusi Normal)

Uji nonparametrik yang bersesuaian

Tujuan

Uji – t untuk sample bebas Uji Mann-Whitney U; Uji  Wilcoxon jumlah peringkat Membandingkan dua sample bebas
Uji – t  berpasangan Uji Wilcoxon pasangan dengan peringkat yang cocok Meneliti perbedaan dalam  suatu grup
Koefisien korelasi Pearson Koefisien korelasi peringkat Spearman Mengetahui hubungan korelasi linier antara dua peubah
Analisa varians satu arah (Uji F ) Analisa varians dengan menggunakan peringkat Kruskal-Wallis Membandingkan tiga grup atau lebih
Analisa varians dua arah Analisa varians dua arah Friedman Mabandingkan tiga grup atau lebih dengan menggunakan dua faktor yang berbeda

Jadi dapat disumpulkan bahwa penggunaan statistik nonparametrik lebih diutamakan jika hipotetis yang akan diuji tidak melibatkan parameter dari populasi. Data yang diambil tidak memenuhi syarat yang ditetapkan oleh statistik parametrik dan asumsi-asumsinya ditolak, atau bila kita membutuhkan hasil yang cepat sebelum melakukan penelitian berikutnya.

Ada terdapat enam persyaratan yang harus dipenuhi pada uji asumsi klasik agar data observasi tersebut dapat menggunakan uji statistik parametrik atau statistik inferesial, yaitu :

  1. Uji kerandoman
  2. Uji normalitas
  3. Uji linearitas
  4. Uji heteroskedastisitas
  5. Uji Multikolinearitas
  6. Uji Autokorelasi

Mari kita sama-sama membahasnya satu persatu dari keenam persyaratan uji asumsi klasik tersebut di atas.

  1. Uji kerandoman
    Kerandoman data diperlukan karena data observasi yang homogen akan mengakibatkan bentuk distribusi tidak normal, disamping itu kerandoman data mencerminkan atau representatif terhadap populasinya, karena data yang diambil atau dicuplik dari suatu populasi seharusnya data itu mencerminkan sifat-sifat dari populasinya.

    Hal ini juga menyangkut variabel random, di mana variabel random adalah variabel yang nilainya merupakan hasil dari suatu peristiwa, sehingga data tersebut tidak bias atau tidak gayut atau nilai-nilai yang dihasilkan tidak berpola (heterogen).

  2. Uji normalitas
    Uji normalitas bertujuan untuk menguji apakah dalam model regresi, variabel terikat dan variabel bebas keduanya mempunyai distribusi normal ataukah tidak. Model regresi yang baik adalah memiliki distribusi data normal atau mendekati normal.

    Ada beberapa pendekatan yang dapat dilakukan untuk mengetahui apakah data tersebut berdistribusi normal atau tidak yaitu : analisis grafik dan analisis statistik. Analisis statistik bisa digunakan uji Kolmogorov Smirnov, atau dengan memanfaatkan deskripsi data nilai-nilai skewness dan kurtosisnya.

  3. Uji linearitas
    Uji ini biasanya dilakukan untuk melihat apakah spesifikasi model yang digunakan sudah benar atau tidak. Apakah fungsi yang digunakan dalam suatu studi empiris sebaiknya berbentuk linear, kuadrat atau kubik. Dengan uji ini akan diperoleh informasi apakah model empiris sebaiknya linear, kuadrat atau kubik.

    Ada beberapa pendekatan yang dapat dilakukan untuk mengetahui apakah model persamaan regresi tersebut linear atau tidak yaitu : uji Durbin-Watson, uji Ramsey test dan uji Lagrange Multiplier.

  4. Uji heteroskedastisitas
    Uji heteroskedastisitas bertujuan menguji apakah dalam model regresi terjadi ketidaksamaan variance dari residual satu pengamatan ke pengamatan yang lain. Jika variance dari residual satu pengamatan ke pengamatan yang lain tetap maka disebut Homoskedastisitas dan sebaliknya. Model regresi yang baik adalah yang homoskedastisitas. Sebagai tambahan bahwa pada umumnya data yang diambil dari populasi secara berturut-turut atau time series pada umumnya cenderung terjadi homoskedastisitas, sedangkan data yang cross-section kemungkinan besar tidak terjadi homoskedastisitas.

    Ada beberapa pendekatan untuk mengetahui apakah dalam model regresi terdapat kesamaan variance atau tidak yaitu : Pendekatan grafik yang dihasilkan dengan memplot antara nilai prediksi variabel terikat (ZPRED) dengan residualnya (SRESID). Deteksi ada tidaknya heteroskedastisitas dapat dilakukan dengan melihat ada tidaknya pola tertentu pada grafik scatterplot antara SRESID dan ZPRED. Dimana sumbu Y adalah Y yang telah diprediksi dan sumbu X adalah residual (Y prediksi – Y sesungguhnya) yang telah distudentized.

    Dasar analisisnya adalah jika pola tertentu, seperti titik-titik yang ada membentuk pola tertentu yang teratur (bergelombang, melebar kemudian menyempit) maka mengindikasikan telah terjadi heteroskedastisitas. Dan jika tidak ada pola yang jelas, serta titik-titik menyebar di atas dan di bawah angka 0 pada sumbu Y, maka telah terjadi homoskedastisitas. Pendekatan statistik dengan menggunakan uji White, uji Glejser dan uji Park.

  5. Uji multikolinearitas
    Uji multikolinearitas bertujuan untuk menguji apakah model regresi ditemukan adanya korelasi antar variabel bebas. Model regresi yang baik seharusnya tidak terjadi korelasi antara variabel bebas (tidak terjadi multikolinearitas). Jika variabel bebas saling berkorelasi, maka variabel-variabel ini tidak ortogonal. Variabel ortogonal adalah variabel bebas yang nilai korelasi antar sesama variabel bebas sama dengan nol.

    Untuk mendeteksi ada atau tidaknya multikolinearitas di dalam model regresi adalah sebagai berikut :

    Nilai R ² yang dihasilkan oleh suatu estimasi model regresi empiris sangat tinggi, tetapi secara individual variabel-variabel bebas banyak yang tidak signifikan mempengaruhi variabel terikat. Menganalisis matrik korelasi variabel-variabel bebas.

    Jika antar variabel bebas ada korelasi yang cukup tinggi (umumnya diatas 0,90), maka hasil ini merupakan indikasi adanya multikolinearitas. Tidak adanya korelasi yang tinggi antar variabel bebas tidak berarti bebas dari multikolinearitas.

    Multikolinearitas dapat disebabkan karena adanya efek kombinasi dua atau lebih variabel bebas.Multikolinearitas dapat juga dilihat dari : nilai tolerance dan lawannya variance inflation faktor (VIF). Kedua ukuran ini menunjukkan setiap variabel bebas manakah yang dijelaskan oleh variabel bebas lainnya. Dalam pengertian sederhana setiap variabel bebas menjadi variabel terikat dan diregres terhadap variabel bebas lainnya. Tolerance mengukur variabilitas variabel bebas yang terpilih yang tidak dapat dijelaskan oleh variabel bebas lainnya.

    Jadi nilai tolerance yang rendah sama dengan nilai VIF tinggi adalah menunjukkan adanya kolinearitas yang tinggi. Nilai cut-off yang umum dipakai adalah nilai tolerance 0,10 atau sama dengan nilai VIF di atas 10%.

  6. Uji autokorelasi
    Uji autokorelasi bertujuan menguji apakah dalam suatu model regresi linear ada korelasi antara residual (kesalahan pengganggu) pada periode sebelum dan sesudah, jika terjadi korelasi maka dinamakan terjadi autokorelasi, dan model regresi yang baik adalah yang tidak mengandung autokorelasi. Pada data silang waktu (cross-section) masalah autokorelasi jarang ditemui, namun pada data runtun waktu (time-series) masalah autokorelasi sering ditemui.

    Ada beberapa pendekatan yang digunakan untuk mengetahui apakah model regresi terdapat autokorelasi atau tidak yaitu : uji Durbin-Watson digunakan untuk autokorelasi tingkat satu (firs order autocorrelation) dan mensyaratkan adanya intercept (konstanta) dalam model regresi dan tidak ada variabel lag di antara variabel bebas. Uji lainnya seperti uji Lagrange Multiplier (LM Test) dan uji Statistik Q : Box – Pierce dan Ljung Box.Untuk kedua uji yang terakhir ini mensyaratkan bahwa data observasi di atas 100 sampel dan derajat autokorelasi lebih dari satu.

Korelasi peringkat.

Terdapat tiga jenis koefisien korelasi peringkat pada nonparametrik yang umumnya digunakan yaitu Spearman R, Kendal tau dan Gamma Coefficient.

Statistik chi-square juga merupakan bagian dari korelasi non-parametrik, tetapi berbeda dengan ketiga jenis korelasi tersebut, perhitungannya didasarkan pada tabel frekuensi dua arah (tabel silang). Selain itu, dalam Spearman R, Kendal tau dan Gamma mempersyaratkan data dalam skala ordinal (atau dapat diordinal/di peringkat), sedangkan pada statistik chi-square dapat berupa data nominal maupun ordinal.

Untuk statistik chi-square akan dibahas pada seri tulisan mengenai non-parametrik berikutnya Spearman R adalah ukuran korelasi pada statistik non-parametrik yang analog dengan koefisien korelasi Pearson Product Moment pada statistik parametrik. Spearman R adalah korelasi Pearson yang dihitung atas dasar rank dari data.

Kendal tau, adalah ukuran korelasi yang setara dengan Spearman R, terkait dengan asumsi yang mendasarinya serta kekuatan statistiknya. Namun, besaran Spearman R dan Kendal tau akan berbeda karena perbedaan dalam logika mendasari serta formula perhitungannya.

Jika Spearman R setara dengan koefisien korelasi Pearson Product Moment, yaitu koefisien korelasinya pada dasarnya menunjukkan proporsi variabilitas (dimana untuk Spearman R dihitung dari ranks sedangkan korelasi Pearson dari data aslinya), sebaliknya ukuran Kendal tau merupakan probabilita perbedaan antara probabilita data dua variabel dalam urutan yang sama dengan probabilita dua variabel dalam urutan yang berbeda.

Berdasarkan logika perhitungan ini, Noether (1981) dalam (Daniel,1991) mengemukakan bahwa koefisien Kendal tau lebih mudah ditafsirkan dibandingkan Spearman R.  Gamma statistic, lebih baik dibandingkan Spearman R atau Kendal tau ketika data mengandung banyak observasi yang memiliki nilai yang sama.

Gamma ekuivalen dengan Spearman R dan Kendal tau dari sisi asumsi yang mendasarinya. Tetapi dari sisi intepretasi dan perhitungannya, Gamma lebih mirip dengan Kendal tau.

Secara sederhana, untuk melihat efektivitas iklan terhadap penjualan, akan dilihat korelasi dari kedua variabel tersebut. Jika terdapat korelasi positif yang signifikan, maka dapat disimpulkan iklan tersebut efektif dalam meningkatkan penjualan. Demikian juga sebaliknya.

Untuk menghitung koefisien korelasi untuk ketiga pengukuran (tersebut, langkah pertama yang dilakukan adalah dengan memberi rangking untuk iklan dan penjualan, mulai dari yang angka terkecil sampai angka terbesar.
Model-Model Analisis Statistik Non-Parametrik
Statistik nonparametrik adalah valid dengan asumsi yang longgar serta teorinya relatif luwes. Karenanya metode ini relatif serba bisa/serba guna, memiliki banyak alternatif prosedur dan diaplikasikan dalam banyak metode-metode analisis baru.

Mengingat banyaknya alternatif prosedur statistik non-parametrik menyebabkan berbagai literatur memberikan pengelompokan kategori statistik non parametrik dengan berbagai cara yang berbeda. Namun demikian, secara sederhana dan berdasarkan prosedur yang sering digunakan, uji-uji tersebut diantaranya dapat dikelompokkan atas kategori berikut: statistik nonparametrik adalah valid dengan asumsi yang longgar serta teorinya relatif luwes. Karenanya metode ini relatif serba bisa/serba guna, memiliki banyak alternatif prosedur dan diaplikasikan dalam banyak metode-metode analisis baru.

Mengingat banyaknya alternatif prosedur statistik non-parametrik menyebabkan berbagai literatur memberikan pengelompokan kategori statistik non parametrik dengan berbagai cara yang berbeda. Namun demikian, secara sederhana dan berdasarkan prosedur yang sering digunakan, uji-uji tersebut diantaranya dapat dikelompokkan atas kategori berikut:
• Prosedur untuk data dari sampel tunggal
• Prosedur untuk data dari dua kelompok atau lebih sampel bebas (independent)
• Prosedur untuk data dari dua kelompok atau lebih sampel berhubungan (dependent)
• Korelasi peringkat dan ukuran-ukuran asosiasi lainnya

1.Prosedur untuk data dari sampel tunggal
Prosedur bertujuan untuk menduga dan menguji hipotesis parameter populasi seperti ukuran nilai sentral. Dalam statistik parametrik, ukuran nilai sentral yang umum adalah rata-rata dan median, dan pengujian hipotesisnya menggunakan uji t. Namun demikian, uji t memiliki asumis bahwa populasi dari sampel yang diambil berdistribusi normal. Jika asumsi ini tidak terpenuhi, akan mempengaruhi kesimpulan pengujian hipotesis.

Prosedur non parametrik untuk menduga nilai sentral untuk sampel tunggal ini diantaranya adalah uji tanda untuk sampel tunggal dan uji peringkat bertanda Wilcoxon. Selain pengukuran tendensi sentral, juga terdapat prosedur non parametrik lainnya untuk sampel tunggal dalam pengukuran proporsi populasi (yaitu uji binomial) dan uji kecenderungan (trend) data berdasarkan waktu (yaitu uji Cox-Stuart)

2. Prosedur untuk sampel independen.
Prosedur ini digunakan ketika kita ingin membandingkan dua variabel yang diukur dari sampel yang tidak sama (bebas). Misalnya sampel yang diambil berasal dari dua populasi yaitu populasi rumah pedagang sate dan populasi pedagang bakso, dan ingin membandingkan rata-rata pendapatan diantara kedua kelompok pedagang ini.
Dalam statistik parametrik, untuk membandingkan membandingkan nilai rata-rata dua kelompok independent, dapat digunakan uji t (t-test). Untuk nonparametrik, alternatif pengujiannya diantaranya adalah Wald-Wolfowitz runs test, Mann-Whitney U test dan Kolmogorov-Smirnov two-sample test. Selanjutnya, jika kelompok yang diperbandingkan lebih dari dua, dalam statistik parametrik dapat menggunakan analisis varians (ANOVA/MANOVA), dan pada statistik nonparametrik alternatifnya diantaranya adalah analisis varians satu arah berdasarkan peringkat Kruskal-Wallis dan Median test.

3. Prosedur untuk Sampel dependen.
Prosedur ini digunakan ketika ingin membandingkan dua variabel yang diukur dari sampel sama (berhubungan). Misalnya ingin mengetahui perbedaan produktivitas kerja, dengan pengukuran dilakukan pada sampel pekerja yang sama baik sebelum maupun sesudah pelatihan dilakukan.

Pada statistik parametrik, jika ingin membandingkan dua variabel yang diukur dalam sampel yang sama, dapat menggunakan uji t data berpasangan. Sebaliknya, alternatif non-parametrik untuk uji ini adalah Sign test dan Wilcoxon’s matched pairs test. Jika variabel diteliti bersifat dikotomi, dapat menggunakan McNemar’s Chi-Square test. Selanjutnya, jika terdapat lebih dari dua variabel, dalam statistik parametrik, dapat menggunakan ANOVA. Alternatif nonparametrik untuk metode ini adalah Friedman’s two-way analysis of variance dan Cochran Q test.

4. Korelasi Peringkat dan Ukuran-Ukuran Asosiasi Lainnya.
Dalam statistik parametrik ukuran korelasi yang umum digunakan adalah korelasi Product Moment Pearson. Diantara korelasi nonparametrik yang ekuivalen dengan koefisien korelasi standar ini dan umum digunakan adalah Spearman R, Kendal Tau dan coefficien Gamma. Selain ketiga pengukuran tersebut, Chi square yang berbasiskan tabel silang juga relatif populer digunakan dalam mengukur korelasi antar variabel.

Statistik Uji Kruskal-Wallis
Bagian ini akan membahas mengenai Statistik Uji Kruskal-Wallis, contoh perhitungan manualnya dan aplikasi pada program statistik SPSS.
Analisis varians satu arah berdasarkan peringkat Kruskal-Wallis pada statistik non-parametrik dapat digunakan pada sampel independent dengan kelompok lebih dari dua.
Korelasi Peringkat
Bagian ini akan membahas mengenai korelasi peringkat. Terdapat tiga jenis koefisien korelasi peringkat pada nonparametrik yang umumnya digunakan yaitu Spearman R, Kendal tau dan Gamma Coefficient. Statistik chi-square juga merupakan bagian dari korelasi non-parametrik, tetapi berbeda dengan ketiga jenis korelasi tersebut,

Korelasi Peringkat dengan SPSS
Tulisan ini merupakan lanjutan dari tulisan seri 4 non-parametrik yang membahas mengenai korelasi peringkat pada statistik non-parametrik. Jika pada tulisan sebelumnya diberikan pengertian dasar dan contoh perhitungan secara manual, maka pada bagian ini akan diberikan aplikasi perhitungannya menggunakan paket program statistik SPSS. Untuk memahami bagian ini, silakan baca tulisan seri 4 tersebut.

Prosedur Uji Chi Square
Prosedur X2 Test (Uji Chi Square) berdasarkan tabel silang ini adalah menabulasi (menyusun dalam bentuk tabel) suatu variabel dalam kategori dan menguji hipotesis bahwa frekuensi yang diobservasi (data yang diamati) tidak berbeda dari frekuensi yang diharapkan (frekuensi teoritis). Uji goodness-of-fit dari chi-square membandingkan antara frekuensi yang diobservasi dan frekuensi yang diharapkan (expected) pada masing-masing kategori untuk menguji bahwa semua kategori mengandung proporsi nilai yang sama atau menguji bahwa masing-masing kategori mengandung proporsi nilai tertentu.

Chi-Square dengan SPSS
Pada bagian ini, akan dibahas lebih lanjut aplikasi perhitungan chi-square dengan menggunakan paket program statistik SPSS.
Karena kasus yang digunakan adalah kasus pada seri 6 sebelumnya, silakan baca seri tersebut untuk memahami bagian ini.
Dalam aplikasi SPSS, untuk perhitunganChi Square tersebut melalui tahapan sebagai berikut:

STATISTIK DESKRIPTIF


Pengertian

Seperti dikemukakan sebelumnya bahwa statistik deskriptif adalah statistik yang berfungsi untuk mendiskripsikan atau memberi gambaran terhadap obyek yang diteliti melalui data sampel atau populasi sebagaimana adanya, tanpa melakukan analisis dan membuat kesimpulan yang berlaku untuk umum.

Dalam statistik deskriptif ini, akan dikemukakan cara-cara penyajian data, dengan tabel biasa maupun distribusi frekuensi; grafik garis maupun batang; diagram lingkaran; piktogram; penjelasan kelompok melalui modus, median, mean, dan variasi kelompok melalui rentang dan simpangan baku.

B. Penyajian Data

1. Tabel

Penyajian data hasil penelitian dengan menggunakan tabel merupakan penyajian yang banyak digunakan, karena lebih efisien dan cukup komunikatif. Terdapat dua macam tabel, yaitu tabel biasa dan tabel distribusi frekuensi. Setiap tabel berisi judul tabel, judul setiap kolom, nilai data dalam setiap kolom, dan sumber data darimana data tersebut diperoleh.

2. Tabel Distribusi Frekuensi

Tabel distribusi frekuensi disusun bila jumlah data yang akan disajikan cukup banyak, sehingga kalau disajikan dalam tabel biasa menjadi tidak efisien dan kurang komunikatif. Selain itu, tabel ini dapat digunakan sebagai persiapan untuk pengujian terhadap normalitas data yang menggunakan kertas Peluang Normal.

Pengklasifikasian nilai-nilai menjadi beberapa kelompok nilai sehingga didalam setiap kelompok menunjukan frekuensi subjek yang memiliki nilai tersebut.
Contoh :  Jumlah hasil ujian mata kuliah ekonomi yang terdiri dari 50 mahasiswa.
47        45        37        49        42        32        25        21        46        34
37        32        21        20        31        43        47        39        33        29
18        29        30        15        40        28        48        44        23        18
46        23        31        30        16        22        48        49        32        25
35        42        44        37        29        30        41        21        25        17
Analisis :
  • Data diatas termasuk data interval karena nilai yang satu dengan yang lain dapat diketahui jaraknya.
  • Perlu pengaturan data karena belum teratur, sehingga perlu dibedkan antara sample kecil dan sample besar
  • Pengurutan nilai tertinggi hingga yang terendha banyak memakan waktu
  • Sehingga adanya pengaturan dengan distribusi frekuensi.
Langkah-langkahnya :
    1. Mengidentifkasi nilai tertinggi dan terendah, dari nilai diatas tersaji nilai tertinggi 49 sedangkan nilai terendah 15.
    2. Menentukan rentang nilai yaitu mengurangi nilai paling rendah dari nilai paling tinggi.
      Rentangan nilai (range aatau R) untuk kedua nilai adalah 49-15 = 34
    1. Berdasarkan atas besarnya rentangan ini peneliti dapat menentukan kira-kira banyaknya kelas interval tidak lebih dari 15 buah tetapi tidak kurang dari 5 buah (agar tidak terlalu boros tetapi rentangan data tidak terlalu) ada rumus untuk menentukan banyaknya kelas (k) serta lebar kelas (i) dikenal dengan  rumus Sturges : k(banyak kelas) =1 + (3,3) x log n, sedang L (lebar kelas) = R/k.  Dengan demikian maka :
  • K = 1+(3,3) x log 50
                  = 1+(3,3)x1,69897
                  = 1+5,6066 = 6,6066 dibulatkan 7
  • Lebar kelas = 34 : 7 = 5
    1. Membuat distribusi frekuensi dengan lebar kelas 5 dan banyaknya kelas interval 7 dengan pertimbangan bahwa semua nilai dapat termuat didalam distribusi frekuensi tetapi tidak banyak sisa kelas yang terbuang. Perkiraan kelas interval adalah 45-49; 40-44; 35-39; 30-34; 25-29;20-24; 25-29
    1. Menentukan titik tengah kelas interval yang dihitung dengan menjumlahkan batas atas kelas dan batas bawah kelas kemudian dibagi 2. Menentukan titik tengah kelas interval pertama, diketahui :Batas bawah kelas interval; 45 dan batas atas kelas interval ;49 maka titik tengah kelas interval = (45+49) : 2 = 47
    1. Memasukan setiap nilai kedalam kelas interval :
Kelas interval
Titik tengah
Jari-jari
frekuensi
45-49
40-44
35-39
30-34
25-29
20-24
15-19
47
42
37
32
27
22
17
///// ////
///// //
///// /
///// /////
///// /
///// //
/////
9
7
6
10
6
7
5
jumlah
N=50
Dengan menggunakan distribusi frekuensi diatas peneilti akan lebih mudah menentukan frekuensi mutlak, frekuesni relative, rerata nilai (mean), mode dan median.
    1. frekuensi mutlak untuk nilai-nilai diatas dilihat dari frekuensi yang ada dalam setiap kelas interval. Walaupun nilai-nilai didlam kelas interval bervariasi, akan tetapi untuk kelompok tersebut dianggap sudah diwakili oleh nilai yang muncul sebagai titik tengah. Dengan demikian maka frekuensi mutlak untuk distribusi diatas adalah 9,7,6,10, 6,7 dan 5.
    2. frekuensi relative adalah besarnya persentasi setiap frekuensi yang menunjuk pada nilai.
    3. mode adalah frekuensi tertinggi yang dimiliki oleh nilai.oleh karena yang dipandang sebagai nilai adalah titik tengah kelas interval maka mode dari kelas interval adalah 10, frekuensi yang dimiliki ioleh kelas interval (30-34)

3. Grafik

Selain dengan tabel, penyajian data yang cukup populer dan komunikatif adalah dengan grafik. Pada umumnya terdapat dua macam grafik yaitu : grafik garis dan grafik batang. Grafik batang ini dapat dikembangkan lagi menjadi grafik balok (tiga dimensi). Suatu grafik selalu menunjukkan hubungan antara “jumlah” dengan variabel lain, misalnya waktu.

Macam grafik :

–          grafik garis

–          grafik batang

–          diagram lingkaran

–          pictogram (grafik gambar)

C. Pengukuran Gejala Pusat (Central Tendency)

Setiap penelitian selalu berkenaan dengan sekelompok data. Adapun yang dimaksud dengan kelompok di sini adalah satu orang mempunyai sekelompok data atau sekelompok orang mempunyai satu macam data. Misalnya, sekelompok mahasiswa di ruang kuliah dengan satu nilai mata kuliah.

Beberapa teknik penjelasan kelompok yang telah diobservasi dengan data kuantitatif, selain dapat dijelaskan dengan menggunakan tabel dan gambar, dapat juga dijelaskan menggunakan teknik statistik yang disebut : Modus, Median, dan Mean

1. Modus.

Modus merupakan teknik penjelasan kelompok yang didasarkan atas nilai yang sedang populer (yang sedang menjadi mode) atau yang sering muncul dalam kelompok tersebut..

2. Median

Median adalah salah satu teknik penjelasan kelompok yang didasarkan atas nilai tengah dari kelompok data yang telah disusun urutannya dari yang terkecil sampai yang terbesar atau sebaliknya dari yang terbesar sampai yang terkecil.

3. Mean

Mean merupakan teknik penjelasan kelompok yang didasarkan atas nilai rata-rata dari kelompok tersebut. Rata-rata (mean) ini diperoleh dengan menjumlahkan data seluruh individu dalam kelompok itu kemudian dibagi dengan jumlah individu yang ada pada kelompok tersebut.

D. Pengukuran Variasi Kelompok

Untuk menjelaskan keadaan kelompok dapat juga didasarkan pada tingkat variasi data yang terjadi pada kelompok tersebut. Uneuk mengetahui tingkat variasi kelompok data dapat dilakukan dengan melihat rentang data dan standard deviasi atau simpangan baku dari kelompok data yang diketahui.

1. Rentang Data

Rentang data (data range) dapat diketahui dengan jalan mengurangi data yang terbesar dengan data yang terkecil yang ada pada kelompok itu.

2. Varians

Salah satu teknik statistik yang digunakan untuk menjelaskan homogenitas kelompok adalah dengan varians. Varians merupakan jumlah kuadrat semua deviasi nilai-nilai individual terhadap rata-rata kelompok. Akar varians tersebut disebut sebagai standard deviasi atau simpangan baku. Varians populasi diberi simbol s2 dan standard deviasi adalah s . Sedangkan varians untuk sampel diberi simbol s2 dan standard deviasi untuk sampel diberi simbol s.

SKALA PENGUKURAN


Ada empat tipe skala pengukuran dalam penelitian, yaitu nominal, ordinal, interval dan ratio.

A. Nominal

Skala pengukuran nominal digunakan untuk mengklasifikasikan obyek, individual atau kelompok; sebagai contoh mengklasifikasi jenis kelamin, agama, pekerjaan, dan area geografis. Dalam mengidentifikasi hal-hal di atas digunakan angka-angka sebagai symbol. Apabila kita menggunakan skala pengukuran nominal, maka statistik non-parametrik digunakan untuk menganalisa datanya. Hasil analisa dipresentasikan dalam bentuk persentase. Sebagai contoh kita mengklaisfikasi variable jenis kelamin menjadi sebagai berikut: laki-laki kita beri simbol angka 1 dan wanita angka 2. Kita tidak dapat melakukan operasi arimatika dengan angka-angka tersebut, karena angka-angka tersebut hanya menunjukkan keberadaan atau ketidakadanya karaktersitik tertentu.

Contoh:

Jawaban pertanyaan berupa dua pilihan “ya” dan “tidak” yang bersifat kategorikal dapat diberi symbol angka-angka sebagai berikut: jawaban “ya” diberi angka 1 dan tidak diberi angka 2.

B. Ordinal

Skala pengukuran ordinal memberikan informasi tentang jumlah relatif karakteristik berbeda yang dimiliki oleh obyek atau individu tertentu. Tingkat pengukuran ini mempunyai informasi skala nominal ditambah dengan sarana peringkat relatif tertentu yang memberikan informasi apakah suatu obyek memiliki karakteristik yang lebih atau kurang tetapi bukan berapa banyak kekurangan dan kelebihannya.

Contoh:

Jawaban pertanyaan berupa peringkat misalnya: sangat tidak setuju, tidak setuju, netral, setuju dan sangat setuju dapat diberi symbol angka 1, 2,3,4 dan 5. Angka-angka ini hanya merupakan simbol peringkat, tidak mengekspresikan jumlah.

C. Interval

Skala interval mempunyai karakteristik seperti yang dimiliki oleh skala nominal dan ordinal dengan ditambah karakteristik lain, yaitu berupa adanya interval yang tetap. Dengan demikian peneliti dapat melihat besarnya perbedaan karaktersitik antara satu individu atau obyek dengan lainnya. Skala pengukuran interval benar-benar merupakan angka. Angka-angka yang digunakan dapat dipergunakan dapat dilakukan operasi aritmatika, misalnya dijumlahkan atau dikalikan. Untuk melakukan analisa, skala pengukuran ini menggunakan statistik parametric.

Contoh:

Jawaban pertanyaan menyangkut frekuensi dalam pertanyaan, misalnya: Berapa kali Anda melakukan kunjungan ke Jakarta dalam satu bulan? Jawaban: 1 kali, 3 kali, dan 5 kali. Maka angka-angka 1,3, dan 5 merupakan angka sebenarnya dengan menggunakan interval 2.

D. Ratio

Skala pengukuran ratio mempunyai semua karakteristik yang dipunyai oleh skala nominal, ordinal dan interval dengan kelebihan skala ini mempunyai nilai 0 (nol) empiris absolut. Nilai absoult nol tersebut terjadi pada saat ketidakhadirannya suatu karakteristik yang sedang diukur. Pengukuran ratio biasanya dalam bentuk perbandingan antara satu individu atau obyek tertentu dengan lainnya.

Contoh:

Berat Sari 35 Kg sedang berat Maya 70 Kg. Maka berat Sari dibanding dengan berat Maya sama dengan 1 dibanding 2.

E. Validitas

Suatu skala pengukuran dikatakan valid apabila skala tersebut digunakan untuk mengukur apa yang seharusnya diukur. Misalnya skala nominal yang bersifat non-parametrik digunakan untuk mengukur variabel nominal bukan untuk mengukur variabel interval yang bersifat parametrik. Ada 3 (tiga) tipe validitas pengukuran yang harus diketahui, yaitu:

a. Validitas Isi (Content Validity)

Validitas isi menyangkut tingkatan dimana item-item skala yang mencerminkan domain konsep yang sedang diteliti. Suatu domain konsep tertentu tidak dapat begitu saja dihitung semua dimensinya karena domain tersebut kadang mempunyai atribut yang banyak atau bersifat multidimensional.

b. Validitas Kosntruk (Construct Validity)

Validitas konstruk berkaitan dengan tingkatan dimana skala mencerminkan dan berperan sebagai konsep yang sedang diukur. Dua aspek pokok dalam validitas konstruk ialah secara alamiah bersifat teoritis dan statistik.

c. Validitas Kriteria (Criterion Validity)

Validitas kriteria menyangkut masalah tingkatan dimana skala yang sedang digunakan mampu memprediksi suatu variable yang dirancang sebagai kriteria.

F. Reliabilitas

Reliabilitas menunjuk pada adanya konsistensi dan stabilitas nilai hasil skala pengukuran tertentu. Reliabilitas berkonsentrasi pada masalah akurasi pengukuran dan hasilnya.


Test Statistk non-parametrik


Statistik non parametris digunakan untuk menguji hipotesis bila datanya berbentuk nominal dan ordinal dan tidak berlandaskan asumsi bahwa distribusi data harus normal. Sehingga kita kenal beberapa tes yang digunakan dalam penelitian hipotesis antara lain :

Test binomial

Tes binomial digunakan untuk menguji hipotesis bila dalam populasi terdiri atas dua kelompok kelas, datanya berbentuk nominal dan jum,lha sampelnya kecilnya (kurang dari 25).

Chi kuadrat
Chi kuadrat satu sampel, adalah teknik statistik yang digunakan untuk menguji hipotesis deskriptif bila dalam populasi terdiri atas dua atau lebi kelas, data berbentuk nominal dan smapelnya besar. yang dimaksud hipotesis deskriptif diatas adlah merupakan estimasi gugaan terhadap ada tidaknya perbedaan frekuensi anatra kategori satu dan kategori lainnya dalam sebuah sampel tentang suatu hal.

Run test
Test ini digunakan untuk menguji hipotesis deskriptif satu sampel, bial datanya berbentuk ordina. pengujian dilakukan dengan dengancara mengukur kerandoman populasi yang didasarkan atas data hasil pengamatan melalui data sampel.

McNemar Test
Teknik statistik digunakan untk mengji hipotesa komparatif dua sampel yang berkorelasi bila datanya berbentuk nominal/diskrit. dancangan peneitianya biasanya bebentuk before after. jadi hipotesa penelitian merupakan perbandaingan antara nilai sebelum dan sesudah ada perlakuan.

Sign Test
test ini digunakan untuk menguji hipotesa komparatif dua sampel yang berkorelasi, bila datanya berbentuk ordinal. teknik ini dianamakan uji tanda  karena data yang akan dianalisis dinyatakan dalam bentuk tanda-tanda yaitu tanda positif dan negatif.

Wilcoxon Match Pairs Test
Teknik  ini merupakan penyempurnaan dari uji tanda (sign test). kalau dalam uji tnada besarnya selisih nilai angka antara positif dan negatif tidak diperhitungkan sedangkan dlaam uji wilcoxon ini diperhitungkan, teknik digunakan untuk menguji signifikansi hipotesis komparatif dua sampel yang berkorelasi bila datanya berbentuk ordinal.

Chi kuadrat dua sampel
Chi kuadrat dua sampel digunakan untuk menguji hipotesis komparatif dua smapel bila datanya berbentuk nominal dan sampelnya besar. cara perhitungan dapat menggunakan rumus yang telah ada atau dapat menggunakan tabel kontingensi 2×2.

Fisher Exact Probability Test
Test ini digunakan untuk menguji signifikansi hipotesis komparatif dua sampel kecil independen bila datanya berbentuk nominal untuk sampel yang besar duigunakan chi kuadrat.

Test median
Tes median digunakan untuk menguji signifikansi hipoteis komparatif dua smapel independen bila datanya bernbentuk nominal atau ordinal. pengjuijan didasarkaan atas median dari smapel yang diambil secara random. dengan demikian Ho yang akan diuji berbunyi : tidak terdapat perbedaan dua kelompok populasi berdasarkan mediannya.

Mann-Whitney U-Test
U-test ini digunakan untuk menguji signifikansi hipotesis komparatif dua sampel independen bila datanya berbentuk ordinal test ini merupakan test yang terbaik untuk menguji hipotesis komparatif dua sampel indenden bila datanya berbentuk ordinal.

Test Kolmogorov-Smirnov dua sampel
Test ini digunakan untuk menguji hipotesis komparatif dua sampel independen bila datanya bernetuk ordinal yang telah tersusun pada tabel distribusi frekuensi kumulatif dengan menggunakan kela-kelas interval.

Test Run Wald-Wolfowitz
Tes ini dibgunakan untuk meguji signifikasin hipotesis komparatif dua sampel independen bila datanya berbentuk ordinal dan disusun dalam bentuk run. oleh karena itu sebelum dtaa dua sampel (n1 + n2) dianalisis maka perlu disusun terlebih dahulu kedlaam bentuk ranking.

Test Cochran
Tes ini digunakan untuk hipotesis komparatif k sampel berpasangan bila datanya benrbnuk nominal dan frekuensi dikotomi.

Test Friedman
Friedman two way anova (analisi varian dua jalan Friedman) digunakan untuk menguji hipotesis komparatif k sampel yang berpasanga (related) bila datany aberebntuk ordinal (ranking), bila datany terkumpul berbntuk interval atau ratio maka data tersebut diubah kedalam ordinal.

Chi-kuadrat k Sampel
Test ini digunakan untuk menguji hipotesis komparatif lebih dari dua sample, bila datanya benrbntuk diskrit atau nominal.

Median Extention
test median extension digunakan untuk menguji hipotesis komparatif median k sampel independen bila datanya berbentuk ordinal dan dalam tes ini ukuran sampel tidak harus sama.

Analisis Varian satu jalan Kruskal-Walls
teknik ini digunakan untuk menguji hipotesis k sampel inedependen bila datanya berbentuk ordinal. bila dalam pengukuran ditemukan data berbentuk interval atau ratio maka perlu dirubah dulu kedlam ordinal (data berbentukr anking/peringkat).

Koefiisen Kontingensi
koefisien ini digunakan untuk menghitung hubungan antar variabel bila datanya berbentuk nominal. teknik mempunyai kaitan eratdengan chi kuadrat yang digunakan untuk menguji hipotesis komparatif k sampel independen, oleh karena itu rumus yang digunakan mengandung nilai cjhi kuadrat.

Korelasi Spearman Rank
Korelasi spearman rank digunakan mencari hubungan atau uji signifikansi hipotesisi asosiatif bila amsing-masing variabel yang dihubungkan berbentuk ordinal dan sumber data aantar variabel tidak harus sama.

Korelasi Kendal Tau
Sepertinya dalam korelasi spearman rank, korlasi kendal tau digunakan untuk mencari hubungan dan menguji hipotesis antara dua variabel atau lebih bila datanya berbentuk ordinal atau ranking.