Senin, 17 Oktober 2016

Uji Chi Square

Chi-square adalah uji statistik yang biasa digunakan untuk membandingkan data observasi dengan data yang kita harapkan untuk mendapatkan sesuai dengan hipotesis tertentu.
Sebagai contoh, jika, menurut hukum Mendel, Anda diharapkan 10 dari 20 keturunan dari salib menjadi laki-laki dan jumlah diamati sebenarnya adalah 8 laki-laki, maka Anda mungkin ingin tahu tentang "kebaikan agar sesuai" antara diamati dan diharapkan. Adalah penyimpangan (perbedaan antara diamati dan diharapkan) hasil kebetulan, atau apakah mereka karena faktor lain. Berapa banyak penyimpangan dapat terjadi sebelum Anda, penyidik, harus menyimpulkan bahwa sesuatu selain kesempatan sedang bekerja, menyebabkan diamati berbeda dari yang diharapkan. Uji chi-square selalu menguji apa yang para ilmuwan sebut hipotesis nol, yang menyatakan bahwa tidak ada perbedaan yang signifikan antara hasil yang diharapkan dan diamati.
Rumus untuk menghitung chi-square (2) adalah:
2 = (o-e) 2 / e
Artinya, chi-square adalah jumlah dari perbedaan kuadrat antara diamati (o) dan diharapkan (e) data (atau penyimpangan, d), dibagi dengan data yang diharapkan di semua kategori mungkin.
Misalnya, bahwa persilangan antara dua tanaman kacang menghasilkan populasi 880 tanaman, 639 dengan biji hijau dan 241 dengan biji kuning.
Anda diminta untuk mengusulkan genotipe orang tua. hipotesis Anda adalah bahwa alel untuk hijau adalah dominan alel untuk kuning dan bahwa tanaman induk berdua heterozigot untuk sifat ini.
Jika hipotesis Anda benar, maka rasio diprediksi keturunan dari salib ini akan menjadi 3: 1 (berdasarkan hukum Mendel) seperti yang diperkirakan dari hasil Punnett persegi (Gambar B. 1).
Gambar B.1 - Punnett Square. Diprediksi keturunan dari persilangan antara tanaman hijau dan kuning-unggulan. Hijau (G) adalah dominan (3/4 hijau; 1/4 kuning).
Untuk menghitung 2, pertama menentukan jumlah
diharapkan dalam setiap kategori. Jika rasio 3: 1 dan jumlah total individu yang diamati adalah 880, maka nilai-nilai numerik yang diharapkan harus 660 hijau dan 220 kuning.
Chi-square mengharuskan Anda menggunakan nilai numerik, bukan persentase atau rasio.
Kemudian menghitung 2 menggunakan rumus ini, seperti yang ditunjukkan pada Tabel B.1.
Perhatikan bahwa kita mendapatkan nilai 2,668 untuk
2. Tapi apa nomor ini berarti? Berikut adalah cara untuk menafsirkan 2 nilai:
1. Tentukan derajat kebebasan (df). Derajat kebebasan dapat dihitung sebagai jumlah kategori dalam masalah dikurangi 1. Dalam contoh kita, ada dua kategori (hijau dan kuning); Oleh karena itu, ada tingkat I kebebasan.
2. Tentukan standar relatif untuk melayani sebagai dasar untuk menerima atau menolak hipotesis. standar relatif umum digunakan dalam penelitian biologis p> 0,05. Nilai p adalah probabilitas
bahwa penyimpangan yang diamati dari yang diharapkan adalah karena kebetulan saja (tidak ada akting kekuatan lain). Dalam hal ini, menggunakan p> 0,05, yang Anda harapkan penyimpangan terjadi karena kebetulan saja 5% dari waktu atau kurang.
3. Lihat tabel distribusi chi-kuadrat (Tabel B.2).
Menggunakan derajat tepat 'kebebasan, mencari nilai terdekat chi-square Anda dihitung dalam tabel. Tentukan closestp (probabilitas) nilai yang terkait dengan chi-square dan derajat kebebasan.
Dalam hal ini (2 = 2,668), nilai p adalah sekitar 0,10, yang berarti bahwa ada kemungkinan 10% bahwa setiap penyimpangan dari hasil yang diharapkan adalah karena kebetulan saja.
Berdasarkan p standar kami> 0,05, ini adalah dalam kisaran penyimpangan diterima. Dalam hal hipotesis Anda untuk contoh ini, yang diamati chi-squareis tidak berbeda secara signifikan dari yang diharapkan. nomor yang diamati konsisten dengan yang diharapkan di bawah hukum Mendel.
Langkah-Langkah Prosedur untuk Pengujian Hipotesis Anda dan Menghitung Chi-Square
1. Negara hipotesis yang diuji dan hasilnya diprediksi. Mengumpulkan data dengan melakukan percobaan yang tepat (atau, jika genetika bekerja masalah, menggunakan data yang disediakan dalam masalah).
2. Tentukan nomor yang diharapkan untuk masing-masing kelas observasional. Ingatlah untuk menggunakan angka, tidak persentase.
Chi-square tidak boleh dihitung jika nilai yang diharapkan dalam setiap kategori kurang dari 5.
3. Hitung 2 menggunakan rumus. Lengkapi semua perhitungan untuk tiga angka yang signifikan. Membulatkan jawaban Anda untuk dua signifikan digit.
4. Gunakan tabel distribusi chi-kuadrat untuk menentukan signifikansi dari nilai.
Sebuah. Menentukan derajat kebebasan dan menemukan nilai dalam kolom yang sesuai.
b. Cari nilai terdekat dihitung Anda 2 pada yang derajat dari baris kebebasan df.
c. Pindah ke atas kolom untuk menentukan nilai p.
5. Negara kesimpulan Anda dalam hal hipotesis Anda.
Sebuah. Jika p value untuk dihitung 2 adalah p> 0,05, menerima hipotesis Anda. 'Penyimpangan kecil cukup bahwa kebetulan saja menyumbang untuk itu. Nilai p dari 0,6, misalnya, berarti ada kemungkinan 60% bahwa setiap penyimpangan dari yang diharapkan adalah karena kebetulan saja. Ini adalah dalam kisaran penyimpangan diterima.
b. Jika p value untuk dihitung 2 adalah p <0,05, menolak hipotesis Anda, dan menyimpulkan bahwa beberapa faktor selain kesempatan operasi untuk deviasi untuk menjadi begitu besar.
Misalnya, nilai p 0,01 berarti bahwa hanya ada peluang 1% bahwa deviasi ini adalah karena kebetulan saja. Oleh karena itu, faktor lain harus terlibat.
Uji chi-square akan digunakan untuk menguji untuk "kebaikan cocok" antara data yang diamati dan diharapkan dari beberapa pemeriksaan laboratorium dalam manual ini lab.
Secara umum, uji chi-square adalah uji statistik yang digunakan untuk menguji perbedaan dengan variabel kategori. Ada sejumlah fitur dari dunia sosial kita mencirikan melalui variabel kategori - agama, preferensi politik, dll Untuk menguji hipotesis menggunakan variabel seperti, menggunakan uji chi-square.
Uji chi-square digunakan dalam dua kondisi yang sama namun berbeda:
Sebuah. untuk memperkirakan seberapa dekat distribusi diamati cocok distribusi yang diharapkan - kami akan lihat ini sebagai kebaikan-of-fit tes
b. untuk memperkirakan apakah dua variabel acak independen.
Kebaikan-of-Fit Uji
Salah satu kebaikan-of-fit aplikasi yang lebih menarik dari uji chi-square adalah untuk meneliti masalah keadilan dan kecurangan dalam permainan kesempatan, seperti kartu, dadu, dan rolet. Sejak permainan seperti biasanya melibatkan taruhan, ada insentif yang signifikan bagi orang untuk mencoba untuk rig game dan tuduhan kartu hilang, "dimuat" dadu, dan "lengket" roda roulette yang terlalu umum.
Jadi bagaimana bisa kebaikan-of-fit tes digunakan untuk memeriksa kecurangan dalam perjudian?
Hal ini lebih mudah untuk menggambarkan proses melalui contoh. Ambil contoh dadu. Kebanyakan dadu digunakan dalam taruhan memiliki enam sisi, dengan masing-masing pihak memiliki nilai satu, dua, tiga, empat, lima, atau enam. Jika mati yang digunakan adalah adil, maka peluang dari setiap nomor tertentu datang adalah sama: 1 di 6. Namun, jika mati dimuat, maka nomor-nomor tertentu akan memiliki kemungkinan lebih besar muncul, sementara yang lain akan memiliki lebih rendah kemungkinan.
Satu malam di Tunisia Nights Casino, penjudi terkenal Jeremy Turner (alias The Missouri Guru) adalah memiliki malam yang fantastis di meja dadu. Dalam dua jam bermain, dia disiksa sampai $ 30.000 dalam kemenangan dan tidak menunjukkan tanda-tanda berhenti. Orang banyak berkumpul di sekitar dia untuk menonton beruntun - dan The Missouri Master memberitahu siapa pun dalam pendengaran bahwa keberuntungan itu adalah karena fakta bahwa dia menggunakan sepasang beruntung kasino dari "dadu jago," dinamakan demikian karena salah satu hitam dan lainnya biru.
Gulungan
Tanpa diketahui Turner, bagaimanapun, seorang ahli statistik kasino telah diam-diam mengawasi gulungan dan menandai bawah nilai-nilai setiap roll, mencatat nilai-nilai dadu hitam dan biru secara terpisah. Setelah 60 gulungan, statistik telah menjadi yakin bahwa mati biru dimuat.
Nilai tentang Blue Die Diamati Frekuensi yang diharapkan Frekuensi
1 16 10
2 5 10
3 9 10
4 7 10
5 6 10
6 17 10
Total 60 60
Pada pandangan pertama, meja ini akan muncul menjadi bukti kuat bahwa mati biru, memang, dimuat. Ada lebih 1 dan 6 ini dari yang diharapkan, dan kurang dari nomor lain. Namun, ada kemungkinan bahwa perbedaan tersebut terjadi secara kebetulan. Statistik chi-square dapat digunakan untuk memperkirakan kemungkinan bahwa nilai-nilai yang diamati pada die biru terjadi secara kebetulan.
Ide kunci dari uji chi-square adalah perbandingan nilai diamati dan diharapkan. Berapa banyak dari sesuatu yang diharapkan dan berapa banyak yang diamati pada beberapa proses? Dalam hal ini, kita akan mengharapkan 10 dari setiap nomor telah muncul dan kami mengamati nilai-nilai tersebut di kolom sebelah kiri.
Dengan set ini angka, kita menghitung statistik chi-square sebagai berikut:
Menggunakan rumus ini dengan nilai-nilai dalam tabel di atas memberi kita nilai 13,6.
Terakhir, untuk menentukan tingkat signifikansi kita perlu mengetahui "derajat kebebasan." Dalam kasus kebaikan-of-fit uji chi-square, jumlah derajat kebebasan adalah sama dengan jumlah istilah yang digunakan dalam menghitung chi-square minus satu. Ada enam hal di chi-square untuk masalah ini - karena itu, jumlah derajat kebebasan adalah lima.
Kami kemudian membandingkan nilai yang dihitung dalam rumus di atas untuk satu set standar tabel. Nilai kembali dari meja adalah 1,8%.
Kami menafsirkan ini sebagai berarti bahwa jika mati adil (atau tidak dimuat), maka kesempatan untuk mendapatkan? 2 statistik sebagai besar atau lebih besar dari yang dihitung di atas hanya 1,8%. Dengan kata lain, hanya ada kesempatan yang sangat tipis bahwa gulungan tersebut berasal dari dadu. Missouri Guru dalam masalah serius.
ikhtisar
Untuk rekap langkah-langkah yang digunakan dalam menghitung uji kebaikan-of-fit dengan chi-square:
1. Menetapkan hipotesis.
2. Hitung chi-square statistic. Melakukan hal itu mengetahui:
Jumlah pengamatan
nilai-nilai yang diharapkan
nilai-nilai yang diamati
3. Kaji tingkat signifikansi. Melakukan hal memerlukan mengetahui jumlah derajat kebebasan.
4. Akhirnya, memutuskan apakah akan menerima atau menolak hipotesis nol.
pengujian Independence
Penggunaan utama lain dari uji chi-square adalah untuk menguji apakah dua variabel independen atau tidak. Apa artinya menjadi mandiri, dalam pengertian ini? Ini berarti bahwa dua faktor yang tidak terkait. Biasanya dalam penelitian ilmu sosial, kami tertarik untuk mencari faktor-faktor yang terkait - pendidikan dan pendapatan, pekerjaan dan prestise, usia dan perilaku pemilih.
Dalam hal ini, chi-square dapat digunakan untuk menilai apakah dua variabel independen atau tidak.
Lebih umum, kita mengatakan bahwa variabel Y adalah "tidak berkorelasi dengan" atau "independen" variabel X jika lebih dari satu tidak terkait dengan lebih dari yang lain. Jika dua variabel kategori yang berkorelasi nilai-nilai mereka cenderung bergerak bersama-sama, baik dalam arah yang sama atau di seberang.
Contoh
Kembali ke contoh dibahas pada pendahuluan chi-square, di mana kita ingin tahu apakah anak laki-laki atau perempuan mendapat masalah lebih sering di sekolah. Berikut ini adalah tabel mendokumentasikan persentase anak laki-laki dan perempuan yang mendapat masalah di sekolah:
Mendapat in Trouble No Masalah Jumlah
Anak laki-laki 46 71 117
Gadis 37 83 120
Total 83 154 237
Untuk menguji statistik apakah anak laki-laki mendapat masalah di sekolah lebih sering, kita perlu membingkai pertanyaan dalam hal hipotesis.
1. Menetapkan Hipotesis
Seperti dalam kebaikan-of-fit uji chi-square, langkah pertama dari uji chi-square kemerdekaan adalah untuk membentuk hipotesis. Hipotesis nol bahwa kedua variabel independen - atau, dalam kasus ini yang kemungkinan terlibat dalam kesulitan adalah sama untuk anak laki-laki dan perempuan. Hipotesis alternatif yang akan diuji adalah bahwa kemungkinan mendapatkan dalam kesulitan tidak sama untuk anak laki-laki dan perempuan.
peringatan Catatan
Hal ini penting untuk diingat bahwa uji chi-square hanya tes apakah dua variabel independen. Hal ini tidak bisa menjawab pertanyaan yang lebih besar atau kurang. Menggunakan uji chi-square, kita tidak dapat mengevaluasi secara langsung hipotesis bahwa anak laki-laki mendapat masalah lebih dibandingkan anak perempuan; bukan, tes (tegasnya) hanya dapat menguji apakah dua variabel independen atau tidak.
2. Hitung nilai yang diharapkan untuk setiap sel tabel
Seperti dengan kebaikan-of-fit contoh dijelaskan sebelumnya, gagasan kunci dari uji chi-square kemerdekaan adalah perbandingan nilai diamati dan diharapkan. Berapa banyak dari sesuatu yang diharapkan dan berapa banyak yang diamati pada beberapa proses? Dalam kasus data tabular, namun, kami biasanya tidak tahu apa distribusi harus seperti (seperti yang kita lakukan dengan gulungan dadu). Sebaliknya, dalam penggunaan ini uji chi-square, nilai yang diharapkan dihitung berdasarkan baris dan kolom total dari meja.
Nilai yang diharapkan untuk setiap sel tabel dapat dihitung dengan menggunakan rumus berikut:
Misalnya, pada tabel membandingkan persentase anak laki-laki dan perempuan dalam kesulitan, jumlah yang diharapkan untuk jumlah anak laki-laki yang mendapat masalah adalah:
Langkah pertama, kemudian, dalam menghitung statistik chi-square dalam uji kemerdekaan adalah menghasilkan nilai yang diharapkan untuk setiap sel tabel. Disajikan dalam tabel di bawah ini adalah nilai-nilai yang diharapkan (dalam tanda kurung dan miring) untuk setiap sel:
Mendapat in Trouble No Masalah Jumlah
Anak laki-laki 46 (40,97) 71 (76,02) 117
Gadis 37 (42,03) 83 (77,97) 120
Total 83 154 237
statistik 3. Hitung Chi-square
Dengan set ini angka, kita menghitung statistik chi-square sebagai berikut:
Dalam contoh di atas, kita mendapatkan statistik chi-square sama dengan:
4. Kaji tingkat signifikansi
Terakhir, untuk menentukan tingkat signifikansi kita perlu mengetahui "derajat kebebasan." Dalam kasus uji chi-square kemerdekaan, jumlah derajat kebebasan adalah sama dengan jumlah kolom dalam tabel minus satu dikalikan dengan jumlah baris dalam satu meja dikurangi.
Dalam tabel ini, ada dua baris dan dua kolom.
Oleh karena itu, jumlah derajat
kebebasan adalah:
Kami kemudian membandingkan nilai yang dihitung dalam rumus di atas untuk satu set standar tabel. Nilai kembali dari meja adalah p <20%. Dengan demikian, kita tidak dapat menolak hipotesis nol dan menyimpulkan bahwa anak laki-laki tidak signifikan lebih mungkin untuk mendapat masalah di sekolah dibandingkan anak perempuan.
ikhtisar
Untuk rekap langkah-langkah yang digunakan dalam menghitung uji kebaikan-of-fit dengan chi-square
1. Menetapkan hipotesis
2. nilai Hitung diharapkan untuk setiap sel tabel.
3. Hitung chi-square statistic. Melakukan hal itu mengetahui:
Sebuah. Jumlah pengamatan
b. nilai-nilai yang diamati
4. Kaji tingkat signifikansi. Melakukan hal memerlukan mengetahui jumlah derajat kebebasan
5. Akhirnya, memutuskan apakah akan menerima atau menolak hipotesis nol.

Tidak ada komentar: