MBG1032 Biyoistatistik - Doç.Dr.Alper YILMAZ - 5 Mayıs 2025
Ki-kare testi, kategorik değişkenler için kullanılan parametrik olmayan bir istatistiksel testtir.
Temel Amaç:
Kullanım Alanları:
Ki-kare dağılımı, bağımsız standart normal dağılmış değişkenlerin karelerinin toplamının dağılımıdır.
Özellikleri:
Matematiksel İfade:
\(\chi^2 = \sum_{i=1}^{k} Z_i^2\)
Burada \(Z_i\)’ler bağımsız standart normal değişkenlerdir.
Ki-kare Dağılımları
Görsel Kaynak: Wikimedia Commons
Ki-kare testi, farklı amaçlar için kullanılabilir:
Amaç: Gözlenen frekansların teorik/beklenen bir dağılıma uygunluğunu test etmek.
Hipotezler:
Test İstatistiği: \(\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\)
Burada:
Serbestlik Derecesi: df = k - 1 - m
Gregor Mendel (1822-1884), modern genetiğin babası olarak kabul edilir. Bezelye bitkilerinde yaptığı deneyler ile kalıtım yasalarını keşfetmiştir.
Mendel’in Çalışmaları:
Senaryo: Mendel’in sarı (dominant, Y) x yeşil (resesif, y) bezelye tohumu çaprazlamasından sonra F2 nesilde gözlenen fenotipik oranları inceleyelim.
Mendel’in Teorik Beklentisi: 3:1 oranı (3 sarı : 1 yeşil)
Mendel’in verilerini R’ın chisq.test()
fonksiyonu ile analiz edelim:
Senaryo: Mendel’in sarı-düzgün (YYRR) x yeşil-buruşuk (yyrr) bezelye tohumu çaprazlamasından sonra F2 nesilde gözlenen fenotipik oranları inceleyelim.
Mendel’in Teorik Beklentisi: 9:3:3:1 oranı
Amaç: İki kategorik değişken arasında anlamlı bir ilişki olup olmadığını test etmek.
Hipotezler:
Test İstatistiği: \(\chi^2 = \sum_{i=1}^{r} \sum_{j=1}^{c} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}\)
Burada:
Serbestlik Derecesi: df = (r - 1) × (c - 1)
Beklenen Frekansların Hesaplanması:
\(E_{ij} = \frac{(\text{i. satır toplamı}) \times (\text{j. sütun toplamı})}{\text{genel toplam}}\)
Senaryo: Bir hastalığın görülme sıklığı ile kan grupları arasında bir ilişki olup olmadığını test etmek istiyoruz.
p-değeri < 0.05 ise, iki değişken arasında anlamlı bir ilişki olduğu sonucuna varırız (H₀ reddedilir).
Ki-kare testi, parametrik olmayan bir test olmasına rağmen, bazı varsayımlara dayanır:
Bağımsızlık: Gözlemler birbirinden bağımsız olmalıdır.
Rastgele Örnekleme: Veriler popülasyondan rastgele seçilmelidir.
Kategorik Veri: Ki-kare testi yalnızca kategorik (nominal veya ordinal) verilere uygulanabilir.
Yeterli Örnek Boyutu: Beklenen frekansların çoğu 5’ten büyük olmalıdır. Genellikle, beklenen frekansların en fazla %20’si 5’ten küçük olabilir ve hiçbir beklenen frekans 1’den küçük olmamalıdır.
Varsayımlar Karşılanmadığında:
Fisher’ın Kesin Testi, özellikle örneklem boyutu küçük olduğunda ve Ki-kare testinin varsayımları karşılanmadığında kullanılabilir.
Ki-kare testi, biyoloji alanında yaygın olarak kullanılır:
Hardy-Weinberg dengesi, evrim geçirmeyen bir popülasyonda alel ve genotip frekanslarının sabit kalacağını belirten bir ilkedir.
Tek lokus, iki alel (A ve a) için:
Ki-kare testi ile Hardy-Weinberg dengesi test edilebilir
Akademik yayınlarda Ki-kare sonuçlarını nasıl raporlamalıyız?
Ki-kare Uygunluk Testi için: "Mendel’in monohybrid çaprazlama çalışmasındaki gözlenen fenotip dağılımının (sarı:yeşil) teorik 3:1 oranına uygunluğu Ki-kare uygunluk testi ile değerlendirilmiştir. Analiz sonucunda, gözlenen dağılımın teorik orana uygun olduğu bulunmuştur (χ²(1) = 0.25, p = 0.617)."
Ki-kare Bağımsızlık Testi için: "Kan grubu ile hastalık görülme sıklığı arasındaki ilişki Ki-kare bağımsızlık testi ile incelenmiştir. Analiz sonucunda, kan grubu ile hastalık arasında istatistiksel olarak anlamlı bir ilişki bulunmuştur (χ²(3) = 8.52, p = 0.036, Cramer’s V = 0.21). O kan grubuna sahip bireylerde hastalık görülme oranı, diğer kan gruplarına göre anlamlı derecede düşüktür."
Senaryo: Farklı bitki türlerinin farklı habitat tiplerine dağılımı arasında bir ilişki olup olmadığını test etmek istiyoruz.
Kan grupları ile ilgili yapılan bir çalışmada 400 kişiden toplanan veriler şu şekildedir:
Normal teorik dağılım %40 A, %10 B, %5 AB ve %45 O grubu şeklindedir. Bu dağılımın teorik dağılıma uyup uymadığını test ediniz.
Bir moleküler biyolog, iki gen arasında bağlantı olup olmadığını test etmek istiyor. F2 neslinde gözlenen fenotipik oranlar şöyledir:
Bağımsız kalıtım hipotezini (9:3:3:1 oranı) test ediniz.