MBG1032 Biyoistatistik - Doç.Dr.Alper YILMAZ
ANOVA, ikiden fazla grup ortalaması arasındaki farkların istatistiksel anlamlılığını değerlendirmek için kullanılan parametrik bir testtir.
Kullanım Amacı:
Temel Fikir:
Gruplar arası varyans ile gruplar içi varyansı karşılaştırarak, faktörün anlamlı bir etkisi olup olmadığını belirlemek
Neden ANOVA? Neden çoklu t-testi kullanmıyoruz?
Örnek: 3 grup karşılaştırması yapıyorsak:
Tip I hata olasılığı 0.05 yerine 0.143’e çıkar!
ANOVA, bu "çoklu karşılaştırma problemini" çözer ve genel hata oranını kontrol altında tutar.
İstatistikte birçok ANOVA türü vardır:
Bu derste ağırlıklı olarak Tek Yönlü ANOVA üzerinde duracağız.
Tek Yönlü ANOVA’da:
Matematiksel Model:
\[Y_{ij} = \mu + \alpha_i + \epsilon_{ij}\]
Burada:
Sıfır Hipotezi (H₀): Tüm grup ortalamaları birbirine eşittir. \[H_0: \mu_1 = \mu_2 = ... = \mu_k\]
Alternatif Hipotez (H₁): En az bir grup ortalaması diğerlerinden farklıdır.
\[H_1: \ ext{En az bir } \mu_i \ eq \mu_j \ ext{ (i ≠ j için)}\]
ANOVA, t-testine benzer şekilde, bazı varsayımlar üzerine kuruludur:
Bağımsızlık: Gözlemler birbirinden bağımsız olmalıdır.
Normallik: Her gruptaki verilerin normal dağılması veya örneklem boyutunun yeterince büyük olması (n>30).
Varyansların Homojenliği (Homoscedasticity): Tüm gruplardaki varyansların yaklaşık olarak eşit olması.
Not: Varsayımlar karşılanmadığında, parametrik olmayan alternatifler düşünülmelidir (örn. Kruskal-Wallis testi).
ANOVA’nın adı "Varyans Analizi"dir çünkü toplam varyansı iki bileşene ayırır:
1. Gruplar Arası Varyans (Between-Groups Variance):
2. Gruplar İçi Varyans (Within-Groups Variance):
F-istatistiği = Gruplar Arası Varyans / Gruplar İçi Varyans
ANOVA’da varyans analizi için, kareler toplamı (Sum of Squares - SS) hesaplanır:
1. Toplam Kareler Toplamı (SST):
\[SST = \sum_{i=1}^{k}\sum_{j=1}^{n_i}(Y_{ij} - \bar{Y})^2\]
2. Gruplar Arası Kareler Toplamı (SSB): \[SSB = \sum_{i=1}^{k}n_i(\bar{Y}_i - \bar{Y})^2\]
3. Gruplar İçi Kareler Toplamı (SSW): \[SSW = \sum_{i=1}^{k}\sum_{j=1}^{n_i}(Y_{ij} - \bar{Y}_i)^2\]
İlişki: SST = SSB + SSW
Kareler toplamı değerleri, ilgili serbestlik dereceleri ile bölünerek ortalama kareler (Mean Squares - MS) hesaplanır:
1. Gruplar Arası Ortalama Kareler (MSB): \[MSB = \frac{SSB}{k-1}\]
2. Gruplar İçi Ortalama Kareler (MSW): \[MSW = \frac{SSW}{N-k}\]
F-İstatistiği: \[F = \frac{MSB}{MSW}\]
Burada:
F-değeri, α düzeyindeki kritik F-değeri ile karşılaştırılır. Eğer hesaplanan F-değeri kritik değerden büyükse, H₀ reddedilir.
F-dağılımı, iki farklı varyans tahmininin oranı olarak hesaplanan F-istatistiği için örnekleme dağılımıdır.
Özellikleri:
Görsel Kaynak: Wikimedia Commons
ANOVA sonuçları genellikle bir tablo ile özetlenir:
Varyasyon Kaynağı | SS | df | MS | F | p-değeri |
---|---|---|---|---|---|
Gruplar Arası (Between) | SSB | k-1 | MSB = SSB/(k-1) | F = MSB/MSW | p |
Gruplar İçi (Within) | SSW | N-k | MSW = SSW/(N-k) | ||
Toplam | SST | N-1 |
Örnek Senaryo: Üç farklı gübre türünün (A, B, C) domates bitkilerinin boy (cm) üzerindeki etkisini analiz edelim.
ANOVA, gruplar arasında bir fark olduğunu söyler, ancak hangi grupların farklı olduğunu söylemez. Bunu belirlemek için post-hoc testleri kullanılır.
En Yaygın Post-hoc Testleri:
Tukey HSD (Honestly Significant Difference): Tüm olası ikili grup karşılaştırmalarını yapar ve aile bazında hata oranını kontrol eder.
Bonferroni Düzeltmesi: Alfa (α) değerini karşılaştırma sayısına bölerek çoklu test problemini düzeltir.
Scheffé Testi: Tüm olası grup karşılaştırmaları için uygundur, ancak genellikle daha muhafazakardır.
Not: Post-hoc testleri sadece ANOVA sonucu istatistiksel olarak anlamlıysa (p < 0.05) uygulanır.
Tukey HSD sonuçlarına göre:
Genel Sonuç: * Gübre B ve Gübre C, Gübre A’dan daha etkilidir. * Gübre B ve Gübre C arasında anlamlı bir fark yoktur.
Akademik yayınlarda ANOVA sonuçlarını nasıl raporlamalıyız?
"Gübre türünün domates bitkilerinin boyları üzerindeki etkisi, tek yönlü ANOVA ile değerlendirilmiştir. Gübre türünün bitki boyu üzerinde istatistiksel olarak anlamlı bir etkisi bulunmuştur, F(2, 21) = 16.44, p < 0.001. Post-hoc Tukey HSD testleri, Gübre B ile yetiştirilen bitkilerin (M = 77.75 cm, SD = 2.49) ve Gübre C ile yetiştirilen bitkilerin (M = 71.50 cm, SD = 2.45), Gübre A ile yetiştirilen bitkilerden (M = 68.38 cm, SD = 2.67) anlamlı şekilde daha uzun olduğunu göstermiştir (sırasıyla p < 0.001 ve p < 0.05). Gübre B ve Gübre C arasında istatistiksel olarak anlamlı bir fark bulunmamıştır (p = 0.094)."
ANOVA, biyoloji ve tıpta yaygın olarak kullanılan bir analiz yöntemidir:
Şimdi, iris
veri setinde üç farklı Iris türünün (setosa, versicolor, virginica) taç yaprak (petal) boylarını karşılaştıralım.
İki Yönlü ANOVA, iki faktörün ve bunların etkileşiminin etkisini analiz eden bir yöntemdir.
Örnek: Hem gübre türünün (A, B, C) hem de sulama sıklığının (günlük, haftalık) domates bitkilerinin boyuna etkisini incelemek istiyoruz.
İki Yönlü ANOVA Modeli: \[Y_{ijk} = \\mu + \\alpha_i + \\beta_j + (\\alpha\\beta)_{ij} + \\epsilon_{ijk}\]
İki Yönlü ANOVA ile üç hipotezi test ederiz: 1. İlk faktörün ana etkisi (\(H_0: \\alpha_1 = \\alpha_2 = ... = \\alpha_a = 0\)) 2. İkinci faktörün ana etkisi (\(H_0: \\beta_1 = \\beta_2 = ... = \\beta_b = 0\)) 3. Faktörler arası etkileşim (\(H_0: (\\alpha\\beta)_{ij} = 0 \ ext{ tüm } i, j \ ext{ için}\))
Avantajlar: * İkiden fazla grubu aynı anda karşılaştırabilme * Tip I hata oranını kontrol etme * Kategorik faktörlerin sürekli değişkenler üzerindeki etkisini inceleme
Sınırlamalar: * Sadece ortalamaları karşılaştırır, dağılımlardaki diğer farklılıkları görmez * Parametrik bir test olarak, belirli varsayımlara dayanır * Grup farkını bulur ancak hangi grupların farklı olduğunu belirtmez (post-hoc testleri gerekir)
ANOVA’nın Ötesinde: * İki faktörlü çalışmalar için İki Yönlü ANOVA * Tekrarlı ölçümler için Tekrarlı Ölçümler ANOVA