MBG1032 - Doç.Dr. Alper YILMAZ
t-testi, iki grup ortalaması arasındaki farkın istatistiksel anlamlılığını değerlendirmek için kullanılan yaygın bir parametrik testtir.
Kullanım Amacı:
Temel Fikir:
Gözlemlenen farkın, rastgele şans eseri ortaya çıkıp çıkmadığını değerlendirmek.
Serbestlik Derecesi (SD = n-1): Veriler üzerinde yapılabilen bağımsız karşılaştırmaların sayısı.
Görsel Kaynak: Wikimedia Commons
Kaynak: t-Test DATAtab
Kaynak: t-Test DATAtab
1. Tek Örneklem t-testi: \[ t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} \]
2. Bağımsız Örneklemler t-testi: \[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \]
3. Eşleştirilmiş Örneklemler t-testi: \[ t = \frac{\bar{d}}{s_d/\sqrt{n}} \]
Burada:
t-testi parametrik bir testtir ve bazı varsayımlar üzerine kuruludur:
Normallik: Verilerin normal dağılıma sahip olması veya örneklem boyutunun yeterince büyük olması (n>30)
Varyansların homojenliği: Bağımsız örneklemler t-testinde, grupların varyanslarının benzer olması
Bağımsızlık: Gözlemlerin birbirinden bağımsız olması
Ölçüm düzeyi: Verilerin aralıklı veya oransal ölçek düzeyinde olması
Not: Eğer varsayımlar karşılanmazsa, parametrik olmayan alternatifler düşünülmelidir (ör. Mann-Whitney U testi, Wilcoxon işaretli sıra testi).
Bu varsayım, t-testi için toplanan verilerdeki bir ölçümün, diğer ölçümleri etkilememesi gerektiği anlamına gelir. Yani bir deney katılımcısının veya örneğin verdiği sonuç, diğer katılımcıların veya örneklerin sonuçlarını etkilememelidir.
Her t-testi, alternatif hipotezin yapısına göre tek yönlü veya çift yönlü olabilir:
Çift Yönlü t-testi (Two-sided):
alternative = "two.sided"
Tek Yönlü t-testi (One-sided):
alternative = "less"
)alternative = "greater"
)Önemli Not: Tek yönlü test kullanmak için, hipotez kurulmadan önce farkın yönüne dair güçlü bir teorik gerekçe olmalıdır. Veriler incelendikten sonra tek yönlü test seçmek, tip I hata olasılığını artırır.
Bir örneklemin ortalamasını, bilinen veya hipotez edilen bir popülasyon değeriyle karşılaştırır.
Örnek Senaryo: Yeni geliştirilen bir bitkisel ilacın, farelerde ortalama kan glikoz seviyesini referans değer olan 100 mg/dL’den farklı bir seviyeye değiştirip değiştirmediğini test etmek istiyoruz.
İlacın test edildiği 15 farenin kan glikoz seviyelerini analiz edelim:
Yorum: p-değeri 0.05’ten küçük olduğu için H0 hipotezini reddediyoruz. Bitkisel ilacın, farelerin kan glikoz seviyelerini, referans değer olan 100 mg/dL’den anlamlı şekilde düşürdüğünü söyleyebiliriz (t(14) = -11.94, p < 0.001).
İki farklı, bağımsız grubun ortalamalarını karşılaştırmak için kullanılır.
Örnek Senaryo: İki farklı gübre türünün (A ve B) domates bitkilerinin boyları üzerindeki etkisini karşılaştırmak istiyoruz.
Yorum: p-değeri 0.05’ten küçük olduğundan H0 hipotezini reddediyoruz. Gübre B’nin, domates bitkilerinin boyunu, Gübre A’ya göre istatistiksel olarak anlamlı şekilde daha fazla artırdığını söyleyebiliriz (t(18) = -5.14, p < 0.001).
Aynı deneklerin/örneklerin iki farklı durumda ölçülen değerlerini karşılaştırmak için kullanılır.
Örnek Senaryo: 10 hastanın, belirli bir ilaç tedavisinden önce ve sonra kolesterol seviyelerini karşılaştırmak istiyoruz.
Burada \(\mu_d\), tedavi öncesi ve sonrası değerler arasındaki farkların ortalamasıdır.
Yorum: p-değeri 0.05’ten küçük olduğundan H0 hipotezini reddediyoruz. İlaç tedavisinin, hastaların kolesterol seviyelerini istatistiksel olarak anlamlı şekilde düşürdüğünü söyleyebiliriz (t(9) = 14.41, p < 0.001). Ortalama düşüş 19.2 mg/dL’dir.
Akademik yayınlarda t-testi sonuçlarını nasıl raporlamalıyız?
1. Tek Örneklem t-Testi: “Bitkisel ilacın farelerin kan glikoz seviyelerine etkisi, tek örneklem t-testi ile değerlendirilmiştir. Farelerin ortalama kan glikoz seviyesi (M = 92.1, SD = 2.6) referans değerden (100 mg/dL) anlamlı şekilde düşüktür, t(14) = -11.94, p < 0.001.”
2. Bağımsız İki Örneklem t-Testi: “Gübre B ile yetiştirilen domates bitkilerinin boyları (M = 78.3 cm, SD = 3.4), Gübre A ile yetiştirilen bitkilerden (M = 71.5 cm, SD = 3.7) anlamlı şekilde daha yüksektir, t(18) = -5.14, p < 0.001.”
3. Eşleştirilmiş Örneklemler t-Testi: “İlaç tedavisi sonrası hastaların kolesterol seviyeleri (M = 230.8 mg/dL, SD = 11.0), tedavi öncesine (M = 250.0 mg/dL, SD = 7.6) göre anlamlı şekilde daha düşüktür, t(9) = 14.41, p < 0.001. Ortalama azalma 19.2 mg/dL’dir (%95 GA [16.2, 22.2]).”
Örnek: “miR-21 ekspresyon seviyesi, kanser hastalarında (M = 4.2, SD = 1.1) sağlıklı kontrollere (M = 1.8, SD = 0.7) göre anlamlı şekilde daha yüksekti, t(58) = 10.73, p < 0.001, ortalama fark = 2.4 kat (%95 GA [2.0, 2.8]).”
Şimdi, iris
veri setinde farklı türlerdeki çiçeklerin taç yaprak (petal) boylarını karşılaştıralım.
Yorum: İki Iris türü arasındaki taç yaprak boyu farkı istatistiksel olarak anlamlıdır, t(86.7) = -39.5, p < 0.001. Versicolor türünün taç yaprakları (M = 4.26 cm, SD = 0.47), setosa türünün taç yapraklarından (M = 1.46 cm, SD = 0.17) ortalama 2.8 cm daha uzundur (%95 GA [2.66, 2.94]).
Bu yanılgıyla ilgili doğru açıklama: “Büyük örneklemler küçük farkları bile anlamlı gösterebilir” şeklindedir. İstatistiksel açıdan bakıldığında, örneklem büyüklüğü arttıkça istatistiksel testlerin gücü (power) artar. Yani, gerçekten var olan bir etkiyi tespit etme olasılığımız yükselir. Bu doğrudur ve istatistiğin temel ilkelerinden biridir. Ancak buradaki yanılgı şudur:
# 1. Tek Örneklem t-Testi
# a. Çift yönlü test (varsayılan)
t.test(x, mu = 0)
# b. Tek yönlü test (küçüktür)
t.test(x, mu = 0, alternative = "less")
# c. Tek yönlü test (büyüktür)
t.test(x, mu = 0, alternative = "greater")
# 2. Bağımsız İki Örneklem t-Testi
# a. Varyansların eşit olduğu varsayımıyla
t.test(x, y, var.equal = TRUE)
# b. Varyansların eşit olmadığı varsayımıyla (Welch t-testi, var
sayılan)
t.test(x, y)
# c. Tek yönlü test ile (örneğin x'in y'den büyük olup olmadığın
ı test etmek için)
t.test(x, y, alternative = "greater")
# 3. Eşleştirilmiş Örneklemler t-Testi
t.test(x, y, paired = TRUE)
# Tek yönlü seçeneği ile
t.test(x, y, paired = TRUE, alternative = "greater")
# 4. Formül kullanımı (veritabanları ile çalışırken)
t.test(value ~ group, data = mydata)
t.test(value ~ group, data = mydata, paired = TRUE)
t.test(value ~ group, data = mydata, alternative = "less")
t-Testi Türü | Temel Varsayımlar | R Kodu |
---|---|---|
Tek Örneklem | - Verilerin normal dağılması veya n>30 - Bağımsız gözlemler |
t.test(x, mu = 0) |
Bağımsız İki Örneklem (eşit varyans) |
- İki grupta da normal dağılım - Varyansların homojenliği - Bağımsız gözlemler |
t.test(x, y, var.equal = TRUE) |
Bağımsız İki Örneklem (Welch/eşit olmayan varyans) |
- İki grupta da normal dağılım - Varyanslar farklı olabilir - Bağımsız gözlemler |
t.test(x, y) |
Eşleştirilmiş Örneklemler | - Farkların normal dağılması - Eşleştirilmiş gözlemler |
t.test(x, y, paired = TRUE) |