Ders7 Uygulama: İstatistiksel Güç ve ANOVA

MBG1032 Biyoistatistik - Doç.Dr.Alper YILMAZ - 02 Mayıs 2024

İstatistiksel Güç Analizi

İstatistiksel güç analizi, şu soruları yanıtlamamıza yardımcı olur:

  1. Belirli bir etki büyüklüğü, alfa ve örneklem boyutu için çalışmanın gücü nedir?
  2. Belirli bir güç, etki büyüklüğü ve alfa için gereken örneklem boyutu nedir?
  3. Belirli bir güç, alfa ve örneklem boyutunda saptanabilecek minimum etki büyüklüğü nedir?

R’da power.t.test() fonksiyonu, t-testi için güç hesaplaması yapar.

t-Testi için Güç Hesaplaması

power.t.test() fonksiyonu, t-testi için güç hesaplaması yapar.

Örnek 1: Örneklem boyutu, anlamlılık düzeyi ve etki büyüklüğü verildiğinde güç hesabı:

Örneklem Boyutu Hesaplaması

Örnek 2: Güç, anlamlılık düzeyi ve etki büyüklüğü verildiğinde gereken örneklem boyutu hesabı:

Etki Büyüklüğü, Örneklem Boyutu ve Güç İlişkisi

Farklı etki büyüklükleri (ortalama farkları) ve örneklem boyutları için güç değişimi:

Uygulama: Örneklem Boyutu Planlama

Senaryo: Yeni bir genin ekspresyonunun, normal duruma göre en az 30 birim artması bekleniyorsa ve standart sapma yaklaşık 100 birim ise, 0.8 istatistiksel güç ve 0.05 anlamlılık düzeyi için kaç örnek gerekir?

Bu sonuca göre, belirtilen koşullar altında, her grupta yaklaşık kaç örnek gerektiğini yorumlayınız.

Tek Yönlü ANOVA Uygulaması

Şimdi gerçek bir veri seti üzerinde ANOVA analizi yapalım. PlantGrowth veri seti, üç farklı koşulda yetişen bitkilerin ağırlıklarını içerir:

Verilerin Özeti ve Görselleştirilmesi

ANOVA Analizi

Post-hoc Testleri: Tukey HSD

Biyolojide Çoklu Karşılaştırma Problemi

Biyolojik araştırmalarda sıklıkla karşılaştığımız bir durum:

  • Mikroarray veya RNA-seq analizinde binlerce gen ekspresyonunu karşılaştırıyoruz
  • Metabolomik analizlerde yüzlerce metabolit ölçüyoruz
  • Çoklu SNP analizlerinde binlerce genetik varyantı test ediyoruz

Çoklu Test Problemi:

  • Her test için α = 0.05 kullanırsak, çok sayıda yanlış pozitif sonuç elde ederiz
  • 1000 gen için test yapıyorsak ve tüm null hipotezler doğruysa bile, 50 geni (1000 × 0.05) yanlışlıkla anlamlı bulabiliriz
  • Bu “çoklu test problemi” biyolojide çok önemlidir!

Bonferroni Düzeltmesi

Bonferroni düzeltmesi, en basit ve en sık kullanılan çoklu test düzeltme yöntemidir.

Prensip:

  • α değerini test sayısına böleriz: α’ = α/m
  • Burada m = toplam test sayısı

Örnek:

  • 1000 gen için test yapıyoruz
  • Standart α = 0.05
  • Bonferroni düzeltmesi ile: α’ = 0.05/1000 = 0.00005
  • Yani p < 0.00005 olan genleri anlamlı kabul ederiz

Benjamini-Hochberg (FDR) Düzeltmesi

Bonferroni çok muhafazakardır ve biyolojik çalışmalarda gerçek etkileri kaçırabilir. Benjamini-Hochberg yöntemi (FDR - False Discovery Rate), daha esnek bir alternatiftir.

Prensip:

  1. P-değerlerini küçükten büyüğe sıralayın
  2. Her p-değeri için düzeltilmiş değer hesaplayın: p’ = p × (m/i)
    • m = toplam test sayısı
    • i = p-değerinin sıra numarası
  3. Belirli bir FDR seviyesini (genellikle 0.05 veya 0.10) sağlayan tüm testleri anlamlı kabul edin

R ile Çoklu Test Düzeltmeleri

R’da p.adjust() fonksiyonu, farklı çoklu test düzeltme yöntemlerini uygular:

Düzeltme Yöntemlerinin Karşılaştırılması

Bonferroni Düzeltmesi:

  • Avantaj: Basit, anlaşılır ve Tip I hatayı sıkı kontrol eder (FWER - Family-Wise Error Rate)
  • Dezavantaj: Çok muhafazakardır ve gerçek farklılıkları kaçırabilir (düşük istatistiksel güç)
  • Kullanım: Az sayıda planlı karşılaştırma varsa veya Tip I hata kesinlikle önlenmek isteniyorsa

Benjamini-Hochberg (FDR) Düzeltmesi:

  • Avantaj: Daha esnek, daha iyi istatistiksel güç sağlar
  • Dezavantaj: Daha fazla yanlış pozitife izin verir (belirli bir oranda)
  • Kullanım: Büyük ölçekli tarama çalışmalarında (genomik, proteomik, metabolomik)

Biyolojide Tercih:

  • Mikroarray, RNA-seq, proteomik çalışmalarda genellikle FDR tercih edilir
  • Kritik klinik veya tanısal uygulamalarda Bonferroni tercih edilebilir

Birden Fazla Faktörle ANOVA (İki Yönlü ANOVA)

Şimdi ToothGrowth veri setini kullanarak, C vitamini dozu ve uygulama yönteminin diş büyümesi üzerindeki etkisini analiz edelim:

Verilerin Özeti ve Görselleştirilmesi

İki Yönlü ANOVA Analizi

Sonuçların Yorumlanması

İki yönlü ANOVA sonuçlarına göre:

  1. Uygulama yönteminin (supp) diş büyümesi üzerinde anlamlı bir etkisi var mı?
  2. Dozajın (dose) diş büyümesi üzerinde anlamlı bir etkisi var mı?
  3. Uygulama yöntemi ve dozaj arasında anlamlı bir etkileşim var mı?

ANOVA Örneği: Iris Veri Seti

Şimdi iris veri setini kullanarak ANOVA analizi yapalım. Bu veri seti üç farklı Iris türünün (setosa, versicolor, virginica) çiçek özelliklerini içerir.

Iris Veri Seti Görselleştirme

Iris ANOVA Analizi

Iris Post-hoc Analizi

ANOVA Örneği: InsectSprays Veri Seti

InsectSprays veri seti, farklı böcek ilaçlarının (A-F) böcek sayısı üzerindeki etkisini gösterir.

InsectSprays Görselleştirme ve Analiz

Problemler ve Çözüm Önerileri

Biyolojik deneylerde ANOVA varsayımlarını sağlamak zor olabilir:

  1. Normallik sorunu:
    • Shapiro-Wilk testi ile kontrol edin
    • Gerekirse veri dönüşümü yapın (log, karekök)
    • Ya da parametrik olmayan Kruskal-Wallis testini kullanın
  2. Varyans homojenliği sorunu:
    • Levene testi ile kontrol edin
    • Welch ANOVA kullanın
  3. Bağımsızlık sorunu:
    • Deneysel tasarımınızı gözden geçirin
    • Tekrarlı ölçümler ANOVA kullanmayı düşünün

Alıştırmalar

  1. Aşağıdaki veri seti için tek yönlü ANOVA analizi yapınız ve sonuçları yorumlayınız.
  1. Bir çalışmada orta büyüklükteki bir etki (f=0.25) için 0.80 güç elde etmek istiyorsunuz. 4 grup ile çalışacaksanız, her grupta kaç örnek olmalıdır?

ANOVA için Güç ve Örneklem Boyutu İlişkisi

Farklı grup sayıları için gereken örneklem boyutunu inceleyelim:

Farklı Test Türleri için Güç Analizi

Tek örneklem, bağımsız örneklem ve eşlenmiş örneklem t-testleri için güç analizini karşılaştıralım:

Özet: İstatistiksel Güç ve ANOVA

İstatistiksel Güç:

  • Gerçek bir etki varsa onu tespit etme olasılığı (1 - β)
  • Minimum 0.8 güç hedeflemek standart yaklaşımdır
  • Güç şu faktörlerden etkilenir:
    • Örneklem boyutu (n) - arttıkça güç artar
    • Etki büyüklüğü (delta) - arttıkça güç artar
    • Standart sapma (sd) - arttıkça güç azalır
    • Anlamlılık düzeyi (α) - arttıkça güç artar (ama Tip I hata da artar)
    • Test türü - eşli test > tek örneklem test > bağımsız test

ANOVA:

  • İkiden fazla grup ortalamasını karşılaştırmak için kullanılır
  • Tip I hata oranını kontrol altında tutar
  • Gruplar arası farklılık olduğunu söyler, ancak hangi grupların farklı olduğunu belirtmez (post-hoc testleri gerekir)

Uygulamalarda dikkat edilmesi gerekenler:

  • Gerçekçi etki büyüklükleri ile çalışın
  • Örneklem boyutunuzu iyi planlayın
  • Varsayımları kontrol edin ve gerekirse alternatif yöntemleri kullanın
  • Çoklu karşılaştırmalar için uygun düzeltme yöntemini seçin

pairwise.t.test(), aov() ve p.adjust() Fonksiyonları

R’da grup karşılaştırmaları ve p-değerlerinin düzeltilmesi için kullanılan üç önemli fonksiyonu inceleyelim.

pairwise.t.test() Fonksiyonu

Temel Amacı: - Gruplar arasında çoklu ikili karşılaştırmalar yapmak - Tüm olası grup çiftleri arasında t-testleri gerçekleştirmek - Çoklu test düzeltmelerini otomatik olarak uygulamak

Kullanımı:

pairwise.t.test(x, g, p.adjust.method = "bonferroni")

Burada: - x: Karşılaştırılacak sürekli değişken - g: Grup faktörü - p.adjust.method: p-değeri düzeltme yöntemi

aov() Fonksiyonu

Temel Amacı: - Varyans Analizi (ANOVA) modelini uygulamak - Grup ortalamaları arasında fark olup olmadığını test etmek - Kompleks deneysel tasarımları modellemek

Kullanımı:

model <- aov(formula, data)
summary(model)

Burada: - formula: İstatistiksel model formülü (örn: yanıt ~ faktör1 * faktör2) - data: Veri çerçevesi

p.adjust() Fonksiyonu

Temel Amacı: - Çoklu testlerde p-değerlerini düzeltmek - Tip I hata oranını kontrol etmek - Herhangi bir istatistiksel testten gelen p-değerleri için kullanılabilir

Kullanımı:

p.adjust(p, method = "bonferroni")

Burada: - p: Düzeltilecek p-değerleri vektörü - method: Düzeltme yöntemi (“bonferroni”, “holm”, “BH”, “fdr”, vb.)

Kullanım Örnekleri

Fonksiyonların Karşılaştırılması

Özellik pairwise.t.test() aov() p.adjust()
Temel İşlev İkili karşılaştırmalar Genel grup karşılaştırması p-değeri düzeltmesi
Çoklu Test Problemi Otomatik düzeltir Doğrudan ele almaz Sadece düzeltme yapar
Esneklik Orta (sadece t-testleri) Yüksek (karmaşık modeller) En yüksek (herhangi bir p-değeri)
Tipik Kullanım Post-hoc analiz Temel analiz Herhangi bir düzeltme

Tipik İş Akışı

Biyolojik araştırmalarda bu fonksiyonların tipik kullanımı:

  1. Önce aov() ile genel karşılaştırma yapılır:
    • Gruplar arasında fark var mı?
  2. ANOVA anlamlıysa, pairwise.t.test() veya başka bir post-hoc test uygulanır:
    • Hangi gruplar arasında fark var?
  3. Özel analizlerde, test p-değerleri p.adjust() ile manuel olarak düzeltilir:
    • Genomik çalışmalarda binlerce gen için

Biyolojik Araştırmalarda Uygulama

Gen ekspresyon çalışmaları: - Farklı tedavilerin gen ekspresyonuna etkisini incelemek için aov() kullanılır - Hangi tedaviler arasında fark olduğunu belirlemek için pairwise.t.test() kullanılır - Mikrodizi veya RNA-seq analizlerinde binlerce p-değerini düzeltmek için p.adjust() kullanılır

Metabolomik çalışmalar: - Metabolit seviyelerinde grup farkları için aov() - Spesifik metabolit karşılaştırmaları için pairwise.t.test() - Yüzlerce metabolite ait p-değerlerinin düzeltilmesi için p.adjust()

Hangi Durumlarda Hangi Fonksiyonu Kullanmalı?

pairwise.t.test()’i şu durumlarda kullanın: - ANOVA ile anlamlı fark bulunduğunda - Hangi grupların farklı olduğunu hızlıca belirlemek istediğinizde - Çoklu düzeltme yöntemini kendiniz seçmek istediğinizde

aov()’u şu durumlarda kullanın: - Grup ortalamaları arasında fark olup olmadığını test etmek istediğinizde - Karmaşık deneysel tasarımlarla çalışırken (faktöriyel, etkileşimli) - Tam bir ANOVA tablosu gerektiğinde

p.adjust()’ı şu durumlarda kullanın: - Özel testlerden elde edilen p-değerlerini düzeltmek istediğinizde - İkiden fazla karşılaştırma içeren herhangi bir analizde - Farklı düzeltme stratejilerini karşılaştırmak istediğinizde