Ders3: İhtimal hesabı ve dağılım

MBG1032 - Doç.Dr.Alper YILMAZ - 28 Şubat 2024

Özet

  • Olasılık hesapları
  • Normal dağılım
  • Poisson dağılımı
  • Bernoulli dağılımı

Olasılık hesapları

Normal dağılım modeli

Normal dağılım kuralı

Z skor

Ortalamaya kaç standard sapma uzak olunduğunu gösterir ve normal dağılım değerlerini standart hale getirir (~ -3,3)

\[ Z = \frac{x-\mu}{\sigma} \]

Normal dağılım tablosu

Örnek

SAT skorları için ortalama 1500, standart sapma 300 iken 1800’den düşük puan alma ihtimali kaçtır? 1800 puan yüzde kaçlık dilime denk gelmektedir?

Z-skor açısından

Örnek 2

Bir öğrencinin SAT skoru 1630’tan yüksek olma ihtimali nedir?

Soru

20-62 yaş erkeklerin boy dağılımı ortalaması 70 inç ve standart sapması 3.3 inç iken, rastgele seçilen bir erkeğin boyunun 69 inç ve 74 inç arasında olması ihtimali nedir?

Soru

Boyu 40 yüzdelik dilimde olan bir kişinin boyu kaçtır?

Poisson dağılımı

Poisson dağılımı, nadiren meydana gelen olayların, belirli bir zaman aralığında veya belirli bir alanda kaç kere gerçekleşeceğini tahmin etmek için kullanılan bir olasılık dağılımıdır.

Aşağıdaki grafik 8 milyon nüfuslu bir şehirde bir yıl boyunca hastaneye gelen günlük Akut Miyokard İnfarktüsü (AMI) vaka sayısını göstermektedir (ortalama=4.4 kişi)

Örnekler

Poisson dağılımı gösteren biyolojik veriler, genellikle nadir ve rastgele meydana gelen olaylara odaklanır. Bu tür veriler, çeşitli biyolojik disiplinler ve uygulama alanları üzerinden örneklerle açıklanabilir:

  1. Mikrobiyoloji ve Bakteriyoloji:
    • Bakteri Kolonilerinin Sayımı: Petri kabında belirli bir süre ve koşullar altında büyüyen bakteri kolonilerinin sayımı. Örneğin, bir laboratuvar ortamında standart bir hacimdeki besiyeri üzerine ekilen bakteri spesifik bir zaman diliminde kaç koloni oluşturur.
    • Virüs Titrelemeleri: Bir hacimdeki virüs partikülleri sayısı. Bu, özellikle su örneklerinde veya biyolojik sıvılarda yapılan ölçümler için geçerlidir.
  2. Ekoloji ve Koruma Biyolojisi:
    • Ender Türlerin Birey Sayısı: Belirli bir alandaki nadir görülen türlerin birey sayıları. Bu, büyük koruma alanlarında veya özel ekosistemlerde endemik türler için kullanılabilir.
    • Parazit Sayımı: Belirli bir konakçı popülasyonunda parazitlerin dağılımı. Örneğin, bir balık popülasyonunda bulunan parazit türlerinin sayısı.
  3. Moleküler Biyoloji ve Genetik:
    • DNA Mutasyonları: Belirli bir gen uzunluğu boyunca meydana gelen mutasyonların sayısı. Özellikle büyük genomlar üzerinde nadiren meydana gelen olaylar için kullanılır.
    • Transkripsiyonel Olaylar: Belirli bir zaman diliminde hücrede meydana gelen mRNA transkripsiyon olaylarının sayısı.
  4. Halk Sağlığı ve Epidemiyoloji:
    • Nadir Hastalık Vakaları: Bir bölgede belirli bir zaman diliminde görülen nadir hastalık vakalarının sayısı. Özellikle düşük prevalanslı hastalıklar için geçerlidir.
    • Salgın Olayları: Belirli bir zaman aralığında bir popülasyonda meydana gelen salgın hastalık vakalarının sayısı.
  5. Nörobilim ve Fizyoloji:
    • Nöronal Ateşleme Olayları: Belirli bir zaman diliminde bir veya birden fazla nöronun ateşleme (aksiyon potansiyeli) olaylarının sayısı. Özellikle düşük ateşleme hızlarına sahip nöronlar için Poisson dağılımı uygulanabilir.
    • Sinaptik Olaylar: Sinapslarda meydana gelen nörotransmitter salınım olaylarının sayısı.

Poisson dağılımı

Poisson fonksiyonu

k olay olma ihtimali

t zaman içinde gerçekleşen k olay ihtimali

Örnek

  • 7 gün içinde 2 hastanın AMI tesşhisi ile hastanelik olma ihtimali nedir? (\(\lambda\)​=4.4, k=2, t=7)
  • 7 gün içinde en fazla 2 kişinin hastanelik olması ihtimali nedir?
  • En az 3 kişinin 7 gün içinde hastanelik olma ihtimali kaçtır?

Bernoulli dağılımı

Bernoulli dağılımı, yalnızca iki sonuçtan (başarı veya başarısızlık, evet veya hayır, 1 veya 0 gibi) birini alabilen rastgele bir deneyi modellemek için kullanılan bir olasılık dağılımıdır. Binomial dağılımında n defa gerçekleşen, ikili sonucu olan olayların ihtimali hesaplanırken, Bernoulli dağılımında k=1’dir.

Madeni para atışı, hastalık testi sonucu, bitki tohumu çimlenmesi, ilaç tepkisi gibi örnekler Bernoulli dağılımı için örnek gösterilebilir.

Bernoulli dağılımının tekrarı ile sadece Binomial dağılım ortaya çıkmaz; geometrik, negatif binomial ve hipergeometrik dağılımlar Bernoulli dağılımı temel alır.

Geometik dağılım

Geometrik dağılım, bağımsız ve aynı şekilde dağılmış Bernoulli denemeleri serisinde, ilk başarının elde edilmesi için gereken deneme sayısını modelleyen bir olasılık dağılımıdır. Diğer bir deyişle, bir dizi denemede ilk başarıya ulaşana kadar yapılan deneme sayısının dağılımını tanımlar.

Örnekler

Geometrik dağılım, biyolojik süreçler ve fenomenler içinde çeşitli örneklerle temsil edilebilir. Bu tür dağılımlar, belirli bir olayın meydana gelmesi için gereken deneme sayısını veya bir başarı elde edene kadar geçen süreyi modellemek için özellikle uygun olabilir. İşte geometrik dağılımı kullanarak modelleyebileceğiniz biyolojik örnekler:

  1. Hastalığa Dirençli Bitki Bulma: Bir araştırmacı, belirli bir hastalığa dirençli bir bitki çeşidi geliştirmek üzere rastgele mutasyonlar oluşturuyor. Her bir mutasyonun, istenilen direnci gösterme olasılığı düşük olabilir. Bu durumda, araştırmacının dirençli bir mutasyon elde etmesi için gereken deneme sayısı geometrik dağılımla modelleyebilir.
  2. Nadir Görülen Türlerin Tespiti: Bir ekolog, nadir görülen bir türün üyelerini bulmak için rastgele örnekler alıyor. Her bir örnekleme denemesinde bu türden bir birey bulma şansı düşükse, bu tür bir bireyin ilk kez tespit edilmesi için gereken örnekleme sayısı geometrik dağılımla modelleyebilir.
  3. Antibiyotik Direnci: Bir mikrobiyolog, bir bakteri popülasyonundan rastgele seçilen bir bakterinin belirli bir antibiyotiğe dirençli olup olmadığını test eder. Eğer popülasyon içinde dirençli bakterilerin oranı düşükse, ilk dirençli bakterinin tespit edilmesi için yapılması gereken test sayısı geometrik dağılımla ifade edilebilir.
  4. Genetik Çaprazlamalar: Genetik bir özelliğin baskın olduğu durumda, belirli bir çaprazlama sonucunda istenilen genetik yapıya (örneğin, bir hastalığa karşı dirençli bir genotip) sahip bir yavru elde edilene kadar gereken çaprazlama sayısı. Her bir çaprazlamanın bağımsız ve sabit bir başarı şansı varsa, bu durum geometrik dağılımla modellenebilir.

Geometrik dağılım

Gerçekleşme ihtimali p= 0.35 iken, ilk denemede başarılı olma ihtimali yine 0.35’tir. İkinci denemede başarılı olma ihtimali ise 0.65 x 0.35 = 0.228i’dir. Üçüncü denemede başarılı olma ihtimali ise 0.65 x 0.65 x 0.35 = 0.148’tir.

Geometric dağılımda olasılık üssel şekilde azalır.

Geometrik dağılım

k. denemede ilk başarıyı elde etme ihtimali

Bekleme süresinin ortalaması, varyansı ve standard sapması

Geometrik dağılım - formüller

Soru

Başarının ilk 4 denemede gerçekleşme ihtimali kaçtır?

P(X=1) + P(X=2) + P(X=3) + P(X=4) = 0.82

Başarının ilk 4 denemede gerçekleşmeme ihtimali kaçtır?

1- 0.82 = 0.18

R’da geometrik fonksiyon “başarıdan öncde gerekli deneme sayısını” dikkate alır

Negatif binomial dağılım

Geometrik dağılım ilk başarının k. denemede gerçekleşmesi ihtimalini hesaplarken Negatif Binomial Dağılım daha geneldir, R. başarının K. denemede gerçekleşme ihtimalini hesaplar.