R Temelleri

Aritmetik

R ile aritmetik yapılabilir. (Run Code butonunu tıklayınız)

Yukarıdaki kutuya herhangi bir işlem yazıp çalıştırabilirsiniz.

 

8 / 2 + 4 * 5 şeklindeki bir ifadede, işlem sırası doğru olarak izleniyor mu?

Matematik fonksiyonları

Değişkenler / Objeler

Bu değişken, oturum boyunca geçerlidir, başka bir slaytta tekrar kullanılabilir.

Vektörler

R dilinde vektörler önemli bir veri yapısıdır. Aynı tipteki (tamsayı, ondaliklı sayı, karakter, vb.) verilerin toplu şekilde saklandığı bir yapıdır. Başka dillerde “liste”, “dizi” olarak adlandırılır. R dilinde vektörler c() fonksiyonu ile oluşturulur.

İndeks

Bir vektördeki elemanlara indeksler yardımıyla erişim sağlanır. R dilinde indeks 1’den başlar. 5. elemanına ulaşmak için my_vec[5] şeklinde komut yazılmalıdır.

İndeksler aralıklarla da kullanılabilir. Örneğin, 1. ve 2. elemanına ulaşmak için my_vec[1:2] komutu kullanılabilir.

İndeks vektörü

Bir vektördeki belirli elemanlara erişim için indekslerden oluşan bir vektör kullanılabilir. 5. ve 3. elemanlara (bu sırada) erişilmek isteniyorsa c(5,3) vektörü indeks olarak kullanılabilir

Vektörlerle işlemler

Normalde bir liste veya dizinin işlenmesi için for döngüsü kullanılır. R’de ise vektörlerle işlem yapılırken, bir fonksiyon veya işlem otomatik olarak bütün elemanlara uygulanır.

Ayrıca, R’daki çoğu fonksiyon vektörler ile uyumludur, her bir eleman için veya tüm vektör için çalışabilirler.

Karşılaştırma operatörleri

Eşitlik ==, büyüktür >, küçüktür <, eşit değil != operatörleri bir vektöre uygulandığında, her bir eleman için karşılaştırma yapılır.

Sonuçlar logical/mantıksal (TRUE/FALSE) vektör olarak döndürülür. Bu sonuç vektörü, maske olarak kullanılabilir, yani indeks olarak kullanıldığında, “TRUE” değerlerin denk geldiği elemanlar gösterilebilir.

Farkedildiği üzere, bu işlem sayesinde veri kümesinde filtreleme yapılmıştır.

Sıralama

sort() fonksiyonu ile vektörler sıralanabilir.

Soru: ters yönde sıralama yapmak için ne yapılmalıdır?

order() fonksiyonu ile de sıralama yapılabilir. Ancak bu fonksiyon doğrudan elemanları sıralamaz; bunun yerine, sıralı elemanların orijinal vektördeki indekslerini döndürür.

Tablolarda sütunları veya satırları sıralamak gerektiğinde kullanılır.

Sıralama

Aşağıdaki kutuda my_vec[order(my_vec)] komutunu çalıştıp çıktısını sort() ile karşılaştırınız.

NA

NA “not available” anlamına gelir. Herhangi bir vektörde NA olması durumunda toplama, min/max gibi işlemlerin de NA olarak sonuçlanmasına neden olur.

Bu sorunu aşmak için na.rm=TRUE parametresi kullanılabilir.

Data Frame / veri tablosu/çerçevesi

Bir veri tablosu, aynı boydaki farklı vektörlerin sütun olarak birleşmesi olarak düşünülebilir. Bu veri yapısı en çok kullanılan veri yapısıdır. Aşağıdaki örnekte, iris veri seti kullanılmıştır.

Veri tablosu / erişim

Bir veri tablosundaki herhangi bir sütunun tamamına $sütun_adı şeklinde ulaşılabilir.

Veri tablosunun belirli bir kısmına erişmek için [satır, sütun] şeklinde kullanılabilir.

iris$Species komutu Species sütununu vektör olarak elde eder. iris[1:5,] ilk 5 satırı elde eder. iris[1:5,1:2] şeklindeki komut, ilk 2 sütunu ve ilk 5 satırı elde eder.

Bir sonraki slaytta bahsi geçen komutları deneyiniz.

Veri tablosu / erişim

Veri tablosu / işlemler

  • dim(iris) komutu, veri setinin boyutlarını verir.(satır, sütun) şeklinde
  • nrow(iris) komutu, veri setindeki satır sayısını verir.
  • ncol(iris) komutu, veri setindeki sütun sayısını verir.
  • str(iris) komutu, veri setinin yapısını, sütun tipleri ve ilk verileri gösterir.
  • summary(iris) komutu, veri setindeki istatistiksel ölçümleri verir.

Bir sonraki slaytta bahsi geçen komutları deneyiniz.

Veri tablosu / işlemler