R ile aritmetik yapılabilir. (Run Code butonunu tıklayınız)
Yukarıdaki kutuya herhangi bir işlem yazıp çalıştırabilirsiniz.
8 / 2 + 4 * 5
şeklindeki bir ifadede, işlem sırası doğru olarak izleniyor mu?
Ctrl + Enter ile tek satır, Shift + Enter ile bütün satırlar çalıştırılabilir
Bu değişken, oturum boyunca geçerlidir, başka bir slaytta tekrar kullanılabilir.
R dilinde vektörler önemli bir veri yapısıdır. Aynı tipteki (tamsayı, ondaliklı sayı, karakter, vb.) verilerin toplu şekilde saklandığı bir yapıdır. Başka dillerde “liste”, “dizi” olarak adlandırılır. R dilinde vektörler c()
fonksiyonu ile oluşturulur.
Bir vektördeki elemanlara indeksler yardımıyla erişim sağlanır. R dilinde indeks 1’den başlar. 5. elemanına ulaşmak için my_vec[5]
şeklinde komut yazılmalıdır.
İndeksler aralıklarla da kullanılabilir. Örneğin, 1. ve 2. elemanına ulaşmak için my_vec[1:2]
komutu kullanılabilir.
Bir vektördeki belirli elemanlara erişim için indekslerden oluşan bir vektör kullanılabilir. 5. ve 3. elemanlara (bu sırada) erişilmek isteniyorsa c(5,3)
vektörü indeks olarak kullanılabilir
Normalde bir liste veya dizinin işlenmesi için for
döngüsü kullanılır. R’de ise vektörlerle işlem yapılırken, bir fonksiyon veya işlem otomatik olarak bütün elemanlara uygulanır.
Ayrıca, R’daki çoğu fonksiyon vektörler ile uyumludur, her bir eleman için veya tüm vektör için çalışabilirler.
Eşitlik ==
, büyüktür >
, küçüktür <
, eşit değil !=
operatörleri bir vektöre uygulandığında, her bir eleman için karşılaştırma yapılır.
Sonuçlar logical/mantıksal (TRUE/FALSE) vektör olarak döndürülür. Bu sonuç vektörü, maske olarak kullanılabilir, yani indeks olarak kullanıldığında, “TRUE” değerlerin denk geldiği elemanlar gösterilebilir.
Farkedildiği üzere, bu işlem sayesinde veri kümesinde filtreleme yapılmıştır.
sort()
fonksiyonu ile vektörler sıralanabilir.
Soru: ters yönde sıralama yapmak için ne yapılmalıdır?
order()
fonksiyonu ile de sıralama yapılabilir. Ancak bu fonksiyon doğrudan elemanları sıralamaz; bunun yerine, sıralı elemanların orijinal vektördeki indekslerini döndürür.
Tablolarda sütunları veya satırları sıralamak gerektiğinde kullanılır.
Aşağıdaki kutuda my_vec[order(my_vec)]
komutunu çalıştıp çıktısını sort()
ile karşılaştırınız.
NA “not available” anlamına gelir. Herhangi bir vektörde NA olması durumunda toplama, min/max gibi işlemlerin de NA olarak sonuçlanmasına neden olur.
Bu sorunu aşmak için na.rm=TRUE
parametresi kullanılabilir.
Bir veri tablosu, aynı boydaki farklı vektörlerin sütun olarak birleşmesi olarak düşünülebilir. Bu veri yapısı en çok kullanılan veri yapısıdır. Aşağıdaki örnekte, iris
veri seti kullanılmıştır.
Bir veri tablosundaki herhangi bir sütunun tamamına $sütun_adı
şeklinde ulaşılabilir.
Veri tablosunun belirli bir kısmına erişmek için [satır, sütun]
şeklinde kullanılabilir.
iris$Species
komutu Species sütununu vektör olarak elde eder. iris[1:5,]
ilk 5 satırı elde eder. iris[1:5,1:2]
şeklindeki komut, ilk 2 sütunu ve ilk 5 satırı elde eder.
Bir sonraki slaytta bahsi geçen komutları deneyiniz.
dim(iris)
komutu, veri setinin boyutlarını verir.(satır, sütun) şeklindenrow(iris)
komutu, veri setindeki satır sayısını verir.ncol(iris)
komutu, veri setindeki sütun sayısını verir.str(iris)
komutu, veri setinin yapısını, sütun tipleri ve ilk verileri gösterir.summary(iris)
komutu, veri setindeki istatistiksel ölçümleri verir.Bir sonraki slaytta bahsi geçen komutları deneyiniz.