Bölüm 1 Giriş

1.1 R nedir?

R ile ilgili şimdiye kadar en uygun bulduğum, en çok hoşuma giden benzetme Matthew Keller’a ait. Keller diyor ki: ‘R is like a magic, except you have functions instead of spells’ - yani diyor ki R büyü gibidir, ancak büyülü sözcükler yerine fonksiyonlarınız vardır. SPSS, SAS kullanıcıları, ‘muggle’ gibidir. Ortamı değiştirme kabiliyetleri sınırlıdır. Onların analizi için birileri tarafından uygun görülmüş dizayn edilmiş algoritmalarla sınırlıdırlar ve üstüne para ödemek zorundadırlar. Keller, R programcıları ise ‘büyücü’lere benzetiyor. R programcılar, alanında uzman olan kişiler tarafından yazılmış fonksiyonlara (yani büyülere) bağlı kalarak devam edebilecekleri gibi, kendi büyülerini de yaratabilirler (’sectumsempra’ gibi lanetler de mümkün tabii). Bunları kullanmak / bunlara erişmek için para ödemezler, ve yeterinde deneyim kazandıklarında yapamayacakları bir şey yoktur.

1.2 R Avantajları

  • Ücretsiz!
  • Açık kaynak kodlu
  • Aktif ve dinamik bir komünitesi var. Yardım almak çok kolay.
  • Güncel
  • Kod yazarken analiz hakkında düşünmeniz gerekiyor. Bu sebeple yaptığınız analizin, deney düzeneğinize, örnekleminize ve en önemlisi hipotezinize uygun olup olmadığını tartabiliyorsunuz. Rastgele tuşlara tıklayıp p<0.05 görünce alıp devam etmekten oldukça farklı!
  • İstatistiksel testlerin varsayımlarına bağlı kalmadan, simülasyonlar ile empirik dağılımlar yaratıp test yapabilirsiniz.
  • R notebook / R markdown gibi dökümanlar oluşturarak analizinizi / deneyinizi takip etmeyi ve yayınlamayı kolaylaştırmak ve tekrar edilebilirliğini sağlamak mümkün.
  • Özellikle rutin olarak biyoistatistik / biyoenformatik çalışmıyorsanız, Windows kullanıcısı olma ihtimaliniz yüksek. R işletim sisteminden bağımsız olduğundan, kendi bilgisayarınızda çalışabilir, ve gerektiğinde analizinizi / kodunuzu başka platformlarda çalışanlarla rahatlıkla paylaşabilirsiniz.
  • Bilim dili günümüzde İngilizce imiş gibi gözüküyor. Ben buna katılmıyorum. Bilimin dili bence grafikler. Yazdığınız 15 sayfalık bir makaleyi özetleyebilecek 3 grafik yapabilmek çok büyük bir güç (büyük konuştum, tabii her şeyi grafikleştirmek mümkün değil ama zamanla makaleleri okurken farketmeye başlıyor insan Excel, Graph Pad grafiklerinin R’da oluşturulmuş grafikler yanında nasıl kaldığını…)
  • Bir de öğrenmesi en kolay dillerden birisi. Ancak bunun yanında öğrenme eğrisi lineer değil. Yani ilk zamanlar çok zor gelebilir (ilk zamanlar çok basit olmasına rağmen kaç defa matrisin satırı yerine sütunu ile işlem yapmaya çalıştığımı anlatamam bile!) ama alıştıktan sonra insanın kendisini geliştirmesi, yeni fonksiyon hatta başkalarının kullanımı için paket yazmak diğer dillere göre çok daha kolay.
  • Son olarak, R paket sayısı, paketlerin güncellenme sıklığı, paket yazarlarının ulaşılabilirliği açısından özellikle biyoloji alanında çalışanlar açısından çok avantajlı. Bioconductor projesi özellikle biyoloji ile alakalı analizler için -omics data analizi için vs. inanılmaz avantaj sağlıyor.

1.3 R Öğrenmeye Nasıl Başlarım?

Bu sorunun tabii ki kesin net bir cevabı yok, kişiden kişiye, kullanımdan kullanıma farklılık gösterecektir en verimli yol. Ama yine de bir takım basamaklardan geçmemek imkansız (R’ı bilgisayarınıza indirmek ve kurmak gibi!). İlk olarak bu ‘mutlaka olması gereken maddeler’ ve yararlı bulduğum kimi basamakları sıralayalım.

1.3.1 R kurulumu

Çok basit: CRAN Anasayfasına gidip, kullandığımız işletim sistemi için olan versiyonu indiriyoruz. Bir çok kullanıcı için ‘base’ sürümü yeterli olacaktır. Sonrasında talimatları takip ederek R’ı kuruyoruz.

1.3.2 RStudio

R’ın kendi arayüzü oldukça sade ve yeterli olsa da, ben herkese RStudio’yu indirmelerini tavsiye ediyorum. RStudio da ücretsiz ve R programlama için bir çeşit arayüz gibi düşünebilirsiniz.

1.3.3 Kaynaklar

1.3.3.2 Bloglar