Sinema Gösterim İstatistikleri
R Project Kurulumu
.
- https://cran.r-project.org/ adresinden, kullandığımız işletim sistemine göre seçim yapıyoruz ve indirme sayfasına geçiyoruz. Ben windows işletim sistemi kullandığım için onu seçtim.
- Açılan sayfadan install R for the first time linkine tıklayalım.
- Daha sonra Dowlond R 3.3.2 for Windows (62 megabytes, 32/64 bit) linkine tıklayak indirmeye başlıyoruz.
- İndirdiğimiz dosyayı çift tıklayarak açıyoruz.
- Programı kullanacağımız dili seçiyoruz.
- Sonra çıkan ekranlarda 'Next' diyerek kurulumu tamamlıyoruz.
- Sorunsuz bir kurulumda başlangıç ekranı bu şekilde olacaktır.
- Daha sonra Dowlond R 3.3.2 for Windows (62 megabytes, 32/64 bit) linkine tıklayak indirmeye başlıyoruz.
- İndirdiğimiz dosyayı çift tıklayarak açıyoruz.
- Programı kullanacağımız dili seçiyoruz.
- Sonra çıkan ekranlarda 'Next' diyerek kurulumu tamamlıyoruz.
- Sorunsuz bir kurulumda başlangıç ekranı bu şekilde olacaktır.
R Studio Kurulumu
- https://www.rstudio.com/ adresinden,R Studio'u indirmeye tıklıyoruz.
- İşletim sistemimize uygun linke tıklıyoruz.
- İndirdiğimiz R Studio setup dosyasını çalıştıralım.
- Daha sonra ileri diyerek kuruluma başlıyoruz.
- Kurulacak dizin ayarlanıp, 'İleri' butonuna tıklıyoruz.
- Programın kısayollarının konulacağı başlat menüsü klasörünü seçiyoruz ve 'Kur' butonuna tıklıyoruz.
- Kurulumu tamamlıyoruz.
- Sorunsuz bir kurulumda başlangıç ekranı bu şekilde açılacaktır.
Beş Büyük Şehrin Yıllara Göre Sinema Gösterim Sayısının Analizi
- getwd() => Programın varsayılan dizin çalışması veriliyor.
- setwd() =>Parantez içersine girilen değeri yeni çalışma dizini olarak belirliyor.
- Veri seti Excel formatı yerine CSV dediğimiz formatta, virgülle,noktalı virgülle veya tabla ayrılmış bir metin dosyası şeklindedir.
- Tüm veri setimizi veri adlı değişkene atıyoruz. Daha sonra veri adlı değişkeni çağırarak listeliyoruz.
- Burada;
head(veri) => Veri isimli veri setinin ilk 6 satırını alır. Burada da bütün sütunlar dahil olmak üzere ilk 6 satırın yıllara göre sinema gösterim sayılarını getirmiştir.
tail(veri) => Veri isimli veri setinin son 6 satırını alır. Son 6 satırdaki sinema gösterim sayılarını getirmiştir.
ls(veri) =>Veri setindeki ana başlıkları verir. Bu komutla birlikte şehirlerin isimleri gelmektedir.
- Burada;
veri[0,] => Exceldeki gibi veriler hafızada bir satır ve sütun lokasyonu ile tutulmaktadır.Etiket satırındaki tüm sütunlar ekrana gelmektedir. Bu komutla birlikte ilk satırdaki sütunlar(satırlar,tür,Anlara,Bursa,Tranzon,İstanbul,İzmir) ekrana gelmiştir.
veri[1,2:4 ] => Burada satır numarasını girdikten sonra görmek istediğimiz iki sütun arasındaki tüm verileri görmek için “:” işareti ile <ilk sütun>:<son sütun > şeklinde görmek istediğimiz kısımları girebiliriz. Bu komutla birinci satırdaki Tür ve Ankara arası bilgiler gelmektedir.
summary(veri) => Veri setinin tüm elemanlarının istatistiksel özelliklerini tek seferde ekranda gösterir. Burada da yılların ve şehirlerin tüm özellikleri ekrana gelmiştir.
- Desciribe komutunu çalıştırmak için ilk öncelikle ekranda gözüken komutu çalıştırıyoruz.
- Daha sonrasında ise paketlerden Hmisc paketini yüklüyoruz.
- Kütüphaneden Hmisc komutunu çağırıyoruz.
- describe(veri) => Summary komutunda olduğu gibi her bir sütun için ortalama ve aralıklardaki dağılımlara bakabiliyoruz.
- Burada;
mean(veri$Bursa) => Veri setinin ortalamasını vermektedir.
sd(veri$Bursa) => Veri setinin standart sapmasını vermektedir.
- Veri setlerinin istatistiksel özelliklerin grafiksel olarak göstermek için histogram kullanılır. Frekans dağılımını göstermektedir. Burada da Bursa şehrinde sinema gösterim sayısının histogram grafiği gösterilmiştir.
- Burada;
probability=TRUE =>Bu komut y ekseninde frekanslar yerine olasılıkların gösterilmesini sağlar.
- Burada;
lines => Bir başka histogram elde etmek için lines komutu kullanılır. Böylelikle bir çizgi gragiği oluşturulur.
col="green" => Oluşturulan çizginin rengi yeşildir.
lwd=3 => Çizginin piksel kalınlığı ise 3'tür.
- densitiy(veri$Bursa) => Bu komutla x ve y serisi oluşturuluyor. x ekseni Bursa şehrinin sinema gösterim sayısı, y ekseni ise bunun olasılığına denk gelmektedir.
- Bursadaki sinema gösterim sayısının histogram grafiği üzerine, İzmirdeki sinema gösterim sayısı çizgi şeklinde eklenmiştir.
- Aşağıdaki iki komutta da 2007 yılına denk gelen şehirlerdeki sinema gösterim sayıları getirilmektedir.
- Aşağıdaki komutta Ankara şehrindeki sinema gösterim sayısı 1000'den fazla olan yılların histogram grafiğidir.
- Aşağıdaki komutta ise veri aralıklarını kendimiz girerek histogram oluşturduk.
- Yukarıdaki komutun plot(density komutuyla yapılmış şeklidir.
- library(car) => "car" paketini kütüphaneye ekliyoruz.
- scatterplotMatrix komutu tüm verileri birbirine göre grafikler.
- İstediğimiz sütunları c(“sütun1”,”sütun2”,”sütun3”) şeklinde veri[,vektör] şeklinde ekleyerek, aynı anda bir çok grafiğe sahip olabiliriz.
Kaynak:
- http://www.barissanli.com/calismalar/dersler/r/rders2.php
- http://www.tuik.gov.tr/PreTabloArama.do?metod=search&araType=vt