8 Aralık 2016 Perşembe

Sinema Gösterim İstatistikleri

 



 Sinema Gösterim İstatistikleri  


R Project Kurulumu

     .

  • https://cran.r-project.org/ adresinden, kullandığımız işletim sistemine göre seçim yapıyoruz ve indirme sayfasına geçiyoruz. Ben windows işletim sistemi kullandığım için onu seçtim.




  • Açılan sayfadan install R for the first time  linkine tıklayalım. 



  • Daha sonra Dowlond R 3.3.2 for Windows (62 megabytes, 32/64 bit) linkine tıklayak indirmeye başlıyoruz.




  • İndirdiğimiz dosyayı çift tıklayarak açıyoruz.




  • Programı kullanacağımız dili seçiyoruz.


  • Sonra çıkan ekranlarda 'Next' diyerek kurulumu tamamlıyoruz.


  • Sorunsuz bir kurulumda başlangıç ekranı bu şekilde olacaktır.
 

 

R Studio Kurulumu

  • https://www.rstudio.com/  adresinden,R Studio'u indirmeye tıklıyoruz.






  • İşletim sistemimize uygun linke tıklıyoruz.


    


  • İndirdiğimiz R Studio setup dosyasını çalıştıralım.


  • Daha sonra ileri diyerek kuruluma başlıyoruz.




  • Kurulacak dizin ayarlanıp, 'İleri' butonuna tıklıyoruz.




  • Programın kısayollarının konulacağı başlat menüsü klasörünü seçiyoruz ve 'Kur' butonuna tıklıyoruz.




  • Kurulumu tamamlıyoruz.





  • Sorunsuz bir kurulumda başlangıç ekranı bu şekilde açılacaktır.



    

   Beş Büyük Şehrin Yıllara Göre Sinema Gösterim Sayısının Analizi



  • getwd()  => Programın varsayılan dizin çalışması veriliyor. 
  • setwd()  =>Parantez içersine girilen değeri yeni çalışma dizini olarak belirliyor.










  • Veri seti Excel formatı yerine CSV dediğimiz formatta, virgülle,noktalı virgülle veya tabla ayrılmış bir metin dosyası şeklindedir.
  • Tüm veri setimizi veri adlı değişkene atıyoruz. Daha sonra veri adlı değişkeni çağırarak listeliyoruz.








  • Burada;
           head(veri)  => Veri isimli veri setinin ilk 6 satırını alır. Burada da bütün sütunlar dahil olmak üzere ilk 6 satırın yıllara göre sinema gösterim sayılarını getirmiştir.

           tail(veri)     => Veri isimli veri setinin son 6 satırını alır. Son 6 satırdaki sinema gösterim sayılarını getirmiştir.

           ls(veri)       =>Veri setindeki ana başlıkları verir. Bu komutla birlikte şehirlerin isimleri gelmektedir.








  • Burada;
      str(veri)          =>   Veri setimizdeki  tüm verilerimizin özelliklerini,cinslerini ve ilk 5-6 satırını gösterir. Bütün  sütunlardaki bilgilerin özelliklerini görmekteyiz.

       veri[0,]          =>   Exceldeki gibi veriler hafızada bir satır ve sütun lokasyonu ile tutulmaktadır.Etiket satırındaki tüm sütunlar ekrana gelmektedir. Bu komutla birlikte ilk satırdaki sütunlar(satırlar,tür,Anlara,Bursa,Tranzon,İstanbul,İzmir) ekrana gelmiştir.

      veri[1,2:4 ]      =>   Burada satır numarasını girdikten sonra görmek istediğimiz iki sütun arasındaki tüm verileri görmek için “:” işareti ile <ilk sütun>:<son sütun >  şeklinde görmek istediğimiz kısımları girebiliriz.  Bu komutla birinci satırdaki Tür ve Ankara arası  bilgiler gelmektedir.

summary(veri)   =>    Veri setinin tüm elemanlarının istatistiksel özelliklerini tek seferde ekranda gösterir. Burada da  yılların ve şehirlerin tüm özellikleri ekrana gelmiştir.







  • Desciribe komutunu çalıştırmak için ilk öncelikle ekranda gözüken komutu çalıştırıyoruz. 
  • Daha sonrasında ise paketlerden  Hmisc paketini yüklüyoruz.











  • Kütüphaneden Hmisc komutunu çağırıyoruz.






  • describe(veri) => Summary komutunda olduğu gibi her bir sütun için ortalama ve aralıklardaki dağılımlara bakabiliyoruz.










  •  Burada;
           describe(veri$Bursa)  =>  Burada verideki tüm alt değişkenler gözükmektedir. 

           mean(veri$Bursa)       =>  Veri setinin ortalamasını vermektedir.  

            sd(veri$Bursa)               =>  Veri setinin standart sapmasını vermektedir.







  • Veri setlerinin istatistiksel özelliklerin grafiksel olarak göstermek için histogram kullanılır. Frekans dağılımını göstermektedir. Burada da Bursa  şehrinde sinema gösterim sayısının histogram grafiği gösterilmiştir. 








  • Burada;
          breaks=300              => Histogram grafiğinin çözünürlüğü artırılmıştır.  

          probability=TRUE     =>Bu komut y ekseninde frekanslar yerine olasılıkların gösterilmesini sağlar.






  •  Burada;
           plot.new      => Bu komut ile boş bir grafik oluşturulur.Bursa şehrinin sinema gösterim histogramı çizdirilmiştir.   

            lines             => Bir başka histogram elde etmek için lines komutu kullanılır. Böylelikle bir çizgi gragiği  oluşturulur.  

            col="green"  => Oluşturulan çizginin rengi yeşildir.  

            lwd=3          => Çizginin piksel kalınlığı ise 3'tür.





  • densitiy(veri$Bursa)  => Bu komutla x ve y serisi oluşturuluyor. x ekseni Bursa şehrinin sinema gösterim sayısı, y ekseni ise bunun olasılığına denk gelmektedir.


   


  • Bursadaki sinema gösterim sayısının histogram grafiği üzerine, İzmirdeki sinema gösterim sayısı çizgi şeklinde eklenmiştir.







  
  • Aşağıdaki iki komutta da 2007 yılına denk gelen şehirlerdeki sinema gösterim sayıları getirilmektedir.








  • Aşağıdaki komutta Ankara şehrindeki sinema gösterim sayısı 1000'den fazla olan yılların histogram grafiğidir.










  • Aşağıdaki komutta ise veri aralıklarını kendimiz girerek histogram oluşturduk.






  • Yukarıdaki komutun plot(density  komutuyla  yapılmış şeklidir.








  • library(car) => "car" paketini kütüphaneye ekliyoruz. 
  • scatterplotMatrix komutu  tüm verileri birbirine göre grafikler. 
  • İstediğimiz sütunları c(“sütun1”,”sütun2”,”sütun3”) şeklinde veri[,vektör] şeklinde ekleyerek, aynı anda bir çok grafiğe sahip olabiliriz.


Kaynak:

  • http://www.barissanli.com/calismalar/dersler/r/rders2.php
  • http://www.tuik.gov.tr/PreTabloArama.do?metod=search&araType=vt