İstatistikte Temel Kavramlar

Zeynep Budak
5 min readFeb 1, 2024

Yeni bir seriye başlıyorum. YouTube kanalımda çektiğim videoların içeriklerini burada paylaşacağım. Burada genel olarak istatistik ve veri biliminin alt başlıklarını inceleyeceğiz. Öncelikle işe istatistik biliminin uğraş alanını tanımlamakla başlayalım.

İstatistik çeşitli olgulara ilişkin verilerin toplanması, sınıflandırılması, özetlenmesi, organize edilmesi, analiz edilmesi ve yorumlanması faaliyetlerini kendisine konu edinen veri bilimidir. Yani kısaca veri bilimi=istatistiktir diyebiliriz.

Örneğin, bir sınıfta kaç çocuğun mavi gözleri olduğunu saymak istatistik kullanmaktır. Bu sayıları topladıktan sonra, sınıfta mavi gözlü çocukların ne kadar yaygın olduğunu anlayabiliriz. İstatistik, sayılar ve bilgilerle oynamak gibi düşünülebilir. Bu sayılarla, insanlar daha iyi kararlar alabilir ve dünyayı daha iyi anlayabilirler.

İlgilendiğimiz olaylardaki olguların/birimlerin ölçülmesi ile üretilen verinin ham biçimden işlenmiş biçime dönüşmesine kadar ki süreç istatistik biliminin ilgi alanına girmektedir. Burada dikkat çekeceğimiz bir hususta ölçme kavramından ne anlamamız gerektiğidir.

Ölçmenin tanımını yapmakla başlayalım:
Bir araştırmada ilgilenilen birimin herhangi bir özelliğine ilişkin değer verme işlemine ölçme denir.

Ölçme sonucu elde edilen değerler topluluğuna ise veri diyoruz. Veriye aynı zamanda değişken değeri de denilebilir. Veriler sayısal değerlerden oluşabileceği gibi niteliksel özelliklerden de oluşabilir.

Örneğin: A Üniversitesi'nin Fen Fakültesi öğrencilerine yapılan bir ankette aşağıdaki soruları soralım.

Cinsiyetiniz: K-E-N

Bölümünüz: Fizik, Kimya, Biyoloji, Matematik, İstatistik

Aylık geliriniz: …TL

Kardeş sayınız:

Bu örnekte öğrencilere sorulan çok sayıdaki sorudan sadece dört tanesini aldık. Bu dört soruda anketin uygulandığı öğrencilere dört ölçüm yapılmış ve dört niteliğe(değişkene) ilişkin veri türetilmiştir. Görüleceği üzere aylık gelir sorusunda TL birimi cinsinden bir ölçme yapılmışken, bölümünüz kısmında böyle bir ölçü birimi olmamasına rağmen fakültenin bölümleri ölçülmüş ve veriler elde edilmiştir. Sanıyorum ki bu örnekle artık istatistikte ölçme dediğimiz zaman ne anlamamız gerektiği açık hale gelmiş bulunmaktadır.

Ölçüm yapılarak bilgi ettiğimiz kişi ya da eşya biçimindeki nesnelere deneysel birim denir. Deneysel birime aynı zamanda gözlem birimi de denir. Yukarıdaki örnekte gözlem birimimiz ise öğrencilerdir.

Bir gözlem biriminden diğerine farklılık gösteren nesne özelliklerine değişken denir. Örneğin, düşünün ki bugün hava sıcak, yarın soğuk. Hava sıcaklığı bir değişkendir çünkü değişebilir; bazen sıcak, bazen soğuk olur. Öğrencilere yapılan ankette her bir soru bir değişkeni tanımlar. Birinci soru cinsiyet değişkenini, ikinci soru bölüm değişkenini, üçüncüsü gelir değişkenini, dördüncüsü ise kardeş değişkenini ölçmektedir.

Sıradaki tanımımız ise yığın. Yığının farklı kaynaklarda farklı karşılıkları olabilir. Örneğin kitle, evren, popülasyon gibi tanımlar da yığın için kullanılmaktadır. Peki yığın nedir? Belirli bir özellikteki birimlerin oluşturduğu topluluğa yığın denir. Aynı zamanda gözlem birimlerinin bir değişken bakımından aldıkları değerlerinin oluşturduğu topluluğa da yığın denir. Yani bir yığın, oluşturduğu gözlem birimlerinin tanımlanmasıyla belirtilir. Yukarıdaki örneğimizde A Üniversitesi'nin Fen Fakültesi öğrencilerinin oluşturduğu topluluk bir yığındır.

Yığındaki birimlerin sayısının belirlenebildiği yığınlara sonlu yığın, belirlenemediği yığınlara ise kavramsal veya sonsuz yığın denir.

Yığındaki her bir gözlem biriminin ölçülmesinden elde edilen sayısal değerlerin bir fonksiyonuna parametre denir. Diğer bir adıyla yığın karakteristiğidir. Parametre, yığından hesaplanan betimsel ve sayısal ölçümlerdir.

İstatistiksel bir araştırmada temel amaç, yığına ilişkin parametreler hakkında bilgi edinerek yığının ilgilendiğimiz değişkenleri bakımından karakterlerini tanımaktır. İlgilendiğimiz değişkenleri sayısal olarak özetleyen aritmetik ortalama, mod, medyan, yığın oranı veya yığının varyansı gibi ölçümler yığını niteleyen parametrelerdir.

Yığın sonlu olup çok fazla birim içeriyorsa veya yığın kavramsalsa tüm gözlem birimleri üzerinden ölçüm yapabilme zorluğundan dolayı yığından çekilecek bir alt veri küme verisi ile çalışılabilir.

Yığını temsil eden alt küme verisine örnek denir. Örnekten elde edilen veriye dayanarak yığın parametresi hakkında tahmin elde edilir. Bu yığın parametrelerinin tahminlerine ise istatistik denir.

Yığın parametrelerini tahmin etmek için ilgili yığından alınacak örneğin yığını temsil edebilecek yapıda olması için belirli kurallara göre seçim yapılır. Bu kurallar çerçevesinde örnek seçme işlemine ise örnekleme denir.

Örnekleme işleminde kullanılan yöntemler, örnekleme işleminin şansa bağlı olarak yapılıp yapılmadığına göre iki kategoride toplanırlar.

1. İstatistiksel(tesadüfi) objektif örnekleme

Yığından birimlerin örneğe, belli bir şansa bağlı olarak seçimini gerçekleştiren yöntemlerdir.

Objektif örnekleme, olasılı örnekleme yöntemleri olarak da bilinir. (Tesadüfi ya da istatistiksel). Basit tesadüfi örnekleme, tabakalı örnekleme, küme örneklemesi, sistematik örnekleme bunlardan bazılarıdır.

2. İstatistiksel olmayan (tesadüfi olmayan) subjektif örnekleme

Örnek seçim işleminin kişisel yargı ya da diğer şansa bağlı olmayan yollarla gerçekleştirildiği yöntemlerdir.

Subjektif örnekleme, olasılı olmayan örnekleme yöntemleri olarak da bilinir. (Tesadüfi olmayan veya istatistiksel olmayan) Kota örneklemesi, dilim örneklemesi, kartopu örneklemesi bunlardan bazılarıdır.

Peki tesadüfi örnek nedir?

Yığın yerine yığın içindeki her bir birime eşit seçilme şansı verecek şekilde oluşturulan örneğe tesadüfi örnek diğer adıyla random sample denir. Tesadüfi örnek, bir şeyleri rastgele seçmek demektir. Örneğin, bir kutu dolusu farklı renkte bilyeler düşün. Eğer gözlerini kapatarak kutudan bir bilye seçersen, bu tesadüfi bir örnekleme olur çünkü hangi rengi seçeceğini önceden bilmiyorsun. Tesadüfi örneklemeyi kullanmak, her bilyenin seçilme şansının eşit olmasını sağlar. Bu yöntem, insanların bir grup hakkında adil ve doğru bilgi toplamalarına yardımcı olur.

Yığın yerine örnek üzerinden çalışmamızın bazı nedenlerini aşağıdaki gibi sıralayabiliriz:

  • Yığındaki tüm birimleri ölçmek uzun zaman alır.
  • Yığın içinde yer alan tüm birimlere ulaşmak zor olabilir.
  • Yığın birimlerinin tümünü ölçmek yüksek maliyet gerektirebilir.
  • Birimleri ölçmek birimleri deforme edebilir.

Buraya kadar açıkladığımız parametre, örnek ve istatistik kavramlarını bir örnekle açıklayalım:

— Çankaya ilçesindeki konutların ortalama kirası, ortalama kirada kalma süresi, ortalama konut büyüklüklerini ve konut türünün dağılımını elde etmek için bir anket çalışması yapılmıştır.

Değişken: Konut kirası, konutun kirada kalma süresi, konut büyüklüğü ve konut türü.

Parametre: Yığındaki tüm konutlardan elde edilen ortalama konut kirası, konutun ortalama kirada kalma süresi, ortalama konut büyüklüğü ve konut türü oranları.

Örnek: Çankaya ilçesindeki konutlardan tesadüfi olarak seçilen 500 konutluk alt küme.

İstatistik: 500 konuttan elde edilen ortalama konut kirası, ortalama konutun kirada kalma süresi, ortalama konut büyüklüğü ve konut türü oranları.

İstatistiğin amacı:

İstatistik genel olarak betimsel amaçlı istatistik ve tümevarımsal amaçlı istatistik olmak üzere ikiye ayrılır.

Betimsel amaçlı istatistik yığındaki tüm birimlerden ilgili değişken ya da değişkenler bakımından veri toplandığında bu verileri kullanarak yığını özetlemeyi yani betimlemeyi amaçlar. Bu işlem, frekans dağılımları oluşturularak, grafikler çizilerek ya da parametreler hesaplanarak yapılır. Betimsel istatistik, toplanan verileri özetlemek ve açıklamak için kullanılır. Örneğin, bir okuldaki tüm öğrencilerin matematik sınav sonuçlarını düşün. Eğer bu sınav sonuçlarının ortalamasını (yani ortalama puanını), en yüksek ve en düşük puanları hesaplarsan, bu betimsel istatistik olur. Bu bilgiler, sınav sonuçlarının genel bir resmini verir, ancak bu sınıfa özgüdür ve başka sınıflar veya okullar hakkında bir şey söylemez.

Tümevarımsal amaçlı istatistikte ise yığından tesadüfi olarak seçilen örnekten elde edilen verileri kullanarak, parametreler tahmin edilir ya da parametrelerle ilgili iddiaların doğru olup olmadığının ortaya çıkarılır. Nokta tahmin, aralık tahmini ve hipotez testleri tümevarımsal istatistiğin konularını oluşturur. Tümevarımsal istatistik, toplanan verilerden genellemeler yapmak ve tahminlerde bulunmak için kullanılır. Örneğin, bir şehirdeki 100 ailenin ne kadar televizyon izlediğini araştıran bir anket düşün. Bu 100 aile, şehirdeki tüm ailelerin “tesadüfi bir örneği” olsun. Bu verileri kullanarak, araştırmacılar tüm şehirdeki ailelerin ortalama ne kadar televizyon izlediği hakkında tahminlerde bulunabilir. Küçük bir örneklem grubundan alınan verilerle daha büyük bir grup hakkında genellemeler yapılır.

Beni YouTube’da takip etmek ve bu içeriğin videosuna ulaşmak isterseniz: https://www.youtube.com/channel/UCIjKdThhDR83Ut6ql8Y3TtA

Beni LinkedIn’de takip etmek isterseniz: https://www.linkedin.com/in/zeynepbudak/

Beni Twitter’da takip etmek isterseniz: https://twitter.com/kadubpenyez

Beni Instagram’da takip etmek isterseniz: https://www.instagram.com/kadubpenyez/

Benimle birebir görüşmek isterseniz: https://superpeer.com/zeynepbudak

İçeriklerimi faydalı buluyor ve bana destek olmak isterseniz: https://www.buymeacoffee.com/zeynepbudak

--

--