Veri Türleri ve Veri Toplama Yöntemleri

Zeynep Budak
15 min readMar 13, 2024

Bu bölümde istatistiksel veriye biraz daha yakından bakacağız. Bu verilerin, ne türlerde olacağı, hangi yöntemlerle toplanacağı ve toplanan verinin bilgiye nasıl dönüştürüleceğine ilişkin bazı yöntemlerin özelliklerini açıklayacağız.

Verinin türü ve ölçme düzeyi gibi özellikler, analiz için kullanılacak istatistiksel yöntemin ne olması gerektiğini de belirler. Veri türleri ve verinin ölçme düzeyi uygulamadan uygulamaya değişiklik gösterir.

Toplanan veri, değişik yönlerden aşağıdaki gibi sınıflandırılabilir:

  • Ölçü birimi bakımından: nicel-nitel veri
  • Zaman bakımından: zaman dizisi verisi-yatay kesit veri-karma veri
  • Değer aralığı bakımından: kesikli-sürekli veri

Şimdi bunların her birini kısa örneklerle açıklayalım.

Ölçü Birimi Bakımından Veri

Nicel veri: Bazı durumlarda veri değerleri tamamen sayısal olabilir ve tl, kilogram, santimetre gibi miktar belirten nicel ölçü birimleri ile açıklanabilir. Ölçü birimini sayısal bir değer ile tamamlayabildiğimiz verilere nicel veri denir.

Örneğin, bir imalat sürecinde üretilen çelik çubukların çapına ilişkin veriler ve ölçü birimi de milimetre olabilir.

Nitel veri(kategorik): Bazı durumlarda gözlem biriminden toplanan veri milimetre, kilogram vb. ölçülerle ifade edilemeyip, sadece o birimin (insan, madde, işletme vb.) hangi kategoriye ait olduğunu belirtir. İşte bu türden, ölçme ölçeği kategorik olan veriye nitel veri denir.

Örneğin, bir araştırmada işletme türlerine ilişkin toplanan veriler olsun. Bu durumda gözlem birimi olan işletmelerin her birinden elde edilen veri, anonim şirket, limited şirket, adi şirket, komandit şirket vb. değerleri alır. Görüleceği gibi veri sadece o işletmenin hangi işletme türü kategorisine gireceğini tanımlamaktadır.

Bazen de yaptığımız bir ölçüm sonucu olan veri gerçekte nicel veri olmasına rağmen, bunu nitel veriye dönüştürürüz. Bu durumda veri yine nitel bir veri olmuş olur.

Örneğin, bir imalat sürecinde ürettiğimiz çelik çubuklar örneğini düşünelim. Çelik çubukların çaplarını ölçelim ve milimetre olarak kaydedelim. 100 birimlik ölçüm ve dolayısıyla veri olduğunu varsayalım. Çap verisi 45-55 mm arasında ise ürün hatasız, dışında ise hatalı olarak kaydedilsin.

Görüldüğü üzere çap verisi nicel olduğu halde, analizimizde kullanacağımız dönüştürülmüş “hata durumu değişkeni” verisi nitel veridir.

Zaman Bakımından Veri

Verileri bir başka yönden, zamanla ilişkisi bakımından,

  • Zaman serisi verisi,
  • Yatay kesit veri,
  • Karma veri

olarak üç kategoride sınıflayabiliriz.

Zaman serisi verisi:

Zamanın ardışık noktalarında gözlemlenmiş sıralı veri değerleri kümesine zaman dizisi verisi denir.

Örnek:

  • İMKB’de bulunan A hisse senedine ilişkin 10–14 Ekim 2005 kapanış fiyatları aşağıdaki gibi olsun.

Yukarıdaki veri, gözlem birimi A hisse senedine ilişkin ardışık olarak zamanın 5 noktasında toplanan bir zaman dizisi verisidir.

Gözlem birimlerinden topladığımız veriler çeşitli özelliklerine göre çeşitli adlar alırlar.

Yatay kesit veri :

Zamanın belli bir noktasında birimlerden gözlemlenen veri türüdür.

Zaman serisi biçimindeki veri türünde bir gözlem birimi, herhangi bir değişken bakımından zamanın ardışık noktalarında gözlemlenirken, yatay kesit veride ise zamanın belli bir anında, çok sayıdaki gözlem birimi herhangi bir değişken bakımından ölçülerek elde edilen veri kümesi söz konusudur.

Örnek:

  • 2005 Ekim ayında Ankara’daki beyaz eşya satıcılarının ciroları ile ilgili veri kümesi bir yatay kesit veri tanımlar. Çünkü veri belli bir zaman noktasına (Ekim 2005) aittir.
  • Ankara’da hanehalklarının aylık gıda harcamalarını araştıran bir anket çalışması gerçekleştirilelim. Örnekleme yöntemiyle 500 hanelik bir örnek seçelim. Bu 500 haneye “Hanehalkınızın aylık ortalama gıda harcaması nedir?”sorusunu soralım. Bu durumda hanehalkı aylık ortalama gıda harcaması değişkenine ilişkin 500 birimlik bir veriye sahip oluruz. Bu veri zamanın belli bir noktasında toplandığından yatay kesit bir veridir.

Karma veri:

Bazı araştırmalarda toplanan verinin hem zaman boyutu hem de yatay kesit boyutu söz konusudur. Bu tür verilere karma veri ya da panel veri adı verilir. Bu tür veriler, birden fazla gözlem biriminin zamanın çeşitli noktalarında gözlemlenmesi ile elde edilir.

Örnek:

Aşağıdaki tabloda Dolar ve Euro’nun 2004 yılında aylar itibariyle TL döviz kuru ortalama değerleri yer almaktadır.

Burada gözlem birimleri dolar ve euro olmak üzere iki tanedir. Bu verinin yatay kesit boyutunu oluşturur. Her iki gözlem birimi aylar itibariyle yer almaktadır. Bu da zaman boyutunu oluşturarak veri için karma yapıyı ortaya koymaktadır.

Veri aynı zamanda belli bir değer aralığında tüm değerleri alıp alamamasına göre sürekli ve kesikli olmak üzere sınıflandırılabilir.

Ölçek Bakımından Veri

Sürekli veri:

Bir ölçeğin değer aralığındaki tüm değerleri alabilen verilere denir.

Örnek:

  • ABD doları, Euro döviz kurları sürekli değişkenlerdir.
  • Hisse senedi fiyatları, işçilerin aldığı aylık ücret, hanehalkı gıda harcaması vb. değişkenler sürekli değişkenlerdir.

Kesikli veri:

Değer aralığında her değeri alamayan, ancak bazı değerleri alabilen verilere kesikli veri denir.

Örnek:

  • Bir pazarlama araştırması yaptığımızı ve sorular arasında aşağıdaki iki sorunun da olduğunu varsayalım.

Soru 1: Eğitim durumunuz nedir?

a) İlköğretim b) Orta öğretim c) Lise d) Üniversite e) Lisansüstü

Soru 2: Aileniz kaç kişiden oluşmaktadır?

a) 1–2 b) 3–4 c) 5–6 d) 7 ve daha fazla

Yukarıdaki sorular eğitim durumu ve aile büyüklüğü olmak üzere iki değişken tanımlamaktadır. Bu değişkenlere ilişkin veriler, birinci değişken sadece 5 değer, ikinci değişkene ilişkin veriler ise dört değer alabilmektedir. Örneğin ikinci değişken 5.5 değerini alamaz, bu yüzden kesikli bir veri tanımlar.

Veri Ölçme Düzeyleri

Veriler aynı zamanda ölçme düzeyleri ile de tanımlanabilir.

Nominal ölçme düzeyindeki veri:

Nominal ölçek aslında veriyi herhangi bir boyutta ölçeklendirmemektedir. Nominal ölçek, veriyi bir anlamda etiketlendirir. Cinsiyet, politik tercih, eğitim durumu, şirket türü gibi değişkenlerin verisi bu türden verilerdir. Cinsiyet değişkeni verisine kadın, erkek; şirket türü değişkeni verisine anonim şirket, limited şirket vb. etiketleri örnek olarak verilebilir.

Nitel veriler nominal ölçekte ölçülmüş verilerdir.

Sıralama ölçme düzeyindeki veri:

Sıralama verisi en basit anlamda gerçek ölçek verisidir. Nominal veri için bir üstünlük derecelendirmesi yapılamaz. Ancak sıralama düzeyindeki veriler için böyle bir üstünlük sıralaması yapılabilir.

Örnek:

Cinsiyet değişkeninin verisi olan kadın ve erkek için bir öncelik ya da üstünlük sıralaması yapılamaz. Ancak, varsayalım ki bir işyerinde çalışanlar için performans değerlendirmesi yapılıyor olsun. Bu amaçla, yapılan performans puanlaması şöyledir:

Burada kişilerin performans puanları sıralama ölçeğine sahiptir. Ahmet’in Mehmet’ten; Mehmet’in Ayşe’den; Ayşe’nin Hasan’dan daha üstün performansa sahip olduğunu söyleyebiliriz. Ancak, Ahmet-Mehmet performans farkı 5 puan; Mehmet-Ayşe performans farkı 5 puan olmasına rağmen, Ahmet’le Mehmet arasındaki performans farkı, Mehmet’le Ayşe arasındaki performans farkına eşittir diyemeyiz. Yine, Ahmet Ayşe’nin iki katı performans farkına sahiptir de diyemeyiz. Başta da ifade ettiğimiz gibi performans puanlarına bakarak sadece bir sıralama yapabiliriz.

Bir başka deyişle performans puanları için toplama-çıkarma veya çarpma-bölme işlemleri gerçekleştiremeyiz. Çünkü, bu puanlar arasında bir oransal ilişki kuramayız.

Nominal veri ile sıralama verisi arasındaki temel fark şudur: Nominal veri için sadece eşitlik (=) ilişkisi kurulabilirken, sıralama verisi için eşitlik ilişkisinin yanı sıra büyüklük-küçüklük (<, >) ilişkisi de kurulabilir.

Örnek:

Yapılan bir pazarlama araştırmasında tüketicilere aşağıdaki soru sorulmuş olsun.

Soru: Aşağıdaki firmaların üretmiş olduğu çikolataları tercih sırasına göre belirtiniz. (1: en iyi, 4: en kötü)

Seçeneklerin yanındaki tercih sıralaması anketin uygulandığı denek tarafından doldurulmuş olsun.

Görüldüğü üzere çikolata markaları arasında tüketici bir tercih sıralaması yaptığından, buradan elde edilen veri sıralama ölçeğindeki veridir. Anketin uygulandığı denek en çok Ülker markasını, en az ise Saray markasını tercih ettiğini belirtmiştir. Ancak Ülker ile Eti arasındaki tercih farkı, Nestle ile Saray arasındaki tercih farkına eşittir diyemediğimiz gibi, Ülker, Saray markasının dört misli tercih ediliyor da diyemeyiz.

Aralık Ölçme düzeyindeki veri:

Eğer veri sıralama özelliklerine sahip olup (<, =, >), aynı zamanda iki veri değeri arasındaki uzaklık bir ölçekle ölçülebiliyorsa, bu tür veriler aralık verisi ya da aralık ölçme düzeyinde ölçülmüş veri olarak adlandırılır. Gerçek sıfır noktası yoktur.

Örnek:

Aralık ölçeğindeki verinin en güzel örneği sıcaklık verisidir. Hem Fahrenheit hem de Celsius sıcaklık ölçekleri, =, > gibi sıralama ölçeği özelliklerine sahiptir. Ayrıca, eşit aralıklardaki noktalar arasındaki uzaklıkta ölçülebilmektedir. Örneğin 30° C > 25° C, 40° C > 35° C dir. 30° C ve 25° C arasındaki 5° C lik fark, 40° C ve 35° C arasındaki 5° C lik farka eşittir.

Görüldüğü gibi aralık ölçme düzeyindeki veri ile iki değer arasındaki farkı ölçebilirken, sıralama ölçeğinde bu mümkün değildir ve sadece değerin diğerinden büyük ya da küçük olduğunu söylemek mümkün olmaktadır..

Oransal ölçme düzeyindeki veri:

Aralık ölçme düzeyindeki verinin sahip olduğu özelliklere ilaveten, gerçek bir sıfır noktasının da olduğu veri oransal ölçme düzeyindeki veridir. Oransal ölçme düzeyi en yüksek düzeydeki ölçme düzeyidir.

Kg, cm, TL gibi birimlerle ifade edilen bir çok veri bir sıfır noktasına sahiptir ve oransal ölçme düzeyinde ölçülmüştür.

Aralık ve oransal ölçme düzeyleri arasındaki fark, gerçek sıfır noktası tanımına dayalı olarak biraz karmaşık gözükebilir. Bunu açıklamak için iki durum ele alalım.

Birinci durum: Varsayalım ki sizin 10 TL kardeşinizin de 20 TL parası var. Bu para birimlerini dolara da, euroya da çevirsek, yine kardeşinizin parası sizinkinin iki katıdır diyebiliriz. Çünkü her iki para biriminin sıfırı var. Eğer sizin paranız kaybolmuşsa, sizin sıfır paranız varsa yani paranız yoksa burada sıfır gerçek anlamına sahiptir ve yokluğu tanımlamaktadır. Böylece sahip olunan para değişkenine ilişkin veriler, hem farkları hem de oranları tespit edebilmekte olduğundan oransal ölçme düzeyindedir deriz.

İkinci durum: Dünkü sıcaklığın 35° F (1.67° C), bugünkü sıcaklığın da 70° F (21.11° C) olduğunu varsayalım. Şimdi soruyu şöyle soralım. Bugünün sıcaklığı dünkü sıcaklığın iki katı mıdır? Cevabımız hayır olacaktır. Bunu Fahrenheit’i Celsius’a çevirmek suretiyle görebiliriz. Şöyle ki Fahrenheit olarak 2/1 oranı Celsius’a çevirdiğimizde bu oran (21.11/1.67)=(12.64/1) olur. Benzer şekilde, sıcaklığın 0°F (-17.78°C) olduğunu varsayalım. 0°F, sıcaklığın olmadığını ifade etmez, dolayısıyla sıcaklık için gerçek anlamda bir sıfır değildir, yani yokluğu tanımlamamaktadır. Sadece 10°F (-12.22°C) den daha soğuk olduğunu söyler. Dolayısıyla F, C cinsinden sıcaklık gerçek bir sıfır noktasına sahip olmadığından oransal değil, aralık ölçme düzeyindeki verileri tanımlar. Aralık ölçme düzeyindeki veriler için farklar ölçülebilmekte ancak farklar oran biçiminde ifade edilememektedir.

Veri Toplama Araçları ve Teknikleri

Veri toplamanın birçok aracı ve yöntemi vardır. Veri toplamak için kullanılabilecek uygun aracın belirlenmesi verinin birincil veri mi ikincil veri mi olduğuna bağlıdır.

Tanım (Birincil veri): Sizin bizzat kendiniz veya sizinle ilişkili biri tarafından belirli bir amaç için kullanılmak üzere toplanan veridir.

Tanım (İkincil veri): Sizin dışınızdaki kaynaklar tarafından toplanan verilerdir.

Tüm veriler ilk önce herhangi birisi için birincil veri olarak başlar. Sizin birincil veriniz ise bir başkasının ikincil verisi olabilir. Türkiye İstatistik Kurumu tarafından belli büyüklükteki işyerlerinden toplanan “sanayi üretim istatistikleri” TÜİK için birincil veridir. Eğer siz bu veriyi alıp herhangi bir istatistiksel analizinde kullanırsanız bu durumda sizin için ikincil veri olur.

Verileri birincil ve ikincil tür veri olarak ayırmamızın nedeni, veri toplama tekniklerinin farklılığından dolayıdır. Birincil veri için ilgileneceğimiz hususlar veride gerekli olanın ne olduğunu tespit ederek, verinin nasıl ve ne zaman ve nereden toplanacağını belirlemektir. Halbuki ikincil veride ise ana husus hangi verinin gerekli olduğunun ve bunları nerede bulacağımızın belirlenmesidir.

Veri toplamanın birçok yöntemi ve aracı vardır. Ancak burada kısaca en yararlı ve sık kullanılan aşağıdaki yöntemlerden kısaca bahsedeceğiz.

  • Deney
  • Telefon araştırması
  • Posta anketi
  • Direkt gözlem ve kişisel gözlem.

Deney:

Çıktı olarak bir veri üreten işlemler sürecine deney denir. Fiziksel bir laboratuvar ortamında çıktı üzerine etkide bulunan bazı faktörlerin düzeyleri değiştirilerek, bunlara karşın gözlemlediğimiz bir çıktı verisini kaydederiz. Bu tür veriler, deney yoluyla elde edilmiş verilerdir.

Telefon araştırması:

İnsanlar ve onların düşünceleri hakkında veri elde etmenin bir yolu da telefon araştırmasıdır. Telefon araştırması diğer yöntemlere göre nispeten daha ucuz ve kolay bir yöntemdir. Bununla beraber, bazı deneklerin telefonu olmaması, bazılarının aradığınız anda açmaması, bazılarının görüşmeyi reddetmesi gibi sorunları vardır.

Özellikle seçim tahmini vb. araştırmalarda, sonucun hızlı alınması gerektiği ve maliyetin önemli olduğu araştırmalarda telefon araştırması yöntemi kullanılır.

Telefon araştırmalarında, görüştüğümüz insanı uzun süre bağlantıda tutamayacağımız için soruların mümkün olduğunca kısa ve kapalı uçlu olarak sorulmasına dikkat etmek gerekir.

Tanımlanan belli bir kısa seçenekler listesinden cevaplayanın seçmesinin istendiği soru türüne “kapalı uçlu soru” denir.

Cevaplayan deneğe, sorulan soruya karşın vereceği cevaba ilişkin kelimeleri, ifadeleri, değerleri tamamen serbest biçimde seçerek belirtmesine izin verilen sorulara “açık uçlu soru” denir.

(e-)Posta anketi:

Yazılı bir formla, posta yoluyla deneklere gönderilip cevap istenerek veri toplama yöntemi olan posta yoluyla anket çalışması da sık kullanılan yöntemlerdendir. Bu yöntemle veri toplamada maliyet özellikle posta masraflarından kaynaklanır.

Yazılı formla bilgi toplandığından sorular hem açık hem de kapalı uçlu olabilir.

Açık uçlu soru, cevaplayana daha fazla esneklik vermekle birlikte, analiz aşamasında zorluk çıkarır.

Kişisel gözlem:

Kişisel görüşme yoluyla veri toplama da sık kullanılan yöntemlerden biridir. Kişisel görüşme yoluyla veri toplama daha ziyade yazılı form üzerinden yapılır. Görüşmeler ya yapılandırılmış ya da yapılandırılmamış görüşme yoluyla gerçekleştirilir.

Yapılandırılmış görüşme”, soruların önceden basılı hale getirildiği yöntemdir. “Yapılandırılmamış görüşme” ise, görüşmenin bir ya da birkaç geniş kapsamlı soruyla başlayıp, görüşmenin ilerleyen seyrinde verilen cevaplara göre yeni soruların sorulduğu yöntemdir.

Veri hangi yöntemle toplanırsa toplansın, dikkat edilmesi gereken husus verinin doğru ve güvenilir bir biçimde toplanmasıdır.

Veri Toplamada Dikkat Gerektiren Noktalar

  • Veri gerekli olduğunda, eğer kullanmak uygunsa öncelikle araştırılan konuda ikincil veri olup olmadığına bakmak gerekir. Çünkü çok daha az maliyet gerektirir.
  • İkincil veri kullanılacağı zaman, hemen bu verinin güvenilir olduğunu varsaymayarak, verinin güvenilirliği konusunda bir değerlendirme yapmak gerekir.
  • Veri toplamada “yanlılık” olmamasına dikkat etmek gerekir. Yanlılık birkaç nedenle ortaya çıkar.

Örneğin, kişisel anket durumunda anketörün davranışı, ses tonu vb. hususlar deneklerin cevaplarında yanlılık yaratabilir. Buna “anketör yanlılığı” denir.

Diğer bir yanlılık ise “cevaplamama yanlılığı”dır. Posta ile yapılan anketlerde formların bir kısmı dönemeyebilir, telefonda bazı denekler cevaplandırmayı reddedebilir. Bu durumda “cevaplamama yanlılığı” problemiyle karşılaşabiliriz. Örneğin gelir dağılımı araştırması yaptığımızı varsayalım. Posta ile gönderdiğimiz anketlere daha ziyade düşük gelirli cevap vermiş diğerleri göndermemiş ise bu durumda cevaplamama yanlılığından bahsederiz. Çünkü veriler düşük gelirli kesime doğru bir yanlılık gösterecektir.

Verilerdeki diğer bir yanlılık ise “seçme yanlılığı”dır. Gelir dağılımı ile ilgili Ankara’da yapacağımız bir araştırmada, örneğe seçeceğimiz birimlerin büyük bir kısmını varlıklı bölgelerden seçersek bir seçme yanlılığı yaratırız ve tahminlerimiz, varlıklı kesimin verilerine yanlılık gösterir.

Veri toplamada diğer bir problem, ölçme hatasından kaynaklanan “ölçme yanlılığı”dır. Örneğin, deney yoluyla toplanan verilerde, bir ölçme aleti fazla tartıyorsa, verilerde bu yönde bir yanlılık oluşur.

Örnekleme Yöntemleri

Birinci bölümde, gerçek araştırmalarda çoğu zaman yığın bilgisine sahip olamayacağımızı, yığından bilgi toplamanın zorluklarını tartışmış, bu bağlamda veri toplamanın neden örnekleme yöntemiyle yapılması gerektiğini ve avantajlarını tartışmıştık. Şimdi burada konuyu tekrar ele alıp, bu defa örnekleme yoluyla veri toplamak için kullanabileceğimiz bazı örnekleme tekniklerinin kısa bir açıklamasını yapmaya çalışacağız.

Örnekleme işleminde kullanılan yöntemler, örnekleme işleminin şansa bağlı olarak yapılıp yapılmadığına göre iki kategoride toplanırlar.

İstatistiksel olmayan (tesadüfi olmayan) örnekleme yöntemleri: Örnek seçim işleminin kişisel yargı ya da diğer şansa bağlı olmayan yollarla gerçekleştirildiği yöntemlerdir.

İstatistiksel örnekleme yöntemleri (olasılıklı örnekleme): Yığından birimlerin örneğe belli bir şansa bağlı olarak olasılıklı seçimini gerçekleştiren yöntemlerdir.

Burada istatistiksel olmayan örnekleme yöntemleri üzerinde durmayacağız, olasılıklı örnekleminin temel kavramlarını ve örnekleme tekniklerinden bazılarını ele alacağız.

Öncelikle örnekleminin temel kavramlarını aşağıdaki şekil üzerinden açıklamaya çalışalım.

Şimdi şekil üzerinde tanımladığımız kavramları açıklayalım

Gözlem birimi: Hakkında ölçüm yaparak bilgi elde ettiğimiz kişi ya da eşya biçimindeki nesnelerdir. Gözlem birimine aynı zamanda deneysel birim de denir.

Örnekleme birimi: Bir ya da birden fazla gözlem birimi kümesidir. Örnekleme birimleri birbiriyle çakışamazlar. Yani bir gözlem birimi yalnız ve yalnızca bir örnekleme biriminde yer alır.

Çerçeve: Yığındaki örnekleme birimlerinin listesidir.

Burada belirtilmesi gereken bir husus, bazen örnekleme birimleri sadece bir gözlem birimi içeriğinde, örnekleme birimi ile gözlem biriminin aynı olmasıdır.

Örnek:

Bir pazarlama araştırması firması, yeni bir ürün hakkında bir şehirde yaşayan 20 yaş üstü insanların düşüncelerini öğrenmek istemektedir. Firma bu amaçla şehirdeki 20 yaş üstü insanlardan n=500 kişiyi tesadüfi olarak seçmiş ve bunların düşüncesini almak amacıyla anket uygulamıştır. Bu araştırmada yukarıda verdiğimiz kavramları tanımlayalım.

Örneğe çekilen her bir 20 yaş üstü birey örnekleme birimidir. Şehirdeki tüm mümkün örneklemin (tüm 20 yaş üstü insanları) listesi çerçeveyi oluşturur. 500 örnekleme birimi ise örneği tanımlar. Bu problemden, her bir örnekleme birimi sadece bir gözlem birimi içerdiğinden, örnekleme birimi ile gözlem birimi birbirinden ayrılır.

Örnek:

Aynı firma bu araştırmayı başka bir biçimde de yapabilir. Şehirde bulunan hanehalklarından n=200 hanehalkını tesadüfi olarak seçer ve bu hanehalklarındaki 20 yaş üstü bireylerle anket yapabilir.

Bu durumda, şehirdeki hanehalklarının listesi çerçeveyi, her bir hanehalkı örnekleme birimini ve her hanehalkındaki 20 yaş üstü birey gözlem birimini oluşturur.

Basit Tesadüfi Örnekleme

Bu bölümde her örnekleme biriminin sadece bir gözlem birimi içerdiğini varsayacağız.

Tanım : N tane örnekleme biriminin olduğu bir yığından, n sayıda örnekleme biriminin, örneğe çıkma şansı eşit olacak biçimde seçilmesine basit tesadüfi örnekleme denir.

Basit tesadüfi örneklemeyi aşağıdaki iki örnekle açıklayalım.

Örnek:

Bir torbanın içerisine N=50 tane isim yazıp koyalım. Bunlardan n=10 tanesini gözümüzü kapatarak seçelim. Bu durumda 10272278170 (N!/(n!(N-n)!)), mümkün örnekten birini seçeriz. Torba içindeki her birimin örneğe çıkma şansı eşit ve her birim tesadüfi olarak seçildiğinden, seçilen örnek basit tesadüfi bir örnektir.

Örnek:

Migros mağazaları İnsan Kaynakları Yöneticisi çalışanlarının memnuniyetine ilişkin bir araştırma yapmak istemektedir. Bu amaçla, N=10000 çalışanına anket uygulamak zor olduğundan, bunlar içinden n=150 kişilik bir örnek seçip örneğe çıkan bu birimlere anket uygulayacaktır. Bu amaçla bilgisayarında kayıtlı 10000 kişiye 1–10000 arasında numara verip, bilgisayarda tesadüfi olarak bu sayılar arasından 150 tanesini seçebilir. Çıkan sayıların her biri bir çalışanın numarasıdır. Böylece, her bir çalışanın örneğe çıkma olasılığı eşit olduğundan, seçim işlemi basit tesadüfi örnekleme ile yapılmış olur.

Tabakalı Tesadüfi Örnekleme

Basit tesadüfi örnekleme ile örnek seçimi bazen arzulanan bilgiyi elde etme için büyük bir örnek çapı gerektirebilir ve dolayısıyla veri toplama zor ve maliyetli olabilir. Tabakalı tesadüfi örnekleme aynı bilgiyi daha küçük bir örnek çapı ile elde etmeye imkan sağlayabilir.

Tanım : Yığındaki birimlerin, örnekleme birimlerinin her birinin tabaka adı verilen alt kümelerden sadece birinde yer alacak şekilde bölünüp, bu tabakalardan basit tesadüfi örnekleme ile örnek seçme işlemine “tabakalı tesadüfi örnekleme” bu yolla elde edilen örneğe de “tabakalı tesadüfi örnek” denir.

Örnek :

Ankara Bakkallar Federasyonunun, Ankara Merkezinde bulunan bakkalların aylık satışlarına ilişkin bir araştırma yapacağını varsayalım. Federasyon Merkezinde bakkalların kayıtları bilgisayar veri tabanında saklanmaktadır. Araştırmanın yürütücüleri bakkalların bulundukları yöreye göre bu satışların anlamlı farklılıklar göstereceğini öngörmektedir. Yine basit tesadüfi örnekleme ile örnek seçildiğinde gözlem birimlerine ulaşıp anket uygulamanın maliyetinin yüksek olacağını tahmin etmektedirler. Ayrıca bazı ilçelerde çok az sayıda bakkal olduğundan bu ilçelerden basit tesadüfi örnekleme ile örneğe bakkal çıkma olasılıkları düşük olacaktır. Bu nedenlerle, bu veri tabanından tesadüfi örnek seçmek yerine, Ankara’nın her bir ilçesini tabakalar olarak alıp, bu tabakaların her birinden basit tesadüfi örnekleme ile örnek seçmeye karar vermişlerdir. Böylece veri tabanındaki kayıtlar ilçeler bazında tabakalara ayrılıp, bu tabakaların her birinden bakkallar örneğe seçilmiştir.

Böyle bir araştırma tasarımı ile araştırma maliyeti düşürüldüğü gibi, her bir ilçeden örneğe bakkal seçilmesi ile seçilen örneğin yığını temsili etme yeteneği de artırılmış olur. Yığın parametresi olan aylık ortalama satış daha güvenilir biçimde tahmin edilmiş olur. Örnek seçiminin tabakalı tesadüfi örneklemeyle yapılmasıyla, her bir tabaka hakkında (ilçe hakkında) ortalama satış bilgisi edinme imkanı sağlanmış olur.

Örnek :

Yukarıdaki örnekteki senaryoyu biraz daha genişletelim. Bakkallar aynı zamanda büyüklüklerine göre birbirinden çok farklıdır. Dolayısıyla seçilecek örnekte her büyüklükteki (küçük-orta-büyük) bakkalın örneğe belli oranlarda seçilmesini de sağlamak isteyelim. Bu durumda tabakaları oluşturan her bir ilçeyi de alt tabakalar olan küçük-orta-büyük bakkallara ayıralım ve bu alt tabakalardan örnekleme birimlerini seçelim. Böylece hem örnek çapı daha da küçültülmüş hem de her büyüklükteki bakkal, örnekte temsili edilmiş olur.

Bu işlemin anlaşılması bakımından tabaka işlemini aşağıdaki şekil yardımıyla belirginleştirebiliriz.

Tabakalı tesadüfi örneklemenin avantajlarını şöyle sıralayabiliriz:

  1. Yığın bütününe ilişkin parametrelerin yanı sıra, her bir tabakaya ilişkin parametrelerin tahminlerini elde etmek mümkün olur.
  2. Parametre tahminleri, basit tesadüfi örnekleme ile elde edilenden daha sağlıklıdır. Çünkü her bir tabaka, birbirine benzer birimler bir arada olacak şekilde oluşturulur. Böylece, her bir tabaka için ve dolayısıyla yığının bütünü için daha sağlıklı parametre tahmini elde edilmiş olur.
  3. Örneklemenin yapılacağı çerçevenin daha kolay elde edilebilmesi, veri toplamanın daha ucuza gelmesi gibi nedenlerle, basit tesadüfi örneklemeye nazaran maliyet bakımından daha ekonomik olabilir.

Küme Örneklemesi

Bazı durumlarda, her bir birime ulaşıp ölçüm yapmak yüksek parasal ve zaman maliyeti gerektirebilir ve böylece örnekleme maliyeti dikkate değer biçimde artabilir. Bu problemin üstesinden gelmenin bir yolu küme örneklemesine başvurmak olabilir.

Tanım: Yığının kümelere bölünüp, bu kümeler içinden m tanesinin basit tesadüfi örnekleme ile seçilip, nihai örneği oluşturacak birimlerin bu kümelerden olasılıklı biçimde çekildiği örnekleme yöntemidir.

Küme örneklemesi ile tabakalı örnekleme arasındaki farka dikkat etmek gerekir. Tabakalı tesadüfi örneklemede, örnekleme birimleri yığının ayrıldığı tabakaların tamamından tesadüfi olarak seçilirken, küme örneklemesinde, önce yığının ayrıldığı kümeler arasından m tanesi rasgele seçilmekte, daha sonra bu seçilen kümelerden örnekleme birimleri rasgele seçilmektedir. Kümelerin büyüklüğü aynı olmayabilir.

Burada bir şeye daha işaret etmek gerekir. m tane küme rasgele seçildikten sonra, bu kümeler içinden n sayıdaki örnekleme birimleri rasgele seçilebildiği gibi, bazen de zaman, bütçe kısıtlamasına ya da araştırmanın niteliğine göre, seçilen küme içerisindeki tüm birimler gözlemlenebilir.

Örnek :

Yukarıdaki örneği tekrar ele alalım. Küme örneklemesi durumunda, her bir ilçeyi küme olarak dikkate alıp, bu ilçelerden tesadüfi olarak Çankaya, Keçiören ve Mamak ilçelerini (kümelerini) seçmiş olalım. İkinci aşamada n birimlik örnek, artık bu m tane (3 tane) ilçe içinde bulunan bakkallar arasından seçilecektir.

Örnek :

Ankara’da hanehalkında bulunan 20+ yaş grubunda insanlarla bir araştırma yapacağımızı varsayalım. Örnek çekimi için Ankara’daki 20+ yaş insanların listesi olan bir çerçeve bulmak son derece zordur. Halbuki hanehalklarının listesini bulabiliriz. Dolayısıyla, hanehalklarını birer küme olarak alıp, önce bu kümelerden (hanehalkı) m tanesini seçer, daha sonra bu seçilen kümelerden 20+ yaşta bireyleri rastgele seçeriz. Böylece örneğimizi küme örnekleme yöntemiyle oluşturmuş oluruz.

Böylece küme örneklemesinin avantajlarını şöyle özetleyebiliriz:

  1. Küme örneklemesinde yığının çerçevesini oluşturmak daha kolaydır.
  2. Birimler arasındaki mesafe uzak olduğunda, ulaşım maliyetleri yüksek olabilir. Küme örneklemesi ile bu maliyet azaltılır.

Beni YouTube’da takip etmek ve bu içeriğin videosuna ulaşmak isterseniz: https://www.youtube.com/channel/UCIjKdThhDR83Ut6ql8Y3TtA

Beni LinkedIn’de takip etmek isterseniz: https://www.linkedin.com/in/zeynepbudak/

Beni Twitter’da takip etmek isterseniz: https://twitter.com/kadubpenyez

Beni Instagram’da takip etmek isterseniz: https://www.instagram.com/kadubpenyez/

Benimle birebir görüşmek isterseniz: https://superpeer.com/zeynepbudak

İçeriklerimi faydalı buluyor ve bana destek olmak isterseniz: https://www.buymeacoffee.com/zeynepbudak

--

--