İstatistik 1. Ders Flashcards
Risk almakla kumar oynamak arasındaki fark nedir?
İstatistiki verinin ve ihtimalin alınarak analiz edilmesidir.
Veri okur yazarlığı nedir?
1- Verinin tanımlanması, görselleştirilmesi
2- Verinin toplanması (Bu dersin konusunun dışında)
3- Deney tasarımı (araştırmaya etki eden bütün faktörlerin etkisini değerlendirmektir)
4- Gerekli veri miktarı
5- Alınan sonuçların güvenilirliği.
6- Doğruluk oranının ne olduğunu bilmek. Hata ihtimalleri nelerdir
7- Farklı yöntemlerin karşılaştırması nasıl yapılacak.
İstatistiki veri yerine insan algısının yetersizlikleri neler olabilir?
1- Genellemeleri doğru yapamaya meyillidir.
2- Birçok boyutu olan verilerdeki örüntüyü algılayamamaya meyillidir.
3- Olmayan örüntüler algılamaya meyillidir.
4- Bilişsel yanlılıkları kararını etkileyebilir
a- Hatırında taze olana göre karar yanlılığı
b- Örn. siyasi görüşümüze uygun yayınlara göre karar vermek.
c- Yeteneğini fazla gören çaylaklık az olduğunu düşünen uzmanlık etkisi yaygındır.
İlk dersteki konular
1- Verinin toplanması (Çok önemli ancak ders dışı)
2- Betimsel istatistik (veriyi nasıl tanımlayıp özetleyeceğimiz)
3- Çıkarımsal istatistik (Veriden sonuç nasıl çıkarılır)
İstatistikte karar verme ve yorumlamayı etkileyen iki önemli kavram nedir?
1- Değişkenlik
2- Bilinmezlik
İstatistiksel düşünme, karar verme sürecinin tanımı nedir?
Kaçınamayacağımız değişkenlik ve bilinmezliğin anlaşılarak karar verme sürecine katılmasıdır.
Betimsel istatistik nedir?
Ham ve büyük verilerin yorumlanıp sonuç çıkarılması için
-özetlenmesi
-tanımlanması
-düzenlenmesi
-görselleştirilmesi
işleriyle ilgilenen istatistik dalıdır.
Çıkarımsal istatistik nedir?
Çıkarılan alt kümenin nasıl seçileceği, bu genellemenin güvenilirliği yani geneli temsil gücüyle ilgilenen daldır.
İncelenen bütün kişiler yada ölçümlere populasyon denir. İki kriteri nedir?
1- Dahil etme
2- Dışlama
İstatistikte bir “örnek” ne anlama gelir?
Populasyonun bir alt kümesidir.
Sample size: Örnek boyutu kaç ölçüm olduğunu gösterir.
Sampling: Alt kümenin nasıl seçildiğini
Sampling bias: Örnekleme yanlılığı, alt kümenin doğru seçilmemiş olması ihtimalinin sonuçlara olan yansıma miktarıdır.
Variable
Observation
Instance
Data
Case nedir?
Variable farklı değerler alabilen her özellik ve nitelik
Observation birçok değişkenden oluşan bir kayıt
Instance tek gözlem
Data gözlemler topluluğu
Case örnekteki bir kişi
Örnekleme stratejileri nelerdir?
- İhtimale dayalı yöntem model testi için kullanılabilir ve kullanılmalıdır.
- Belirleyici yöntem. Hızlı bir modelleme inşa etmek için kullanılabilir. Hızlıdır ancak bir modeli test etmek için uygun değillerdir. Genel populasyonu iyi temsil etmez. Belirleyici metot öngörü elde etmek için kullanılır.
Simple random sampling hangi durumda kullanılır?
avantajlarıyla dezavantajları?
Populasyondaki her insanın örneklemimize girme ihtimalinin eşit olduğu durumda. Yani grafikteki bütün noktaların yerini bildiğimizde.
Avantajları: Basittir ve temsil gücü yüksektir. Hatasının hesabı daha basittir.
Dezavantajları: Elimizde populasyonun listesi yoksa herkesin örneklemimize girmesini sağlayamayız. Daha da önemlisi, yüksek maliyetli olmasıdır.
En iyi çalışan örneklem budur.
Tabakalı tesadüfi örnekleme (stratified random sampling)
Eldeki veri öbeklerine göre eş dağılımlı katmanlarına yani parçalarına ayrılarak bu parçalarda örnekler seçilerek örnekleme yapılır.
Küme tesadüfi örnekleme (cluster random sampling)
populasyon küçük parçalarına ayrılarak bunlardan rastgele örnekler alınması yöntemidir.