İstatistik 1. Ders Flashcards

1
Q

Risk almakla kumar oynamak arasındaki fark nedir?

A

İstatistiki verinin ve ihtimalin alınarak analiz edilmesidir.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Veri okur yazarlığı nedir?

A

1- Verinin tanımlanması, görselleştirilmesi
2- Verinin toplanması (Bu dersin konusunun dışında)
3- Deney tasarımı (araştırmaya etki eden bütün faktörlerin etkisini değerlendirmektir)
4- Gerekli veri miktarı
5- Alınan sonuçların güvenilirliği.
6- Doğruluk oranının ne olduğunu bilmek. Hata ihtimalleri nelerdir
7- Farklı yöntemlerin karşılaştırması nasıl yapılacak.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

İstatistiki veri yerine insan algısının yetersizlikleri neler olabilir?

A

1- Genellemeleri doğru yapamaya meyillidir.
2- Birçok boyutu olan verilerdeki örüntüyü algılayamamaya meyillidir.
3- Olmayan örüntüler algılamaya meyillidir.
4- Bilişsel yanlılıkları kararını etkileyebilir
a- Hatırında taze olana göre karar yanlılığı
b- Örn. siyasi görüşümüze uygun yayınlara göre karar vermek.
c- Yeteneğini fazla gören çaylaklık az olduğunu düşünen uzmanlık etkisi yaygındır.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

İlk dersteki konular

A

1- Verinin toplanması (Çok önemli ancak ders dışı)
2- Betimsel istatistik (veriyi nasıl tanımlayıp özetleyeceğimiz)
3- Çıkarımsal istatistik (Veriden sonuç nasıl çıkarılır)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

İstatistikte karar verme ve yorumlamayı etkileyen iki önemli kavram nedir?

A

1- Değişkenlik
2- Bilinmezlik

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

İstatistiksel düşünme, karar verme sürecinin tanımı nedir?

A

Kaçınamayacağımız değişkenlik ve bilinmezliğin anlaşılarak karar verme sürecine katılmasıdır.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Betimsel istatistik nedir?

A

Ham ve büyük verilerin yorumlanıp sonuç çıkarılması için
-özetlenmesi
-tanımlanması
-düzenlenmesi
-görselleştirilmesi
işleriyle ilgilenen istatistik dalıdır.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Çıkarımsal istatistik nedir?

A

Çıkarılan alt kümenin nasıl seçileceği, bu genellemenin güvenilirliği yani geneli temsil gücüyle ilgilenen daldır.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

İncelenen bütün kişiler yada ölçümlere populasyon denir. İki kriteri nedir?

A

1- Dahil etme
2- Dışlama

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

İstatistikte bir “örnek” ne anlama gelir?

A

Populasyonun bir alt kümesidir.
Sample size: Örnek boyutu kaç ölçüm olduğunu gösterir.
Sampling: Alt kümenin nasıl seçildiğini
Sampling bias: Örnekleme yanlılığı, alt kümenin doğru seçilmemiş olması ihtimalinin sonuçlara olan yansıma miktarıdır.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Variable
Observation
Instance
Data
Case nedir?

A

Variable farklı değerler alabilen her özellik ve nitelik
Observation birçok değişkenden oluşan bir kayıt
Instance tek gözlem
Data gözlemler topluluğu
Case örnekteki bir kişi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Örnekleme stratejileri nelerdir?

A
  • İhtimale dayalı yöntem model testi için kullanılabilir ve kullanılmalıdır.
  • Belirleyici yöntem. Hızlı bir modelleme inşa etmek için kullanılabilir. Hızlıdır ancak bir modeli test etmek için uygun değillerdir. Genel populasyonu iyi temsil etmez. Belirleyici metot öngörü elde etmek için kullanılır.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Simple random sampling hangi durumda kullanılır?
avantajlarıyla dezavantajları?

A

Populasyondaki her insanın örneklemimize girme ihtimalinin eşit olduğu durumda. Yani grafikteki bütün noktaların yerini bildiğimizde.
Avantajları: Basittir ve temsil gücü yüksektir. Hatasının hesabı daha basittir.
Dezavantajları: Elimizde populasyonun listesi yoksa herkesin örneklemimize girmesini sağlayamayız. Daha da önemlisi, yüksek maliyetli olmasıdır.
En iyi çalışan örneklem budur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Tabakalı tesadüfi örnekleme (stratified random sampling)

A

Eldeki veri öbeklerine göre eş dağılımlı katmanlarına yani parçalarına ayrılarak bu parçalarda örnekler seçilerek örnekleme yapılır.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Küme tesadüfi örnekleme (cluster random sampling)

A

populasyon küçük parçalarına ayrılarak bunlardan rastgele örnekler alınması yöntemidir.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Sistematik örnekleme

A

Sürekli akan bir veride belirlenen aralıklarla örnek alımı yöntemidir.

17
Q

Gözlemsel ve deneysel çalışmalar arasındaki fark nedir?

A

Gözlemselde nedensellik yerine ilinti yada birliktelik bulunulabilirken deneyselde nedensellik bulunabilir.

18
Q

Dondurmanın tüketim miktarıyla suç oranı arasındaki bağıntı neye güzel bir örnektir?

A

İlişki nedensellik demek değildir.

19
Q

Veriye çok sayıda analiz uygulanırsa ne olabilir?

A

İlgisiz verilerle bağıntı olduğu yanılsaması oluşabilir.

20
Q

Parametre kestiriminde doğruluk ile kesinlikten hangisi tercih edilir?

A

Doğruluğu düşük yani yanlı olsa da kesinliği yüksek olması hatanın kolay düzeltilebileceği anlamına gelir.
Atış hedefi örneği…
Lokantada bütün yemeklerin az tuzlu yada tuzlu olması yemeğin bir gün güzel bir gün tatsız diğer gün farklı olması yanında tercih edilir.

21
Q

Betimleyici istatistik
dağılım
veri işleme
görüntüleme

A

Dağılım: ortalama, medyan, mod

İşlenmesi: geçersiz veri, aykırı veri, normalize edilmiş, dönüştürülmüş veri

Verinin görüntülenmesi: Çizgi, bar, histogram gibi…