统计挖坑题 Flashcards

1
Q

职称 爱好,属于什么数据

A

等级/顺序数据!

三步判断数据类型:1.绝对零点 2.相等单位 3.是否有比较意义

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

变异系数一般什么时候用

A

同一组的不同特质
统一特质但样本间水平差距大(3与6年纪数学)

❗️不可用于推论统计
❗️只能用于等比数据(其实平均数不为零的等距也可以用)(标准差可以用等距)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

样本的变异小/大于总体的变异?

A

小于总体变异性,所以通常除n-1以更好地无偏

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

切比雪夫定律

A

至少有1-1/h^2个数落在平均数h个标准差之内

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

平均差(离差的绝对值)一颗说明分布中全部数值的差异情况吗

A

可以

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

离差可以用来描述离中趋势吗

A

不行,要因为正负抵消

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

相关系数的注意事项

A
  1. 受样本量影响
  2. 不是等距数据
  3. 相关可能是线性的或非线性的
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

皮尔逊积差相关适用范围

A
  1. 总体正态
  2. 连续性数据
  3. 满足线性关系
  4. 成对出现,不小于30对

📒既然是【连续】即等距等比均可

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

斯皮尔曼等级相关和肯德尔系数的区别

A

斯皮尔曼只能处理两列变量

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

肯德尔W和U的区别

A
  1. U(一致性系数)要用对偶比较法

2. W一定是正数,U只可能是三个数 可能为负

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

肯德尔U的正负表示一致的方向吗

A

不表示

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

点二列相关适用范围

A
  1. 一列真二分,一列连续变量

2. 总体正态(与二列相关的主要区别)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

点二列和二列的共同点

A
  1. 都有一列是连续变量

2. 都是质与量相关

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

哪种品质相关要求两个二分变量都是人为二分

A

四分相关

📌phi相关两个都是真二分

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

相关系数是等距的测量值吗

A

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

卡方分布的应用

A
  1. 比较样本与总体方差的差距

2. 计数数据的假设检验

17
Q

F分布的应用

A
  1. 总体的方差齐性检验

2. 多组间均值差异检验

18
Q

统计概率又称?

A

经验概率或后验概率,取决于被观测物实际出现的概率

19
Q

古典概率又称?

A

先验概率

20
Q

中心极限定律和大数定律

A

中心极限是样本均值呈正态分布

大数定律是样本均值趋近总体均值/样本容量越大,越能代表总体

21
Q

和方可以作为分布差异的指标吗

A

不可以,因为受样本量影响

(和方可表示离中趋势)

22
Q

三种集中数量和差异数量分别是

A

集中:均值、中数、众数
差异:全距、标准差、四分位【距】

📒四分位距=third四分位数-first四分位数

23
Q

样本均值分布包含所有样本吗

A

24
Q

统计量的分布可以代表样本的分布吗

A

25
Q

总体范围确定的情况下,慎重决定样本容量对取样误差没有影响,对吗

A

样本容量大,标准误小(【样本均值】分布的标准差)

26
Q

同样要使样本分布在总体的顶端10%,n=16的样本和n=26的样本所需均值一样吗

A

不一样,小样本所需均值更大

27
Q

【显著性水平a】为0.05表示所观测到的差异有5%的可能性由【随机误差】导致,对吗

A

28
Q

犯I类错误的原因

A

样本中包含极端数据、决策标准过于宽松

29
Q

II类错误的原因

A

处理效应小、数据不够灵敏、样本数据变异过大

30
Q

二项分布近似做正态分布时要注意什么

A

n取精确上下限

31
Q

样本百分比率的取样服从什么分布

A

二项分布(要么是,要么不是/要么男要么女)

📒如果是三类的百分比(赞同/反对/中立)采用卡方匹配度检验
卡方匹配的假设:观察独立、每个单位格期望次数不小于5

32
Q

t检验和z检验谁更敏感

A

z

33
Q

良好估计量的标准

A

无偏:样本【容量不变】,组数无限增加,【样本分布】【均值】趋于总体均值
有效:某无偏估计量的抽样分布方差小于另一个无偏估计量,则较另一个更有效
一致:样本【容量增加】,【估计量】趋于总体均值
充分:容量为n的样本充分反映了总体的信息

34
Q

影响置信区间宽度的因素

A
  1. 样本量,大则窄-
  2. 置信度,高泽宽+
  3. 样本方差,大则宽+
35
Q

因素分析的作用

A

用数目较少的更有意义的潜在构念来解释一组观测变量

解决多重共线性的问题

36
Q

单方差分析的前提

A
  1. 观察独立
  2. 总体正态
  3. 【处理间】方差同质
37
Q

二因素方差分析统计前提

A
  1. 观察独立
  2. 总体正态
  3. 【样本所在总体】同方差
38
Q

相关系数r本身就是【效应大小】的指标对吗

A

📒0.5是大效应,0.7是高相关。效应相关别搞混