统计挖坑题 Flashcards
职称 爱好,属于什么数据
等级/顺序数据!
三步判断数据类型:1.绝对零点 2.相等单位 3.是否有比较意义
变异系数一般什么时候用
同一组的不同特质
统一特质但样本间水平差距大(3与6年纪数学)
❗️不可用于推论统计
❗️只能用于等比数据(其实平均数不为零的等距也可以用)(标准差可以用等距)
样本的变异小/大于总体的变异?
小于总体变异性,所以通常除n-1以更好地无偏
切比雪夫定律
至少有1-1/h^2个数落在平均数h个标准差之内
平均差(离差的绝对值)一颗说明分布中全部数值的差异情况吗
可以
离差可以用来描述离中趋势吗
不行,要因为正负抵消
相关系数的注意事项
- 受样本量影响
- 不是等距数据
- 相关可能是线性的或非线性的
皮尔逊积差相关适用范围
- 总体正态
- 连续性数据
- 满足线性关系
- 成对出现,不小于30对
📒既然是【连续】即等距等比均可
斯皮尔曼等级相关和肯德尔系数的区别
斯皮尔曼只能处理两列变量
肯德尔W和U的区别
- U(一致性系数)要用对偶比较法
2. W一定是正数,U只可能是三个数 可能为负
肯德尔U的正负表示一致的方向吗
不表示
点二列相关适用范围
- 一列真二分,一列连续变量
2. 总体正态(与二列相关的主要区别)
点二列和二列的共同点
- 都有一列是连续变量
2. 都是质与量相关
哪种品质相关要求两个二分变量都是人为二分
四分相关
📌phi相关两个都是真二分
相关系数是等距的测量值吗
不
卡方分布的应用
- 比较样本与总体方差的差距
2. 计数数据的假设检验
F分布的应用
- 总体的方差齐性检验
2. 多组间均值差异检验
统计概率又称?
经验概率或后验概率,取决于被观测物实际出现的概率
古典概率又称?
先验概率
中心极限定律和大数定律
中心极限是样本均值呈正态分布
大数定律是样本均值趋近总体均值/样本容量越大,越能代表总体
和方可以作为分布差异的指标吗
不可以,因为受样本量影响
(和方可表示离中趋势)
三种集中数量和差异数量分别是
集中:均值、中数、众数
差异:全距、标准差、四分位【距】
📒四分位距=third四分位数-first四分位数
样本均值分布包含所有样本吗
✅
统计量的分布可以代表样本的分布吗
✅
总体范围确定的情况下,慎重决定样本容量对取样误差没有影响,对吗
❌
样本容量大,标准误小(【样本均值】分布的标准差)
同样要使样本分布在总体的顶端10%,n=16的样本和n=26的样本所需均值一样吗
不一样,小样本所需均值更大
【显著性水平a】为0.05表示所观测到的差异有5%的可能性由【随机误差】导致,对吗
✅
犯I类错误的原因
样本中包含极端数据、决策标准过于宽松
II类错误的原因
处理效应小、数据不够灵敏、样本数据变异过大
二项分布近似做正态分布时要注意什么
n取精确上下限
样本百分比率的取样服从什么分布
二项分布(要么是,要么不是/要么男要么女)
📒如果是三类的百分比(赞同/反对/中立)采用卡方匹配度检验
卡方匹配的假设:观察独立、每个单位格期望次数不小于5
t检验和z检验谁更敏感
z
良好估计量的标准
无偏:样本【容量不变】,组数无限增加,【样本分布】【均值】趋于总体均值
有效:某无偏估计量的抽样分布方差小于另一个无偏估计量,则较另一个更有效
一致:样本【容量增加】,【估计量】趋于总体均值
充分:容量为n的样本充分反映了总体的信息
影响置信区间宽度的因素
- 样本量,大则窄-
- 置信度,高泽宽+
- 样本方差,大则宽+
因素分析的作用
用数目较少的更有意义的潜在构念来解释一组观测变量
解决多重共线性的问题
单方差分析的前提
- 观察独立
- 总体正态
- 【处理间】方差同质
二因素方差分析统计前提
- 观察独立
- 总体正态
- 【样本所在总体】同方差
相关系数r本身就是【效应大小】的指标对吗
✅
📒0.5是大效应,0.7是高相关。效应相关别搞混