4 统计 Flashcards
数据类型
1、根据数据观测方法与来源: 计数、测量 2、根据数据反映的测量水平: 称名数据、顺序数据、等距数据、比率数据 3、根据数据的连续性: 连续数据、离散数据
条形图与直方图的区别
1、描述数据类型不同: 称名;连续
2、表示数据多少的方式不同: 直条长短;面积
3、坐标上的标尺分点意义不同: 分类轴;刻度值
4、图形直观形状不同: 有间隔,间隔大小不表示任何意义;没有间隔
常用的集中量数?
表示、计算、优缺点、应用原则?
算术平均数
中位数
众数
平均数、中数、众数的关系
正态分布中:三者合一 偏态分布中: 平均数永远在尾端,众数永远在顶端,中数永远在中间,偏态永远看尾端 Mo=3Md-2M 正偏态:低、难。 Mo
集中量数最好的代表
一般情况:平均数
偏态:众数
有极端值或模糊数据:中数
差异量数
全距 百分位差 四分位差 离差和平均差 方差与标准差 变异系数(差异系数):表示相对离散程度,不能进行统计推论
标准差的特点
加不变,乘则乘
注:方差*C平方
平均数的特点
加则加
乘则乘
离差之和永为0
集中量数与差异量数的关系
1、集中量数是指…包括… 差异量数是指…包括…
2、二者关系:
差异可衡量集中是否有代表性,差异小,集中代表性好,差异大,集中代表性差。
3、描述一组数据二者都要看,这样才能反映数据的全貌。
相对量数
百分位数
百分等级
标准分数
标准分数的特点(性质)
1、Z分数均值为0,标准差为1
2、Z分数之和为0
3、若原始分数呈正态分布,则转换所得的Z分数呈均值为0,标准差为1的标准正态分布;
若原始分数呈非正态分布,转换所得的Z分数呈均值为0,标准差为1,其分布也为非正态分布。
标准分数的优点
1、可比性:不同性质…转换…同一背景下比较
2、可加性:不同性质…相同参照点
3、明确性:查分布函数表…百分等级
4、稳定性:转换后…标准差为1…不同性质…权重一样
相关量数的概念?
双变量之间的关系?
1、用于描述双变量数据之间的关系
2、因果、共变、相关
相关关系的表示方法和类别
1、散点图、相关系数r
2、线性相关: 正相关、负相关、零相关
非线性相关
相关量数
1、积差相关 2、等级相关:斯皮尔曼: 条件、计算 肯德尔:W(和谐系数)、U(一致性系数) 3、质量相关:点二列:条件、计算 二列:条件、计算 4、品质相关:Φ相关、四分相关、列联相关