数据分析 data analysis Flashcards
variable [‘veərɪəb(ə)l]
变量
count
数目 就是 frequency
relative frequency
相对频率 一般指相对整体 就是一般意义上的频率 用分数或者百分数 小数表示
bar graph; bar chart
柱状图
circle graph; pie chart
饼状图
sector
饼状图里的每一小部分
histogram
直方图
scatter plot
散点图
time plot
时间曲线图
arithmetic mean
平均数
median
中数
mode
众数
weighed mean
加权平均数
measure of position
位置的度量
quartiles
四分位数 Q2=中数 Q1=较小的一组的中数 Q3=较大的一组的中数
percentiles
百分位数
measures of dispersion
离散型的度量
range
值域:最大值减最小值
interquartile range
四分位差Q3减去Q1
boxplot 或者 box and whisker plot
箱线图 上面有五个书:最小值 Q1 Q2 Q3 最大值
standard deviation=population standard deviation
总体标准差 就是那种正常的算法
sample standard deviation
样本标准差 当数值为随机抽取样本时 底下为n-1
standardization
标准化 就是用变量减去算数平均值再除以标准差:可以算出 how many standard deviations above or below the mean.
empty set
空集 空集是所有集合的子集