II-Descriptive Statistics-5 Flashcards
4种Measurement of scales
- nominal scales
- ordinal scales (大小)
- interval scales (加减,零)
- ratio scales(乘除,零)
总体
样本
总体参数
样本统计量
pupolation
sample
population parameter
sample statistic
Frequency Distribution
频率分布 以图表方式展示统计数据的方法 对所有衡量尺度都适用
Absolute Frequency
Relative Frequency
Cumulative Frequency
Cumulative relative Frequency
- 频率分布中每一区间里 观测值的数量
- AF/total number of observations
- frequencies add up to now
- frequencies add up to now / total number of observations
modal interval
众数区间,有最多观测值的区间
3 kinds of graphic presentation of
Frequency Distribution
- histogram frenquency 直方图
- polygon 折线图
- cumulative frequency distribution
6 means of central tendency
- arithmetic: population and sample
- median
- mode
- weighed
- geometric
- harmonic
arithmetic means的3个特点
- 所有观测值都被用到
- 唯一一个偏差总和为零的度量
- 缺陷:被极大的偏差带跑
mode中位数取值方法
1.观测值排序
2,奇数个,取中间值,偶数个,取n/2 ; (n+2)/2两个值的平均数
harmonic mean
描述平均价格
$1000可以买多少8股票,多少9,多少10? 除以3,得出平均可以买多少股票。再用$1000除以此数,得出平均价格
geometric mean harmonic mean arithmetic mean 三者关系
Weighted mean呢?
harmonic mean小于geometric mean小于arithmetic mean
Weighted mean无法参与比较,因为权重不同结果不同
对于基金经理
衡量过去业绩用哪种mean
预测未来业绩用哪种mean
过去用geometric
未来用arithmetic
四种quantile
分位数
- quartile
- quintile
- decile
- percentile
Quantile:
- equation
- quantile = 7.2含义
- Ly = (n + 1) * ?%
- obervations中第7第8数字中间,距离第7, 20% (linear interpolation线性插值)
计算quantile时应注意什么
Third Quartile代表什么
- 所有观测值升序排列
- third quartile即从上往下75%
measures of
absolute dispersion
及算法
- range:max-min
- mean absolute deviation (MAD):每一观测值与算术平均值之差的绝对值相加求平均
- variance:观测值与平均值的差值平方,总体除N,样本除N-1
- standard deviation:方差开根号
MAD与standard deviation的关系
standard diviation
总是大于等于
MAD
semivariance/semideviation
target semiviarance / target semideviation
算法
- 求平均值
- 找出低于或等于平均值(或目标值)的观测值
- 求方差,除以观测值数量N-1
字母辨析
S
σ
Xbar
μ
- 样本标准差
- 总体标准差
- 样本均值
- 总体均值
Chebyshev’s inequality
definition
- 一组方差为有限值的样本,
- K (>1)个标准差范围内观测值所占的百分比为
1 - 1 / k2
2 measurements of relative dispersion
- coefficient of variation
- Sharpe Ratio
coefficient of variation CV
equation, and
what it means
the amount of risk per unit of return
Sharpe Ratio:
equation, and
what it means
mean excess return per unit risk
使用sharpe ratio时
应注意的问题
- SR有可能是负数,负数时风险(分母)越大,SR值反而越大,因此不可理解为SR越大,投资表现一定更好
- SR基于标准差计算,标准差适于描述对称分布,对于skewed分布描述不准确
skewness: equation
准确版和简易版
标准版:
系数为 1 / (n-1)(n-2)
mode median mean三者关系
- positively skewed
- negatively skewed
- mode < median < mean
- mode > median > mean
kurtosis
几种描述词汇
峰度
keptokurtic尖峰
platykurtic平峰
mesokurtic正常分布
excess kurtosis
equation
简易版
以下公式 - 3 (正态分布峰度)
geometric mean
arithmetic mean
量化关系
geo = arith - (variance of return /2)