高考统计知识点总结
第二章:统计 1、抽样方法:
①简单随机抽样(总体个数较少)
②系统抽样(总体个数较多)
③分层抽样(总体中差异明显)
注意:在 N 个个体的总体中抽取出 n 个个体组成样本,每个个体被抽到的机会(概率)均为Nn。
2、总体分布的估计:
⑴一表二图:
①频率分布表——数据详实
②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势
注:总体分布的密度曲线与横轴围成的面积为 1。
⑵茎叶图:
①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。
3、总体特征数的估计:
⑴平均数:nx x x xxn 3 2 1; 取值为nx x x , , ,2 1 的频率分别为np p p , , ,2 1 ,则其平均数为n n px p x p x 2 2 1 1;
注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据nx x x , , ,2 1 方差:212) (1 niix xns ;标准差:21) (1 niix xns
注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系;
②制作散点图,判断线性相关关系 ③线性回归方程:
a bx y (最小二乘法)
1221ni iiniix y nxybx nxa y bx 注意:线性回归直线经过定点 ) , ( y x 。
第三章:概率 1、随机事件及其概率:
⑴事件:试验的每一种可能的结果,用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件 A 的概率:
1 ) ( 0 , ) ( A PnmA P . 2、古典概型:
⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点:
①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
⑶古典概型概率计算公式:一次试验的等可能基本事件共有 n 个,事件 A 包含了其中的 m 个基本事件,则事件 A 发生的概率nmA P ) ( . 3、几何概型:⑴几何概型的特点:①所有的基本事件是无限个;②每个基本事件都是等可能发生。
⑵几何概型概率计算公式:的测度的测度DdA P ) ( ; 其中测度根据题目确定,一般为线段、角度、面积、体积等。
4、互斥事件:
⑴不可能同时发生的两个事件称为互斥事件; ⑵如果事件nA A A , , ,2 1 任意两个都是互斥事件,则称事件nA A A , , ,2 1 彼此互斥。
⑶如果事件 A,B 互斥,那么事件 A+B 发生的概率,等于事件 A,B 发生的概率的和, 即:
) ( ) ( ) ( B P A P B A P
⑷如果事件nA A A , , ,2 1 彼此互斥,则有:
) ( ) ( ) ( ) (2 1 2 1 n nA P A P A P A A A P
⑸对立事件:两个互斥事件中必有一个要发生,则称这两个事件为对立事件。
①事件 A 的对立事件记作 A
) ( 1 ) ( , 1 ) ( ) ( A P A P A P A P
②对立事件一定是互斥事件,互斥事件未必是对立事件。
1、基本概念 ⑴互斥事件:不可能同时发生的两个事件. 如果事件 A B C 、 、 ,其中任何两个都是互斥事件,则说事件 A B C 、 、 彼此互斥. 当 A B 、 是互斥事件时,那么事件 A B 发生(即 A B 、 中有一个发生)的概率,等于事件 A B 、 分别发生的概率的和,即
( ) ( ) ( ) P A B P A P B . ⑵对立事件:其中必有一个发生的两个互斥事件.事件 A 的对立事件通常记着 A .对立事件的概率和等于1. ( ) 1 ( ) P A P A .
特别提醒:“互斥事件”与“对立事件”都是就两个事件而言的,互斥事件是不可能同时发生的两个事件,而对立事件是其中必有一个发生的互斥事件,因此, 对立事 件必然是互斥事件,但互斥事件不一定是对立事件,也就是说“互斥”是“对立”的必要但不充分的条件. ⑶相互独立事件:事件 A (或 B )是否发生对事件 B (或 A )发生的概率没有影响,( 即其中一个事件是否发生对另一个事件发生的概率没有影响).这样的两个事件叫做相互独立事件. 当 A B 、 是相互独立事件时,那么事件 A B 发生(即 A B 、 同时发生)的概率,等于事件 A B 、 分别发生的概率的积.即
( ) ( ) ( ) P A B P A P B .
若 A、B 两事件相互独立,则 A 与 B 、 A 与 B、 A 与 B 也都是相互独立的. ⑷独立重复试验
①一般地,在相同条件下重复做的 n 次试验称为 n 次独立重复试验.②独立重复试验的概率公式 如果在 1 次试验中某事件发生的概率是 p ,那么在 n 次独立重复试验中这个试验恰好发生 k 次的概率
( ) ( 1 ) 0 , 1 2 , . ,k k n kn nP k n k C p p
⑸ 条件概率:
:对任意事件 A 和事件 B,在已知事件 A 发生的条件下事件 B 发生的概率,叫做条件概率.记作 P(B|A),读作 A 发生的条件下 B 发生的概率.公式:( )( ) , ( ) 0.( )P ABP B A P AP A
2 2 、离散型随机变量
⑴随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量奎屯王新敞新疆
随机变量常用字母 , , , X Y 等表示.
⑵离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ⑶连续型随机变量: 对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量. ⑷离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出. 若 X 是随机变量, ( , Y aX b a b 是常数)则 Y 也是随机变量奎屯王新敞新疆
并且不改变其属性(离散型、连续型). 3 3、 、离散型随机变量的分布列 ⑴概率分布(分布列)
设离散型随机变量 X 可能取的不同值为1 2, x x ,…,ix ,…,nx , X 的每一个值ix ( 1,2, , i n )的概率 ( )i iP X x p ,则称表 X 1x 2x … ix … nx P
1p 2p … ip … np 为随机变量 X 的概率分布,简称 X 的分布列. 性质:① 0, 1,2,... ;ip i n
②11.niip ⑵两点分布
如果随机变量 X 的分布列为
则称 X 服从 两点分布,并称 ( 1) p P X 为成功概率. ⑶二项分布 如果在一次试验中某事件发生的概率是 p,那么在 n 次独立重复试验中这个事件恰好发生 k 次的概率是 ( ) (1 ) .k k n knP X k C p p
其中 0,1,2,..., , 1 k n q p ,于是得到随机变量 X 的概率分布如下:
X
0 1 … k … n P
0 0 nnC p q
1 1 1 nnC p q … k k n knC p q … 0 n nnC p q
我们称这样的随机变量 X 服从 二项分布,记作 p n B X , ~ ,并称 p 为成功概率. 判断一个随机变量是否服从二项分布,关键有三点:
①对立性:即一次试验中事件发生与否二者必居其一; ②重复性:即试验是独立重复地进行了 n 次; ③等概率性:在每次试验中事件发生的概率均相等. 注:⑴ 二项分布的模型是有放回抽样;⑵二项分布中的参数是 , , . p k n
⑷超几何分布
一般地, 在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品数,则事件 X k 发生的概率为 ( ) ( 0,1,2, , )k n kM N MnNC CP X k k mC ,于是得到随机变量 X 的概率分布如下:
X
0 1 P
1 p
p
其中 min , m M n ,*, , , , n N M N n M N N ≤ ≤ . 我们称这样的随机变量 X 的分布列为超几何分布列,且称随机变量 X 服从 超几何分布. . 注:⑴ 超几何分布的模型是不放回抽样;
⑵ 超几何分布中的参数是 , , . M N n 其意义分别是
总体中的个体总数、N 中一类的总数、样本容量. 4 4 、离散型随机变量的均值与方差 ⑴离散型随机变量的均值
一般地,若离散型随机变量 X 的分布列为 X 1x 2x … ix … nx P
1p 2p … ip … np 则称 1 1 2 2 i i n nE X x p x p x p x p 为离散型随机变量 X 的 均值或数学期望(简称期望).它 它反映了离散型随机变量取值的 平均水平.
性质:① ( ) ( ) . E aX b aE X b
②若 X 服从两点分布,则 ( ) . E X p
③若 p n B X , ~ ,则 ( ) . E X np
⑵离散型随机变量的方差 一般地,若离散型随机变量 X 的分布列为 X 1x 2x … ix … nx P
1p 2p … ip … np 则称 21( ) ( ( ))ni iiD X x E X p 为离散型随机变量 X 的 方差,并称其算术平方根 ( ) D X 为随机变量 X 的 标准差. 它反映了离散型随机变量取值的 稳定与波动,集中与离散 的程度.
( ) D X 越小, X 的稳定性越高,波动越小,取值越集中; ( ) D X 越大, X 的稳定性越差,波动越大,取值越分散 . 性质:①2( ) ( ). D aX b a D X
②若 X 服从两点分布,则 ( ) (1 ). D X p P
③若 p n B X , ~ ,则 ( ) (1 ). D X np P
5 5、 、正态分布 正态变量概率密度曲线函数表达式:
R x e x fx,21222 ,其中 , 是参数,且X
0 1 … m
P
0 0 nM N MnNC CC 1 1 nM N MnNC CC
… m n mM N MnNC CC
, 0 .记作2( , ). N 如下图:
专题八:统计案例
1、回归分析 回归直线方程 bx a y ˆ , 其中 1 122 21 1n ni i i ii in ni ii ix x y y x y nx ybx x x nxa y bx 相关系数: 12 21 1ni iin ni ii ix x y yrx x y y 12 2 2 21 1ni iin ni ii ix y nxyx nx y ny 2、独立性检验 假设有两个分类变量 X 和 Y,它们的值域分另为{x 1 , x 2 }和{y 1 , y 2 },其样本频数 2 2 列联表为:
y 1
y 2
总计 x 1
a b a+b x 2
c d c+d 总计 a+c b+d a+b+c+d
若要推断的论述为 H 1 :“X 与 Y 有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度. 具体的做法是,由表中的数据算出随机变量2K 的值22( )( )( )( )( )n ad bcKa b c d a c b d ,其中n a b c d 为样本容量,K2 的值越大,说明“X 与 Y 有关系”成立的可能性越大. 随机变量2K 越大,说明两个分类变量,关系越强;反之,越弱。
23.841 K 时,X X 与 与 Y Y 无关;23.841 K 时,X X 与 与 Y Y 有 有 95% 可能性有关;26.635 K 时 时 X X 与 与 Y Y 有 有 99%可能性有关. .
上一篇:城市滨水空间生态规划探析
下一篇:科技成果评价委托书、评价报告范文