圆梦辅导中心 必修三 概率与统计知识点总结
第二章 统计
一、简单随机抽样
1.总体和样本
在统计学中 , 把研究对象的全体叫做总体.
把每个研究对象叫做个体.
把总体中个体的总数叫做总体容量.
为了研究总体的有关性质,一般从总体中随机抽取一部分:, , , 研究,
我们称它为样本.其中个体的个数称为样本容量.
2.简单随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:
(1)抽签法;⑵随机数表法;⑶计算机模拟法
4.抽签法:
(1)给调查对象群体中的每一个对象编号;
(2)准备抽签的工具,实施抽签
(3)对样本中的每一个个体进行测量或调查
5.随机数表法:
例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二、系统抽样
1.系统抽样(也叫等距离抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体)/n(样本个数)
前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布有某种循环性规律,且这种循环和抽样距离重合。
2.系统抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。
三、分层抽样
1.分层抽样:先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:
1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样方法抽取样本。
2.分层抽样是把差异性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体。
分层标准:
(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。
(2)以保证各层内部同质性强、各层之间差异性强、突出总体内在结构的变量作为分层变量。
(3)以那些有明显分层区分的变量作为分层变量。
3.分层的比例问题:
(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。
四、用样本的数字特征估计总体的数字特征
1、样本均值:
2、样本标准差:(标准差是方差的算术平方根)
3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变
(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍,
五、两个变量的线性相关
1、概念:(1)回归直线方程 (2)回归系数
2.回归直线方程的应用
(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系
(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计。
(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。
4.在生活中应用直线回归的注意事项(不要求):
(1)做回归分析要有实际意义;
(2)回归分析前,最好先作出散点图;
(3)回归直线不要外延。
第三章 概 率
一、随机事件的概率及概率的意义
1、基本概念:
(1)必然事件:在一定条件下,必然会发生的事件,叫做必然事件;
(2)不可能事件:在一定条件下,一定不会发生的事件,叫做不可能事件;
(3)确定事件:必然事件和不可能事件统称为确定事件;
(4)随机事件:在一定条件下可能发生也可能不发生的事件,叫做随机事件;
(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数为事件A出现的频数;称事件A出现的比例(A)=为事件A出现的概率。对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率(A)稳定在某个常数上,则把这个常数记作P(A),称为事件A的概率。
(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数与试验总次数n的比值,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率
二、 概率的基本性质
1、基本概念:
(1)事件的包含、并事件、交事件、相等事件;
(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;
(3)若A∩B为不可能事件,且A∪B为必然事件,那么称事件A与事件B互为对立事件;注意:对立事件一定是互斥事件,但互斥事件不一定是对立事件!
(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)
2、概率的基本性质:
1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;
2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);
3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);
4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件是互斥事件的特殊情形。
三、古典概型及随机数的产生
1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。
(2)古典概型的解题步骤;
①求出总的基本事件数;
②求出事件A所包含的基本事件数,然后利用公式P(A)=
四、几何概型及均匀随机数的产生
1、基本概念:
(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;
(2)几何概型的概率公式:
P(A)=;
(3)几何概型的特点:1)试验中所有可能出现的结果(基本事件)有无限多个;
2)每个基本事件出现的可能性相等.
第二篇:中考统计与概率知识点大全
第五章 统计初步与概率初步
考点一、平均数 (3分)
1、平均数的概念
(1)平均数:一般地,如果有n个数那么,叫做这n个数的平均数,读作“x拔”。
(2)加权平均数:如果n个数中,出现次,出现次,…,出现次(这里),那么,根据平均数的定义,这n个数的平均数可以表示为,这样求得的平均数叫做加权平均数,其中叫做权。
2、平均数的计算方法
(1)定义法
当所给数据比较分散时,一般选用定义公式:
(2)加权平均数法:
当所给数据重复出现时,一般选用加权平均数公式:,其中。
(3)新数据法:
当所给数据都在某一常数a的上下波动时,一般选用简化公式:。
其中,常数a通常取接近这组数据平均数的较“整”的数,,,…,。是新数据的平均数(通常把叫做原数据,叫做新数据)。
考点二、统计学中的几个基本概念 (4分)
1、总体
所有考察对象的全体叫做总体。
2、个体
总体中每一个考察对象叫做个体。
3、样本
从总体中所抽取的一部分个体叫做总体的一个样本。
4、样本容量
样本中个体的数目叫做样本容量。
5、样本平均数
样本中所有个体的平均数叫做样本平均数。
6、总体平均数
总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。
考点三、众数、中位数 (3~5分)
1、众数
在一组数据中,出现次数最多的数据叫做这组数据的众数。
2、中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
考点四、方差 (3分)
1、方差的概念
在一组数据中,各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差。通常用“”表示,即
2、方差的计算
(1)基本公式:
(2)简化计算公式(Ⅰ):
也可写成
此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方。
(3)简化计算公式(Ⅱ):
当一组数据中的数据较大时,可以依照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据,,…,,那么,
此公式的记忆方法是:方差等于新数据平方的平均数减去新数据平均数的平方。
(4)新数据法:
原数据的方差与新数据,,…,的方差相等,也就是说,根据方差的基本公式,求得的方差就等于原数据的方差。
3、标准差
方差的算数平方根叫做这组数据的标准差,用“s”表示,即
考点五、频率分布 (6分)
1、频率分布的意义
在许多问题中,只知道平均数和方差还不够,还需要知道样本中数据在各个小范围所占的比例的大小,这就需要研究如何对一组数据进行整理,以便得到它的频率分布。
2、研究频率分布的一般步骤及有关概念
(1)研究样本的频率分布的一般步骤是:
①计算极差(最大值与最小值的差)
②决定组距与组数
③决定分点
④列频率分布表
⑤画频率分布直方图
(2)频率分布的有关概念
①极差:最大值与最小值的差
②频数:落在各个小组内的数据的个数
③频率:每一小组的频数与数据总数(样本容量n)的比值叫做这一小组的频率。
考点六、确定事件和随机事件 (3分)
1、确定事件
必然发生的事件:在一定的条件下重复进行试验时,在每次试验中必然会发生的事件。
不可能发生的事件:有的事件在每次试验中都不会发生,这样的事件叫做不可能的事件。
2、随机事件:
在一定条件下,可能发生也可能不放声的事件,称为随机事件。
考点七、随机事件发生的可能性 (3分)
一般地,随机事件发生的可能性是有大小的,不同的随机事件发生的可能性的大小有可能不同。
对随机事件发生的可能性的大小,我们利用反复试验所获取一定的经验数据可以预测它们发生机会的大小。要评判一些游戏规则对参与游戏者是否公平,就是看它们发生的可能性是否一样。所谓判断事件可能性是否相同,就是要看各事件发生的可能性的大小是否一样,用数据来说明问题。
考点八、概率的意义与表示方法 (5~6分)
1、概率的意义
一般地,在大量重复试验中,如果事件A发生的频率会稳定在某个常数p附近,那么这个常数p就叫做事件A的概率。
2、事件和概率的表示方法
一般地,事件用英文大写字母A,B,C,…,表示事件A的概率p,可记为P(A)=P
考点九、确定事件和随机事件的概率之间的关系 (3分)
1、确定事件概率
(1)当A是必然发生的事件时,P(A)=1
(2)当A是不可能发生的事件时,P(A)=0
2、确定事件和随机事件的概率之间的关系
事件发生的可能性越来越小
0 1概率的值
不可能发生 必然发生
事件发生的可能性越来越大
考点十、古典概型 (3分)
1、古典概型的定义
某个试验若具有:①在一次试验中,可能出现的结构有有限多个;②在一次试验中,各种结果发生的可能性相等。我们把具有这两个特点的试验称为古典概型。
2、古典概型的概率的求法
一般地,如果在一次试验中,有n种可能的结果,并且它们发生的可能性都相等,事件A包含其中的m中结果,那么事件A发生的概率为P(A)=
考点十一、列表法求概率 (10分)
1、列表法
用列出表格的方法来分析和求解某些事件的概率的方法叫做列表法。
2、列表法的应用场合
当一次试验要设计两个因素, 并且可能出现的结果数目较多时,为不重不漏地列出所有可能的结果,通常采用列表法。
考点十二、树状图法求概率 (10分)
1、树状图法
就是通过列树状图列出某事件的所有可能的结果,求出其概率的方法叫做树状图法。
2、运用树状图法求概率的条件
当一次试验要设计三个或更多的因素时,用列表法就不方便了,为了不重不漏地列出所有可能的结果,通常采用树状图法求概率。
考点十三、利用频率估计概率(8分)
1、利用频率估计概率
在同样条件下,做大量的重复试验,利用一个随机事件发生的频率逐渐稳定到某个常数,可以估计这个事件发生的概率。
2、在统计学中,常用较为简单的试验方法代替实际操作中复杂的试验来完成概率估计,这样的试验称为模拟实验。
3、随机数
在随机事件中,需要用大量重复试验产生一串随机的数据来开展统计工作。把这些随机产生的数据称为随机数。