(共48张PPT)
必备知识·逐点夯实
第二节 用样本估计总体
第十章 统计与成对数据的统计分析
核心考点·分类突破
【课标解读】
【课程标准】
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
3.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
4.结合实例,能用样本估计总体的取值规律.
5.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
【核心素养】
数学抽象、数学运算、数据分析.
【命题说明】
考向 考法 高考命题常以频率分布直方图为载体,考查用样本数据估计总体
数字特征;数据的众数、中位数、平均数、方差、百分位数是高
考热点,常以选择题或解答题的形式出现.
预测 预计2025年高考仍会在总体集中趋势、离散程度中出题.百分位
数也会是考查的一个热点.
必备知识·逐点夯实
知识梳理·归纳
1.总体取值规律的估计
(1)常见的统计图表有____________、____________、____________、
____________________等.
(2)作频率分布直方图的步骤
①求__________;
②决定__________与__________;
③将__________分组;
④列频率分布表;
⑤画频率分布直方图.
条形图
扇形图
折线图
频率分布直方图
极差
组距
组数
数据
2.第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有
_________的数据小于或等于这个值,且至少有(100-p)%的数据________________
这个值.
微点拨 第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到
大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一
四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
p%
大于或等于
3.总体集中趋势的估计
(1)平均数、中位数和众数的应用
数值型数据(如用水量、身高、收入、产量等)集中趋势多用____________、
____________描述;分类型数据(如校服规格、性别、产品质量等级等)集中趋势
多用__________描述.
平均数
中位数
众数
(2)平均数、中位数、众数的求法
数字特征 样本数据 频率分布直方图
众数 出现次数______的数据 取最高的小长方形底边______
的横坐标
中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间 两个数据的________) 划分频率分布直方图为左右
两个面积______的分界线与x
轴交点的横坐标
平均数 样本数据的算术平均数 每个小矩形的______乘以小矩
形底边______的横坐标之和
最多
中点
平均数
相等
面积
中点
4.总体离散程度的估计
(1)方差、标准差的定义:假设一组数据为x1,x2,…,xn,其平均数为,则方差:s2=(xi-)2或-;标准差:s=.
(2)总体(样本)方差
①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=(Yi-)2.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
微思考 方差、标准差的大小,说明样本数据有怎样的离散关系
提示:样本方差、标准差越大,说明样本数据越分散,否则说明越集中.
×
×
基础诊断·自测
类型 辨析 改编 易错
题号 1 2,3 4
1.(思考辨析)(正确的打“√”,错误的打“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( )
提示:(1)一组数据如果出现极端值,其平均数与中位数不会接近,例如:1 000,0,0,0,0,
所以(1)错误;
(2)方差与标准差具有相同的单位.( )
提示: (2)因为标准差是方差的算术根,其单位不一样,所以(2)错误;
√
√
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.
( )
提示: (3)因为一组数中每个数减去同一个非零常数,则这组数的平均数改变,每个
数与平均数的差值不变,所以方差不变,所以(3)正确;
(4)在频率分布直方图中,最高的小矩形底边中点的横坐标是众数.( )
提示: (4)因为在频率分布直方图中,最高的小矩形底边中点的横坐标为众数,所以
(4)正确.
2.(必修第二册P215练习T2)若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为( )
A.2 B.4 C.6 D.8
【解析】选D.根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.
3.(必修第二册P203例2)某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为( )
A.88.5 B.89 C.91 D.89.5
【解析】选B.7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.
4.(统计图识别错误)某中学初中部共有120名教师,高中部共有150名教师,其性别
比例如图所示,则该校女教师的人数为 .
【解析】因为初中部女教师占70%,高中部女教师占40%,所以该校女教师的人数
为120×0.7+150×0.4=84+60=144.
144
核心考点·分类突破
考点一统计图表的识别
[例1](多选题)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2021年1月至2023年12月月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论正确的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【解析】选BCD.对于选项A,由题图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察题中折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,观察题中折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;对于D选项,观察题中折线图,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.
解题技法
统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例;
(2)折线图:描述数据随时间的变化趋势;
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
对点训练
1.已知某地区中小学生的人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本量和该地区的高中生近视人数分别为( )
A.200,25 B.200,2 500
C.8 000,25 D.8 000,2 500
【解析】选B.由扇形分布图并结合比例分配的分层随机抽样知识易知样本量为=200,则样本中高中生的人数为200×25%=50,易知该地区高中生人数为=
5 000,结合近视率条形图得该地区高中生近视的人数为5 000×50%=2 500.
2.走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11 600
B.这一星期内甲的日步数的均值大于乙
C.这一星期内甲的日步数的方差大于乙
D.这一星期内乙的日步数的30%分位数是7 030
【解析】选D.对于A,这一星期内甲的日步数从小到大为2 435,7 965,9 500,
11 600,12 700,16 000,16 800,所以中位数为11 600,选项A正确;
对于B,计算甲的平均数为=×(2 435+7 965+9 500+11 600+12 700+16 000+
16 800)=11 000,
乙的平均数为=×(14 200+12 300+7 030+12 970+5 340+11 600+10 060)=
10 500,所以甲的日步数的均值大于乙,选项B正确;
对于C,甲有极端值,对方差的影响大,所以甲的日步数的方差大于乙,选项C正确;
对于D,因为7×30%=2.1,所以乙的日步数的30%分位数是从小到大的第3个数,为10 060,选项D错误.
【补偿训练】
(2023·丽水模拟)某校高一年级1 000名学生的血型统计情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用比例分配的分层随机抽样的方法从中抽取一个容量为100的样本,则从高一年级A型血的学生中应抽取的人数是( )
A.11 B.22 C.110 D.220
【解析】选B.由题图中数据可知高一年级A型血的学生人数占高一年级学生总人数的22%,所以抽取一个容量为100的样本,从A型血的学生中应抽取的人数是100×22%=22.
考点二离散型数据的数字特征
[例2](多选题)(2024·苏州模拟)给定数6,4,3,6,3,8,8,3,1,8,则这组数据的( )
A.中位数为5 B.方差为
C.平均数为5 D.85%分位数为8
【解析】选ACD.将数6,4,3,6,3,8,8,3,1,8按从小到大的顺序排列为1,3,3,3,4,6,6,8,
8,8,则这组数据的中位数为=5,故A正确;
平均数为=5,故C正确;
则方差为[++×3+×3+×2]=5.8,故B错误;
因为10×85%=8.5,所以85%分位数是从小到大第9个数字为8,故D正确.
解题技法
样本数字特征的求法
(1)众数是样本数据中出现次数最多的数据.
(2)将样本数据按大小顺序排列,处在最中间位置的一个数据(或最中间两个数据的均值)即为中位数.
(3)平均数是样本数据的算术平均数.
(4)极差是样本数据中最大值与最小值的差.
对点训练
1.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为( )
A.92,85 B.92,88 C.95,88 D.96,85
【解析】选B.数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,10×25%=2.5,取第三个数,所以第25百分位数是88.
2.(多选题)下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:
396 275 268 225 168 166 176 173 188 168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是( )
A.极差 B.中位数
C.众数 D.平均数
【解析】选ABD.根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,发生改变;加入数据前,中位数为×(173+176)=174.5,加入数据后,中位数为176,发生改变;
众数为数据中出现次数最多的数,不会改变;
若加入数据前,平均数为,加入数据后,平均数为>,发生改变.
【补偿训练】
某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,
99,101,103,116,130,则这8名学生数学成绩的第75百分位数为( )
A.102 B.103 C.109.5 D.116
【解析】选C.这组数据已经按照由小到大的顺序排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为=109.5.
考点三频率分布直方图的数字特征
[例3](多选题)在某次单元测试中,4 000名考生的考试成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )
A.成绩在[70,80)分的考生人数最多
B.考生考试成绩的第80百分位数为83.3
C.考生考试成绩的平均分约为70.5分
D.考生考试成绩的中位数为75分
【解析】选ABC.根据题图得,成绩出现在[70,80)的频率最大,故A正确;
考生考试成绩的第80百分位数为80+×10≈83.3,故B正确;
根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+
85×0.15+95×0.1=70.5,故C正确;
0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生考试成绩的中位数
为70+×10≈71.67,故D错误.
解题技法
频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
(4)第p百分位数: ①确定第p百分位数所在的区间[a,b],②确定小于a和小于b的数据所占的百分比fa%,fb%,则第p百分位数为a+×(b-a).
对点训练
(2024·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生考试成绩的众数为80
D.估计总体中成绩落在内的学生人数为150
【解析】选D.由10×=1可得a=0.005,故A错误;
前三个矩形的面积和为10×=0.6,所以这20名学生考试成绩的第60百分位数为80,故B错误;
这20名学生考试成绩的众数为75,故C错误;
总体中成绩落在内的学生人数为3a×10×1 000=150,故D正确.
【补偿训练】
某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:
(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;
【解析】(1)设分数在[70,80)内的频率为x,
根据频率分布直方图,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,所以分数在[70,80)内的频率为0.25,
补全这个频率分布直方图,如图所示.
某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:
(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分.
【解析】(2)因为分数在区间[80,90)内的频率为0.25,在区间[90,100]内的频率为0.05,而0.05<10%<0.25+0.05,所以设排名前10%的分界点为90-a,则0.025a+0.005
×10=10%,
解得a=2,所以排名前10%的分界点为88分,即获奖的学生至少需要88分.
考点四总体离散趋势的估计
[例4](2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如表:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
【解析】(1)由题表中的数据可得,
=×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.0,
=×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,
=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×
(10.2-10.0)2+(10.3-10.0)2]=0.036,
=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+
(10.6-10.3)2]=0.04.
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【解析】(2)由(1)中数据得-=0.3,2=2,
显然->2 ,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
解题技法
计算方差、标准差的步骤
(1)求出样本数据的平均数;
(2)计算每个样本数据与样本平均数的差xi-(i=1,2,…,n),并求对应的平方值;
(3)求出上述n个平方值的平均数,即为样本方差;求出上述n个平方值平均数的算术平方根,即为样本标准差.
对点训练
1.(2023·成都模拟)一次数学考试后,某班级平均分为110分,方差为.现发现有两名同学的成绩计算有误,甲同学成绩被误判为113分,实际得分为118分;乙同学成绩误判为120分,实际得分为115分.更正后重新计算,得到方差为,则与的大小关系为( )
A.= B.> C.< D.不能确定
【解析】选B.设班级人数为n,因为113+120=118+115,所以更正前后平均分不变,且(113-110)2+(120-110)2>(118-110)2+(115-110)2,所以>.
2.(多选题)(2021·新高考Ⅱ卷)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有( )
A. x1,x2,…,xn的标准差
B. x1,x2,…,xn的中位数
C. x1,x2,…,xn的极差
D. x1,x2,…,xn的平均数
【解析】选AC.由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数无法度量数据的离散程度;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数无法度量数据的离散程度.
【补偿训练】
1.(2023·天津模拟)已知一组样本数据x1,x2,…,xn(x1
C.极差 D.方差
【解析】选A.对于A项,新数据的总数为++…+=x1+x2+…+xn,
与原数据总数一样,且数据数量不变,都是n,故平均数不变,故A正确;
对于B项,不妨设原数据为1,2.5,3,中位数为2.5,则新数据为1.75,2.75,2,中位数为2,显然中位数变了,故B错误;
对于C项,原数据极差为xn-x1,新数据极差为-,因为--(xn-x1)=<0,极差变小了,故C错误;
对于D项,由于两组数据的平均数不变,而极差变小,说明新数据相对原数据更集中于平均数,故方差变小,即D错误.
2.某学校有男生400人,女生600人.为了调查该校全体学生每天睡眠时间,采用分
层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生
每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方
差为 .
【解析】由题意,总体的均值为×7.5+×7=7.2,根据分层抽样的性质,则总
体的方差为×[1+(7.5-7.2)2]+×[0.5+(7-7.2)2]=0.436+0.324=0.76.
0.76
谢谢观赏!!用样本估计总体
一、单项选择题
1.下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:
396 275 268 225 168 166 176 173 188
168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征没有改变的是( )
A.极差 B.中位数
C.众数 D.平均数
2.某工厂随机抽取20名工人,对他们某天生产的产品件数进行统计,数据如表,则该组数据的第75百分位数是( )
件数 7 8 9 10 11
人数 3 7 5 4 1
A.8.5 B.9
C.9.5 D.10
3.一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的,则该组数据的第60百分位数是( )
A.7.5 B.8
C.9 D.9.5
4.)为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计错误的是( )
A.众数为82.5
B.中位数为85
C.平均数为86
D.有一半以上干部的成绩在80~90分
5.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图:
则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
6.若一组样本数据x1,x2,…,xn的平均数为10,另一组样本数据2x1+4,2x2+4,…,2xn+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为( )
A.17,54 B.17,48
C.15,54 D.15,48
二、多项选择题
7.有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
8.病毒研究所检测甲、乙两组实验小白鼠的某医学指标值,得到样本数据的频率分布直方图(如图所示),则下列结论正确的是( )
A.甲组数据中位数大于乙组数据中位数
B.甲组数据平均数小于乙组数据平均数
C.甲组数据平均数大于甲组数据中位数
D.乙组数据平均数小于乙组数据中位数
三、填空题
9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙只有1人能入选,则入选的最佳人选应是 ________.
10.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).
四、解答题
11.某地旅游主管部门为了更好地为游客服务,在景区随机发放评分调查问卷100份,并将问卷评分数据分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],绘制如图所示频率分布直方图.
(1)已知样本中分数在[80,85)的游客为15人,求样本中分数小于80的人数,并估计第75百分位数;
(2)已知样本中男游客与女游客比例为3∶2,男游客样本的平均值为90,方差为10,女游客样本的平均值为85,方差为12,由样本估计总体,求总体的方差.
12.某滨海城市沙滩风景秀丽,夏日美丽的海景和清凉的海水吸引了不少前来游玩的旅客.某饮品店通过公开竞标的方式获得卖现制饮品的业务,为此先根据前一年沙滩开放的160天的进入沙滩的人数,做前期的市场调查来模拟饮品店开卖之后的利润情况,考虑沙滩承受能力有限,超过1.4万人即停止预约.以下表格是160天内进入沙滩的每日人数(单位:万人)的频数分布表.
人数/万 [0,0.2) [0.2,0.4) [0.4,0.6) [0.6,0.8) [0.8,1.0) [1.0,1.2) [1.2,1.4]
频数/天 8 8 16 24 a 48 32
(1)绘制160天内进入沙滩的每日人数的频率分布直方图(用阴影表示),并求出a的值和这组数据的65%分位数;
(2)据统计,每10个进入沙滩的游客当中平均有1人会购买饮品,X(单位:个)为进入该沙滩的人数(X为10的整倍数.如有8 006人,则X取8 000).每杯饮品的售价为15元,成本为5元,当日未出售饮品当垃圾处理.若该店每日准备1 000杯饮品,记Y为该店每日的利润(单位:元),求Y和X的函数关系式;
(3)以频率估计概率,求该店在160天的沙滩开放日中利润不低于7 000元的概率.
13.某型合金钢生产企业为了合金钢的碳含量百分比在规定的范围值内,检验员在同一试验条件下,每天随机抽样10次,并测量其碳含量(单位:%).已知其产品的碳含量服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内10次抽样中其碳含量百分比在(μ-3σ,μ+3σ)之外的次数,求P(X≥1)及X的数学期望;
(2)一天内的抽检中,如果出现了至少1次检测的碳含量在(μ-3σ,μ+3σ)之外,就认为这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.下面是在一天中,检测员进行10次碳含量(单位:%)检测得到的测量结果:
次数 1 2 3 4 5 6 7 8 9 10
碳含量(%) 0.31 0.32 0.34 0.31 0.30 0.31 0.32 0.31 0.33 0.32
经计算得,==0.317,s==0.011,其中xi为抽取的第 i次的碳含量百分比(i=1,2,…,10).
①用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?
②若去掉x1,剩下的数的平均数和标准差分别记为μ1,σ1,试写出σ1的算式(用,s,x1,μ1表示σ1).
附:若随机变量Z服从正态分布N(μ,σ2),则
P(μ-3σ≤Z≤μ+3σ)≈0.997 3,0.997 310≈0.973 3.
参考答案
1.C [根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,会发生改变,加入数据前,中位数为=174.5,加入数据后,中位数为176,发生改变,众数为数据中出现次数最多的数,不会改变,平均数体现数据的整体水平,会发生改变.故选C.]
2.C [抽取的工人总数为20,20×75%=15,那么第75百分位数是所有数据从小到大排序的第15项与第16项数据的平均数,第15项与第16项数据分别为9,10,所以第75百分位数是=9.5.
故选C.]
3.C [这组数据一共8个数,中位数是,极差为13-1=12,所以=12×,解得m=9,又8×60%=4.8,则第60百分位数是第5个数据9.故选C.]
4.C [由频率分布直方图知,众数为82.5,A正确;
由(0.01+0.03+0.06)×5=0.5,即中位数为85,B正确;
由(0.01×72.5+0.03×77.5+0.06×82.5+0.05×87.5+0.03×92.5+0.02×97.5)×5=85.5,C错误;
由(0.06+0.05)×5=0.55>0.5,则有一半以上干部的成绩在80~90分之间,D正确.
故选C.]
5.B [讲座前中位数为>70%,A错误;
讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,B正确;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,C错误;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,D错误.
故选B.]
6.A [由题意可知,数据x1,x2,…,xn的平均数为10,则=10n,所以数据2x1+4,2x2+4,…,2xn+4的平均数为
×102==102n,将两组数据合并后,新数据x1,x2,…,xn,2x1+4,2x2+4,…,2xn+4的平均数为
=(5×102n-860n+458n)=54.故选A.]
7.BD [取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.综上,故选BD.]
8.BCD [根据甲组的样本数据的频率分布直方图可知,甲组的平均数大于中位数,且都小于7,
同理可得乙组的平均数小于中位数,且都大于7,
故甲组数据中位数小于乙组数据中位数,A错误;
甲组数据平均数小于乙组数据平均数,B正确;
甲组数据平均数大于甲组数据中位数,C正确;
乙组数据平均数小于乙组数据中位数,D正确.
故选BCD.]
9.甲 [甲的平均数为=(10+8+9+9+9)=9,
乙的平均数为=(10+10+7+9+9)=9,
甲的方差为=[(10-9)2+(8-9)2]=,
乙的方差为=[(10-9)2×2+(7-9)2]=,
∵=,∴甲、乙的平均水平相同,
,∴甲的成绩稳定,故甲入选.]
10.7或8或9或10(填上述4个数中任意一个均可) [7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为:6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.]
11.解:(1)由频率分布直方图,可得分数在[85,100]内的频率为(0.06+0.05+0.04)×5=0.75,
所以分数在[85,100]内的人数为100×0.75=75,
所以分数小于80分的人数为100-75-15=10,
由题意可设第75百分位数为x,其中x∈[90,95),则1-(0.05×5+0.04×5)+(x-90)×0.05=0.75,解得x=94,
故样本中分数小于80的人数为10人,第75百分位数约为94.
(2)由已知可得总样本平均值为==×90+×85=88,
又由s2=+()2]
=[10+(88-90)2]+[12+(88-85)2]==,
所以用样本估计总体,总体的方差为.
12.解:(1)由题意,8+8+16+24+a+48+32=160,解得a=24.
因为=0.5,=0.8,
所以65%分位数在区间[1.0,1.2)上,
则65%分位数为1.0+0.2×=1.1.
画出频率分布直方图如图所示.
(2)由题意知,当X≥10 000时,Y=10×1 000=10 000元,
当X<10 000时,Y=×10-×5=1.5X-5 000,
所以Y=
(3)记销售的利润不少于7 000元的事件为A,则人数X≥8 000,
此时P(A)==0.65.
13.解:(1)由已知得,抽取一次碳含量在(μ-3σ,μ+3σ)之内的概率为0.997 3,
所以P(X≥1)=1-P(X=0)≈1-0.997 310≈1-0.973 3=0.026 7.
又碳含量在(μ-3σ,μ+3σ)之外的概率为0.002 7,
故X~B(10,0.002 7),
因此E(X)=0.027.
(2)①由=0.317,s=0.011,得μ,σ的估计值为=0.317,=0.011,
所以(-3,+3)=(0.284,0.350),
由所测数据可以看出10次抽检的碳含量均在(-3,+3)之内,
因此不需要对当天的生产过程进行检查.
=
=
=.
又注意到-x1+2μ1=-(9μ1+x1)+x1+2μ1=0,