2023版新教材高中数学第八章 成对数据的统计分析 (4份打包)(含解析)

同步练习18 成对数据的统计相关性
必备知识基础练 
一、单项选择题(每小题5分,共40分)
1.[2023·重庆高二期末]下列两个变量中,成正相关的两个变量是(  )
A.汽车自身的重量与行驶每公里的耗油量
B.每个人体育锻炼的时间与身体的重量
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
2.下列关于散点图的说法中,正确的是(  )
A.任意给定统计数据,都可以绘制散点图
B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系
D.从散点图中无法看出数据的分布情况
3.[2023·河北保定高二期中]在下列各图中的两个变量具有线性相关关系的图是(  )
A.①②  B.①③  C.②③  D.②④
4.[2023·福建泉州高二期中]甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r,如下表
相关系数 甲 乙 丙 丁
r -0.92 0.78 -0.69 0.887
则哪位同学的试验结果体现两变量有更强的线性相关性?(  )
A.甲B.乙
C.丙D.丁
5.[2023·山东菏泽高二期末]对四组数据进行统计,获得如下散点图,将四组数据相应的相关系数进行比较,正确的是(  )
A.r2C.r46.[2023·广东汕尾高二期中]有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题”.按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系,现抽取某次考试中一个班级(共50名学生)的数学成绩与物理成绩绘制成散点图.根据下图,以下结论中正确的是(  )
A.数学成绩好,物理成绩也好
B.数学成绩好,但物理成绩差
C.物理成绩好,但数学成绩差
D.物理成绩差,但数学成绩好
7.[2023·河北承德高二期末]关于样本相关系数r,下列结论正确的是(  )
A.r越接近0,成对样本数据的线性相关程度越强
B.r值越大,成对样本数据的线性相关程度越强
C.r>0,成对样本数据正相关
D.r<0,成对样本数据不相关
8.在一次试验中,测得(x,y)的五组数据分别为(1,3),(2,4),(4,5),(5,13),(10,12),去掉一组数据(5,13)后,下列说法正确的是(  )
A.样本数据由正相关变成负相关
B.样本的相关系数不变
C.样本的相关性变弱
D.样本的相关系数变大
二、多项选择题(每小题5分,共10分)
9.[2023·河南南阳高二期中]对于样本相关系数r,下列说法正确的是(  )
A.若两个随机变量线性不相关,则r=0
B.若r=0,则两个随机变量没有任何相关性
C.r的值越小,成对样本数据的线性相关程度越弱
D.成对样本数据线性相关的正负性与r的符号(正负)相同
10.[2023·山西太原高二期中]对于样本相关系数r,下列说法正确的是(  )
A.r的取值范围是[-1,1]
B.|r|越大,相关程度越弱
C.|r|越接近于0,成对样本数据的线性相关程度越强
D.|r|越接近于1,成对样本数据的线性相关程度越强
三、填空题(每小题5分,共10分)
11.[2023·辽宁沈阳高二期中]在散点图中,若所有的样本点都落在一条斜率为非0实数的直线上,则相关系数=________.
12.[2023·河南南阳高二期中]变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则r1与r2的大小关系是________.
四、解答题(共20分)
13.(10分)假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
已知=90,≈140.8,=112.3,≈8.9,≈1.4.
(1)求,;
(2)计算y与x的相关系数,并判断该设备的使用年限与所支出的维修费用的相关程度.
14.(10分)如图是我国2016年至2022年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2016~2022.
由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
附注:参考数据:i=9.32,iyi=40.17,=0.55,≈2.646.
关键能力综合练
15.(5分)[2023·河南许昌高二期末]下图是某地区2022年4月至2023年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数r=0.91,则下列结论正确的是(  )
A.月温差(月最高气温-月最低气温)的最大值出现在1月
B.每月最高气温与最低气温的平均值在4~8月逐月增加
C.每月最低气温与最高气温有较强的线性相关性,且二者为线性负相关
D.9~12月的月温差相对于5~8月,波动性更小
[答题区]
题号 1 2 3 4 5 6 7 8 9 10 15
答案
16.(15分)某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号 1 2 3 4 5 6
每袋出厂价格xi 10.5 10.9 11 11.5 12 12.5
月销售量yi 2.2 2 1.9 1.8 1.5 1.4
并计算得=782.56,=19.9,iyi=122.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若样本相关系数|r|≥0.75,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数
r=,≈0.57.
同步练习18 成对数据的统计相关性
1.解析:一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;一般情况下,锻炼时间越长,体重越轻,成负相关,故B错误;一般情况下,花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故为负相关,故C错误;期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
答案:A
2.解析:散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;散点图能看出两个量是否具有一定关系,但是并不一定是因果关系,故B正确,C错误;散点图中能看出数据的分布情况,故D错误.
答案:B
3.解析:由图可知,②③中的点集中在一条直线的附近,所以图②③中的两个变量具有线性相关关系.
答案:C
4.解析:因为|-0.92|>|0.887|>|0.78|>|-0.69|,所以甲同学的试验结果体现两变量有更强的线性相关性.
答案:A
5.解析:由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2答案:A
6.解析:根据散点图可知,数学成绩与物理成绩正相关,即一般来说,数学成绩好,物理成绩也好.
答案:A
7.解析:|r|越接近0,成对样本数据的线性相关程度越弱,故A错误;|r|越接近1,成对样本数据的线性相关程度越强,故B错误;r>0,成对样本数据正相关,故C正确;r<0,成对样本数据负相关,故D错误.
答案:C
8.解析:由题意,去掉离群点(5,13)后,仍然为正相关,相关性变强,相关系数变大,故A、B、C错误,D正确.
答案:D
9.解析:对于A和C,相关系数r用来衡量两个变量之间的线性相关程度,相关系数r是一个绝对值小于等于1的量,并且它的绝对值越大说明相关程度越高,故A正确,C错误;对于B,相关系数r=0说明两个随机变量线性不相关,但这不代表两个变量之间不存在其他类型的关系,故B错误;对于D,由相关系数的概念可知,成对样本数据线性相关的正负性与r的符号(正负)相同,故D正确.
答案:AD
10.解析:对于样本相关系数r,取值范围是[-1,1],|r|越大,越接近于1,成对样本数据的线性相关程度越强;|r|越小,越接近于0,成对样本数据的线性相关程度越弱.
答案:AD
11.解析:当散点图的所有点都在一条斜率为非0实数的直线上时,它的残差为0,残差的平方和为0,所以它的相关系数为±1,即|r|=1.
答案:1
12.解析:由数据可知Y与X正相关,V与U负相关,
所以r2<0答案:r213.解析:(1)==4,
==5.0.
(2)iyi-5=112.3-5×4×5=12.3,-52=90-5×42=10,
-52≈140.8-5×52=15.8,
所以r===≈≈0.987,
接近于1,说明该设备的使用年限与所支出的维修费用之间具有很高的相关性.
14.解析:==4,=1+4+9+16+25+36+49=140,
r=
===≈0.993,因为r正向趋近1,所以说明这对样本数据的线性相关程度很强.
15.解析:
对于A,2022年各月温差(单位:℃)如下表所示:
月份 4 5 6 7 8 9 10 11 12
温差 23 18 17 16 16 20 31 24 21
2023年各月温差(单位:℃)如下表所示:
月份 1 2 3
温差 15 27 22
因此,月温差(月最高气温-月最低气温)的最大值出现在10月,A错;对于B,每月最高气温与最低气温的平均值在4~8月分别为20.5, 23, 26.5, 29, 30,逐月增加,B对;对于C,因为r=0.91,每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关,C错;对于D,由A中表格中的数据可知,9~12月的月温差相对于5~8月,波动性更大,D错.
答案:B
16.解析:(1)该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格为:
=×(10.5+10.9+11+11.5+12+12.5)=11.4(元),
平均月销售量为=×(2.2+2+1.9+1.8+1.5+1.4)=1.8(万袋),
平均月销售收入为iyi=×122=(万元).
(2)由已知,每袋出厂价格与月销售量的样本相关系数为:
r=


==-=-
≈-≈-0.98.
(3)由于每袋出厂价格与月销售量的样本相关系数|r|≈0.98>0.75,所以该食品加工厂制定的每袋食品的出厂价格与月销售量有较强的相关性.同步练习19 一元线性回归模型及其应用
必备知识基础练
一、单项选择题(每小题5分,共40分)
1.[2023·黑龙江哈尔滨高二期末]下列关于y与x的经验回归方程中,变量x,y成正相关关系的是(  )
A.=-2.1x+1.8B.=1.2x+1.5
C.=-0.5x+2.1D.=-0.6x+3
2.已知回归直线的斜率的估计值是1.2,样本点的中心为(4,5),则经验回归方程是(  )
A.=1.2x+4B.=1.2x+5
C.=1.2x+0.2D.=0.95x+1.2
3.已知变量x,y之间具有线性相关关系,根据15对样本数据求得经验回归方程为=2x-1,若i=23,则i=(  )
A.12B.19
C.31D.46
4.[2023·河北沧州高二期末]下列残差满足一元线性回归模型中对随机误差的假定的是(  )
5.[2023·河北保定高二期末]已知x,y的对应值如下表所示,若y与x线性相关,且经验回归方程为=1.4x+1.4,则m=(  )
x 0 2 4 6 8
y 1 m+1 2m+1 3m+3 11
A.2B.3C.4D.5
6.[2023·河南濮阳高二期末]某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据如下表所示
第x天 1 2 3 4 5 6 7
高度y/cm 1 4 6 9 11 12 13
由表格数据可得到y关于x的经验回归方程为=2.04x+,则第6天的残差为(  )
A.-0.08B.2.12
C.-2.12D.0.08
7.[2023·河南郑州高二期末]若需要刻画预报变量Y和解释变量x的相关关系,且从已知数据中知道预报变量Y随着解释变量x的增大而减小,并且随着解释变量x的增大,预报变量Y大致趋于一个确定的值,为拟合Y和x之间的关系,应使用以下回归方程中的(b>0,e为自然对数的底数)(  )
A.Y=bx+a
B.Y=-b ln x+a
C.Y=b+a
D.Y=be-x+a
8.用模型y=menx+2(m>0)拟合一组数据时,设z=lny,将其变换后得到回归方程为=3x+2,则n-m=(  )
A.-1B.1
C.-2D.2
二、多项选择题(每小题5分,共10分)
9.研究变量x,y得到一组样本数据,进行回归分析,以下说法正确的是(  )
A.经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
B.若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1,则这组样本数据的样本相关系数为1
C.在经验回归方程=-2x+8中,当解释变量x每增加1个单位时,响应变量平均增加2个单位
D.用决定系数R2来比较两个模型的拟合效果,R2越小,模型的拟合效果越差
10.[2023·河南平顶山高二期末]“冬吃萝卜夏吃姜,不劳医生开药方.”鲁山县张良镇生产的黄姜,有“姜中之王”的美誉,自汉朝起便为历代宫廷贡品,闻名天下.某黄姜种植户统计了某种有机肥料的施肥量x(单位:吨)与姜的产量y(单位:吨)的一组数据,由表中数据,得到经验回归方程为=5.3x+,则下列结论正确的是(  )
施肥量x(吨) 0.6 0.8 1 1.2 1.4
姜的产量y(吨) 3.1 4.2 5.2 6.4 7.3
A.=-0.06
B.姜的产量与这种有机肥的施肥量正相关
C.回归直线过点(1,5.24)
D.当施肥量为1.8吨时,预计姜的产量约为8.48吨
三、填空题(每小题5分,共10分)
11.[2023·江西宜春高二考试]某同学收集了具有线性相关关系的两个变量x,y的一组样本数据(xi,yi)(i=1,2,…,10),经计算得到经验回归方程为=-2x+,且i=20,i=-25,则=________.
12.[2023·河南南阳高二期中]已知两个随机变量x和y的一组成对样本数据为(1,3),(2,4),(4,5),(9,n),若用最小二乘法求出回归方程为=x+1.75,则n=________.
四、解答题(共20分)
13.(10分)[2023·河南南阳高二期中]某冷饮店为了解每天的用电量y(千瓦时)与销售额x(千元)之间的关系,随机统计了某5天的用电量与当天的销售额,并制作了对照表:
销售额(千元) 3 6 7 4 5
用电量(千瓦时) 2.5 4.5 6 3 4
(1)已知y与x线性相关,求y关于x的经验回归方程;
(2)若某天的销售额为1万元,利用(1)中所得的经验回归方程,预测这一天的用电量.
附:回归直线=x+的斜率和截距的最小二乘法估计公式分别为:=,=-.
14.(10分)[2023·河北邯郸高二期中]某视频UP主采购了8台不同价位的航拍无人机进行测评,并从重量、体积、画质、图传、续航、避障等多方面进行综合评分.以下是价格和对应的评分数据:
价格x/百元 3 6 8 10 14 17 22 32
评分y 43 52 60 71 74 81 89 98
(1)根据以上数据,求y关于x的经验回归方程(系数精确到0.1);
(2)某网友准备购买一台评分不低于90分的航拍无人机,根据(1)中经验回归方程,预估最少需要多少元(结果精确到整数).
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘法估计分别为=,=-.
关键能力综合练
15.(5分)[2023·河南洛阳高二期中]杂交水稻之父袁隆平,为推进粮食安全、消除贫困、造福民生做出杰出贡献,他在杂交水稻育种的某试验中,第1个周期到第5个周期育种频数如下
周期数(x) 1 2 3 4 5
频数(y) 2 17 36 93 142
由表格可得y关于x的二次回归方程为=6x2+,则此回归模型第2个周期的残差(实际值与预报值之差)为(  )
A.0B.1
C.4D.5
[答题区]
题号 1 2 3 4 5 6 7 8 9 10 15
答案
16.(15分)[2023·山东滨州高二期末]为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1~10分别对应年份2013~2022.
根据散点图,分别用模型①y=bx+a,②y=c+d作为年研发投入y关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y关于年份代码x的经验回归方程模型?并说明理由;
(2)根据(1)中所选模型,求出y关于x的经验回归方程,并预测该公司2028年的高科技研发投入.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=+x的斜率和截距的最小二乘估计分别为=,=-.
同步练习19 一元线性回归模型及其应用
1.解析:设关于y与x的经验回归方程为=x+,变量x,y成正相关关系,则>0,
答案:B
2.解析:因为回归直线必过样本中心,所以回归直线必过(4,5),所以由直线的点斜式方程可得:-5=1.2(x-4),即=1.2x+0.2.
答案:C
3.解析:因为i=23,所以=,因为=2x-1,且过点(,),所以=2-1,解得=,则i=15=19.
答案:B
4.解析:图A显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;图B说明残差的方差不是一个常数,随观测时间变大而变大;图C显示残差与观测时间有线性关系,应将时间变量纳入模型;图D的残差较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,可见D满足一元线性回归模型对随机误差的假定.
答案:D
5.解析:==4,
==1.2m+3.4,
又经验回归方程为=1.4x+1.4,所以1.2m+3.4=1.4×4+1.4,解得m=3.
答案:B
6.解析:==4,
==8,
根据经验回归方程过样本中心(4,8),故有8=2.04×4+,则有=-0.16,
此时=2.04x-0.16,当x=6时,=2.04×6-0.16=12.08,残差=12-12.08=-0.08.
答案:A
7.解析:由预报变量Y随着解释变量x的增大而减小,即回归方程对应一个递减函数,排除A、C;由随解释变量x的增大,预报变量Y大致趋于一个确定的值,即x趋向正无穷,预报变量Y趋向于某一个值,而不是趋向负无穷,排除B.
答案:D
8.解析:因为y=menx+2(m>0),z=lny,
所以lny=nx+2+lnm,
又=3x+2,所以,解得,
所以n-m=2.
答案:D
9.解析:经验回归直线=x+可以不经过点(x1,y1),(x2,y2),…,(xn,yn)中的任意一个,A错误;因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1,所以样本相关系数为1,B正确;在经验回归方程=-2x+8中,当解释变量x每增加1个单位时,响应变量平均减少2个单位,C错误;用决定系数R2来比较两个模型的拟合效果,R2越小,模型的拟合效果越差,D正确.
答案:BD
10.解析:由表中数据可得=(0.6+0.8+1+1.2+1.4)=1,=(3.1+4.2+5.2+6.4+7.3)=5.24,
所以回归直线=5.3x+过点(1,5.24),故C正确;
=5.24-5.3×1=-0.06,故A正确;
因为系数5.3>0,所以姜的产量与这种有机肥的施肥量正相关,故B正确;
在回归方程中令x=1.8,得=5.3×1.8-0.06=9.48,所以预计姜的产量约为9.48吨,故D错误.
答案:ABC
11.解析:由题意知,=i=2,=i=-,因为样本中心点(,)满足经验回归方程=-2x+,所以=-+2×2=.
答案:
12.解析:该组数据中,=(1+2+4+9)=4,=(3+4+5+n)=3+,则样本点中心为(4,3+),则3+=4+1.75,解之得,n=11.
答案:11
13.解析:(1)由表中数据计算得:=5,=4,
(xi-)(yi-)=(-2)×(-1.5)+1×0.5+2×2+(-1)×(-1)+0×0=8.5,
(xi-)2=4+1+4+1+0=10,
所以==0.85,=-0.85=-0.25.
所以回归方程为=0.85x-0.25.
(2)将x=10代入(1)的回归方程中得:=0.85×10-0.25=8.25.
故预测这一天的用电量为8.25千瓦时.
14.解析:(1)由题意得==14,
==71,
故===≈1.9,
所以=-≈71-1.9×14≈44.4,
y关于x的经验回归方程为=1.9x+44.4.
(2)令=1.9x+44.4≥90,解得x≥24,
即预估最少需要2400元.
15.解析:令t=x2则回归方程为=6t+,符合线性回归,
周期数的平均数==11,
频数的平均数==58,
则中心点为(11,58),代入=6t+,
可得58=6×11+,则=-8,
所以=6t-8,
当x=2时y的预估值为6×4-8=16,
则第2个周期的残差为17-16=1.
答案:B
16.解析:(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)设t=,所以y=c+dt,
所以===6.3,=-=60.825,
所以y关于x的经验回归方程为y=60.825+6.3,
令x=16,则y=60.825+6.3×4=86.025,
即预测该公司2028年的高科技研发投入86.025亿元.同步练习20 列联表与独立性检验
必备知识基础练 
一、单项选择题(每小题5分,共40分)
1.下面是一个2×2列联表,则表中a,c处的值分别为(  )
y1 y2 总计
x1 a 25 73
x2 21 b c
总计 d 49
A.98,28  B.28,98  C.48,45  D.45,48
2.对于独立性检验,下列说法正确的是(  )
A.卡方独立性检验的统计假设是各事件之间相互独立
B.卡方的值可以为负值
C.卡方独立性检验显示“患慢性气管炎和吸烟习惯有关”即指“有吸烟习惯的人必会患慢性气管炎”
D.2×2列联表中的4个数据可为任何实数
3.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是(  )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这人有99%的概率患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
4.[2023·河南漯河高二期末]根据分类变量x与y的成对样本数据,计算得到χ2=6.147.依据α=0.01的独立性检验(x0.01=6.635),结论为(  )
A.变量x与y不独立
B.变量x与y不独立,这个结论犯错误的概率不超过0.01
C.变量x与y独立
D.变量x与y独立,这个结论犯错误的概率不超过0.01
5.[2023·山西运城高二期中]某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验.整理所得数据后发现,若依据α=0.010的独立性检验,则认为学生性别与是否支持该活动无关;若依据α=0.025的独立性检验,则认为学生性别与是否支持该活动有关,则χ2的值可能为(  )
附表:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.4.238  B.4.972  C.6.687  D.6.069
6.某班主任对全班50名学生进行了作业量的调查,数据如表:
性别 作业量 合计
大 不大
男生 18 9 27
女生 8 15 23
合计 26 24 50
则推断“学生的性别与认为作业量大有关”的概率约为(  )
附:χ2=
A.99%B.99.5%C.95%D.99.9%
7.[2023·河北石家庄高二期中]2018年12月28日,广州市地铁14号线开通,在一定程度上缓解从化到广州市区交通的拥堵,为了了解市民对地铁14号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析了其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论不一定正确的是(  )
A.样本中男性比女性更关注地铁14号线开通
B.样本中多数女性是35岁以上
C.样本中35岁以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的人对地铁14号线的开通的关注度更高
8.[2023·江西宜春高二期中]为了解阅读量多少与幸福感强弱之间的关系,一个调查机构随机调查了100人,得到如下数据:
幸福感强 幸福感弱
阅读量多 40 20
阅读量少 15 25
则下列说法正确的是(  )
A.在犯错误的概率不超过0.5%的前提下,可以认为阅读量多少与幸福感强弱有关
B.有99.9%的把握认为阅读量多少与幸福感强弱有关
C.若一个人阅读量多,则有99.5%的把握认为此人的幸福感强
D.在阅读量多的人中随机抽取一人,此人是幸福感强的人的概率约为0.55
二、多项选择题(每小题5分,共10分)
9.[2023·山东聊城高二期末]2023年5月30日,搭载神舟十六号载人飞船的长征二号F遥十六运载火箭在酒泉卫星发射中心发射升空,航天员乘组状态良好,发射取得圆满成功.某学校调查学生对神舟十六号的关注与性别是否有关,随机抽样调查了1000名学生,进行独立性检验,计算得到χ2≈7.936,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是(  )
A.零假设H0:对神舟十六号的关注与性别独立
B.根据小概率值α=0.005的独立性检验,可以认为对神舟十六号的关注与性别无关
C.根据小概率值α=0.005的独立性检验,可以认为对神舟十六号的关注与性别不独立,此推断犯错误的概率不大于0.005
D.根据小概率值α=0.001的独立性检验,可以认为对神舟十六号的关注与性别独立
10.[2023·河北唐山高二期末]有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到2×2列联表.
优秀 非优秀 合计
甲班 10 b
乙班 c 30
合计 105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为20,b的值为45
B.列联表中c的值为30,b的值为35
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关联”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关联”
[答题区]
题号 1 2 3 4 5 6 7 8 9 10
答案
三、填空题(每小题5分,共10分)
11.[2023·重庆南岸高二期末]某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现χ2=3.109,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是________%.
12.[2023·安徽合肥高二期末]某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,________(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关.
四、解答题(共20分)
13.(10分)[2023·河北石家庄高二期中]根据某种病毒的变异发展实际,某地防控措施有了重大调整.其中,老人是否接种疫苗备受关注,为了了解某地区老人是否接种了疫苗,现用简单随机抽样的方法从该地区调查了500名老人,结果如下:
性别 接种情况 男 女
未接种 20 10
已接种 230 240
(1)估计该地区老人中,已接种疫苗的比例;
(2)能否有99%的把握认为该地区的老人是否接种疫苗与性别有关?
14.(10分)[2023·河南信阳高二期末]某校“环境”社团随机调查了某市100天中每天空气中的PM2.5和当天到街心公园锻炼的人次,整理数据得到下表(单位:天):
PM2.5 锻炼人次 [0,300] (300,600] (600,900]
[0,35] 5 12 25
(35,75] 7 10 13
(75,120] 10 11 7
若某天的空气中的PM2.5不高于75,则称这天“空气质量好”;若某天的空气中的PM2.5高于75,则称这天“空气质量不好”.
(1)估计该市一天“空气质量好”的概率;
(2)根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤600 人次>600
空气质量好
空气质量不好
关键能力综合练 
15.(5分)[2023·广东广州高二期末]某校高二年级羽毛球社团为了解喜爱羽毛球运动是否与性别有关,随机在高二年级抽取了若干人进行调查.已知抽取的女生人数是男生人数的3倍,其中女生喜爱羽毛球运动的人数占女生人数的,男生喜爱羽毛球运动的人数占男生人数的.若本次调查得出“在犯错误的概率不超过0.05的前提下,认为喜爱羽毛球运动与性别有关”的结论,则被调查的男生人数至少有________.
16.(15分)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
男 女
需要志愿者 40 30
不需要志愿者 160 270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿者帮助的老年人的比例?说明理由.
同步练习20 列联表与独立性检验
1.解析:由2×2列联表知:
a+25=73,b+25=49,b+21=c,
解得a=48,b=24,c=45.
答案:C
2.解析:根据卡方独立性检验的方法,首先保证各事件之间相互独立,可知A项正确;根据χ2=可知,该值为非负值,故B项错误;根据卡方独立性检验的基本思想,两个事件有关,但不是一个事件发生,另一事件必发生,可知C项错误;2×2列联表中的4个数据应为非负数,故D项错误.
答案:A
3.解析:根据独立检验的基本思想,说明吸烟与患肺癌有关,但不能说吸烟者一定患肺癌,只能说患肺癌的概率较高(而概率值不确定),所以D项正确.
答案:D
4.解析:按照独立性检验的知识及比对的参数值,当χ2=6.147,我们可以下结论变量x与y独立.故排除选项A,B;
依据α=0.01的独立性检验(x0.01=6.635),6.147<6.635,所以我们不能得到“变量x与y独立,这个结论犯错误的概率不超过0.01”这个结论.故C正确,D错误.
答案:C
5.解析:由题知χ2∈[5.024,6.635),故χ2的值可能为6.069.
答案:D
6.解析:由公式得χ2=≈5.059>3.841.
∴学生的性别与认为作业量大有关的概率约为95%.
答案:C
7.解析:由题意,
做出等高条形图对应的列联表如下:
35岁以上 35岁以下 总计
男性 a c a+c
女性 b d b+d
总计 a+b c+d a+b+c+d
根据第1个等高条形图可知,35岁以上男性比35岁以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.根据第2个等高条形图可知,男性中35岁以上的比35岁以下的多,即a>c;女性中35岁以上的比35岁以下的多,即b>d.
男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,所以A正确;35岁以上女性人数为b,35岁以下女性人数为d,因为b>d,所以B正确;35岁以下男性人数为c,35岁以上女性人数为b,无法从图中直接判断b与c的大小关系,所以C不一定正确;35岁以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c+d.所以D正确.
答案:C
8.解析:χ2=
=≈8.249,
∵7.879<8.249<10.828,∴在犯错误的概率不超过0.5%的前提下,可以认为阅读量多少与幸福感强弱有关,故A对,BC错;在阅读量多的人中随机抽取一人,此人是幸福感强的人的概率为≈0.667,故D错.
答案:A
9.解析:因为χ2≈7.936,零假设H0:对神舟十六号的关注与性别独立,A对;因为χ2≈7.936>7.879=x0.005,根据小概率值α=0.005的独立性检验,可以认为对神舟十六号的关注与性别不独立,此推断犯错误的概率不大于0.005,B错C对;因为χ2≈7.936<10.828=x0.001,根据小概率值α=0.001的独立性检验,可以认为对神舟十六号的关注与性别独立,D对.
答案:ACD
10.解析:由题,成绩优秀的学生人数是×105=30,则成绩非优秀的人数为75,
故c=30-10=20,b=75-30=45,故A选项正确,B选项错误;补全列联表如下:
优秀 非优秀 合计
甲班 10 45 55
乙班 20 30 50
合计 30 75 105
χ2=≈6.109>3.841,
故按95%的可靠性要求,能认为“成绩与班级有关联”,故C选项正确,D选项错误.
答案:AC
11.解析:由χ2=3.109>2.706,
对照数表知,市政府断言市民收入增减与旅游需求有关系的可信程度是90%.
答案:90
12.解析:依题意,可得出如下2×2列联表:
国内代表 国外代表 合计
不乐观 40 60 100
乐观 60 40 100
合计 100 100 200
χ2==8>7.879,
所以有99.5%以上的把握认为持乐观态度和国内外差异有关.
答案:有
13.解析:(1)×100%=94%.
(2)∵χ2=≈3.546<6.635,
∴没有99%的把握认为该地区的老人是否接种疫苗与性别有关.
14.解析:(1)由频数分布表可知,该市一天“空气质量好”的概率为==0.72.
所以估计该市一天“空气质量好”的概率为0.72.
(2)2×2列联表如下:
人次≤600 人次>600 总计
空气质量好 34 38 72
空气质量不好 21 7 28
总计 55 45 100
零假设H0:一天中到该公园锻炼的人次与该市当天的空气质量无关,
因为χ2=≈6.285>3.841,
所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
15.解析:设男生人数为x,则女生人数为3x,
所以其中女生喜爱羽毛球运动的人数为x,
男生喜爱羽毛球运动的人数为x,
所以得到的列联表为:
男生 女生 合计
喜爱羽毛球运动 x x x
不喜爱羽毛球运动 x x x
合计 x 3x 4x
χ2===≥3.841,解得x≥31.68825,故被调查的男生至少有32人.
答案:32
16.解析:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=0.14.
(2)补充2×2列联表为
男 女 合计
需要志愿者 40 30 70
不需要志愿者 160 270 430
合计 200 300 500
由已知可得,χ2==≈9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.单元素养测评卷(八) 成对数据的统计分析
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.为了调查中学生近视情况,某校160名男生中有90名近视,150名女生中有75名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力(  )
A.平均数B.方差C.回归分析D.独立性检验
2.已知变量x与y正相关,变量y与z满足y=3-z+1,则下列说法正确的是(  )
A.y与z正相关,x与z正相关
B.y与z正相关,x与z负相关
C.y与z负相关,x与z正相关
D.y与z负相关,x与z负相关
3.某同学在研究变量x,y之间的相关关系时,得到以下数据,并采用最小二乘法得到了经验回归方程=x+,则(  )
x 4.8 5.8 7 8.3 9.1
y 2.8 4.1 7.2 9.1 11.8
A.>0,>0B.>0,<0C.<0,<0D.<0,>0
4.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验.经计算χ2=6.058,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系”.(  )
α 0.1 0.05 0.025 0.01 0.001
xα 2.706 3.841 5.024 6.635 10.828
A.2.5%B.1%C.97.5%D.99%
5.根据变量x和y的一组试验数据(xi,yi)(i=1,2,…,n)计算可得=3,=8,经验回归方程为=x+1.7,则可以预测当x=13时,变量y的估计值为(  )
A.29B.30C.31D.32
6.四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如图两个等高条形图,根据条形图信息,下列结论正确的是(  )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
7.近年来,农村电商借助互联网,使特色农副产品走向全国,送到世界各地,打破农副产品有“供”无“销”的局面,助力百姓增收致富.已知某农村电商每月直播带货销售收入y(单位:万元)与月份x(x=1,2,…,12)具有线性相关关系,根据2023年前5个月的直播销售数据,得到经验回归方程为=0.8x+9.3,则下列结论正确的是(  )
A.相关系数r=0.8,销售收入y与月份x的相关性较强
B.经验回归直线=0.8x+9.3过点(3,11.7)
C.根据经验回归方程可得第6个月的销售收入为14.1万元
D.关于两个变量x,y所表示的成对数据构成的点都在直线=0.8x+9.3上
8.节能降耗是企业的生存之本,树立一种“点点滴滴降成本,分分秒秒增效益”的节能意识,以最好的管理,来实现节能效益的最大化,为此某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:
年号 1 2 3 4 5
年生产利润y(单位千万元) 0.7 0.8 1 1.1 1.4
预测第10年该国企的生产利润约为(  )
A.1.85B.2.02C.2.19D.2.36
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多项是符合题目要求的.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列关于回归分析与独立性检验的说法正确的是(  )
A.相关变量x,y的经验回归方程为y=0.2x-m,若样本点中心为(m,1.6),则m=-2
B.对于独立性检验,χ2的值越大,说明两事件相关程度越大
C.回归分析是对两个变量确定性关系的分析,而独立性检验是分析两个变量之间的不确定性关系
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
10.某同学用搜集到的六组数据(xi,yi)(i=1,2,…,6)绘制了如下散点图,在这六个点中去掉B点后重新进行回归分析,则下列说法正确的是(  )
A.决定系数R2变小
B.相关系数r的绝对值越趋于1
C.残差平方和变小
D.解释变量x与预报变量y相关性变弱
11.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn),利用最小二乘法得到两个变量的经验回归方程为=x+,则下面说法正确的是(  )
A.直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
B.直线=x+必经过点(,)
C.相关系数r与回归系数同号
D.相关系数r越大,两个变量之间的线性相关性越强
12.下列说法正确的序号是(  )
A.在经验回归方程=0.8x-12中,当解释变量x每增加一个单位时,响应变量平均增加0.8个单位
B.利用最小二乘法求经验回归方程,就是使得最小的原理
C.已知X,Y是两个分类变量,若它们的随机变量χ2的观测值越大,则“X与Y有关系”的把握程度越小
D.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本(xi,yi)(i=1,2,…n)都在直线y=-x+1上,则这组样本数据的线性相关系数为-
三、填空题:本题共4小题,每小题5分,共20分.
13.已知变量x,y的散点图如图所示,那么在1,-0.5,0,0.5这四个数中,x,y之间的样本相关系数r最接近的值为________.
14.已知关于x,y的一组数据:
x 1 m 3 4 5
y 0.5 0.6 n 1.4 1.5
根据表中这五组数据得到的经验回归方程为=0.28x+0.16,则n-0.28m的值为________.
15.下面是一个2×2列联表:
则b-d=________,χ2≈________.(保留小数点后3位)
16.已知某品牌的新能源汽车的使用年限x(单位:年)与维护费用y(单位:千元)之间可以用模型y=c1(c1>0)去拟合,收集了4组数据,设z=lny,x与z的数据如表格所示:
x 4 6 8 10
z 2 3 5 6
利用最小二乘法得到x与z的经验回归方程=0.6x+,则c1·c2=________.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(本小题10分)某中学为了解高中数学学习中抽象思维与性别的关系,随机抽取了男生55人,女生45人进行测试,根据测试成绩得到如下2×2列联表:
成绩小于60分 成绩不小于60分 合计
男 10 45 55
女 15 30 45
合计 25 75 100
试根据小概率值α=0.05的独立性检验,能否认为抽象思维与性别有关联?
18.(本小题12分)两个具有相关关系的变量(x,y)的一组统计数据为(x1,y1),(x2,y2),…,(xn,yn).其样本中心点为(25,36.8),且由统计知
样本相关系数r≈0.96.
19.(本小题12分)为推动农村可持续生态农业的发展,广东某农场用五年的时间按照有机标准新改良了100亩土地,预计在改良后的土地上种植有机水果A和其它作物,并根据市场需求确定有机水果A的种植面积.农场经营采用的是CSA农业经营模式即社区支持农业,农场从CSA会员中随机抽取了南方、北方会员共200人,调查数据如下.
喜欢有机水果A 不喜欢有机水果A
南方会员 80 40
北方会员 40 40
(1)视频率为概率,分别估计南方、北方会员中喜欢有机水果A的概率;
(2)试根据小概率值α=0.025的独立性检验,分析喜欢有机水果A是否与会员的区域有关.
附:χ2=,n=a+b+c+d.
α 0.05 0.025 0.005
xα 3.841 5.024 7.879
20.(本小题12分)乒乓球运动在我国非常普及,被定为“国球”.有非常多的青少年从小就接受系统的训练,所以基本功非常扎实,把乒乓球打到对方球台的指定位置是乒乓球运动的基本功之一.打100个球,若有大于90个打到对方球台的指定位置,则称为“优秀”,否则称为“一般”.在练球时,打球动作有“规范动作”和“不规范动作”两种,且在接受训练的学员中,将训练满10次而不满20次记为1组,训练满20次而不满30次记为2组,如此n=1,2,3,…,训练满10n次而不满10(n+1)次记为n组.某乒乓球训练部门为了以后优化训练,在“规范动作”和“不规范动作”的两群体中,在组数15组中各随机抽取10人,即两群体中各抽取50人,进行测试得出的关于“优秀”“一般”的表1和表2如下.
表1:有“规范动作”的学员测试结果(“优秀”个数)
组数 1 2 3 4 5
“优秀”数 1 2 4 6 7
表2:有“不规范动作”的学员测试结果(“优秀”个数)
组数 1 2 3 4 5
“优秀”数 0 1 2 3 4
(1)填写以下表格,依据小概率值α=0.05的独立性检验分析,推断“优秀”和“一般”与练球时的“规范动作”是否有关.
“优秀” “一般” 合计
“规范动作” 50
“不规范动作” 50
合计
(2)在有“规范动作”的学员测试结果中,x表示组数,y表示“优秀”个数,由表1求平均值和及y关于x的经验回归方程=x+.
参考数据及公式:χ2=,n=a+b+c+d.
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
21.(本小题12分)随着时代的不断发展,社会对高素质人才的需求不断扩大,我国本科毕业生中考研人数也不断攀升,2020年的考研人数是341万人,2021年考研人数是377万人.某中学数学兴趣小组统计了本省15所大学2022年的毕业生人数x及考研人数y(单位:千人),经计算得:
(1)利用最小二乘估计建立y关于x的经验回归方程;
(2)该小组又利用收集的数据建立了x关于y的经验回归方程,并把这两条拟合直线画在同一坐标系xOy下,横坐标x,纵坐标y的意义与毕业人数x和考研人数y一致.
①比较前者与后者的斜率k1与k2的大小;
②求这两条直线公共点的坐标.
附:y关于x的回归方程=x+中,斜率和截距的最小二乘估计公式分别为:
22.(本小题12分)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若r>0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?
附:相关系数公式
回归方程=x+中斜率和截距的最小二乘估计公式分别为:
单元素养测评卷(八) 成对数据的统计分析
1.解析:近视与性别是两类变量,
在检验两个随机事件是否相关时,最有说服力的方法是独立性检验.
答案:D
2.解析:因为y=3-z+1=+1,所以y与z负相关,
又因为变量x与y正相关,所以x与z负相关.
答案:D
3.解析:画出散点图如下:
从而可以看出=x+中,>0,<0.
答案:D
4.解析:因为χ2=6.058,对照表格:5.024<6.058<6.635,
因为1-0.025=0.975=97.5%,
所以有97.5%的把握认为“学生性别与是否支持该活动有关系”.
答案:C
5.解析:因为回归直线经过点(,),所以8=3+1.7,解得=2.1,
所以经验回归方程为=2.1x+1.7,
代入x=13,得=13×2.1+1.7=29.
答案:A
6.解析:根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.
答案:C
7.解析:由回归方程为=0.8x+9.3可知,回归系数为0.8,不是相关系数,故A错;由前5个月的直播销售数据,得到经验回归方程,故==3,所以=3×0.8+9.3=11.7,所以过点(3,11.7),故B正确;根据经验回归方程可得第6个月的销售收入的预测值为14.1万元,并不是实际值,故C错误;并不是所有关于两个变量x,y所表示的成对数据构成的点都在直线=0.8x+9.3上,故D错误.
答案:B
8.解析:==3,==1,
则(xi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,
(xi-)(yi-)=0.6+0.2+0+0.1+0.8=1.7,
=-=1-0.17×3=0.49,
所以国企的生产利润y与年份x的回归方程为=0.17x+0.49,
当x=10时,=0.17×10+0.49=2.19,
即预测第10年该国企的生产利润约为2.19.
答案:C
9.解析:根据回归直线经过样本点中心可得1.6=0.2m-m,得m=-2,故A正确;根据独立性检验思想,χ2的值越大,说明推断两事件无关出错的概率越大,因此两事件相关程度越大,故B正确;回归分析是研究两个变量的相关关系,而独立性检验是对两个变量之间是否具有某种关系的一种检验,故C不正确;在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好,故D正确.
答案:ABD
10.解析:从图中可以看出B点较其他点偏离直线远,故去掉B点后,回归效果更好,决定系数R2越接近于1,所拟合的回归方程越优,故去掉B点后,R2变大,越趋于1,A错误;相关系数|r|越趋于1,拟合的回归方程越优,故去掉B点后,相关系数r的绝对值越趋于1,B正确;残差平方和变小拟合效果越好,故C正确;解释变量x与预报变量y相关性增强,D错误.
答案:BC
11.解析:直线=x+有可能不经过点(x1,y1),(x2,y2),…,(xn,yn)中的任何一个点,故A不正确;对于B,显然正确;当两个变量正相关时,相关系数r与回归系数同为正号,当两个变量负相关时,相关系数r与回归系数同为负号,故C正确;相关系数r的绝对值越大,两个变量之间的线性相关性越强,故D不正确.
答案:BC
12.解析:对于选项A:在经验回归方程=0.8x-12中,当解释变量x每增加一个单位时,响应变量平均增加0.8个单位,正确;对于选项B:用随机误差的平方和,即Q=(yi-i)2=(yi-a-bxi)2,并使之达到最小,这样回归直线就是所有直线中Q取最小值的那一条,由于平方又叫二乘,所以这种使“随机误差的平方和为最小”的方法叫做最小二乘法,所以利用最小二乘法求经验回归方程,就是使得(yi-bxi-a)2最小的原理,正确;对于选项C:对分类变量X与Y,对它们的随机变量χ2的观测值越小,则“X与Y有关系”的把握程度越小,错误;对于选项D:样本相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为-1,错误.
答案:AB
13.解析:根据变量x,y的散点图,得x,y之间的样本相关关系非常不明显,
所以相关系数r最接近的值为0.
答案:0
14.解析:由题意,根据表格中的数据,可得==,
==,即样本中心为,
则=0.28×+0.16,即4+n=0.28×(13+m)+0.8,
解得n-0.28m=0.44.
答案:0.44
15.解析:由2×2列联表得
a=49,b=54,c=25,d=46.∴b-d=54-46=8.
χ2=≈24.047.
答案:8 24.047
16.解析:==7,==4,
代入=0.6x+可得=4-0.6×7=-0.2,
由y=(c1>0)得lny=lnc1+c2x,即z=lnc1+c2x,
而=0.6x-0.2,所以lnc1=-0.2,c2=0.6,得c1=e-0.2,
则c1·c2=0.6e-0.2.
答案:0.6e-0.2
17.解析:零假设为H0:抽象思维与性别无关.
将2×2列联表中的数据代入公式,得χ2=≈3.03<3.841,
所以依据α=0.05的独立性检验,没有充分证据推断H0不成立,可以认为H0成立,即认为抽象思维与性别无关.
18.解析:(1)(xi-)2=(x1-)2+(x2-)2+…+(xn-)2
=x+x+…+x-2(x1+x2+…+xn)+n2
=x-2n2+n2=x-n2,
代入数据可得x-n2=138.
(2)由已知得=25,=36.8,
=1.5,
∴=0.96×1.5=1.44,
=-=36.8-1.44×25=0.8,
∴y关于x的经验回归方程为=1.44x+0.8.
19.解析:(1)由题得南方会员中喜欢有机水果A的概率P1==;
北方会员中喜欢有机水果A的概率为P2==,
所以南方、北方会员中喜欢有机水果A的概率分别为,.
(2)零假设H0:假设喜欢有机水果A与会员的区域无关;
χ2==≈5.556>5.024=x0.025,
根据小概率值α=0.025的独立性检验,H0不成立,
即认为是否喜欢有机水果A与会员的区域有关.
20.解析:(1)填写的表格如下.
“优秀” “一般” 合计
“规范动作” 20 30 50
“不规范动作” 10 40 50
合计 30 70 100
因为χ2=≈4.762>3.841=x0.05,
所以在犯错误的概率不超过0.05的前提下,“优秀”和“一般”与练球时的“规范动作”有关.
(2)==3,==4,
==1.6,=-1.6=-0.8,
故所求经验回归方程为=1.6x-0.8.
21.解析:(1)=xi=5,=yi=2,==0.3,=2-0.3×5=0.5,
故回归方程为=0.3x+0.5.
(2)设前者和后者的斜率分别为k1,k2
①显然有0②注意到,两直线都过(,),且k122.解析:(1)因为==5,==5,
(xi-)(yi-)=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
(xi-)2=(-3)2+(-1)2+02+12+32=20,(yi-)2=(-2)2+(-1)2+02+12+22=10,
因此相关系数=>0.75,
所以可用线性回归模型拟合y与x的关系.
(2)由(1)知,==0.7,=-=5-0.7×5=1.5,
因此=0.7x+1.5,当x=12时,=0.7×12+1.5=9.9.
所以液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.

延伸阅读:

标签:

上一篇:Unit 2 After school 同步练习(无答案)

下一篇:2024年中考物理母题解密专题20 电与磁考点精练(答案)