2025届高中数学一轮复习:单元检测九 统计与成对数据的统计分析(含解析)

单元检测九 统计与成对数据的统计分析
(时间:120分钟 满分:150分)
一、选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)做
1.(2024·张家口模拟)有7名同学参加百米竞赛,预赛成绩各不相同,取前3名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道7名同学成绩的(  )
A.平均数 B.众数
C.中位数 D.方差
2.(2023·贵阳模拟)从某班57名同学中选出4人参加户外活动,利用随机数法抽取样本时,先将57名同学按01,02,…,57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第3个同学的编号为(  )
0347 4373 8636 9647 3661 4698 6371 6297
7424 6292 4281 1457 2042 5332 3732 1676
(注:表中的数据为随机数表第一行和第二行)
A.36 B.42 C.57 D.46
3.(2024·沈阳模拟)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2 000名同学,每名同学依据自己的兴趣爱好最多可参加其中一个,各个社团的人数比例的扇形图如图所示,其中参加朗诵社团的同学有8名,参加太极拳社团的有12名,则(  )
A.这五个社团的总人数为100
B.脱口秀社团的人数占五个社团总人数的20%
C.这五个社团总人数占该校学生人数的8%
D.从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为50%
4.某校高三年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:
成绩 [80,90] (90,100] (100,110] (110,120] (120,130] (130,140] (140,150]
频数 30 40 15 12 12 5 2
则以上考生成绩的中位数(  )
A.在(90,100]内 B.在(100,110]内
C.在(110,120]内 D.在(120,130]内
5.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线性关系,设其经验回归方程为=x+,已知i=400,i=1 580,=-1,若该班某学生的听力成绩为26分,据此估计其笔试成绩约为(  )
A.99分 B.101分
C.103分 D.105分
6.(2024·南京联考)已知样本数据3x1+1,3x2+1,3x3+1,3x4+1,3x5+1,3x6+1的平均数为16,方差为9,则另一组数据x1,x2,x3,x4,x5,x6,12的方差为(  )
A. B. C. D.7
7.某地不同身高的未成年男性体重的平均值如表所示:
身高(cm) 60 70 80 90 100 110 120 130 140 150 160 170
平均体重(kg) 6.13 7.9 10 12.2 15 17.5 20.9 26.9 31.1 38.6 47.3 55.1
表格中的数据形成如图所示的散点图.则在以下函数模型中,描述这个地区未成年男性平均体重y(单位:kg)与身高x(单位:cm)的函数关系最合适的是(  )
A.y=0.5x-25 B.y=2(1.02)x
C.y=10lg x-5 D.y=0.01x2-0.5x
8.(2023·武汉模拟)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则(  )
注:同比增长率=×100%,
环比增长率=×100%.
A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降
B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升
C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%
D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%
二、选择题(本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2023·衡阳八中模拟)下列说法正确的是(  )
A.在经验回归方程中,若样本相关系数r越大,则两个变量的线性相关性越强
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.根据分类变量X与Y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05
D.某校共有男女学生1 500人,现按性别采用比例分配的分层随机抽样的方法抽取容量为100人的样本,若样本中男生有55人,则该校女生人数是675
10.(2024·郴州模拟)教育部办公厅“关于进一步加强中小学生体质健康管理工作的通知”中指出,各地要加强对学生体质健康重要性的宣传,中小学校要通过体育与健康课程、大课间、课外体育锻炼、体育竞赛、班级团队活动,家校协同联动等多种形式加强教育引导,让家长和中小学生科学认识体质健康的影响因素,了解运动在增强体质、促进健康、预防肥胖与近视、锤炼意志、健全人格等方面的重要作用,提高学生体育与健康素养,增强体质健康管理的意识和能力.某学校共有2 000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则(  )
A.样本的众数为67.5
B.样本的80%分位数为72.5
C.样本的平均数为66
D.该校男生体重中低于60 kg的学生大约为300人
11.(2024·湖北联考)已知互不相同的20个样本数据,若去掉其中最大和最小的数据,设剩下的18个样本数据的方差为s,平均数为1;去掉的两个数据的方差为s,平均数为2;原样本数据的方差为s2,平均数为,若1=2,则(  )
A.剩下的18个样本数据与原样本数据的中位数不变
B.=1
C.剩下18个数据的22%分位数大于原样本数据的22%分位数
D.10s2=9s+s
三、填空题(本题共3小题,每小题5分,共15分)
12.某校有选修物化、物生、政史三种不同类别课程的学生共900人(假设每人只选修一种类别的课程),按照比例分配的分层随机抽样方法从中抽取20人参加数学调研检测.已知在这次检测中20人的数学平均成绩为119分,其中选修物化和物生类别课程学生的数学平均成绩为120分,选修政史类别课程学生的数学平均成绩为115分,则该校选修政史类别课程的学生人数为____________.
13.已知我国某省二、三、四线城市数量之比为1∶3∶6,2022年3月份调查得知该省二、三、四线城市房产均价为0.8万元/平方米,方差为11.其中三、四线城市房产均价分别为1万元/平方米,0.5万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房产均价为________万元/平方米,二线城市房价的方差为________.
14.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,其变换后得到经验回归方程为=0.3x+4.则c=________.
四、解答题(本题共5小题,共77分.解答应写出文字说明,证明过程或演算步骤)
15.(13分)某校100名学生期中考试化学成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)请根据频率分布直方图,估计这100名学生化学成绩的平均数(同一组中的数据用该组区间中点值代替)及中位数.
16.(15分)某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200),第二组[200,300),第三组[300,400),第四组[400,500),第五组[500,600),第六组[600,700].由于工作中不慎将部分数据丢失,现有以下部分图表:
图1        图2
使用寿命 [100,200) [200,300) [300,400) [400,500) [500,600) [600,700]
频数 30 20
频率 0.2 0.4
(1)求图2中A的值;
(2)补全表格和图2中的频率分布直方图,并求图2中阴影部分的面积;
(3)为了某次展销会,用比例分配的分层随机抽样方法在使用寿命位于[400,600)内的产品中抽取5个作为样本,那么在[400,500)内应抽取多少个?
17.(15分)某学校为了调查学生运动情况,抽取了100名学生调查学生是否喜欢体育锻炼,调查结果统计如表:
喜欢 不喜欢 合计
男生 10
女生 20
合计 100
已知在全部100人中随机抽取1人,抽到不喜欢体育锻炼的人的概率为0.4.
(1)请将上面的列联表补充完整;
(2)依据小概率值α=0.001的独立性检验,分析喜欢体育锻炼是否与性别有关?说明你的理由.
附:χ2=,n=a+b+c+d.
临界值表:
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
18.(17分)近年来,国民经济的增长和社会结构的变化推动宠物饲养成为很多人精神消费的主要方式,使得近几年中国宠物市场规模逐年增长,如表为2018~2022年中国宠物市场规模y(单位:千亿元),其中2018~2022年对应的年份代码x依次为1~5.
年份代码x 1 2 3 4 5
宠物市场规模y/千亿元 1.22 1.34 1.78 2.21 2.95
(1)由表中数据可知,可用一元线性回归模型拟合y与x的关系,请用样本相关系数加以说明;
(2)求y关于x的经验回归方程,并预测2024年中国宠物市场规模.
参考数据:=1.9,iyi=32.83,≈1.41,≈3.162.
参考公式:样本相关系数r=,经验回归方程=+x中斜率和截距的最小二乘估计公式分别为=,=-.
19.(17分)噪声污染已经成为影响人们身体健康和生活质量的严重问题.为了解声音强度D(单位:dB)与声音能量I(单位:W·cm-2)之间的关系,将测量得到的声音强度D和声音能量I的数据作了初步处理,得到如图所示的散点图.
(1)根据散点图判断D=a1+b1I与D=a2+b2lg I哪一个适合作为声音强度D关于声音能量I的回归模型(给出判断即可,不必说明理由);
(2)求声音强度D关于声音能量I的非线性经验回归方程;
(3)假定当声音强度大于60 dB时,会产生噪声污染.城市中某点P处共受到两个声源的影响,这两个声源的声音能量分别是Ia和Ib,且+=1010.已知点P处的声音能量等于Ia与Ib之和.请根据(2)中的非线性经验回归方程,判断点P处是否受到噪声污染,并说明理由.
参考数据:=45.7,=-11.5,(Wi-)2=0.51,(Wi-)(Di-)=5.1,其中Wi=lg Ii,=i.
单元检测九 统计与成对数据的统计分析
(时间:120分钟 满分:150分)
一、选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)做
1.(2024·张家口模拟)有7名同学参加百米竞赛,预赛成绩各不相同,取前3名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道7名同学成绩的(  )
A.平均数 B.众数
C.中位数 D.方差
答案 C
解析 由题设知,7名同学参加百米竞赛,要取前3名参加决赛,则成绩从高到低排列,确定7名同学成绩的中位数,即第4名的成绩便可判断他自己是否能进入决赛.
2.(2023·贵阳模拟)从某班57名同学中选出4人参加户外活动,利用随机数法抽取样本时,先将57名同学按01,02,…,57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第3个同学的编号为(  )
0347 4373 8636 9647 3661 4698 6371 6297
7424 6292 4281 1457 2042 5332 3732 1676
(注:表中的数据为随机数表第一行和第二行)
A.36 B.42 C.57 D.46
答案 D
解析 从随机数表第一行第7列和第8列数字开始往右依次选出的编号为36,47,46,24,
则选出的第3个同学的编号为46.
3.(2024·沈阳模拟)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2 000名同学,每名同学依据自己的兴趣爱好最多可参加其中一个,各个社团的人数比例的扇形图如图所示,其中参加朗诵社团的同学有8名,参加太极拳社团的有12名,则(  )
A.这五个社团的总人数为100
B.脱口秀社团的人数占五个社团总人数的20%
C.这五个社团总人数占该校学生人数的8%
D.从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为50%
答案 B
解析 这五个社团的总人数为=80,占该校学生人数的=4%,A错误,C错误;因为太极拳社团人数的占比为×100%=15%,所以脱口秀社团人数的占比为1-10%-15%-30%-25%=20%,B正确;从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为25%+20%=45%,D错误.
4.某校高三年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:
成绩 [80,90] (90,100] (100,110] (110,120] (120,130] (130,140] (140,150]
频数 30 40 15 12 12 5 2
则以上考生成绩的中位数(  )
A.在(90,100]内 B.在(100,110]内
C.在(110,120]内 D.在(120,130]内
答案 A
解析 由统计表知,成绩不低于80分的考生共有30+40+15+12+12+5+2=116(人),在[80,90]内有30人,在(90,100]内有40人,所以不低于80分的所有考生成绩的中位数在(90,100]内.
5.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线性关系,设其经验回归方程为=x+,已知i=400,i=1 580,=-1,若该班某学生的听力成绩为26分,据此估计其笔试成绩约为(  )
A.99分 B.101分
C.103分 D.105分
答案 C
解析 i=400,故==20;i=1 580,故==79,
故点(20,79)在经验回归直线上,
即79=20-1,
解得=4,
即经验回归方程为=4x-1,当x=26时,代入计算得到=103.
6.(2024·南京联考)已知样本数据3x1+1,3x2+1,3x3+1,3x4+1,3x5+1,3x6+1的平均数为16,方差为9,则另一组数据x1,x2,x3,x4,x5,x6,12的方差为(  )
A. B. C. D.7
答案 C
解析 设数据x1,x2,x3,x4,x5,x6的平均数为,方差为s2,
由3+1=16,9s2=9,
得=i=5,s2=(xi-5)2=1,
则x1,x2,x3,x4,x5,x6,12的平均数为=6,
方差为


===.
7.某地不同身高的未成年男性体重的平均值如表所示:
身高(cm) 60 70 80 90 100 110 120 130 140 150 160 170
平均体重(kg) 6.13 7.9 10 12.2 15 17.5 20.9 26.9 31.1 38.6 47.3 55.1
表格中的数据形成如图所示的散点图.则在以下函数模型中,描述这个地区未成年男性平均体重y(单位:kg)与身高x(单位:cm)的函数关系最合适的是(  )
A.y=0.5x-25 B.y=2(1.02)x
C.y=10lg x-5 D.y=0.01x2-0.5x
答案 B
解析 根据所给散点图,结合一次函数、对数函数的图象可知,选项A,C不合适;
取x=100时,由y=0.01x2-0.5x可得y=50,当x=170时,由y=0.01x2-0.5x可得y=204,与实际值差距很大,故选项D不合适.
8.(2023·武汉模拟)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则(  )
注:同比增长率=×100%,
环比增长率=×100%.
A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降
B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升
C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%
D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%
答案 D
解析 对于A,从图中可以看出2022年1月全国居民消费价格的同比增长率为0.9%>0,
所以2022年1月全国居民消费价格比2021年1月有所上升,故A错误;
对于B,由题图知2022年5月全国居民消费价格环比增长率为-0.2%<0,
所以2022年5月全国居民消费价格比2022年4月有所下降,故B错误;
对于C,将C选项中的数据由小到大排列得,
0.7%,0.8%,0.9%,0.9%,1%,1.5%,1.5%,1.5%,2.1%,2.1%,2.3%,2.5%,2.7%,
因为13×40%=5.2,则同比增长率的40%分位数为第6个数1.5%,故C错误;
对于D,所求环比增长率的平均数为
×(0.7%+0.4%-0.3%+0.4%+0.6%+0.4%-0.2%+0.5%)=0.25%,故D正确.
二、选择题(本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2023·衡阳八中模拟)下列说法正确的是(  )
A.在经验回归方程中,若样本相关系数r越大,则两个变量的线性相关性越强
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.根据分类变量X与Y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05
D.某校共有男女学生1 500人,现按性别采用比例分配的分层随机抽样的方法抽取容量为100人的样本,若样本中男生有55人,则该校女生人数是675
答案 BCD
解析 对于A,样本相关系数|r|≤1,且|r|越接近于1,相关程度越大,反之两个变量的线性相关性越弱,当-1≤r<0时,样本相关系数r越大,|r|则越小,线性相关性越弱,故A错误;对于B,数据1,3,4,5,7,9,11,16是从小到大排列的,由8×75%=6,可得第75百分位数为第6项数据与第7项数据的平均数,即为=10,故B正确;对于C,因为χ2=3.937>3.841=x0.05,所以有95%的把握可判断分类变量X与Y有关联,此推断犯错误的概率不超过0.05,故C正确;对于D,设该校女生人数是x,则由分层随机抽样的比例分配方式,得=,解得x=675,故D正确.
10.(2024·郴州模拟)教育部办公厅“关于进一步加强中小学生体质健康管理工作的通知”中指出,各地要加强对学生体质健康重要性的宣传,中小学校要通过体育与健康课程、大课间、课外体育锻炼、体育竞赛、班级团队活动,家校协同联动等多种形式加强教育引导,让家长和中小学生科学认识体质健康的影响因素,了解运动在增强体质、促进健康、预防肥胖与近视、锤炼意志、健全人格等方面的重要作用,提高学生体育与健康素养,增强体质健康管理的意识和能力.某学校共有2 000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则(  )
A.样本的众数为67.5
B.样本的80%分位数为72.5
C.样本的平均数为66
D.该校男生体重中低于60 kg的学生大约为300人
答案 ABD
解析 对于A,样本的众数为=67.5,故A正确;
对于B,设样本的80%分位数为x,则(0.03+0.05+0.06)×5+(x-70)×0.04=0.8,解得x=72.5,故B正确;
对于C,由频率分布直方图估计样本的平均数为
57.5×0.15+62.5×0.25+67.5×0.3+72.5×0.2+77.5×0.1=66.75,故C错误;
对于D,2 000名男生中体重低于60 kg的人数大约为2 000×5×0.03=300,故D正确.
11.(2024·湖北联考)已知互不相同的20个样本数据,若去掉其中最大和最小的数据,设剩下的18个样本数据的方差为s,平均数为1;去掉的两个数据的方差为s,平均数为2;原样本数据的方差为s2,平均数为,若1=2,则(  )
A.剩下的18个样本数据与原样本数据的中位数不变
B.=1
C.剩下18个数据的22%分位数大于原样本数据的22%分位数
D.10s2=9s+s
答案 ABD
解析 设20个样本数据从小到大排列分别为x1,x2,x3,…,x20,则剩下的18个样本数据为x2,x3,…,x19,
对于A,原样本数据的中位数为,剩下的18个样本数据的中位数为,A正确;
对于B,依题意,1=(x2+x3+…+x19),2=(x1+x20),=(x1+x2+…+x20),
由1=2,得1=(x2+x3+…+x19)=(x1+x20),即x2+x3+…+x19=181,x1+x20=21,
于是x1+x2+x3+…+x19+x20=201,
因此(x1+x2+x3+…+x19+x20)=1,即=1,B正确;
对于C,因为18×22%=3.96,则剩下18个数据的22%分位数为x5,
又20×22%=4.4,则原样本数据的22%分位数为x5,C错误;
对于D,因为s2=×[s+(1-)2]+×[s+(2-)2],又=1=2,所以整理得10s2=9s+s,D正确.
三、填空题(本题共3小题,每小题5分,共15分)
12.某校有选修物化、物生、政史三种不同类别课程的学生共900人(假设每人只选修一种类别的课程),按照比例分配的分层随机抽样方法从中抽取20人参加数学调研检测.已知在这次检测中20人的数学平均成绩为119分,其中选修物化和物生类别课程学生的数学平均成绩为120分,选修政史类别课程学生的数学平均成绩为115分,则该校选修政史类别课程的学生人数为____________.
答案 180
解析 设这20人中选修政史类别课程的学生人数为x,
则115x+120×(20-x)=20×119,解得x=4,
由比例分配的分层随机抽样可知,该校选修政史类别课程的学生人数为×900=180.
13.已知我国某省二、三、四线城市数量之比为1∶3∶6,2022年3月份调查得知该省二、三、四线城市房产均价为0.8万元/平方米,方差为11.其中三、四线城市房产均价分别为1万元/平方米,0.5万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房产均价为________万元/平方米,二线城市房价的方差为________.
答案 2 29.9
解析 设二线城市房产均价为x万元/平方米,方差为y,
因为二、三、四线城市数量之比为1∶3∶6,二、三、四线城市房产均价为0.8万元/平方米,三、四线城市的房产均价分别为1万元/平方米,0.5万元/平方米,
所以x+×1+×0.5=0.8,
解得x=2,
由题意可得11=×[y+(2-0.8)2]+×[10+(1-0.8)2]+×[8+(0.5-0.8)2],解得y=29.9.
14.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,其变换后得到经验回归方程为=0.3x+4.则c=________.
答案 e4
解析 对y=cekx两边取对数得,ln y=ln(cekx)=kx+ln c,
所以=0.3,ln c=4 c=e4.
四、解答题(本题共5小题,共77分.解答应写出文字说明,证明过程或演算步骤)
15.(13分)某校100名学生期中考试化学成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)请根据频率分布直方图,估计这100名学生化学成绩的平均数(同一组中的数据用该组区间中点值代替)及中位数.
解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,
解得a=0.005.
(2)估计这100名学生化学成绩的平均数为
55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73,
设中位数为x,则0.005×10+0.04×10+0.03×(x-70)=0.5,
解得x≈71.67,故估计中位数为71.67.
16.(15分)某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200),第二组[200,300),第三组[300,400),第四组[400,500),第五组[500,600),第六组[600,700].由于工作中不慎将部分数据丢失,现有以下部分图表:
图1        图2
使用寿命 [100,200) [200,300) [300,400) [400,500) [500,600) [600,700]
频数 30 20
频率 0.2 0.4
(1)求图2中A的值;
(2)补全表格和图2中的频率分布直方图,并求图2中阴影部分的面积;
(3)为了某次展销会,用比例分配的分层随机抽样方法在使用寿命位于[400,600)内的产品中抽取5个作为样本,那么在[400,500)内应抽取多少个?
解 (1)由题意可知0.1=A×100,
所以A=0.001.
(2)补全表格.
使用寿命 [100,200) [200,300) [300,400) [400,500) [500,600) [600,700]
频数 20 30 40 80 20 10
频率 0.1 0.15 0.2 0.4 0.1 0.05
补全后的频率分布直方图如图所示,
阴影部分的面积为0.004×100+0.001×100=0.5.
(3)由比例分配的分层随机抽样的性质知,在[400,500)内应抽取5×=4(个).
17.(15分)某学校为了调查学生运动情况,抽取了100名学生调查学生是否喜欢体育锻炼,调查结果统计如表:
喜欢 不喜欢 合计
男生 10
女生 20
合计 100
已知在全部100人中随机抽取1人,抽到不喜欢体育锻炼的人的概率为0.4.
(1)请将上面的列联表补充完整;
(2)依据小概率值α=0.001的独立性检验,分析喜欢体育锻炼是否与性别有关?说明你的理由.
附:χ2=,n=a+b+c+d.
临界值表:
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解 (1)根据在全部100人中随机抽取1人,抽到不喜欢体育锻炼的人的概率为0.4,可得不喜欢体育锻炼的有40人,故可将列联表补充如下.
喜欢 不喜欢 合计
男生 40 10 50
女生 20 30 50
合计 60 40 100
(2)零假设为H0:喜欢体育锻炼与性别无关.因为χ2=≈16.667>10.828=x0.001,
所以根据小概率值α=0.001的独立性检验,推断H0不成立,即认为喜欢体育锻炼与性别有关.
18.(17分)近年来,国民经济的增长和社会结构的变化推动宠物饲养成为很多人精神消费的主要方式,使得近几年中国宠物市场规模逐年增长,如表为2018~2022年中国宠物市场规模y(单位:千亿元),其中2018~2022年对应的年份代码x依次为1~5.
年份代码x 1 2 3 4 5
宠物市场规模y/千亿元 1.22 1.34 1.78 2.21 2.95
(1)由表中数据可知,可用一元线性回归模型拟合y与x的关系,请用样本相关系数加以说明;
(2)求y关于x的经验回归方程,并预测2024年中国宠物市场规模.
参考数据:=1.9,iyi=32.83,≈1.41,≈3.162.
参考公式:样本相关系数r=,经验回归方程=+x中斜率和截距的最小二乘估计公式分别为=,=-.
解 (1)由题意得=3,=1.9,(xi-)2=10,iyi=32.83,≈1.41,
(xi-)(yi-)=iyi-5 =32.83-5×3×1.9=4.33,
∴r≈≈0.971.
∵y与x的样本相关系数近似为0.971,说明y与x的线性相关程度很强,从而可以用一元线性回归模型拟合y与x的关系.
(2)由(1)得===0.433,
=-=1.9-0.433×3=0.601,
∴y关于x的经验回归方程为=0.433x+0.601,
2024年对应的年份代码为7,代入=0.433x+0.601,
得=0.433×7+0.601=3.632,
∴预测2024年中国宠物市场规模为3.632千亿元.
19.(17分)噪声污染已经成为影响人们身体健康和生活质量的严重问题.为了解声音强度D(单位:dB)与声音能量I(单位:W·cm-2)之间的关系,将测量得到的声音强度D和声音能量I的数据作了初步处理,得到如图所示的散点图.
(1)根据散点图判断D=a1+b1I与D=a2+b2lg I哪一个适合作为声音强度D关于声音能量I的回归模型(给出判断即可,不必说明理由);
(2)求声音强度D关于声音能量I的非线性经验回归方程;
(3)假定当声音强度大于60 dB时,会产生噪声污染.城市中某点P处共受到两个声源的影响,这两个声源的声音能量分别是Ia和Ib,且+=1010.已知点P处的声音能量等于Ia与Ib之和.请根据(2)中的非线性经验回归方程,判断点P处是否受到噪声污染,并说明理由.
参考数据:=45.7,=-11.5,(Wi-)2=0.51,(Wi-)(Di-)=5.1,其中Wi=lg Ii,=i.
解 (1)D=a2+b2lg I更适合.
(2)设=W+,则
===10,
∴=-=45.7-10×(-11.5)=160.7,
∴D关于W的经验回归方程是=10W+160.7,
则D关于I的非线性经验回归方程是=10lg I+160.7.
(3)设点P处的声音能量为I1,则I1=Ia+Ib.
∵+=1010,
∴I1=Ia+Ib=10-10(Ia+Ib)
=10-10≥9×10-10,
当且仅当=,
即Ia=,Ib=时等号成立,
根据(2)中非线性经验回归方程,知点P处的声音强度D的预测值的最小值min=10lg(9×10-10)+160.7=10lg 9+60.7>60,
∴点P处会受到噪声污染.

延伸阅读:

标签:

上一篇:Unit 1 Let's be friends! 周测(无答案)

下一篇:河南省许昌市魏都区许昌市东城区新时代精英学校2024-2025六年级上学期开学英语试题(无答案)