2025年高考数学一轮复习-10.2-用样本的数字特征估计总体(课件+专项训练)(含解析)

(共76张PPT)
10.2 用样本的数字特征估计总体

1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
3.结合实例,能用样本估计总体的取值规律.
4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
CONTENTS
01
02
03
/目录
    
    知识·逐点夯实
   考点·分类突破
   课时·过关检测
01

1.总体百分位数的估计
(1)百分位数
定义 意义
百分 位数 一组数据的第p百分位数是这样一个值,它使得这组数据中  至少  有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值 反映该组数中小于或等于该百分位数的分布特点
至少 
(2)求一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据;
第2步:计算i=  n×p%  ;
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
n×p% 
2.总体集中趋势的估计
(1)中位数:将一组数据按大小依次排列,处于  最中间  位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
(2)众数:一组数据中出现次数  最多  的数据叫做这组数据的众数;
(3)平均数:一组数据的  算术  平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数 =  (x1+x2+…+xn)  .
提醒 (1)中位数是样本数据所占频率的等分线,不受少数极端值影响;(2)众数体现了样本数据的最大集中点,一组数据可能有n个众数,也可能没有众数;(3)与中位数、众数比较,平均数反映出样本数据的更多信息,对样本数据中的少数极端值更加敏感.
最中间 
最多 
算术 
(x1+x2+…+xn) 
3.总体离散程度的估计
(1)假设一组数据x1,x2,x3,…,xn的平均数为,则:
①标准差
s=;
②方差
s2=[(x1-)2+(x2-)2+…+(xn-)2].
(2)分层随机抽样的均值与方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为,样本方差为s2.
以分两层抽样的情况为例.假设第一层有m个数据分别为x1,x2,…,xm,平均数为,方差为;第二层有n个数据,分别为y1,y2,…,yn,平均数为,方差为.则=xi,=(xi-)2,=yi,=(yi-)2.
①则=+;
②s2={m[+(-)2]+n[+(-)2]}.

1.判断正误.(正确的画“√”,错误的画“×”)
(1)对一组数据来说,平均数和中位数总是非常接近. (  )
答案:(1)× 
(2)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数. (  )
答案:(2)√ 
(3)方差与标准差具有相同的单位. (  )
答案:(3)× 
(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变. (  )
答案:(4)√
2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是 (  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
解析:A 这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是=91.5,平均数==91.5.
3.为了弘扬体育精神,某校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分分别为10,8,a,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的第75百分位数为 (  )
A.8 B.9
C.8.5 D.9.5
解析:C 由题意可得=8,解得a=8,将这组数据按从小到大的顺序排列为6,7,8,8,8,8,9,10,因为8×75%=6为整数,所以这组数据的第75百分位数为=8.5,故选C.
4.(多选)下列说法正确的是 (  )
A.众数可以准确地反映出总体的情况
B.一组数据的平均数一定大于这组数据中的每个数据
C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D.一组数据的方差越大,说明这组数据的波动越大
解析:CD 对于A,众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得其无法客观反映总体特征,所以A错误;对于B,一组数的平均数不可能大于这组数据中的每一个数据,所以B错误;对于C,平均数、众数与中位数从不同的角度描述了一组数据的集中趋势,所以C正确;对于D,方差可以用来衡量一组数据波动的大小,方差越小,数据波动越小,方差越大,数据波动越大,所以D正确.

1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
2.平均数、方差的公式推广
若数据x1,x2,…,xn的平均数为,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a,方差为m2s2.

1.(2024·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为 (  )
A.0.01 B.0.1
C.1 D.10
解析:C 由结论2知,样本数据10x1,10x2,…,10xn的方差为102×0.01=1,故选C.
2.(多选)如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则下列说法正确的是 (  )
A.图中的x 的值为0.018
B.该班50 名学生期中考试数学成绩的众数是75
C.该班50 名学生期中考试数学成绩的中位数是75
D.该班50 名学生期中考试数学成绩的平均数是75
解析:AB 由频率分布直方图可得10×(0.006×3+0.010+x+0.054)=1,解得x=0.018,A正确;由结论1知,数学成绩的众数是75,B正确;设中位数为a,则0.22+×10×0.054=0.5,解得a≈75.2,C错误;45×0.06+55×0.06+65×0.1+75×0.54+85×0.18+95×0.06=74,D错误.故选A、B.
02

总体百分位数的估计
【例1】 (1)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是      ;(结果保留两位小数)
解析 (1)由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,因此80%分位数一定位于[120,130)内.因为120+×10≈124.44,所以此班的模拟考试成绩的80%分位数约为124.44.
答案 (1)124.44 
(2)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为      ,第86百分位数为      .
解析 (2)∵75%×20=15,∴第75百分位数为=14.5.∵86%×20=17.2,
∴第86百分位数为第18个数据17.
答案 (2)14.5 17
|解题技法|
1.总体百分位数的估计需要注意的两个问题
(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键;
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.
2.确定要求的p%分位数所在分组[A,B),由频率分布表或频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=A+组距×.


1.如图所示是某市3月1日至3月10日的最低气温(单位: ℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是 (  )
A.-2 B.0 C.1 D.2
解析:D 由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,∵共有10个数据,∴10×80%=8,是整数,则这10天最低气温的第80百分位数是=2.
2.已知100个数据的第75百分位数是9.3,则下列说法正确的是 (  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
解析:C 因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其他选项均不正确,故选C.
总体集中趋势的估计
【例2】 (多选)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是 (  )
A.频率分布直方图中第三组的频数为10
B.根据频率分布直方图估计样本的众数为75分
C.根据频率分布直方图估计样本的中位数为75分
D.根据频率分布直方图估计样本的平均数为75分
解析 分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73(分),故D错误.
答案 ABC
|解题技法|
求众数、中位数、平均数的方法
(1)众数:由定义知,一组数据中出现次数最多的数,即为众数,若有两个或几个数据出现的次数最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数;
(2)中位数:若一组数据为奇数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的数据就是这组数据的中位数;若一组数据为偶数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的两个数据的平均数就是这组数据的中位数;
(3)平均数:利用=xi求解.

1.下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:
396 275 268 225 168 166
176 173 188 168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,则下列数字特征没有改变的是 (  )
A.极差 B.中位数
C.众数 D.平均数
解析:C 在此组数据中增加一个比现有的最大值大25的数据后,所得的一组新数据从小到大排列为141,157,166,168,168,173,176,188,225,268,275,396,421.对于A,所得的一组新数据的极差为421-141=280,原来的这组数据的极差为396-141=255,故A不正确;对于B,原来的这组数据的中位数为=174.5,所得的一组新数据的中位数为176,故B不正确;对于C,原来的这组数据与所得的一组新数据的众数均为168,故C正确;对于D,设原来的这组数据的平均数为,则421>,所以所得的一组新数据的平均数>=,故D不正确.
2.(多选)2022年7月下旬,某省遭遇特大洪涝灾害,某品牌服饰公司第一时间向该省捐赠5 000万元物资以援助抗灾,该品牌随后受到消费者的青睐,如图为该品牌服饰某分店1~8月的销量(单位:件)情况.以下描述正确的是(  )
A.这8个月销量的极差为4 132
B.这8个月销量的中位数为2 499
C.这8个月中2月份的销量最低
D.这8个月中销量比前一个月增长最多的是7月份
解析:ACD 对于A,这8个月销量的极差为4 844-712=4 132,故A正确;对于B,这8个月的销量从小到大依次为712,1 433,1 533,1 952,2 822,
3 046,4 532,4 844,所以这8个月销量的中位数是=2 387,故B不正确;对于C,由题图可知,这8个月中2月份的销量最低,故C正确;对于D,由题图可知,这8个月中销量比前一个月增长最多的是7月份,增加了4 532-2 822=1 710,故D正确.
总体离散程度的估计
考向1 方差与标准差
【例3】 (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9
新设备 10.1 10.4 10.1 10.0 10.1
旧设备 9.8 10.0 10.1 10.2 9.7
新设备 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
解 (1)由表格中的数据易得:
=+10.0=10.0,
=+10.0=10.3,
=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,
=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否侧不认为有显著提高.
解 (2)由(1)中数据可得-=10.3-10.0=0.3,而2==,显然有->2成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
|解题技法|
1.标准差、方差描述了一组数据围绕平均数波动的情况.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
考向2 分层随机抽样的方差与标准差
【例4】 某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.
解 由已知条件可知高级职称教师的平均年龄为==45(岁),
高级职称教师年龄的方差为=×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,
所以该校中级职称和高级职称教师的平均年龄为=×38+×45≈39(岁),
该校中级职称和高级职称教师年龄的方差为s2=×[2+(38-39)2]+×[73+(45-39)2]≈20.67.
|解题技法|
计算分层随机抽样的方差的步骤
(1)确定,,,;

(2)确定;

(3)应用公式s2=[+(-)2]+[+(-)2],计算s2.


1.样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为 (  )
A. B.
C. D.2
解析:D 依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=×[(-1)2+02+12+22+(-2)2]=2,即所求的样本方差为2.
2.在高一入学时,某班班委统计了本班所有同学中考的体育成绩,并计算出平均分和方差.后来又转学来一位同学.若该同学中考的体育成绩恰好等于这个班级原来所有同学中考体育成绩的平均分,则下列说法正确的是 (  )
A.班级平均分不变,方差变小
B.班级平均分不变,方差变大
C.班级平均分改变,方差变小
D.班级平均分改变,方差变大
解析:A 设该班原来有n位同学,这n位同学中考体育成绩的平均分和方差分别为x,y,则转学来一位同学后,该班所有同学中考体育成绩的平均分==x,方差s2=×(yn+0)=y-<y,所以转学来一位同学后,班级平均分不变,方差变小,故选A.
3.某学校有高中生500人.其中男生320人,女生180人.为了获得全体高中生身高的信息,按照分层随机抽样原则抽取样本,男生样本量为32,女生样本量为18,通过计算得男生身高样本均值为173.5 cm,方差为17,女生身高样本均值为163.83 cm,方差为30.03,求所有数据的样本均值和方差.
解:由题意得=×173.5+×163.83≈170.02(cm),
s2=×{[32×17+32×(173.5-170.02)2]+[18×30.03+18×(163.83-170.02)2]}≈43.24.
03

1.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据的 (  )
A.众数为2 B.平均数为2.5
C.方差为1.6 D.标准差为4
解析:C 由题中数据可得,众数为2和3,故A错误;平均数为==3,故B错误;方差s2==1.6,标准差为≠4,故C正确,D错误.
2.甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是 (  )
A.极差 B.平均数
C.中位数 D.都不相同
解析:B 由题中数据的分布,可知极差不同,甲的中位数为=18.5,乙的中位数为=16,==,==,所以甲、乙的平均数相同.
3.甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中,不正确的是 (  )
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数
解析:D 甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,∴A正确;=191>110=,∴甲班成绩不如乙班稳定,即甲班成绩波动较大,∴C正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,∴B正确;由题表看不出两班学生成绩的众数,∴D不正确.
4.某市教育部门组织高中教师在暑假期间进行培训,培训后统一举行测试.随机抽取100名教师的测试成绩(单位:分,满分100分)进行统计,得到如图所示的频率分布折线图,则下列说法正确的是(  )
A.这100名教师的测试成绩的极差是20分
B.这100名教师的测试成绩的众数是90分
C.这100名教师的测试成绩的中位数是87.5分
D.这100名教师中测试成绩不低于90分的人数占比超过50%
解析:C 对于A,由题意知,这100名教师的测试成绩的最高分与最低分无法确定,故极差无法确定,故A错误;对于B,由题图易知这100名教师的测试成绩的众数为87.5分,故B错误;对于C,设这100名教师的测试成绩的中位数为x分,则(0.02+0.04)×5+(x-85)×0.08=0.5,解得x=87.5,故C正确;对于D,这100名教师中测试成绩不低于90分的人数占比为(0.03+0.03)×5×100%=30%,30%<50%,故D错误.故选C.
5.(多选)下表为2022年某煤炭公司1~10月份的煤炭生产量:
月份 1 2 3 4 5 6 7 8 9 10
产量(单位:万吨) 23 25 24 17.5 17.5 21 26 29 30 27
则下列结论正确的是 (  )
A.极差为12.5万吨 B.平均数为24万吨
C.中位数为24万吨 D.众数为17.5万吨
解析:ABD 将表格中的数据由小到大排列依次为17.5,17.5,21,23,24,25,26,27,29,30.极差为30-17.5=12.5(万吨),A正确;平均数为=24(万吨),B正确;中位数为=24.5(万吨),C错误;众数为17.5(万吨),D正确.
6.(多选)若甲组样本数据x1,x2,…,xn(数据各不相同)的平均数为2,方差为4,乙组样本数据3x1+a,3x2+a,…,3xn+a的平均数为4,则下列说法正确的是 (  )
A.a的值为-2
B.乙组样本数据的方差为36
C.两组样本数据的中位数一定相同
D.两组样本数据的极差不同
解析:ABD 由题意可知,3×2+a=4,a=-2,故A正确;乙组样本数据方差为9×4=36,故B正确;设甲组样本数据的中位数为xi,则乙组样本数据的中位数为3xi-2,所以两组样本数据的中位数不一定相同,故C错误;甲组数据的极差为xmax-xmin,则乙组数据的极差为(3xmax-2)-(3xmin-2)=3(xmax-xmin),所以两组样本数据的极差不同,故D正确.
7.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲     ,乙     ,丙     .
解析:甲、乙、丙三个厂家从不同角度描述了一组数据的特征,甲:该组数据8出现的次数最多;乙:该组数据的平均数==8;丙:该组数据的中位数是=8.
答案:众数 平均数 中位数
8.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是      .
解析:由30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
9.已知一个样本的样本容量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为,方差为s2,则=      ,s2=      .
解析:设10个数据为x1,x2,…,x9,15,则==15,
又s2=,=3,所以s2==.
答案:15 
10.首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);
解:(1)由频率分布直方图的性质,可得(0.004+a+0.013+0.014+0.016)×20=1,
解得a=0.003.
所以及格率为(0.016+0.014+0.003)×20=0.66=66%.
(2)估计该校学生联考数学成绩的第80百分位数;
解:(2)得分在110分以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,
得分在130分以下的学生所占比例为0.66+0.014×20=0.94,
所以第80百分位数位于[110,130)内,
由110+20×=120,估计第80百分位数为120分.
(3)估计该校学生联考数学成绩的众数、平均数.
解:(3)由图可得,众数估计值为100分.
平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).

11.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为10,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 (  )
A.10 B.11
C.12 D.13
解析:D 设5个数据分别是x1,x2,x3,x4,x5,则由方差为4得(x1-10)2+(x2-10)2+(x3-10)2+(x4-10)2+(x5-10)2=20,显然最大值不可能大于14,假如x5≥15,则(x5-10)2≥25,不合题意,若最大值为14,不妨设x5=14,(x5-10)2=16,则(x1-10)2,(x2-10)2,(x3-10)2,(x4-10)2只能一个0,两个1,还有一个是4,不合题意,若最大值为13,不妨设x5=13,此时如x1=7,x2=9,x3=10,x4=11,满足题意.故选D.
12.某班成立了A,B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组的平均成绩为130分,方差为115,B组的平均成绩为110分,方差为215.则在这次测试中全班学生的平均成绩和方差分别为     ,      .
解析:依题意=130,=115,=110,=215,∴=×130+×110=115(分),∴全班学生的平均成绩为115分.全班学生成绩的方差为s2=[+(-)2]+[+(-)2]=×(115+225)+×(215+25)=85+180=265.
答案:115 265
13.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为      秒.
解析:因为=0.55=55%,=0.85=85%,所以70%分位数在[16,17)内,所以70%分位数约为16+=16.5(秒).
答案:16.5
14.某种治疗心脏病的中药产品的质量以其质量指标值衡量,质量指标值越大表明质量越好.为了提高中药产品的质量,我国医疗科研专家攻坚克难,研发出A,B两种新配方,在这两种新配方生产的产品中随机抽取数量相同的样本,测量这些产品的质量指标值,规定质量指标值小于85为废品,在[85,115)为一等品,不小于115为特等品.现把测量数据整理如下,其中B配方的样本中有6件废品.
A配方的频数分布表
质量指标值 [75,85) [85,95) [95,105) [105,115) [115,125]
频数 8 a 36 24 8
(1)求实数a,b的值;
解:(1)依题意,A,B两种配方的样本容量相同,设为n.
由B配方的样本中有6件废品,结合B配方的频率分布直方图,得=0.006×10,解得n=100.
∴a=100-(8+36+24+8)=24.
由(0.006+b+0.038+0.022+0.008)×10=1,得b=0.026.
∴实数a,b的值分别为24,0.026.
(2)试确定A配方和B配方哪一种更好.(说明:在统计方法中,同一组数据常用该组区间的中点值作代表)
解:(2)由(1)及A配方的频数分布表得,A配方质量指标值的样本平均数=×(80×8+90×24+100×36+110×24+120×8)=×(200×8+200×24+100×36)=100,A配方质量指标值的样本方差=×[(-20)2×8+(-10)2×24+0×36+102×24+202×8]=112.
由(1)及B配方的频率分布直方图得,B配方质量指标值的样本平均数=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100,
B配方质量指标值的样本方差=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
综上,=,>,
即A,B两种配方质量指标值的样本平均数相等,但A配方质量指标值没有B配方质量指标值稳定,
∴B配方更好.
15.中国独有的文书工具,即笔、墨、纸、砚,有文房四宝之名,起源于南北朝时期.其中宣纸是文房四宝的一种,宣纸“始于唐代,产于泾县”,因唐代泾县隶属宣州管辖,故因地得名宣纸.宣纸按质量等级分为正牌(优等品)、副牌(合格品)、废品三等.某公司生产的宣纸为纯手工制作,年产宣纸10 000刀(1刀=100张),该公司按照某种质量指标x给宣纸确定等级如下表所示:
x的范围 (44,48]∪(52,56] (48,52] [0,44]∪(56,60]
质量等级 副牌 正牌 废品
在该公司所生产的宣纸中随机抽取了一刀进行检验,得到频率分布直方图如图所示,已知每张正牌宣纸的利润为15元,副牌宣纸的利润为8元,废品的利润为-20元.
(1)试估计该公司的年利润;
解:(1)由频率分布直方图得,一刀宣纸有正牌100×0.1×4=40(张),有副牌100×0.05×4×2=40(张),有废品100×0.025×4×2=20(张),
∴该公司一刀宣纸的利润的估计值为40×15+40×8-20×20=520(元),
∴估计该公司的年利润为520万元.
(2)市场上有一种售价为100万元的机器可以改进宣纸的生产工艺,但这种机器的使用寿命为一年,只能提高宣纸的质量,不能增加宣纸的年产量.据调查这种机器生产的宣纸的质量指标x如下表所示:
x的范围 (-2,+2) (-6,+6)
频率 0.682 7 0.954 5
其中为质量指标x的平均值,但是由于人们对传统手工工艺的认可,改进后的正牌和副牌宣纸的利润都将下降3元/张,请问该公司是否购买这种机器,请你为公司提出合理建议,并说明理由.(同一组的数据用该组区间的中点值作代表)
解:(2)由频率分布直方图得,=42×0.025×4+46×0.05×4+50×0.1×4+54×0.05×4+58×0.025×4=50.
这种机器生产的宣纸的质量指标x如下表所示:
x的范围 (48,52) (44,56)
频率 0.682 7 0.954 5
∴一刀宣纸中正牌的张数估计为100×0.682 7=68.27,
废品的张数估计为100×(1-0.954 5)=4.55,
副牌的张数为100×(0.954 5-0.682 7)=27.18,
∴一刀宣纸的利润为68.27×12+27.18×5-4.55×20=864.14(元),
∴改进后该公司的年利润为864.14-100=764.14(万元),
∵764.14>520,∴建议该公司购买这种机器.10.2-用样本的数字特征估计总体-专项训练
1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为(  )
A.2        B.4
C.6  D.8
2.据某地区气象局发布的气象数据,未来十天内该地区每天最高温度(单位:℃)分别为31,29,24,27,26,25,24,26,26,23,则这组数据的第40百分位数为(  )
A.27  B.26.5
C.25.5  D.25
3.某校高一年级开设了校本课程,现从甲、乙两班各随机抽取了5名学生校本课程的学分,统计如下表所示,s1,s2分别表示甲、乙两班抽取的5名学生校本课程学分的标准差,则(  )
甲 8 11 14 15 22
乙 6 7 10 23 24
A.s1>s2 B.s1<s2
C.s1=s2 D.s1,s2的大小不能确定
4.某市为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为(  )
A.8.25  B.8.45
C.8.65  D.8.85
5.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(  )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中正确的是(  )
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数
7.为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样方法,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间的均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为    .
8.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为    秒.
9.已知样本x1,x2,…,xn的平均数为x,样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0<a<,则n,m(n,m∈N*)的大小关系为(  )
A.n=m  B.n≥m
C.n<m  D.n>m
10.(多选)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
11.气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于22 ℃”,现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,总体均值为24;
③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.
则肯定进入夏季的地区的序号为    .
12.某种治疗心脏病的中药产品的质量以其质量指标值衡量,质量指标值越大表明质量越好.为了提高中药产品的质量,我国医疗科研专家攻坚克难,研发出A,B两种新配方,在这两种新配方生产的产品中随机抽取数量相同的样本,测量这些产品的质量指标值,规定质量指标值小于85为废品,在[85,115)为一等品,不小于115为特等品.现把测量数据整理如下,其中B配方的样本中有6件废品.
A配方的频数分布表
质量指标值 [75,85) [85,95) [95,105) [105,115) [115,125]
频数 8 a 36 24 8
(1)求实数a,b的值;
(2)试确定A配方和B配方哪一种更好.(说明:在统计方法中,同一组数据常用该组区间的中点值作代表)
参考答案与解析
1.D 根据方差的性质可知,若数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.
2.C 先将这组数据按照从小到大进行排序,分别为23,24,24,25,26,26,26,27,29,31,又10×40%=4,所以该组数据的第40百分位数为排序后的第4个数和第5个数的平均数,即=25.5,故选C.
3.B 甲班抽取的5名学生校本课程学分的平均数=×(8+11+14+15+22)=14,乙班抽取的5名学生校本课程学分的平均数=×(6+7+10+23+24)=14.甲班抽取的5名学生校本课程学分的方差=×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22,∴s1=,乙班抽取的5名学生校本课程学分的方差=×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62,∴s2=.∴s1<s2,故选B.
4.B 由频率分布直方图,得月均用水量在5.2吨以下的居民用户所占的比例为4×0.06=0.24,月均用水量在9.2吨以下的居民用户所占的比例为4×(0.06+0.08)=0.56>0.5,故中位数落在区间[5.2,9.2)内.设样本的中位数为x,则0.24+(x-5.2)×0.08=0.5,所以x=5.2+=8.45,即样本的中位数为8.45,由样本估计总体的思想,估计该市居民月均用水量的中位数为8.45,故选B.
5.B 对于A,讲座前问卷答题的正确率的中位数是=72.5%,所以A错误;对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.
6.ABC 甲、乙两班学生成绩的平均数都是135,故两班学生成绩的平均水平相同,∴A正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,∴B正确;=191>110=,∴甲班成绩不如乙班稳定,即甲班成绩波动较大,∴C正确;由题表看不出两班学生成绩的众数,∴D不正确.故选A、B、C.
7.0.94 解析:该地区中学生每天睡眠时间的平均数为=8.4(小时),则该地区中学生每天睡眠时间的方差为×[1+(9-8.4)2]+×[0.5+(8-8.4)2]=0.94.
8.16.5 解析:因为=0.55=55%,=0.85=85%,所以70%分位数在[16,17)内,所以70%分位数约为16+=16.5(秒).
9.C 由题意得z=(nx+my)=x+y,∴a=,∵0<a<,∴0<<,又n,m∈N*,∴2n<n+m,∴n<m.故选C.
10.BD 若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为,1,2,3,4,5,8的平均数为,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.
11.①③ 解析:由统计知识,①甲地:5个数据的中位数为24,众数为22,可知①符合题意;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27,可知其不满足连续5天的日平均温度不低于22 ℃,所以不符合题意;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若某一天的气温低于22 ℃,此时可取21 ℃,总体方差就大于10.8.所以满足题意.
12.解:(1)依题意,A,B两种配方的样本容量相同,设为n.
由B配方的样本中有6件废品,结合B配方的频率分布直方图,得=0.006×10,解得n=100.
∴a=100-(8+36+24+8)=24.
由(0.006+b+0.038+0.022+0.008)×10=1,得b=0.026.
∴实数a,b的值分别为24,0.026.
(2)由(1)及A配方的频数分布表得,A配方质量指标值的样本平均数=×(80×8+90×24+100×36+110×24+120×8)=×(200×8+200×24+100×36)=100,
A配方质量指标值的样本方差=×[(-20)2×8+(-10)2×24+0×36+102×24+202×8]=112.
由(1)及B配方的频率分布直方图得,B配方质量指标值的样本平均数=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100,
B配方质量指标值的样本方差=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
综上,=,>,
即A,B两种配方质量指标值的样本平均数相等,但A配方质量指标值没有B配方质量指标值稳定,
∴B配方更好.

延伸阅读:

标签:

上一篇:Unit 4 My home Part A Let's spell 同步练习(含答案)

下一篇:河北省保定市徐水区2023-2024六年级下学期期末英语试题(图片版无答案无听力原文无听力音频)