人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件

出处:老师板报网 时间:2022-10-26

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件1

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件2

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件3

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件4

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件5

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件6

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件7

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件8

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件9

人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件10

试读已结束,还剩23页未读,您可下载完整版后进行离线阅读

《人教版高中·高二数学选修2-3《回归分析的基本思想及其初步应用》(第3.1课时)PPT课件》是由用户上传到老师板报网,本为文库资料,大小为952.76 KB,总共有33页,格式为pptx。授权方式为VIP用户下载,成为老师板报网VIP用户马上下载此课件。文件完整,下载后可编辑修改。

  • 文库资料
  • 33页
  • 952.76 KB
  • VIP模板
  • pptx
  • 数字产品不支持退货
单价:14.00 会员免费

讲解人:XXX时间:2020.6.1PEOPLE\'SEDUCATIONPRESSHIGHSCHOOLMATHEMATICSELECTIVE2-33.1回归分析的基本思想及其初步应用第3章统计案例人教版高中数学选修2-3在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为:画散点图求回归直线方程用直线方程进行预报课前导入函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习对具有相关关系的两个变量进行统计分析的一种常用方法——回归分析.提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?课前导入探究对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),我们知道回归直线y=bx+a的斜率和截距的最小二乘估计分别为ˆˆˆniii=1n2ii=1(x-x)(y-y)b=,(x-x)a=y-bx,新知探究ˆˆˆniii=1n2ii=1(x-x)(y-y)b=,(x-x)a=y-bx,其中nniii=1i=111x=x,y=y,(x,y)nn称为样本点的中心,你能推导出这两个计算公式吗?回归直线过样本点的中心新知探究nniii=1i=111x=x,y=y,(x,y)nn从已经学过的知识我们知道,斜距和斜率分别是使aˆbˆˆiiiiQ(α,β)=y-y=y-(βx+α)取最小时的值.由于α,βn2iii=1Q(α,β)=[y-βx-(y-βx)+(y-βx)-α]n2iiiii=12{[y-βx-(y-βx)]+2[y-βx-(y-βx)][(y-βx)-α]+[(y-βx)-α]}新知探究aˆbˆˆiiiiQ(α,β)=y-y=y-(βx+α)α,βn2iii=1Q(α,β)=[y-βx-(y-βx)+(y-βx)-α]n2iiiii=12{[y-βx-(y-βx)]+2[y-βx-(y-βx)][(y-βx)-α]+[(y-βx)-α]}niii=1niii=1[y-βx-(y-βx)](y-βx-α)=(y-βx-α)[y-βx-(y-βx)]注意到nniii=1i=1=(y-βx-α)[y-βx-n(y-βx)]=(y-βx-α)[ny-nβx-n(y-βx)]=0,nn2iiiii=1i=12=[y-βx-(y-βx)]+2[y-βx-(y-βx)](y-βx-α)+n(y-βx-α),继续答题新知探究n22iii=1Q(α,β)=[y-βx-(y-βx)]+n(y-βx-α),因此22nnn22iiiii=1i=1i=1=β(x-x)-2β(x-x)(y-y)+(y-y)+n(y-βx-α)2nn22iiiin2i=1i=1inn22i=1iii=1i=12nii=1(x-x)(y-y)[(x-x)(y-y)]=n(y-βx-α)+(x-x)β--(x-x)(x-x)+(y-y)niii=1niii=1[y-βx-(y-βx)](y-βx-α)=(y-βx-α)[y-βx-(y-βx)]注意到nniii=1i=1=(y-βx-α)[y-βx-n(y-βx)]=(y-βx-α)[ny-nβx-n(y-βx)]=0,nn2iiiii=1i=12=[y-βx-(y-βx)]+2[y-βx-(y-βx)](y-βx-α)+n(y-βx-α),n22iii=1Q(α,β)=[y-βx-(y-βx)]+n(y-βx-α),因此22nnn22iiiii=1i=1i=1=β(x-x)-2β(x-x)(y-y)+(y-y)+n(y-βx-α)2nn22iiiin2i=1i=1inn22i=1iii=1i=12nii=1(x-x)(y-y)[(x-x)(y-y)]=n(y-βx-α)+(x-x)β--(x-x)(x-x)+(y-y)niii=1n2ii=1(x-x)(y-y)β=(x-x)这正是我们所要推导的公式.在上式中,后两项和无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0,即有α,β新知探究niii=1n2ii=1(x-x)(y-y)β=(x-x)α,β从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:例题1编 号 1 2 3 4 5 6 7 8身高/cm165165157170175165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.新知探究解答第一步:画散点图020406080150155160165170175180身高/cm体重/kg新知探究020406080150155160165170175180身高/cm体重/kg第二步:求回归方程第三步:代值计算计算器得:故线性回归方程:当x=172时,0.849.b-85.712,aˆˆ85.712.-0.849xyˆˆy0.849172-85.71260.316(kg)新知探究0.849.b-85.712,aˆˆ85.712.-0.849xyˆˆy0.849172-85.71260.316(kg)020406080150155160165170175180身高/cm体重/kg显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重在60.316kg左右,下图中的样本点和回归直线的相互位置说明了这一点.探究高为172cm的女大学生的体重一定是60.316kg吗?如果不是,其原因是什么?新知探究020406080150155160165170175180身高/cm体重/kg由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回归模型y=bx+a+e来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差.通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)=2>0,这样线性回归的完整表达式为y=bx+a+eE(e)=0,D(e)=2.新知探究注意存在误差的原因(1)随机误差,其大小取决于随机误差的方差.在线性回归模型中,随机误差e的方差2越小,用bx+a预报真实值y的精度越高.(2)和为斜率和截距的估计值,它们与真实值a和b之间也存在误差.bˆaˆ要牢记!新知探究bˆaˆ探究在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?在实际应用中,我们用回归方程aˆxbˆyˆ中的估计bx+a.由于随机误差e=y-(bx+a),所以是e的估计值.对于样本点(x1,y1),(x2,y2),…,(xn,yn)yˆyˆ-yeˆ新知探究而言,它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为n,12...,,,i,aˆxbˆyyˆyeˆiiiiieˆ称为相应于点(xi,yi)的残差(residual).要牢记!aˆxbˆyˆyˆyˆ-yeˆn,12...,,,i,aˆxbˆyyˆyeˆiiiiieˆ思考  如何发现数据中的错误?如何衡量模型的拟合效果?(1)可以利用残差图来分析残差特性;(2)可以利用.ˆˆnn22iii2i=1i=1nn22iii=1i=1(y-y)(y-y)R=1-=(y-y)(y-y)来刻画回归的效果.何为残差图?新知探究ˆˆnn22iii2i=1i=1nn22iii=1i=1(y-y)(y-y)R=1-=(y-y)(y-y)残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.0编号12345671020304050607080-10-20-30-40-50-6090100要牢记!新知探究对R2的理解(1)在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.(2)对于已经获取的样本数据,R2表达式中的为确定的数.因此R2越大,意味着残差平方和越小,即模型的拟合效果越好;反之,越差.n1i2i)y-(yn1i2i)y-(y要牢记!新知探究n1i2i)y-(yn1i2i)y-(y用身高预报体重时,需要注意以下问题(1)回归方程只适用于我们所研究的样本总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.新知探究建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常,若有异常,检查数据是否有误,或模型是否合适等.要牢记!新知探究为了对x、Y两个变量进行统计分析,现有以下两种线性模型和试比较哪一个模型拟合的效果更好.例题2关于X与Y有如下数据:  x24568y3040605070ˆy=6.5x+17.5ˆy=7x+17新知探究ˆy=6.5x+17.5ˆy=7x+17分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.ˆ52ii2i=1152ii=1(y-y)155R=1-=1-=0.8451000(y-y)22R=1-ˆ52iii=152ii=1(y-y)180=1-=0.821000(y-y)84.5%>82%,所以甲选用的模型拟合效果较好.解答新知探究ˆ52ii2i=1152ii=1(y-y)155R=1-=1-=0.8451000(y-y)22R=1-ˆ52iii=152ii=1(y-y)180=1-=0.821000(y-y)1.某校有学生2000人,其中高三学生500人,为了了解学生身体素质情况,采用按年级分层抽样的方法,从该学生中抽取一个200人的样本,则样本中高三学生的人数为_________.解析:本题考查抽样的方法.由已知抽样比200/2000=1/10,故样本中高三学生数为500*(1/10)=50.课堂练习2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ˆˆy=bx+a.课堂练习ˆˆy=bx+a.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解析:(1)如下图01234567012345产量能耗课堂练习66.54.5645342.53(2)yxin1ii4.546543x3.544.5432.5y866543i2222n1i2xˆ266.5-44.53.566.5-63b===0.786-44.586-81ˆˆa=Y-bX=3.5-0.74.5=0.35故线性回归方程为y=0.7x+0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35.课堂练习66.54.5645342.53(2)yxin1ii4.546543x3.544.5432.5y866543i2222n1i2xˆ266.5-44.53.566.5-63b===0.786-44.586-81ˆˆa=Y-bX=3.5-0.74.5=0.351.选择(1)下列说法中正确的有:()①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(由函数关系),在散点图上各个点均在一条直线上A.B.C.D.①②②③①③①②③C课堂练习(2)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是()A.模型Ⅰ的相关系数r为0.98B.模型Ⅱ的相关系数r为0.80C.模型Ⅲ的相关系数r为0.50D.模型Ⅳ的相关系数r为0.25A课堂练习(3)对有线性相关关系的两个变量建立的回归直线方程中,回归系数()A.可以小于0B.小于0C.能等于0D.只能等于0axbyˆˆˆbˆA课堂练习axbyˆˆˆbˆ2.解答题(1)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y),数据如下:学生号12345678910x12010811710410311010410599108y84648468696869465771试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系?课堂练习查表得自由度为10-2=8相应的相关关系临界值由知,两次数学考试成绩有显著性的线性相关关系.101i2i116584x101i2i47384y107.8x68y73796yx101iii易得则相关系数为解答227379610107.868r0.7506(11658410107.8)(473841068)0.05r0.60210.05rr课堂练习101i2i116584x101i2i47384y107.8x68y73796yx101iii227379610107.868r0.7506(11658410107.8)(473841068)0.05r0.60210.05rr  1.数学知识(1)建立回归模型及残差图分析的基本步骤;(2)不同模型拟合效果的比较方法;(3)相关指数和残差的分析.  2.数学思想数形结合的思想,化归思想及整体思想.  3.数学方法数形结合法,转化法,换元法.课堂小结讲解人:XXX时间:2020.6.1PEOPLE\'SEDUCATIONPRESSHIGHSCHOOLMATHEMATICSELECTIVE2-3感谢你的聆听第3章统计案例人教版高中数学选修2-3

返回首页
X