《预防医学统计学ppt课件(正态分布及其应用).ppt》由会员分享,可在线阅读,更多相关《预防医学统计学ppt课件(正态分布及其应用).ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、预防医学(医学统计学)实习预防医学(医学统计学)实习实习二:正态分布及其应用实习二:正态分布及其应用2023/1/311实习纲要正态分布的概念正态分布的图形特征正态曲线下面积的分布规律标准正态转换与标准正态分布的特征正态分布的应用2023/1/312一、正态分布的概念 在医学卫生领域中,许多变量的频数分布是中间频数多,两边频数少,且左右对称。比如,考察一群人的身高,个体的身高是一个随机变量,其取值特点是:在平均身高附近的人较多,特别高和特别矮的人较少。一个班的一次考试成绩、测量误差等均有类似的特征.高斯在研究误差理论时曾用它来刻画误差,因此很多文献中亦称之为高斯分布(Gaussian dist
2、ribution)。2023/1/313 式中式中 为实数为实数,0.0.则称则称X X服从参数为服从参数为 ,2 2的的正态分正态分布布,记为记为N(N(,2 2).).可表为可表为X XN(N(,2 2).图象见右上角图象见右上角若随机变量若随机变量X X的密度函数为的密度函数为一一.一般正态分布一般正态分布 1.1.定义定义2023/1/314二、正态分布图形特征 1、高峰位于中央,两侧逐渐下降并对称,高峰位于中央,两侧逐渐下降并对称,曲线两端不与横轴相交曲线两端不与横轴相交2 2、以均数为中心,左右对称、以均数为中心,左右对称3 3、正态分布有两个参数、正态分布有两个参数:(1)(1)
3、位置参数位置参数 (2)(2)形态参数形态参数 4 4、正态分布曲线下的面积有、正态分布曲线下的面积有 一定的分布规律一定的分布规律 2023/1/3153 3、正态分布的两个参数、正态分布的两个参数(1)位置参数:决定高峰的位置位置参数:决定高峰的位置 当当 一定时,一定时,越大,曲线沿横轴向右移;越大,曲线沿横轴向右移;越小,曲线沿横轴向左移。越小,曲线沿横轴向左移。(2)形态参数:决定曲线的形态形态参数:决定曲线的形态当当 一定时,一定时,越大越大,曲线越平坦曲线越平坦;越小,曲线越陡峻越小,曲线越陡峻。3 3 1 1 2 22023/1/316三、正态曲线下面积的分布规律三、正态曲线下
4、面积的分布规律 正态曲线与正态曲线与X X轴所夹的面积恒等于轴所夹的面积恒等于1 1或或100%100%面积总面积总等于等于1 12023/1/317已知:已知:X X服从均数为服从均数为 ,标准差为,标准差为 的正态分的正态分布,试估计布,试估计X X取值在取值在 ,1.96 1.96,2.582.58区间上的概率区间上的概率95.00%-1.96 +1.962.5%2.5%2023/1/318 -+的区间占总面积的的区间占总面积的68.271.96的区间占总面积的的区间占总面积的952.58的区间占总面积的的区间占总面积的991232023/1/319四、四、标准正态分布标准正态分布 参数
5、参数 0 0,2 21 1的正态分布称为的正态分布称为标准正态标准正态分布,记作分布,记作XN(0,1)XN(0,1)。其其密度函数密度函数为为2023/1/31102 2、标准正态分布曲表、标准正态分布曲表 3 3 2 2 1 0 1 0 1 1 2 2 3 3 (u)(u):表示标准正态分布曲线下区间(,u)之间的面积,即对应u值左侧标准正态分布曲线下面积。附表12023/1/3111 查表确定标准正态分布曲线下的面查表确定标准正态分布曲线下的面积时必须注意:积时必须注意:(1 1)当)当,和和X X已知时,先按已知时,先按u u变变换公式求得换公式求得u u值,再用值,再用u u值查表;
6、值查表;2023/1/3112 当当,和和X X未知时,用样本均数和未知时,用样本均数和样本标准差代替求样本标准差代替求u u值。值。2023/1/3113曲线下对称曲线下对称于于0的区间,的区间,面积相等;面积相等;a.曲线下横轴曲线下横轴上的总面积上的总面积为为100或或1。b.(2 2)查查表表时时,可可以以利利用用标标准准正正态态分分布布的两个特征:的两个特征:(u)=1-(-u)2023/1/3114五、正态分布的应用1、估计频数分布2 2、制定医学参考值范围、制定医学参考值范围3、质量控制4、统计处理方法的基础2023/1/31152、医学参考值范围的制定医学参考值:医学参考值:指
7、绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标所在范围。正常人正常人:排除了对所研究指标有影响的疾病和有关因素的同质的人群2023/1/3116 95 95:1.645S1.645S 99 99:2.326S2.326S 9595:1.645S1.645S9999:2.326S2.326S单侧单侧 95 95:1.96S1.96S 99 99:2.58S2.58S双侧双侧 1 1、正态分布法、正态分布法 (1)1)适适用用范范围围:(近近似似)正正态态分分布布或或对对数数正正态态分布资料分布资料 (2)(2)计算公式计算公式:下限下限上限上限2023/1/3117 2 2、百分位
8、数法、百分位数法(1)(1)适用范围:适用范围:适用任何分布适用任何分布类型的资料类型的资料 2023/1/3118 (2)(2)计算公式:计算公式:上限上限 9595:P95:P95 99 99:P99:P5:P5 99 99:P1:P1单侧:9595:P2.5:P2.5P97.5P97.59999:P0.5:P0.5P99.5P99.5双侧:2023/1/3119通常依据医学专业知识确定单双侧,例如:血清总胆固醇无论过低或过高均属异常,应采用双侧制定上下侧界值;血清转氨酶仅过高异常,应采用单侧制定上侧界值;肺活量仅过低异常,应采用单侧制定下侧界值。通常使用的医学参考值范围有90%,95%,
9、99%;最常用为95%。2023/1/3120 抽样调查某市抽样调查某市45-5545-55岁健康男性居民的血脂水平,岁健康男性居民的血脂水平,184184名名45-5545-55岁健康男性居民的血清总胆固醇的岁健康男性居民的血清总胆固醇的X=4.84mmol/LX=4.84mmol/L,S=0.96mmol/LS=0.96mmol/L,已知健康人的,已知健康人的血清总胆固醇服从正态分布。血清总胆固醇服从正态分布。(1 1)估计该市)估计该市45-5545-55岁健康男性居民的血清总胆固岁健康男性居民的血清总胆固醇的醇的95%95%参考值范围;参考值范围;(2 2)估计该市)估计该市45-55
10、45-55岁健康男性居民中,血清总胆岁健康男性居民中,血清总胆固醇低于固醇低于3.80 mmol/L3.80 mmol/L所占的比例。所占的比例。补充习题2023/1/3121(1)血清胆固醇95%参考值范围:x1.96s=4.841.960.96=(2.96,6.72)(mmol/Lmmol/L)即该市即该市45-5545-55岁健康男性居民的血清总胆固醇的岁健康男性居民的血清总胆固醇的95%95%参考值范围为(参考值范围为(2.96,6.72)(mmol/Lmmol/L)2023/1/3122 (2)(2)3.803.804.844.84 u=u=1.081.08 0.96 0.96 (u)(u)=(-1.08)=0.1401(-1.08)=0.1401即血清总胆固醇低于即血清总胆固醇低于3.80 mmol/L3.80 mmol/L所占的比所占的比例为例为14.01%14.01%。2023/1/3123