《粒子物理与核物理实验中的数据分析.pptx》由会员分享,可在线阅读,更多相关《粒子物理与核物理实验中的数据分析.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023-05-161粒子物理与核物理实验中的粒子物理与核物理实验中的数据分析数据分析杨振伟杨振伟清华大学清华大学第二讲第二讲:基本概:基本概念(续)念(续)2023-05-162随机变量与概率密度函数随机变量与概率密度函数假设实验结果假设实验结果为为 x (记作样本空间中元素记作样本空间中元素)的概率为的概率为那么概率密度函数那么概率密度函数 p.d.f.定义定义为为 f(x),它对全部样本空间,它对全部样本空间S 满满足足定义累积分布函数为定义累积分布函数为对于离散型随机变量对于离散型随机变量 分位数、中分位数、中值与模与模2023-05-163分位分位点点 x 定义为随机变量定义为随机变
2、量 x 的值,它使得的值,它使得 这里这里 0 1。因此可以容易求出分位点。因此可以容易求出分位点随机变量随机变量 x 的的中值中值定义为定义为 随机变量随机变量 x 被观测到大于或小于中值的概率是相等的。被观测到大于或小于中值的概率是相等的。模模定义为使概率密度函数值达到极大的随机变量值。定义为使概率密度函数值达到极大的随机变量值。2023-05-164直方图与概率密度函数直方图与概率密度函数概率密度函数概率密度函数 p.d.f.就是拥有无穷大样本,区间宽度为零,就是拥有无穷大样本,区间宽度为零,而且归一化到单位面积的而且归一化到单位面积的直方图直方图。直方图在统计分析中非常重直方图在统计分
3、析中非常重要要,应准确理解它的含义。,应准确理解它的含义。2023-05-165多变量情形多变量情形观测观测量大于一个,例如量大于一个,例如 x 与与 y2023-05-166边缘分布边缘分布将联合概率密度函数将联合概率密度函数 p.d.f.分别投分别投影到影到 x 与与 y 轴轴若若 x,y 相相互独立,互独立,则可构造则可构造2-维维2023-05-167条件概率密度函数条件概率密度函数利用条件概率的定义,可得到利用条件概率的定义,可得到定义条件概率的密度函数定义条件概率的密度函数 p.d.f.为为则贝叶斯定理可写为则贝叶斯定理可写为 h(y|x)yyx2023-05-168名词总汇名词总
4、汇随机事例随机事例概率概率条件概率条件概率相对频率与主观概率相对频率与主观概率贝叶斯定理贝叶斯定理随机变量随机变量概率密度函数概率密度函数条件密度函数条件密度函数直方图直方图2023-05-169提醒:提醒:概率都是条件概率概率都是条件概率由柯尓莫哥洛夫公理,我们定义了概率由柯尓莫哥洛夫公理,我们定义了概率 P(A)。但在实际应用中,我们总是对但在实际应用中,我们总是对 A 相对于许多样本空间的概率相对于许多样本空间的概率感兴趣,而不仅仅只是一个空间。因此,通常以记号感兴趣,而不仅仅只是一个空间。因此,通常以记号来表示所进行的研究是在特定的样本空间来表示所进行的研究是在特定的样本空间 S 中中
5、,也就是,也就是 A 相相对于对于 S 的条件概率。的条件概率。因此,所有概率在实际应用中都是因此,所有概率在实际应用中都是条件概率条件概率。只有当只有当 S 的选择是明白无误时,才能简单记为的选择是明白无误时,才能简单记为2023-05-1610证明举例:事例与逆事例证明举例:事例与逆事例如果 A 是在 S 中的任意一个事例,则证明:由于 A 与 根据定义是互斥的,并且从文恩图得到因此可以写出2023-05-1611举例:检查给定概率的合理性举例:检查给定概率的合理性如果一个实验有三种可能并且互斥的结果 A,B 和 C,检查下列各种情况给出的概率值是否是合理的:结论:只有结论:只有1)与)与
6、4)是合理的)是合理的。评评论:作为一个合格的实验研究人员,一定要具备判断论:作为一个合格的实验研究人员,一定要具备判断 结果是否合理的能力!结果是否合理的能力!2023-05-1612举例:检查经验概率密度函数举例:检查经验概率密度函数实验上经常经验性地从直方图中给出概率密度函数(例如通过拟合直方图分布等等),但是需要确定得到的函数是否满足概率密度函数的定义,例如试判断哪一个可以用作概率密度函数?答案:1)有负概率值;2)累积函数值大于1。因此,两者在给定的随机变量范围内都不能用作概率密度函数。2023-05-1613数据分析中的问题数据分析中的问题粒子与核物理实验中对动量的测量通常是分别测
7、量粒子与核物理实验中对动量的测量通常是分别测量在已知两分量测量值的概率密度函数情况下,总动量为在已知两分量测量值的概率密度函数情况下,总动量为如何导出总动量的测量值的概率密度函数?如何导出总动量的测量值的概率密度函数?是研究随机变量函数的问题。是研究随机变量函数的问题。2023-05-1614一维随机变量的函一维随机变量的函数数随机变量的函数自身也是一个随机变量。随机变量的函数自身也是一个随机变量。假设假设 x 服服从从 p.d.f.f(x),对于函数对于函数 a(x),其其p.d.f.g(a)为为何?何?2023-05-1615函数的逆不唯一情函数的逆不唯一情况况假如假如 a(x)的的逆不唯
8、一,则函数的逆不唯一,则函数的 p.d.f.应应将将 dS 中中对应于对应于 da 的的所有所有 dx 的区间包括进来的区间包括进来2023-05-1616多维随机变量的函多维随机变量的函数数考虑随机矢量考虑随机矢量 与函数与函数 ,对应的,对应的 p.d.f.如果两个独立变量如果两个独立变量 x 与与 y,分别按,分别按 g(x)与与 h(y)分布,那么分布,那么函函数数 z=xy 应具有何种形式?应具有何种形式?多维随机变量的函数多维随机变量的函数(续一续一)2023-05-1617记作作 g 与与 h 的的Mellin卷卷积如果函数为如果函数为 z=x+y,则应具有何种形式?,则应具有何
9、种形式?记作作 g 与与 h 的傅立叶卷的傅立叶卷积注意:通常将两者皆称注意:通常将两者皆称为 g 与与 h 的卷的卷积,已相同,已相同记号表示。号表示。2023-05-1618多维随机变量的函数多维随机变量的函数(续二续二)考虑具有联合的考虑具有联合的 p.d.f.的随机矢的随机矢量量 ,构造,构造 个线性独立的函数:个线性独立的函数:,而且其逆,而且其逆函数函数 存在。那么存在。那么 的联合的联合 p.d.f.为为这里这里 是雅可比行列式是雅可比行列式任意一个函数任意一个函数均可通过对函数均可通过对函数积分掉其它不用的变积分掉其它不用的变量而得到。是数据处量而得到。是数据处理中误差传递的基
10、础。理中误差传递的基础。2023-05-1619期待值期待值考虑具有考虑具有 p.d.f.的随机变量的随机变量 ,定义,定义期待期待(平均平均)值为值为 注意注意:它不是它不是 的函数,而是的函数,而是 的一个参数。的一个参数。通常记为:通常记为:对对离散型离散型变量,有变量,有对具有对具有 p.d.f.的函数的函数 ,有,有方差方差定义为定义为通常记为:通常记为:标准偏差标准偏差:2023-05-1620协方差与相关系数协方差与相关系数定义定义协方差协方差 (也可用矩阵表示也可用矩阵表示 )为为 相关系数相关系数定义为定义为 如果如果 x,y 独独立,即立,即 则则 2023-05-1621
11、举例:样本平均值举例:样本平均值假设实验上研究一核素衰变寿命,在探测效率为100%的情况下,每次探测到的寿命为 ti,一共测量了 n 次,求平均寿命(也就是寿命的期待值)。根据离散型期待值的定义问题的关键是 ti 的概率密度函数是什么?根据概率的相对频率定义,在 n 次测量中出现 ti 频率为一次因此,期待值(或平均寿命)为思考:如果频率为 mi 次,结果会不同吗?2023-05-1622误差传递误差传递假设假设 服从某一联合服从某一联合 p.d.f.,我们也许并不我们也许并不全部知道该函数形式全部知道该函数形式,但假设我们有协方差,但假设我们有协方差和平均值和平均值 现考虑一函数现考虑一函数
12、 ,方差,方差 是什么?是什么?将将 在在 附近按附近按泰勒展开泰勒展开到第一级到第一级然后,计算然后,计算 与与 2023-05-1623误差传递误差传递(续一续一)由于由于所以利用泰勒展开式可求所以利用泰勒展开式可求2023-05-1624误差传递误差传递(续二续二)两项合起来给出两项合起来给出 的方差的方差如果如果 之间是无关的,则之间是无关的,则 ,那么上式变为,那么上式变为类似地,对于类似地,对于 组函数组函数2023-05-1625误差传递误差传递(续三续三)或者记为矩阵形式或者记为矩阵形式注意:上式只对注意:上式只对 为线性时是精确的,近似程度在函数非为线性时是精确的,近似程度在
13、函数非线性区变化比线性区变化比 要大时遭到很大的破坏。另外,上式并不需要大时遭到很大的破坏。另外,上式并不需要知道要知道 的的 p.d.f.具体形式,例如,它可以不是高斯的。具体形式,例如,它可以不是高斯的。2023-05-1626误差传递的一些特殊情况误差传递的一些特殊情况注意在相关的情况下,最终的误差会有很大的改变,例如当注意在相关的情况下,最终的误差会有很大的改变,例如当这种特征有时候是有益的:将公共的或难以估计的误差,这种特征有时候是有益的:将公共的或难以估计的误差,通过适当的数学处理将它们消掉,达到减小误差的目的。通过适当的数学处理将它们消掉,达到减小误差的目的。2023-05-16
14、27坐标变换下的误差矩阵坐标变换下的误差矩阵实验上经常通过测量粒子在探测器中各点的击中坐标实验上经常通过测量粒子在探测器中各点的击中坐标(x,y)来拟合在极坐标下的径迹来拟合在极坐标下的径迹(r,)。通常情况下,通常情况下,(x,y)的的测量是不关联的。测量是不关联的。由于由于因此,坐标变换后的误差矩阵为因此,坐标变换后的误差矩阵为2023-05-1628大亚湾反应堆中微子实验大亚湾反应堆中微子实验2023-05-1629反应堆中微子反应堆中微子n反应堆能产生大量反电子型中微子3 GW 热功率反应堆n中微子几乎无损穿透物质假设产生的中微子以球面波传播,那么在任一地方任一给定面元的中微子流强为2
15、023-05-1630大亚湾中微子振荡大亚湾中微子振荡n中微子振荡中微子在运动过程中自己不断改变形态n测量中微子形态随运动距离的改变n中微子形态随运动距离的改变理论预言2023-05-1631如何保证如何保证1%精度?精度?n测量中微子振荡的影响那一种方案更易实现那一种方案更易实现1%精度的测量?为什么?精度的测量?为什么?2023-05-1632不同坐标系下相不同坐标系下相关关性的变化性的变化通过转动坐标,随机变量的相关性会发生改变。通过转动坐标,随机变量的相关性会发生改变。显然,通然,通过将坐将坐标系系转动 450,上面的相关性在新坐,上面的相关性在新坐标系下系下消失。消失。随机变量作正则
16、变换去除相关性随机变量作正则变换去除相关性2023-05-1633对应的协方差矩阵为对应的协方差矩阵为非线性情况非线性情况假设有假设有 n 个随机变量个随机变量 x1,xn 以及协方差矩阵以及协方差矩阵Vij=covxi,xj,可可以证明有可能通过以证明有可能通过线性变换线性变换重新定义重新定义 n 个新的变量个新的变量 y1,yn 使得对应的协方差矩阵使得对应的协方差矩阵Uij=covyi,yj非对角元为零非对角元为零。令。令2023-05-1634变换后的变量协方差矩阵对角化变换后的变量协方差矩阵对角化为了使协方差矩阵为了使协方差矩阵 U 对角化对角化由于协方差矩阵总是对称的,因此可知本征
17、矢量是正交的由于协方差矩阵总是对称的,因此可知本征矢量是正交的可先确定协方差矩阵可先确定协方差矩阵 V 的本征列矢量的本征列矢量 ,i=1,n。解方程解方程变换矩阵变换矩阵 A 由本征矢量由本征矢量 给出,即给出,即2023-05-1635正则变换后变量的协方差矩阵正则变换后变量的协方差矩阵因此,正则变换的协方差矩阵为因此,正则变换的协方差矩阵为变量作正则变换变量作正则变换后,其方差由原后,其方差由原协方差矩阵协方差矩阵 V 的的本征值给出。本征值给出。对应于矢量的转动对应于矢量的转动不改变模的大小。不改变模的大小。|y|2=yTy=xTATAx=|x|2尽管非关联变量经常容易尽管非关联变量经
18、常容易处理,但是对经过变换的处理,但是对经过变换的变量的理解不一定容易。变量的理解不一定容易。带电粒子在粒子在闪烁体的射程体的射程2023-05-1636在原来的定在原来的定义下,可以得到下,可以得到粒子射程随粒子射程随动量大小的量大小的变化化关系。通关系。通过转动变换,粒子,粒子的射程与的射程与动量量发生了改生了改变,无物理含无物理含义,但是提供了一,但是提供了一个很好的粒子个很好的粒子类型甄型甄别变量。量。2023-05-1637小结小结1.概率概率2.随机变量随机变量3.随机变量函数随机变量函数4.误差传递误差传递a)定义:柯尔莫哥洛夫公理定义:柯尔莫哥洛夫公理+条件概率条件概率b)解释:频率或信心程度解释:频率或信心程度c)贝叶斯定理贝叶斯定理a)概率密度函数概率密度函数 p.d.f.b)累积分布函数累积分布函数c)联合,边缘与条件的联合,边缘与条件的 p.d.f.a)函数自身也是随机变量函数自身也是随机变量 b)几种方法找出几种方法找出 p.d.f.函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。