《基础统计概念讲述.pptx》由会员分享,可在线阅读,更多相关《基础统计概念讲述.pptx(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 12023/2/272023/2/27基础统计概念讲述基础统计概念讲述2 22023/2/272023/2/27機率的世界機率的世界機率的世界機率的世界 V.S.V.S.確定的世界確定的世界確定的世界確定的世界百分之百確定的事?百分之百確定的事?例子例子.量子的世界量子的世界機率決定一切機率決定一切統計學家從不說統計學家從不說100確定。確定。那麼有多確定那麼有多確定?95%確定;確定;99%確定;確定;99.99966%確定?確定?3 32023/2/272023/2/27機率機率機率機率 V.S.V.S.統計統計統計統計母體母體(分配分配)樣本樣本(抽樣抽樣)機率機率統計統計Q1:隨機
2、變數隨機變數X為常態分配為常態分配N(,2),請問請問 的平均數、變異數、變異係數?的平均數、變異數、變異係數?Q2:自某一母體自某一母體Y隨機抽樣隨機抽樣50個樣本,得到樣本平均數為個樣本,得到樣本平均數為50,樣本標準差為樣本標準差為5,請問此母請問此母體平均數是否為體平均數是否為45(在在95%顯著水準下顯著水準下)?4 42023/2/272023/2/27統計學的種類統計學的種類統計學的種類統計學的種類敘述統計(DescriptiveStatistics)樣本平均數、中位數、四分位數、變異數、標準差推論統計(DeductiveStatistics)信賴區間估計(ConfidenceI
3、nterval)、假設檢定(HypothesisTest)實驗設計回歸分析(Regression)、變異數分析(ANOVA,ANalysisOfVAriance)5 52023/2/272023/2/27敘述統計介紹敘述統計介紹敘述統計介紹敘述統計介紹 平均數、標準差平均數、標準差平均數、標準差平均數、標準差(1)(1)A說:昨天晚上我和3個平均年齡只有24歲的小姐約會。B說:哇!茂死啊!茂死啊!A說:一點也不,年齡差距太大,一點也不起勁。B說:還好吧,你也才28歲而已!60歲6歲6歲只衡量數值集中的程度還不夠,還要衡量離散的程度!只衡量數值集中的程度還不夠,還要衡量離散的程度!6 62023
4、/2/272023/2/27敘述統計介紹敘述統計介紹敘述統計介紹敘述統計介紹 平均數、標準差平均數、標準差平均數、標準差平均數、標準差(2)(2)離散的程度:全距離散的程度:全距(Range)、標準差標準差(Standard Deviation)全距全距最大值最大值-最小值最小值樣本變異數樣本變異數Variance ,i=1,2,.n 其中其中 樣本標準差樣本標準差 s 三個樣本值分別為三個樣本值分別為6,6,60 平均平均24;全距;全距=54,標準差標準差s 31.177 7 72023/2/272023/2/27敘述統計介紹敘述統計介紹敘述統計介紹敘述統計介紹 中位數、四分位數中位數、四
5、分位數中位數、四分位數中位數、四分位數中位數:一群數值從小到大排列後,位於正中間的數。中位數:一群數值從小到大排列後,位於正中間的數。(若為偶數個數值,則取最中間兩數的平均)(若為偶數個數值,則取最中間兩數的平均)四分位數:在此數值之下,有四分位數:在此數值之下,有1/4或或3/4的數值分佈。的數值分佈。例子例子1:10個樣本值,由小到大排列,如下:個樣本值,由小到大排列,如下:3,4,5,5,6,7,8,9,10,11求中位數?上四分位數求中位數?上四分位數(Q1)?下四分位數下四分位數(Q3)?Ans:中位數中位數(median)6.5 First Quartile(Q1)5 Third
6、Quartile(Q3)8.75EXCEL、MINITAB都可以算出來;但都可以算出來;但Q1、Q3答案答案(公式公式)不一樣不一樣 8 82023/2/272023/2/27311敘述統計介紹敘述統計介紹敘述統計介紹敘述統計介紹 箱型圖箱型圖箱型圖箱型圖(Box Plot)Box Plot)作法:把作法:把最小值,最小值,Q1,中位數中位數(=Q2),Q3,最大值最大值畫出來。畫出來。功用:可看出一群數值大致的分佈。功用:可看出一群數值大致的分佈。接前例接前例56.58.75最小值Q1中位數Q3最大值9 92023/2/272023/2/27常見機率分配常見機率分配常見機率分配常見機率分配
7、常態分配常態分配常態分配常態分配(Normal Distribution)(1)Normal Distribution)(1)常態分配特性:1.期望值E(x)=.又稱mean2.變異數V(x)=23.為左右對稱的分配,-x23.為左右對稱的分配為左右對稱的分配4.當當v ,t 分配近似於標準分配近似於標準 常態分配常態分配N(0,1)t(v)t(v)16162023/2/272023/2/27常見機率分配常見機率分配常見機率分配常見機率分配 t t分配分配分配分配 (3)(3)設設(X1,.,Xn)為抽自常態母體為抽自常態母體N(,2)之之一組隨機一組隨機樣本,樣本,則:則:Proof:用來檢
8、定母體平均數用來檢定母體平均數17172023/2/272023/2/27常見機率分配常見機率分配常見機率分配常見機率分配 F F分配分配分配分配 (1)(1)設設 與與 為獨立隨機變數,且為獨立隨機變數,且又令:則隨機變數F的機率分配是自由度v1與v2的F分配,記為FF(v1,v2)18182023/2/272023/2/27設設(X1,.,Xn1)與與(Y1,.,Yn2)為分別由常態母體為分別由常態母體N(1,12)與與N(2,22)抽出的兩抽出的兩組獨立的隨機樣本,組獨立的隨機樣本,則:則:常見機率分配常見機率分配常見機率分配常見機率分配 F F分配分配分配分配 (2)(2)用來檢定兩母
9、體標準差是否相等用來檢定兩母體標準差是否相等(1=2)19192023/2/272023/2/27設設(X1,.,Xn)為由常態母體為由常態母體N(,2)抽出的一抽出的一組獨組獨立的隨機樣本立的隨機樣本。母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 Z Z分配分配分配分配 (1)(1)Recall:Page1020202023/2/272023/2/27母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 Z Z分配分配分配分配 (2)(2)表示:有有95%信心,母體的信心,母體的 mean()將在底下將在底下區間
10、之內區間之內如果要有99%信心的話呢?21212023/2/272023/2/27母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 Z Z分配分配分配分配 (3)(3)定義:對於一常態分配母體的mean(),若已若已知其標準差為知其標準差為,則其100(1-)%的信賴區間為:Example:99%,Z/2=2.575(查表可得,統計軟體會內建)0Z/2(1-)-Z/2現實問題是:現實問題是:不知道。不知道。22222023/2/272023/2/27母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 t t分配分配分
11、配分配 (1)(1)對於一常態分配母體的mean(),若其母體標準差未知,求其100(1-)%的信賴區間t分配分配Recall:其中,i=1,2,n23232023/2/272023/2/27母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 t t分配分配分配分配 (2)(2)0t(/2,n-1)(1-)-t(/2,n-1)24242023/2/272023/2/27母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 t t分配分配分配分配 (3)(3)定義:對於一常態分配母體的mean(),若若與S為其樣本平均值及
12、樣本標準差,則其100(1-)%的信賴區間為:查表得到或軟體內建25252023/2/272023/2/27母體母體母體母體meanmean之信賴區間估計之信賴區間估計之信賴區間估計之信賴區間估計 t t分配分配分配分配 (4)(4)例子:10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試求母體mean的95%信賴區間:Ans:所以母體mean的95%信賴區間:26262023/2/272023/2/27假設檢定假設檢定假設檢定假設檢定(Hypothesis Test)Hypothesis Test)概論概論概論概論 (1)(1)動機:經由統計方法,拒絕
13、拒絕一原始的假設一原始的假設。原始假設:虛無假設虛無假設(Null Hypothesis):希望被否定的統計假設,以H0表示之。另外假設:對立假設對立假設(Alternative Hypothesis):由於否定虛無假設而被認為對的統計假設,以H1或Ha表示之。H0:新藥不具療效H1:新藥具有療效利用數據及統計方法去拒絕H0(接受H1)27272023/2/272023/2/27假設檢定假設檢定假設檢定假設檢定(Hypothesis Test)Hypothesis Test)概論概論概論概論 (2)(2)檢定程序:1.決定檢定統計量2.決定拒絕域(rejectionregion):與顯著水準有
14、關當檢定統計量落入拒絕域,則拒絕當檢定統計量落入拒絕域,則拒絕H00Z(1-)H1Z0Z則拒絕H028282023/2/272023/2/27假設檢定假設檢定假設檢定假設檢定(Hypothesis Test)Hypothesis Test)概論概論概論概論 (3)(3)另一種表示檢定結果的方法:P-Value1.以標準常態分配為例,P-Value=P(Z檢定統計量Z0)2.當當P-Value030,不管母體分配為何,趨近常態實用經驗:若樣本本身的分佈是鐘型曲線(Bell-shape),則樣本數n只要等於4或5,不管母體分配為何,趨近常態最後的問題最後的問題最後的問題最後的問題 如何確保樣本統計量為常態分配?如何確保樣本統計量為常態分配?如何確保樣本統計量為常態分配?如何確保樣本統計量為常態分配?