全部課程
發(fā)布時間: 2019-11-10 14:33:00
均值
?
均值描述的是樣本集合的中間點,它告訴我們的信息是有限的。
方差
方差(variance)是在概率論和統(tǒng)計方差衡量隨機變量或一組數(shù)據(jù)時離散程度的度量。概率論中方差用來度量隨機變量和其數(shù)學期望(即均值)之間的偏離程度。統(tǒng)計中的方差(樣本方差)是各個數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù)。在許多實際問題中,研究方差即偏離程度有著重要意義。方差是衡量源數(shù)據(jù)和期望值相差的度量值。
例如:
方差是指一組數(shù)據(jù)中的各個數(shù)減這組數(shù)據(jù)的平均數(shù)的平方和的平均數(shù),如(1,2,3,4,5)這組數(shù)據(jù)的方差,就先求出這組數(shù)據(jù)的平均數(shù)(1+2+3+4+5)÷5=3,然后再求各個數(shù)與平均數(shù)的差的平方和,用(1-3)?+(2-3)?+(3-3)?+(4-3)?+(5-3)?=10,再求平均數(shù)10÷5=2,即這組數(shù)據(jù)的方差為2
標準差
標準差給我們描述的是樣本集合的各個樣本點到均值的距離之平均
以這兩個集合為例,[0, 8, 12, 20]和[8, 9, 11, 12],兩個集合的均值都是10,但顯然兩個集合的差別是很大的,計算兩者的標準差,前者是8.3后者是1.8,顯然后者較為集中,故其標準差小一些,標準差描述的就是這種“散布度”。之所以除以n-1而不是n,是因為這樣能使我們以較小的樣本集更好地逼近總體的標準差,即統(tǒng)計上所謂的“無偏估計”。而方差則僅僅是標準差的平方。
方差和標準差的區(qū)別:
方差與我們要處理的數(shù)據(jù)的量綱是不一致的,多了個平方,雖然能很好的描述數(shù)據(jù)與均值的偏離程度,但是處理結(jié)果是不符合我們的直觀思維的。 而標準差的根號就抵消了這個平方,就能相對直觀了描述數(shù)據(jù)與均值之間的偏離程度。
上一篇: IPv6的本地聯(lián)網(wǎng)地址計算方法詳解
下一篇: 數(shù)據(jù)歸一化方法