絕對差值計算公式(公式差值計算怎么算)
數據的離散程度即衡量一組數據的分散程度如何,其衡量的標準和方式有很多,而具體選擇哪一種方式則需要依據實際的數據要求進行抉擇。
首先針對不同的衡量方式的應用場景大體歸納如下:
極差:極差為數據樣本中的最大值與最小值的差值
,是所有方式中最為簡單的一種,它反應了數據樣本的數值范圍,是最基本的衡量數據離散程度的方式,受極值影響較大。如在數學考試中,一個班學生得分的極差為60,反應了學習最好的學生與學習最差的學生得分差距為60.
四分位差:即數據樣本的上四分之一位和下四分之一位的差值
,反應了數據中間50%部分的離散程度,其數值越小表明數據越集中,數值越大表明數據越離散,同時由于中位數位于四分位數之間,故四分位差也放映出中位數對于數據樣本的代表程度,越小代表程度越高,越大代表程度越低。
平均差:即
,針對分組數據為
。各變量值與平均值的差的絕對值之和除以總數n,平均差以平均數為中心,能全面準確的反應一組數據的離散狀況,平均差越大,說明數據離散程度越大,反之,離散程度越小。
方差/標準差:方差是各變量與平均值的差的平方和除以總數n-1,
針對分組數據
,方差開根號后為標準差,方差與標準差都能很好的反應數據的離散程度。
異種比率:是指非眾數組的頻數占總頻數的比例。
其中
為變量值的總頻數,
為眾數組的頻數。異種比率越大,說明非眾數組的頻數占總頻數的比重越大,眾數的代表性越差,即占比越小,異種比率越小,說明眾數的代表性越好,即占比越大。異種比率主要適合度量分類數據的離散程度,當然連續數據可以計算異種比率。
離散系數:即變異系數,針對不同數據樣本的標準差和方差,因數據衡量單位不同其結果自然無法直接進行對比,為出具一個相同的衡量指標,則進行了離散系數的計算。離散系數為一組數據的標準差與平均數之比
。
import numpy as np
import stats as sts
scores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23,
32, 34, 43, 41, 21, 23, 26, 26, 34, 42,
43, 25, 24, 23, 24, 44, 23, 14, 52,32,
42, 44, 35, 28, 17, 21, 32, 42, 12, 34]
#集中趨勢的度量
print('求和:',np.sum(scores))
print('個數:',len(scores))
print('平均值:',np.mean(scores))
print('中位數:',np.median(scores))
print('眾數:',sts.mode(scores))
print('上四分位數',sts.quantile(scores,p=0.25))
print('下四分位數',sts.quantile(scores,p=0.75))
#離散趨勢的度量
print('最大值:',np.max(scores))
print('最小值:',np.min(scores))
print('極差:',np.max(scores)-np.min(scores))
print('四分位差',sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))
print('標準差:',np.std(scores))
print('方差:',np.var(scores))
print('離散系數:',np.std(scores)/np.mean(scores))
#偏度與峰度的度量
print('偏度:',sts.skewness(scores))
print('峰度:',sts.kurtosis(scores))
版權聲明:本文為互聯網用戶自發貢獻的內容,其中觀點及相關內容僅代表作者本人。本網站僅提供信息存儲空間服務,不擁有這些內容的所有權,并且不承擔任何法律責任。如果發現本網站上有涉嫌侵權或違法違規的內容,請立即聯系我們的客服QQ:6532516以便進行及時清除。