香港公司

四分位距

9547 171

四分位差(Quartile Deviation)

目錄

  • 1 什麼是四分位差[1]
  • 2 四分位差的公式[1]
  • 3 四分位差的特點[2]
  • 4 四分位差的適用範圍[2]
  • 5 四分位差的計算
    • 5.1 四分位差的計算方法[3]
    • 5.2 四分位差的計算案例[4]
  • 6 參考文獻

什麼是四分位差[1]

  四分位差又稱內距、也稱四分間距(inter-quartile range),是指將各個變數值按大小順序排列,然後將此數列分成四等份,所得第三個四分位上的值與第一個四分位上的值的差。

四分位差的公式[1]

  四分位差用公式表示:

  Q = Q3Q1

  其中:Q1的位置=(n+1)/4

  Q3的位置=3(n+1)/4

  四分位差若圖所示:

四分位差

四分位差的特點[2]

  四分位差反映了中間50%數據的離散程度。其數值越小,說明中間的數據越集中;數值越大,說明中間的數據越分散。與極差(最大值與最小值之差)相比,四分位差不受極值的影響。此外,由於中位數處於數據的中間位置,因此四分位差的大小在一定程度上也說明瞭中位數對一組數據的代表程度。

四分位差的適用範圍[2]

  四分位差主要用於測度

順序數據的離散程度。當然,對於數值型數據也可以計算四分位差,但不適合於分類數據。

四分位差的計算

四分位差的計算方法[3]

  如果所給的數據資料不同,四分位差的具體計算方法也不同:

  1.未分組數據

  首先對數據進行排序,求出QlQ3所在的位置;其次根據位置確定其對應的標誌值即QlQ3;最後計算二者差額的一半,即\frac{Q_l-Q_3}{2}就是四分位差。

  Ql的位置=\frac{n+1}{4}

  Q3的位置=\frac{3(n+1)}{4}

  2.單項式數列

  先計算各組的累計次數,然後確定分位點位置。

  Ql的位置=\frac{\Sigma{f}}{4}

  Q3的位置=\frac{{3}\Sigma{f}}{4}

  對於上面的兩種情況,若(n+1)或Σf恰好為4的倍數,則計算出來的四分位數的位置就是整數,這時,各個位置上的變數值就是相應的四分位數;若(n+1)或Σf不是4的倍數,則按上面公式計算出來的四分位數的位次就可能帶有小數,這時可根據插值法來計算上下四分位數。再按公式計算出四分位差。

  假設樣本容量為50時,\frac{n+1}{4}=12.75,\frac{3(n+1)}{4}=38.25,則按插值法可得:

  \frac{X_{13}-Q_1}{X_{13}-X_{12}}=\frac{13-12.75}{13-12}

  整理得:Q1=0.25X12+0.75X13

  同樣可得:Q3=0.75X38+0.25X39

  3.組距式數列

  先計算上、下四分位的值,然後再計算四分位差。此時計算四分位數的基本原理與中位數相類似。計算公式如下:

  Q_1=L_{Q_1}+\frac{\frac{\Sigma{f}}{4}-S_{Q_1-1}}{f_{Q_1}}×d_{Q_1}

  Q_3=L_{Q_3}+\frac{\frac{{3}\Sigma{f}}{4}-S_{Q_3-1}}{f_{Q_3}}×d_{Q_3}

  式中,L_{Q_1}L_{Q_3},分別代表下四分位和上四分位數所在組的下限;S_{{Q_1}-1}S_{{Q_3}-1}分別代表下四分位和上四分位數所在組以下的累計次數;f_{Q_1}f_{Q_3}分別代表下四分位和上四分位數所在組的次數。

四分位差的計算案例[4]

  例1:由7人組成的旅游小團隊年齡分別為:17、19、22、24、25、28、34,求其年齡的四分位差。計算步驟為:

  ①計算Q1,與Q3的位置。

  Q1的位置=\frac{n+1}{4}=\frac{7+1}{4}=2

  Q3的位置=\frac{3(n+1)}{4}=\frac{3 \times (7+1)}{4}=6

  即Q1Q3的位置分別為第2位和第6位。

  ②確定Q1Q3的數值。

  Q1=19(歲)

  Q3=28(歲)

  即第2位和第6位對應年齡分別為19歲和28歲。

  ③計算四分位差。

  Q.D.=Q3Q1=28-19=9(歲)

  ④含義。說明該旅游小團隊有50%的人年齡集中在19~28歲之間,最大差異為9歲。

  例2:由8人組成的旅游小團隊年齡分別為:17、19、22、24、25、28、34、38,求其年齡的四分位差。計算步驟為:

  ①計算Q1Q3的位置。

  Q1的位置=\frac{n+1}{4}=\frac{8+1}{4}=2.25

  Q3的位置=\frac{3(n+1)}{4}=\frac{3 \times (8+1)}{4}=6.75

  即Q1Q3的位置分別為第2.25位和第6.75位。

  ②確定Q1Q3的數值。由於Q1Q

3的位置帶有小數,所以Q1Q3的數值要按照小數點後數值的比例在相臨的兩個數值之間進行分攤。即:

  Q_l=0.75x2+0.25x3=0.75×19+0.25×22=19.75(歲)

  Q_3=O.25x6+O.75x7=0.25×28+0.75×34=32.5(歲)

  ③計算四分位差。

  Q.D.=Q3-Q1=32.5—19.75=12.75(歲)

  ④含義。說明該旅游小團隊有50%的人年齡集中在19.75歲至32.5歲之間,最大差異為12.75歲。

  (2)分組資料計算的四分位差。

  例3:根據某車間工人日產量分組資料,如表1所示,計算四分位差。

某車間工人日產量分組資料
按日產量分組(個)工人數f(人)向上累計工人數F(人)
5~101212
10~154658
15~203694
20~256100
合計100——

  計算步驟為:

  ①確定Q1Q3的位置。

  Q1的位置=\frac{\Sigma{f}}{4}=\frac{100}{4}=25

  根據向上累計工人數可知Q1在第2組即10~15內。

  Q3的位置=\frac{{3}\Sigma{f}}{4}=\frac{3 \times 100}{4}=75

  根據向上累計工人數可知,Q3在第3組即15~20內。

  ②計算Q1Q3的數值。

  Q_1=10+\frac{\frac{100}{4}-12}{46} \times (15-10)=11.4(個)

  Q_3=15+\frac{\frac{3 \times 100}{4}-58}{36} \times (20-15)=17.4(個)

  ③計算四分位差。

  Q.D.=Q3-Ql=17.4-11.4=6(個)

  ④含義。計算結果表明,有50%(一半)工人的日產量分佈在11.4~17.4之間,且最大差異為6個。

  四分位差的優點表現為不受兩端各25%數值的影響,能對開口組數列的差異程度進行測度,可以衡量中位數代表性高低。缺點為不能反映所有標誌值的差異程度。

參考文獻

  1. 1.0 1.1 第九部分 資料的統計分析.安徽理工大學,2007年10月8日
  2. 2.0 2.1 賈俊平編著.描述統計[M].ISBN:7-300-04576-6/C8.中國人民大學出版社,2003
  3. ↑ 李國柱主編.統計學.科學出版社,2004.8.
  4. ↑ 王琪延,張衛紅主編.統計學.中國市場出版社,2010.10.