箱形图
外观

箱形图[1][2](box plot,boxplot)或盒状图[3]、盒式图,又称盒须图[4](box-and-whisker plot/diagram)、箱线图[5],是一种用作显示一组数据或资料的位置和分散情况的统计图。因图形如箱子,且在上下四分位数之外常有线条像胡须延伸出去而得名。箱子或盒子本身含第1四分位数、中位数(第2四分位数)及第3四分位数,向两端凸出的须状线段分别连接最小值与第1四分位数,以及第3四分位数与最大值。
离群值(outlier)有时会画成是个别的点。箱型图是无母数的,他显示样品的特性,对于母体分布并无任何假设。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。
箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
定义
[编辑]
- Q0/4:最小值(minimum)
- Q1/4:第1四分位数(lower quartile)
- Q2/4:中位数(第2四分位数、median)
- Q3/4:第3四分位数(upper quartile)
- Q4/4:最大值(maximum)
以第1四分位数(Q1/4)和第3四分位数(Q3/4)的数值作为箱型的上下限。
范例
[编辑]以下是箱形图的具体例子:

这组数据显示出:
- 下边界=5
- 第1四分位数(Q1)=7
- 中位数、第2四分位数(median、Q2)=8.5
- 第3四分位数(Q3)=9
- 上边界=10
- 四分位间距(interquartile range,简称IQR)==2 (即ΔQ)
当有数值与第1与第3四分位数的范围差距1.5×IQR以上时,该值为离群值(outlier)。
数值位于范围外1.5×IQR到3×IQR范围的数值,称作适度离群值(mild outlier)。
数值位于范围外3×IQR以上的数值,称作极端离群值(extreme outlier)。
因此该图中的离群值有:
- 适度离群值(mild outlier) = 3.5
- 极端离群值(extreme outlier) = 0.5
参考
[编辑]- ^ 帕庆.管理与组织发展:通过箭形图,箱形图和圆形图看问题[M].经济管理出版社,2003.
- ^ 陈耀茂. 圖解品管統計方法. 五南图书出版股份有限公司. 2021: 34. ISBN 9789865223748.
- ^ 谭克平(2007)。国中教导盒状图的建议及介绍如何用EXCEL制作盒状图。科学教育月刊,(305),20-34。https://doi.org/10.6216/SEM.200712_(305).0004
- ^ 盒狀圖;盒鬚圖. 乐词网. 国家教育研究院 (中文(台湾)).
- ^ 朱兵.箱线图及其在JCR网络版中的应用[J].农业图书情报学刊, 2011(08):15-18.DOI:10.3969/j.issn.1002-1248.2011.08.004.
外部链接
[编辑]- Visual Presentation of Data by Means of Box Plots (PDF)
- On-line box plot calculator with explanations and examples (页面存档备份,存于互联网档案馆)
- Box and Whisker Diagrams: getting Microsoft Excel to plot them for you
- Box and Whisker Plots in Microsoft Excel (页面存档备份,存于互联网档案馆)
- Box plot and whisker plots in Excel 2007 (页面存档备份,存于互联网档案馆)
- Box plot explanation, examples and a javascript/css-based box plot (页面存档备份,存于互联网档案馆)
- 台湾交通大学开放式课程 统计学(一) (页面存档备份,存于互联网档案馆):第四周课程 (youtube)