當前位置:百科全書館>科技>科技生活>

箱線圖怎麼看

科技生活 閲讀(3.09W)

箱線圖怎麼看

1、箱子的中間一條線,是數據的中位數,代表了樣本數據的平均水平。

2、箱子的上下限,分別是數據的上四分位數和下四分位數。這意味着箱子包含了50%的數據。因此,箱子的寬度在一定程度上反映了數據的波動程度。

3、在箱子的上方和下方,又各有一條線。有時候代表着最大最小值,有時候會有一些點“冒出去”。請千萬不要糾結,不要糾結,不要糾結(重要的事情説三遍),如果有點冒出去,理解成“異常值”就好。

箱線圖是針對連續型變量的,解讀時候重點關注平均水平、波動程度和異常值。當箱子被壓得很扁,或者有很多異常的時候,試着做對數變換。當只有一個連續型變量時,並不適合畫箱線圖,直方圖是更常見的選擇。箱線圖最有效的使用途徑是作比較,配合一個或者多個定性數據,畫分組箱線圖。

同一數軸上,幾批數據的箱形圖並行排列,幾批數據的中位數、尾長、異常值、分佈區間等形狀信息便一目瞭然。在一批數據中,哪幾個數據點出類拔萃,哪些數據點表現不及一般,這些數據點放在同類其它羣體中處於什麼位置,可以通過比較各箱形圖的異常值看出。各批數據的四分位距大小,正常值的分佈是集中還是分散,觀察各方盒和線段的長短便可明瞭。每批數據分佈的偏態如何,分析中位線和異常值的位置也可估計出來。還有一些箱形圖的變種,使數據批間的比較更加直觀明白。