Python Box Plots


箱线图是数据集中数据分布情况的一种度量。它将数据集划分为三个四分位数。该图表示数据集中的最小值,最大值,中位数,第一四分位数和第三四分位数。通过为每个数据集绘制箱形图来比较跨数据集的数据分布也很有用。

绘制箱子剧情

Boxplot可以绘制调用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()以可视化每列中值的分布。

例如,这里是一个箱形图,表示对[0,1)上的统一随机变量的10次观察的五次试验。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')

输出 如下 -

boxplot.png