引言
箱型圖,也稱為盒須圖,是一種非常富強的數據可視化東西,它可能幫助我們疾速懂得數據的分佈情況,包含中位數、四分位數、異常值等。在Python中,我們可能利用多種庫來繪製箱型圖,如Matplotlib、Seaborn等。本文將帶你從入門到粗通,一步步學會利用Python繪製箱型圖。
入門:Matplotlib繪製箱型圖
安裝Matplotlib
在開端之前,確保你曾經安裝了Matplotlib庫。假如不安裝,可能經由過程以下命令停止安裝:
pip install matplotlib
導入須要的庫
import matplotlib.pyplot as plt
import numpy as np
籌備數據
假設我們有一組老師的測驗成績數據,如下所示:
scores = [65, 75, 80, 85, 90, 92, 95, 100, 105, 110, 120]
繪製箱型圖
plt.figure(figsize=(8, 6)) # 設置圖形大小
plt.boxplot(scores)
plt.title('老師測驗成績箱型圖')
plt.xlabel('分數')
plt.ylabel('人數')
plt.show()
這段代碼會生成一個簡單的箱型圖,展示老師的測驗成績分佈情況。
進階:自定義箱型圖
箱型圖不只可能展示數據的基本分佈情況,還可能停止一些自定義,以順應差其余須要。
修改箱型圖的色彩跟款式
plt.figure(figsize=(8, 6))
plt.boxplot(scores, patch_artist=True, boxprops=dict(facecolor='lightblue'), medianprops=dict(color='red'))
plt.title('自定義色彩跟款式的老師測驗成績箱型圖')
plt.xlabel('分數')
plt.ylabel('人數')
plt.show()
在這個例子中,我們將箱型圖的色彩改為淺藍色,中位數改為白色。
表現異常值
異常值是箱型圖中的重要構成部分,以下代碼將表現異常值:
plt.figure(figsize=(8, 6))
plt.boxplot(scores, flierprops=dict(marker='o', color='red', markeredgecolor='black'))
plt.title('表現異常值的老師測驗成績箱型圖')
plt.xlabel('分數')
plt.ylabel('人數')
plt.show()
比較兩組數據
假如要比較兩組數據,可能將兩組數據合併掉落隊行繪製:
scores1 = [65, 75, 80, 85, 90, 92, 95, 100, 105, 110, 120]
scores2 = [70, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
plt.figure(figsize=(8, 6))
plt.boxplot([scores1, scores2], labels=['組1', '組2'])
plt.title('比較兩組數據的箱型圖')
plt.xlabel('分數')
plt.ylabel('人數')
plt.show()
粗通:利用Seaborn繪製箱型圖
Seaborn是一個樹破在Matplotlib之上的高等可視化庫,它供給了一些更易於利用的數據可視化東西。
安裝Seaborn
確保你曾經安裝了Seaborn庫:
pip install seaborn
導入Seaborn
import seaborn as sns
繪製箱型圖
sns.boxplot(x=scores)
plt.title('Seaborn繪製的老師測驗成績箱型圖')
plt.xlabel('分數')
plt.ylabel('人數')
plt.show()
利用Seaborn可能非常便利地繪製箱型圖,同時還能保持較高的機動性。
總結
經由過程本文的進修,你應當曾經控制了Python繪製箱型圖的方法,包含入門、進階跟粗通。盼望這些技能可能幫助你更好地分析跟可視化數據。