Python已成为数据科学领域的流行语言之一,其强大的数据分析能力备受青睐。本文主要介绍Python数据分析中的数据可视化技术,包括常用的Matplotlib、Seaborn、Pandas等库的使用方法及案例。
Matplotlib是Python中常用的绘图库之一,可用于绘制各种类型的图表,如线图、柱状图、散点图等。下面是一个简单的例子:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.plot(x, y) plt.show()
上述代码将生成一张简单的线图,其中x轴为1~5,y轴为2~10:

除了简单的线图,Matplotlib还支持更多高级功能,如子图、标签、图例等。例如,下面的代码生成了一个包含两个子图的图表:
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 2 * np.pi, 400)
y = np.sin(x ** 2)
fig, (ax1, ax2) = plt.subplots(2, 1)
ax1.plot(x, y)
ax1.set_title('Sine Wave')
ax2.plot(x, y)
ax2.set_title('Cosine Wave')
plt.show()上述代码将生成一个包含两个子图的图表,分别为正弦波和余弦波:

Seaborn是基于Matplotlib的高级数据可视化库,可用于绘制更复杂的图表,如热力图、密度图等。下面是一个简单的例子:
import seaborn as sns
import pandas as pd
data = pd.read_csv('data.csv')
sns.distplot(data['height'])
plt.show()上述代码将生成一个身高分布的密度图,其中data.csv为一个包含身高数据的CSV文件:

除了常用的热力图、密度图等,Seaborn还支持更多高级功能,如色彩主题、分面绘图等。例如,下面的代码生成了一个包含色彩主题和分面绘图的图表:
import seaborn as sns
import pandas as pd
data = pd.read_csv('data.csv')
sns.set(style='darkgrid')
sns.catplot(x='gender', y='height', hue='age', data=data, kind='bar', col='age')
plt.show()上述代码将生成一个包含色彩主题和分面绘图的图表,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:

Pandas是Python中常用的数据处理库,除了提供数据结构和数据处理方法外,还内置了部分可视化功能。例如,下面的代码生成了一个简单的柱状图:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('data.csv')
data.plot(kind='bar', x='age', y='height', rot=0)
plt.show()上述代码将生成一个包含年龄和身高两个变量的柱状图,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:

除了简单的柱状图,Pandas还支持更多高级功能,如按分组绘图、堆积图等。例如,下面的代码生成了一个按性别分组的堆积图:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('data.csv')
data.groupby('gender').plot(kind='bar', stacked=True)
plt.show()上述代码将生成一个按性别分组的堆积图,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:

本文为翻滚的胖子原创文章,转载无需和我联系,但请注明来自猿教程iskeys.com
