Python数据分析:数据可视化技术

Python已成为数据科学领域的流行语言之一,其强大的数据分析能力备受青睐。本文主要介绍Python数据分析中的数据可视化技术,包括常用的Matplotlib、Seaborn、Pandas等库的使用方法及案例。



Matplotlib


Matplotlib是Python中常用的绘图库之一,可用于绘制各种类型的图表,如线图、柱状图、散点图等。下面是一个简单的例子:

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.plot(x, y)
plt.show()

上述代码将生成一张简单的线图,其中x轴为1~5,y轴为2~10:




细节用法


除了简单的线图,Matplotlib还支持更多高级功能,如子图、标签、图例等。例如,下面的代码生成了一个包含两个子图的图表:

import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 2 * np.pi, 400)
y = np.sin(x ** 2)

fig, (ax1, ax2) = plt.subplots(2, 1)

ax1.plot(x, y)
ax1.set_title('Sine Wave')

ax2.plot(x, y)
ax2.set_title('Cosine Wave')

plt.show()

上述代码将生成一个包含两个子图的图表,分别为正弦波和余弦波:




Seaborn


Seaborn是基于Matplotlib的高级数据可视化库,可用于绘制更复杂的图表,如热力图、密度图等。下面是一个简单的例子:

import seaborn as sns
import pandas as pd

data = pd.read_csv('data.csv')

sns.distplot(data['height'])
plt.show()

上述代码将生成一个身高分布的密度图,其中data.csv为一个包含身高数据的CSV文件:




细节用法


除了常用的热力图、密度图等,Seaborn还支持更多高级功能,如色彩主题、分面绘图等。例如,下面的代码生成了一个包含色彩主题和分面绘图的图表:

import seaborn as sns
import pandas as pd

data = pd.read_csv('data.csv')

sns.set(style='darkgrid')
sns.catplot(x='gender', y='height', hue='age', data=data, kind='bar', col='age')

plt.show()

上述代码将生成一个包含色彩主题和分面绘图的图表,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:




Pandas


Pandas是Python中常用的数据处理库,除了提供数据结构和数据处理方法外,还内置了部分可视化功能。例如,下面的代码生成了一个简单的柱状图:

import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('data.csv')

data.plot(kind='bar', x='age', y='height', rot=0)

plt.show()

上述代码将生成一个包含年龄和身高两个变量的柱状图,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:




细节用法


除了简单的柱状图,Pandas还支持更多高级功能,如按分组绘图、堆积图等。例如,下面的代码生成了一个按性别分组的堆积图:

import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('data.csv')

data.groupby('gender').plot(kind='bar', stacked=True)

plt.show()

上述代码将生成一个按性别分组的堆积图,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:


猿教程
请先登录后发表评论
  • 最新评论
  • 总共0条评论