Python已成为数据科学领域的流行语言之一,其强大的数据分析能力备受青睐。本文主要介绍Python数据分析中的数据可视化技术,包括常用的Matplotlib、Seaborn、Pandas等库的使用方法及案例。
Matplotlib是Python中常用的绘图库之一,可用于绘制各种类型的图表,如线图、柱状图、散点图等。下面是一个简单的例子:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.plot(x, y) plt.show()
上述代码将生成一张简单的线图,其中x轴为1~5,y轴为2~10:
除了简单的线图,Matplotlib还支持更多高级功能,如子图、标签、图例等。例如,下面的代码生成了一个包含两个子图的图表:
import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 2 * np.pi, 400) y = np.sin(x ** 2) fig, (ax1, ax2) = plt.subplots(2, 1) ax1.plot(x, y) ax1.set_title('Sine Wave') ax2.plot(x, y) ax2.set_title('Cosine Wave') plt.show()
上述代码将生成一个包含两个子图的图表,分别为正弦波和余弦波:
Seaborn是基于Matplotlib的高级数据可视化库,可用于绘制更复杂的图表,如热力图、密度图等。下面是一个简单的例子:
import seaborn as sns import pandas as pd data = pd.read_csv('data.csv') sns.distplot(data['height']) plt.show()
上述代码将生成一个身高分布的密度图,其中data.csv为一个包含身高数据的CSV文件:
除了常用的热力图、密度图等,Seaborn还支持更多高级功能,如色彩主题、分面绘图等。例如,下面的代码生成了一个包含色彩主题和分面绘图的图表:
import seaborn as sns import pandas as pd data = pd.read_csv('data.csv') sns.set(style='darkgrid') sns.catplot(x='gender', y='height', hue='age', data=data, kind='bar', col='age') plt.show()
上述代码将生成一个包含色彩主题和分面绘图的图表,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:
Pandas是Python中常用的数据处理库,除了提供数据结构和数据处理方法外,还内置了部分可视化功能。例如,下面的代码生成了一个简单的柱状图:
import pandas as pd import matplotlib.pyplot as plt data = pd.read_csv('data.csv') data.plot(kind='bar', x='age', y='height', rot=0) plt.show()
上述代码将生成一个包含年龄和身高两个变量的柱状图,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:
除了简单的柱状图,Pandas还支持更多高级功能,如按分组绘图、堆积图等。例如,下面的代码生成了一个按性别分组的堆积图:
import pandas as pd import matplotlib.pyplot as plt data = pd.read_csv('data.csv') data.groupby('gender').plot(kind='bar', stacked=True) plt.show()
上述代码将生成一个按性别分组的堆积图,其中data.csv为一个包含性别、身高、年龄数据的CSV文件:
本文为翻滚的胖子原创文章,转载无需和我联系,但请注明来自猿教程iskeys.com