数据集:资料,提取码:hywg
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
# 导入鸢尾花数据集
df = pd.read_csv('iris.csv', index_col=0,header=0,names=[0,1,2,3,'Species'])
# 划分数据集
grouped = df[list(range(4))].groupby(df['Species'])
setosa = grouped.get_group('setosa')
versicolor = grouped.get_group('versicolor')
virginica = grouped.get_group('virginica')
# 索引重排
versicolor.reset_index(drop=True,inplace=True)
virginica.reset_index(drop=True,inplace=True)
# 折线图 每个种类的Sepal.Length折线图
tmp = pd.DataFrame({'setosa':setosa[0],'versicolor':versicolor[0],'virginica':virginica[0]})
tmp.plot()
plt.show()
# 柱状图 每个种类的平均值柱状图
bar = grouped.mean()
bar.plot.bar()
plt.show()
# 不同种类的鸢尾花的Sepals分布
ax = setosa.plot.scatter(x=0, y=1, color='DarkBlue', label='setosa');
bx = versicolor.plot.scatter(x=0, y=1, color='DarkGreen', label='versicolor', ax=ax);
virginica.plot.scatter(x=0, y=1, color='DarkRed', label='virginica', ax=bx);
plt.show()
本文为二次转载,如侵权请联系删除。
文章
10.5W+人气
19粉丝
1关注
©Copyrights 2016-2022 杭州易知微科技有限公司 浙ICP备2021017017号-3 浙公网安备33011002011932号
互联网信息服务业务 合字B2-20220090