原标题:Python 多维数据可视化

1.平行坐标

图中每条垂直的线代表一个特征,表中一行的数据在图中表现为一条折线,不同颜色的线表示不同的类别。

import pandas as pd

import matplotlib.pyplot as plt

from pandas.plotting import parallel_coordinates

data = pd.read_csv( 'D:iris.csv')

plt.figure( '多维度-parallel_coordinates')

plt.title( 'parallel_coordinates')

parallel_coordinates(data, 'Species', color=[ 'blue', 'green', 'red', 'yellow'])

plt.show

ba7992c29f214cab8f055643291d9a7d.png

2.RadViz雷达图

4个特征对应于单位圆上的4个点,圆中每一个散点代表表中一行数据。可以想象为每个散点上都有4条线分别连接到4个特征点上,而特征值(经过标准化处理)就表示这4条线施加在散点上的力,每个点的位置恰好使其受力平衡。

import pandas as pd

import matplotlib.pyplot as plt

from pandas.plotting import radviz

data = pd.read_csv( 'D:iris.csv')

plt.figure( '多维度-radviz')

plt.title( 'radviz')

radviz(data, 'Species', color=[ 'blue', 'green', 'red', 'yellow'])

plt.show

96c22b3d093f4d0c9a81abb1d66c3b85.png

3.Andrews曲线

特征值转化为傅里叶序列的系数,不同颜色的曲线代表不同的类别。

import pandas as pd

import matplotlib.pyplot as plt

from pandas.plotting import andrews_curves

data = pd.read_csv( 'D:iris.csv')

plt.figure( '多维度-andrews_curves')

plt.title( 'andrews_curves')

andrews_curves(data, 'Species', color=[ 'blue', 'green', 'red', 'yellow'])

plt.show

791b2a45e9f34c81b1aef76517ea27f6.png

4.矩阵图

表示不同特征之间的关系。

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

data = pd.read_csv( 'D:iris.csv')

sns.pairplot(data, hue= 'Species')

plt.show

86586237475b4bba8bb725a348810702.png

5.相关系数热力图

表示不同特征之间的相关性(Pearson相关系数),数值越大,相关性越高。

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

data = pd.read_csv( 'D:iris.csv')

corr = data.corr

sns.heatmap(corr, annot=True)

plt.show

责任编辑:

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐