高光谱图像输入卷积神经网络的维度问题
现在处理高光谱影像大多使用3D-CNN,对于高斯光谱数据而言,输入网络模型的shape是(x,y,z)这种形式,x,y是长宽尺寸,而z是光谱维度,IN数据集一般是200,UP数据集一般是103。keras中Conv2D的输入张量尺寸:(samples, rows, cols, channels)Conv3D的输入张量尺寸:(samples, conv_dim1, conv_dim2, conv_d
现在处理高光谱影像大多使用3D-CNN,对于高斯光谱数据而言,输入网络模型的shape是(x,y,z)这种形式,x,y是长宽尺寸,而z是光谱维度,IN数据集一般是200,UP数据集一般是103。
keras中Conv2D的输入张量尺寸:(samples, rows, cols, channels)
Conv3D的输入张量尺寸:(samples, conv_dim1, conv_dim2, conv_dim3, channels)
Conv2D的输入应该是一个4D,第一维是batch,后面三维是长,宽,三基色,这个在高分影像数据集上就是这样,和普通光学影像的输入没有什么区别。
Conv3D的输入是一个5D,第一维也是batch,最后一维也是通道,通道通常会和后面的滤波器的核的个数相关联,卷积核数目的变化就在这个维度上,对于高光谱数据来说,输入的channel,我们通常处理成1,以IN为例的话,也就是(1,224,224,200),batch这个维度在实际运算中会有体现。
Conv3D的卷积核操作和Conv2D是有区别的,Conv2D利用一个滑窗在卷积上滑动,产生feature map,有多少个核就产生多少个feature map。但是Conv3D是沿着光谱维度进行运算,同时在空间上进行滑窗操作,产生的同样是三维的feature map,有多少核就产生多少个feature map。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)