resnet模型的图像分类结构图_比较 VGG, resnet和inception的图像分类效果

简介VGG, resnet和inception是3种典型的卷积神经网络结构。VGG采用了3*3的卷积核，逐步扩大通道数量resnet中，每两层卷积增加一个旁路inception实现了卷积核的并联，然后把各自通道拼接到一起简单起见，直接使用了[1]的代码来测试 resnet，然后用[2],[4]的代码替换[1]中的model，改了改通道，测 VGG 和 inception。GPU是gtx1050，主

yongning1984

1168人浏览 · 2021-01-14 16:51:01

yongning1984 · 2021-01-14 16:51:01 发布

简介

VGG, resnet和inception是3种典型的卷积神经网络结构。

VGG采用了3*3的卷积核，逐步扩大通道数量

resnet中，每两层卷积增加一个旁路

inception实现了卷积核的并联，然后把各自通道拼接到一起

简单起见，直接使用了[1]的代码来测试 resnet，然后用[2],[4]的代码替换[1]中的model，改了改通道，测 VGG 和 inception。

GPU是gtx1050，主板开始是 x79，后来坏了，换成 x470，GPU占比提高很多。

CPU占比始终100%

实验结果

超参数：epochs=80,lr=0.001,optim=Adam

数据集：cifar10

参数个数(k)

训练时间(m)

精度(%)

GPU内存(M)

GPU占比(%)

resnet

195

607

vgg_bn

207

535

inception

107

613

结论：条条道路通罗马。

附加实验

因为方便，注释掉 Batch Normalization，以及 Data Augmentation 又试了两次。

参数个数(k)

训练时间(m)

精度(%)

GPU内存(M)

GPU占比(%)

resnet

195

607

resnet-BN

195

553

resnet-DA

195

607

结论：Data Augmentation很重要

代码改动

class ResNet(nn.Module):

def __init__(self, block, layers, num_classes=10):

super(ResNet, self).__init__()

self.in_channels = 16

self.conv = conv3x3(3, 16)

self.bn = nn.BatchNorm2d(16)

self.relu = nn.ReLU(inplace=True)

self.layer1 = self.make_layer(block, 16, layers[0])

self.layer2 = self.make_layer(block, 32, layers[1], 2)

self.layer3 = self.make_layer(block, 64, layers[2], 2)

self.avg_pool = nn.AvgPool2d(8)

self.fc = nn.Linear(64, num_classes)

print('# generator parameters:', sum(param.numel() for param in model.parameters()))

class VGG(nn.Module):

def __init__(self, features, num_classes=10, init_weights=True):

super(VGG, self).__init__()

self.features = features

self.avgpool = nn.AdaptiveAvgPool2d((3, 3))

self.classifier = nn.Sequential(

nn.Linear(9 * 8 * 8, 64),

nn.ReLU(True),

#nn.Dropout(),

nn.Linear(64, 64),

nn.ReLU(True),

#nn.Dropout(),

nn.Linear(64, num_classes),

)

def vgg_bn(**kwargs):

cfg = [16, 16, 'M', 32, 32, 'M', 32, 32, 'M', 64, 64, 'M', 64, 64, 'M']

model = VGG(make_layers(cfg, batch_norm=True), **kwargs)

class Inception_v1(nn.Module):

def __init__(self, num_classes=10):

super(Inception_v1, self).__init__()

#conv2d0

self.conv1 = conv3x3(3, 6)

self.max_pool1 = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)

self.lrn1 = nn.BatchNorm2d(6)

self.inception_3a = Inception_base(1, 6, [[16], [16,32], [8, 16], [3, 16]]) #3a

self.inception_3b = Inception_base(1, 80, [[40], [32,48], [12, 16], [3, 16]]) #3b

self.max_pool_inc3= nn.MaxPool2d(kernel_size=3, stride=2, padding=0)

self.inception_5a = Inception_base(1, 120, [[40], [32,48], [12, 16], [3, 16]]) #5a

self.inception_5b = Inception_base(1, 120, [[40], [32,48], [12, 16], [3, 16]]) #5b

self.avg_pool5 = nn.AvgPool2d(kernel_size=3, stride=2, padding=0)

self.dropout_layer = nn.Dropout(0.4)

self.fc = nn.Linear(120*9, num_classes)

引用

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

从0到1：魔乐社区贡献者丁一超的大模型量化实战指南

魔乐社区

所有评论(0)

查看更多评论

yongning1984

@weixin_42227109

已为社区贡献2条内容

resnet模型的图像分类结构图_比较 VGG, resnet和inception的图像分类效果

yongning1984

所有评论(0)

温馨提示：您尚未绑定手机号

yongning1984