今天出一期基于CNN-SVM/LSSVM的手写数字识别。流程大致如下:

①采用CNN对MNIST数据集进行分类;

②采用CNN提取MNIST手写数字图片特征,然后采用SVM对提取到的特征进行分类;

③采用CNN提取MNIST手写数字图片特征,然后采用LSSVM对提取到的特征进行分类;

一、MNIST数据集简介

关于MNIST数据集在很多图像识别的论文中都会用到,是一个很经典的数据集。MNIST手写数据集包含70000个样本,每个样本为28×28像素的灰度图片,其中训练集有60000张图片,测试集有10000张。MNIST数据集下载地址是http://yann.lecun.com/exdb/mnist/,包含了4 个部分:

训练集:train-images-idx3-ubyte.gz (9.45 MB,包含60,000个样本)。

训练集标签:train-labels-idx1-ubyte.gz(28.2 KB,包含60,000个标签)。

测试集:t10k-images-idx3-ubyte.gz(1.57 MB ,包含10,000个样本)。

测试集标签:t10k-labels-idx1-ubyte.gz(4.43 KB,包含10,000个样本的标签)。

采用matlab代码处理MNIST数据集如下:

clear all;
close all;
clear
%% %% 原始数据有6万个训练集和1万个测试集,由于要对SVM进行优化,当数据太大时,
% 程序跑起来会很慢,因此随机抽取一些数据即可验证方法准确性
% 选取6000个训练集,和1000个测试集
N_sample = 6000;
N_test=1000;
XTrain = zeros(28,28,1,N_sample);
YTrain=zeros(N_sample,1);


fidimg1=fopen('train-images.idx3-ubyte','rb');
fidimg2=fopen('train-labels.idx1-ubyte','rb');      


[img,count]=fread(fidimg1,16);   % table head
[imgInd,count1]=fread(fidimg2,8);   %table head
for k=1:N_sample    
    [im,~]=fread(fidimg1,[28,28]);
    ind=fread(fidimg2,1);
    XTrain(:,:,1,k)=im';
    YTrain(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTrain=categorical(YTrain);


XTest = zeros(28,28,1,N_test);
YTest=zeros(N_test,1);
fidimg1=fopen('t10k-images.idx3-ubyte','rb');
fidimg2=fopen('t10k-labels.idx1-ubyte','rb');


[img,count]=fread(fidimg1,16);
[imgInd,count1]=fread(fidimg2,8);
for k=1:N_test    
    [im,~]=fread(fidimg1,[28,28]);
    ind=fread(fidimg2,1);
    XTest(:,:,1,k)=im';
    YTest(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTest=categorical(YTest);


%% 图片可视化
% ……………………图片可视化……………………
%注意,原始样本训练集有6万个,这里只取前60个
for i = 1:60
    img = XTrain(:,:,1,i);
    subplot(6,10,i)
    image(img);
    ax=gca;
    ax.XAxis.Visible='off';
    ax.YAxis.Visible='off';
end

上述代码实现了对MINIST数据集的训练集与测试集划分,并选取部分图片进行可视化,可视化结果如下:

493f263f95189147e673f0362cd52240.png

二、CNN分类结果

b11f7f6487b3793ff9b2d583d2a97b17.png

三、CNN-SVM分类结果

21e2980b3c965483f45c2f996a1c4238.png

26652cabba5e77f0729a8f2d2565a819.png

四、CNN-LSSVM分类结果

8f9bf418b18f717283dea5e563e4d77d.png

573b32e747594721a2b54e9953f8f9b8.png

五、代码目录

cf9ff28b25fef34314fb3382e9c15575.png

以上提到的所有图片,代码均可运行出来。

点击下方卡片获取更多代码!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐