基于CNN-SVM/LSSVM的手写数字图像识别，MNIST数据集，MALAB代码实现

今天出一期基于CNN-SVM/LSSVM的手写数字识别。流程大致如下：①采用CNN对MNIST数据集进行分类；②采用CNN提取MNIST手写数字图片特征，然后采用SVM对提取到的特征进行分类；③采用CNN提取MNIST手写数字图片特征，然后采用LSSVM对提取到的特征进行分类；一、MNIST数据集简介关于MNIST数据集在很多图像识别的论文中都会用到，是一个很经典的数据集。MNIST手写数据集包含

今天吃饺子

816人浏览 · 2023-12-26 16:43:38

今天吃饺子 · 2023-12-26 16:43:38 发布

今天出一期基于CNN-SVM/LSSVM的手写数字识别。流程大致如下：

①采用CNN对MNIST数据集进行分类；

②采用CNN提取MNIST手写数字图片特征，然后采用SVM对提取到的特征进行分类；

③采用CNN提取MNIST手写数字图片特征，然后采用LSSVM对提取到的特征进行分类；

一、MNIST数据集简介

关于MNIST数据集在很多图像识别的论文中都会用到，是一个很经典的数据集。MNIST手写数据集包含70000个样本，每个样本为28×28像素的灰度图片，其中训练集有60000张图片，测试集有10000张。MNIST数据集下载地址是http://yann.lecun.com/exdb/mnist/，包含了4 个部分：

训练集：train-images-idx3-ubyte.gz （9.45 MB，包含60,000个样本）。

训练集标签：train-labels-idx1-ubyte.gz（28.2 KB，包含60,000个标签）。

测试集：t10k-images-idx3-ubyte.gz（1.57 MB ，包含10,000个样本）。

测试集标签：t10k-labels-idx1-ubyte.gz（4.43 KB，包含10,000个样本的标签）。

采用matlab代码处理MNIST数据集如下：

clear all;
close all;
clear
%% %% 原始数据有6万个训练集和1万个测试集，由于要对SVM进行优化，当数据太大时，
% 程序跑起来会很慢，因此随机抽取一些数据即可验证方法准确性
% 选取6000个训练集，和1000个测试集
N_sample = 6000;
N_test=1000;
XTrain = zeros(28,28,1,N_sample);
YTrain=zeros(N_sample,1);


fidimg1=fopen('train-images.idx3-ubyte','rb');
fidimg2=fopen('train-labels.idx1-ubyte','rb');      


[img,count]=fread(fidimg1,16);   % table head
[imgInd,count1]=fread(fidimg2,8);   %table head
for k=1:N_sample    
    [im,~]=fread(fidimg1,[28,28]);
    ind=fread(fidimg2,1);
    XTrain(:,:,1,k)=im';
    YTrain(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTrain=categorical(YTrain);


XTest = zeros(28,28,1,N_test);
YTest=zeros(N_test,1);
fidimg1=fopen('t10k-images.idx3-ubyte','rb');
fidimg2=fopen('t10k-labels.idx1-ubyte','rb');


[img,count]=fread(fidimg1,16);
[imgInd,count1]=fread(fidimg2,8);
for k=1:N_test    
    [im,~]=fread(fidimg1,[28,28]);
    ind=fread(fidimg2,1);
    XTest(:,:,1,k)=im';
    YTest(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTest=categorical(YTest);


%% 图片可视化
% ……………………图片可视化……………………
%注意，原始样本训练集有6万个，这里只取前60个
for i = 1:60
    img = XTrain(:,:,1,i);
    subplot(6,10,i)
    image(img);
    ax=gca;
    ax.XAxis.Visible='off';
    ax.YAxis.Visible='off';
end

上述代码实现了对MINIST数据集的训练集与测试集划分，并选取部分图片进行可视化，可视化结果如下：