Matlab 2022深度学习实战：使用CNN-LSTM进行猫狗图像分类

张开发

• 2026/4/13 16:58:18 • 15 分钟阅读

分享文章

Matlab深度学习使用CNN-LSTM进行图像分类。如何在Matlab中搭建CNN-LSTM也是曾经困扰本人挺长时间的问题。数据可换成自己的数据。注意需要Matlab 2022版本2021不确定行不行2020以下肯定是不行。工作如下: 1、数据集为猫狗二分类数据集共1000张图像。按4:1比例随机划分训练集和测试集训练集为400只猫400只狗测试集为100只猫和100只狗。 2、搭建CNN-LSTM网络。 3、训练。 4、测试输出准确率画出混淆矩阵。注本程序只是帮助大家参考如何在Matlab中搭建CNN-LSTM模型用的卷积核数量很少LSTM隐含单元数目也非常少故本实验结果较差。如需要提高准确率可有偿作修改。程序包括程序和图像文件可直接运行注释详细可自行修改各个层以提高准确率。最近在折腾Matlab的CNN-LSTM图像分类发现网上的教程不是太老就是跑不通。自己踩了半个月坑终于搞定了基础版虽然准确率有点拉胯毕竟为了演示随便搭的结构但好歹能跑起来给各位打个样。先看数据准备部分。猫狗各500张直接塞进ImageDatastore注意文件路径的猫狗分类得用不同文件夹存好imds imageDatastore(pet_images,IncludeSubfolders,true,LabelSource,foldernames); [imdsTrain,imdsTest] splitEachLabel(imds,0.8,randomized);这里有个坑Matlab的splitEachLabel如果数据量少可能会分不匀建议用countEachLabel检查下分布。如果发现训练集猫狗数量不对得手动调整随机种子重分。网络结构才是重头戏。咱们用CNN抽特征再把特征序列喂给LSTM。注意输入层必须用sequenceInputLayer卷积层后面要接sequenceFolding强制转序列layers [ sequenceInputLayer([227 227 3],Name,input) % 输入必须带sequence convolution2dLayer(3,8,Padding,same,Name,conv1) batchNormalizationLayer(Name,bn1) reluLayer(Name,relu1) maxPooling2dLayer(2,Stride,2,Name,pool1) sequenceFoldingLayer(Name,fold) % 关键转换层 lstmLayer(32,OutputMode,last,Name,lstm) fullyConnectedLayer(2,Name,fc) softmaxLayer(Name,softmax) classificationLayer(Name,classOutput)];这里lstmLayer的OutputMode要设成last因为咱们是要整个序列的最终状态做分类。如果遇到维度报错八成是sequenceFolding的位置没放对得确保卷积操作在折叠之前完成。Matlab深度学习使用CNN-LSTM进行图像分类。如何在Matlab中搭建CNN-LSTM也是曾经困扰本人挺长时间的问题。数据可换成自己的数据。注意需要Matlab 2022版本2021不确定行不行2020以下肯定是不行。工作如下: 1、数据集为猫狗二分类数据集共1000张图像。按4:1比例随机划分训练集和测试集训练集为400只猫400只狗测试集为100只猫和100只狗。 2、搭建CNN-LSTM网络。 3、训练。 4、测试输出准确率画出混淆矩阵。注本程序只是帮助大家参考如何在Matlab中搭建CNN-LSTM模型用的卷积核数量很少LSTM隐含单元数目也非常少故本实验结果较差。如需要提高准确率可有偿作修改。程序包括程序和图像文件可直接运行注释详细可自行修改各个层以提高准确率。训练配置别手贱开太大batchsize显存分分钟爆炸。建议先用小学习率试水options trainingOptions(adam,... ExecutionEnvironment,auto,... MiniBatchSize,16,... MaxEpochs,10,... InitialLearnRate,1e-4,... Shuffle,every-epoch);开训后如果看到loss曲线像心电图可以试试在卷积层后加dropout。不过注意Matlab的dropout层在序列处理时可能会引发维度错误这时候得换成spatialDropout2dLayer。测试阶段要特别注意数据预处理的一致性。有个邪门bug是验证时自动resize和训练时不一致建议强制指定augimdsTest augmentedImageDatastore([227 227],imdsTest,ColorPreprocessing,rgb2gray); predLabels classify(net,augimdsTest); accuracy sum(predLabels imdsTest.Labels)/numel(imdsTest.Labels)混淆矩阵画起来倒是简单但记得把类别顺序固定住不然猫狗标签可能会反转confMat confusionmat(imdsTest.Labels,predLabels); confusionchart(confMat,{cat,dog})跑完大概能到60%左右的准确率——确实不咋地毕竟卷积核只用了8个LSTM单元也才32个。想要提升的话可以试试这些魔改方案把卷积核堆到64加残差连接LSTM换成biLSTM单元数提到128在全连接前插globalAveragePooling2dLayer数据增强里加随机旋转和颜色抖动改的时候注意每加一层都要算清楚输出维度Matlab的维度报错信息堪比天书。曾经因为忘了调整sequenceFolding的位置生生折腾了两天...完整代码已打包解压后注意把图像路径改成自己的存放位置。环境变量设不对的话可能会报什么无法读取JPEG文件头的错这种情况建议用imread先检查下图片是否损坏。最后说句实在话真要搞实战还是建议用PythonMatlab的深度学习工具箱在自定义结构时还是有点笨重。不过对于习惯Simulink的朋友来说这个方案倒是个不错的过渡选择。

Matlab 2022深度学习实战：使用CNN-LSTM进行猫狗图像分类

最新文章

别再踩坑了！手把手教你用Nacos 2.x + Redis 7.x 搞定若依微服务版RuoYi-Cloud的本地部署

番茄小说下载器：为数字阅读爱好者打造的离线图书馆解决方案

优选算法--bfs解决最短路问题

千问3.5-9B快速部署教程：10分钟搞定Ubuntu环境与模型调用

Optimizing Clock Tree Synthesis: From Library Path Delays to Pin-Level Latencies

GLM-OCR识别结果后处理：结合LSTM优化序列文本准确率

推荐文章

DE1-SoC实战指南：在Qsys/Platform中集成GHRD工程与扩展SPI外设——（de1教程2.5节）

5个核心技术维度解析Cursor Pro激活工具：从机器标识到订阅验证的完整技术栈

vLLM推理引擎教程7-CUDA Graph：从原理到实战的性能优化指南

Rust 泛型与特征约束的应用

利用 milvus-backup 完成从单机到分布式 Milvus 的无缝数据迁移实战

风险管理的识别评估与应对策略

相关文章

Java PTA练习避坑指南：如何避免PersonOverride类中的常见错误（含完整代码示例）

DanKoe 视频笔记：成为失败者：重新定义成功与快乐 [特殊字符]

Caxa二次开发环境配置避坑指南：从ObjectCRX安装到HelloWorld运行

5分钟极速部署：Sakura启动器如何让AI翻译变得像聊天一样简单？

LuckyLilliaBot深度解析：高性能NTQQ OneBot 11协议框架架构设计与实现

OpenClaw 2026年3月史诗级迭代全景深度分析报告：从危机到新生，从工具到生态操作系统

分享文章

更多文章

2025届毕业生推荐的十大AI论文方案横评

[Python3高阶编程] - 异步编程深度学习指南四：pytest中如何调试异步编程(asyncio)

【紧急预警】边缘AI代理正在 silently fail：检测你系统中潜藏的3类静默降级（模型静默退化/上下文截断/状态同步断裂）及自动修复DSL

EF Core 慢查询排查实战：TagWith、OpenTelemetry、执行计划，分钟定位性能瓶颈九

Cadence Allegro中Pin Delay与过孔长度对高速走线等长的影响分析

MeteorSeed麓

告别臃肿：用Python+DuckDB构建轻量级数据仪表盘

软件测试人员，别再贩卖AI焦虑了！

RTF文件中的多语言编码实战：从ANSI到Unicode的完整解析

基于cruise的仿真模型搭建及效果分析：丰田氢能源车型在wltc工况下的跟随优势

Springboot 实现多数据源(PostgreSQL 和 SQL Server)连接匚

WPS-Zotero终极指南：如何在Linux和Windows上无缝管理论文引用