基于深度学习的动物姿态识别 动物关键点识别 yolov8 pose(动物姿态识别+数据集+代码)

张开发
2026/4/20 20:05:09 15 分钟阅读

分享文章

基于深度学习的动物姿态识别 动物关键点识别 yolov8 pose(动物姿态识别+数据集+代码)
更多项目见主页不得不看的文章https://blog.csdn.net/qq1309399183?typeblog介绍这是基于《野外动物姿势》所做的工作。它包含了动物姿态数据集的介绍、标注文件和代码。动物姿态数据集是第一个用于通用动物姿势估计的大规模数据集。它包含了来自23个动物家族和54个物种的10,015张图像具有高质量的关键点标注。我们还包含了约50,00张带有家族和物种标签的图像。该数据集可用于监督学习、跨领域迁移学习、家族内和家族间领域等。它还可用于自监督学习、半监督学习等。标注文件采用COCO风格提供关键点定义具体定义如下背景环境安装步骤 0. 从官方网站下载并安装Miniconda。步骤 1. 创建并激活一个conda环境。conda create--nameopenmmlabpython3.8-yconda activate openmmlab步骤 2. 安装PyTorch按照官方说明进行操作例如在GPU平台上condainstallpytorch torchvision-cpytorch此命令将自动安装最新版本的PyTorch和cudatoolkit请检查它们是否与您的环境匹配。在CPU平台上condainstallpytorch torchvision cpuonly-cpytorch安装我们建议用户按照我们的最佳实践安装MMPose。然而整个过程是高度可定制的。请查看“自定义安装”部分以获取更多信息。最佳实践步骤 0. 使用MIM安装MMCV。pipinstall-Uopenmim miminstallmmcv-full数据及代码使用数据集准备请从下载部分下载数据集并将其解压缩到data文件夹下例如mkdirdata解压后的数据集应该如下所示AP-10K ├── mmpose ├── docs ├── tests ├── tools ├── configs |── data │ │ │-- 000000000002.jpg │ │-- ...推理可以从HRNet-w32、HRNet-w48、ResNet-50、ResNet-101下载检查点。python tools/test.pyCONFIG_FILEDET_CHECKPOINT_FILE训练bashtools/dist_train.shCONFIG_FILEGPU_NUM例如要在1个GPU上训练HRNet-w32模型请运行bashtools/dist_train.sh configs/animal/2d_kpt_sview_rgb_img/topdown_heatmap/a/hrnet_w3k_256x256.py1关键问题1. 数据集的创建目的是什么数据集的创建旨在促进动物姿势估计领域的研究。在更多来自不同物种的训练数据可用的情况下有必要研究一些具有挑战性的问题比如1不同代表性人体姿势模型在动物姿势估计任务上的性能如何2深度模型的表征能力是否受益于在具有不同物种的大规模数据集上的训练3在具有不同物种的大规模数据集的背景下预训练例如在ImageNet数据集或人体姿势估计数据集上的预训练的影响如何4在使用来自特定物种或家族的数据训练的模型中模型的家族内和家族间泛化能力如何然而先前用于动物姿势估计的数据集包含有限数量的动物物种。因此使用现有数据集无法研究这些问题因为它们包含的最多只有5种物种这远远不足以得出可靠的结论。相比之下数据集包含23个家族和54个物种因此可以帮助研究人员研究这些问题。2. 是否进行了数据清理我们使用aHash算法检测相似图像并进行手动检查删除了重复的图像。手动删除了有重叠和标志的图像。清理后的图像被分类到不同的物种和家族中。3. 关键点如何指导进行标注标注者首先了解动物的相貌、体型和关键点分布。然后给标注者展示每个物种的五张图像用于标注关键点这些标注用于评估其标注质量。具有良好标注质量的标注者进一步接受培训了解如何处理由于遮挡导致的身体部分的部分缺失并参与后续的标注过程。标注者被要求标注所有可见的关键点。对于被遮挡的关键点他们被要求标注他们可以根据身体结构、姿势和身体的对称性估计的关键点其中可以从可见的肢体或关键点推断出被遮挡的肢体的长度或被遮挡的关键点的位置。其他关键点则保持未标记。为了确保标注质量我们采用了顺序标注策略。进行了三轮交叉检查和校正包括手动检查和自动检查根据特定规则例如属于同一实例的关键点位于同一边界框中以减少可能的错误标注。首先标注者标注了每个实例的关键点并向经验丰富的高级标注者提交了版本-1标签然后经验丰富的高级标注者检查了版本-1标签的质量并向标注者返回了错误列表标注者根据此列表修复了这些错误。最后标注者向经验丰富的高级标注者提交了修复后的版本-2标签他们进行最后的校正查找任何潜在的错误标注的关键点。完成所有三轮工作后带有高质量标签的数据集的发布版本完成了。结果展示最后有问题看下方推广↓↓↓看不到请升级浏览器

更多文章