YOLOv5的妙用:学习手语,帮助听力障碍群体( 二 )


?
尽管手语的使用和视频中有所不同 , 但这个示例表明当多个人出现在屏幕上时 , 模型可以分辨出不止一个手语实例 。
模型局限性
David 发现 , 该模型还有一些地方有待改进 。
距离
YOLOv5的妙用:学习手语,帮助听力障碍群体文章插图
?
许多原始图像是用手机拍摄的 , 手到摄像头的距离比较近 , 这对远距离推断有一定负面影响 。
【YOLOv5的妙用:学习手语,帮助听力障碍群体】新环境?
YOLOv5的妙用:学习手语,帮助听力障碍群体文章插图
?
这支视频来自于志愿者 , 未用于模型训练 。 尽管模型看到过很多字母 , 但对此的预测置信度较低 , 还有一些错误分类 。
?背景推断
YOLOv5的妙用:学习手语,帮助听力障碍群体文章插图
该测试旨在验证不同的背景会影响模型的性能 。
结论
这个项目表明:计算机视觉可用于帮助听力障碍群体获取更多便利和教育资源!
该模型在仅使用小型数据集的情况下仍能取得不错的性能 。 即使对于不同环境中的不同手部 , 模型也能实现良好的检测结果 。 而且一些局限性是可以通过更多训练数据得到解决的 。 经过调整和数据集的扩大 , 该模型或许可以扩展到美式手语字母表以外的场景 。
YOLOv5的妙用:学习手语,帮助听力障碍群体文章插图
资源?
Yolov5 GitHub 项目:
Yolov5 requirements:/blob/master/requirements.txt
Cudnn 安装指南:
OpenCV 安装指南:+to+install+opencv+in+python+3.8
Roboflow 增强流程:
常用图像数据增强技术综述论文:#Sec3
Pillow 库:
labelImg:
Albumentations 库:
原文链接: