YOLOv5的妙用：学习手语，帮助听力障碍群体( 二 ) 编辑：魔王、杜伟计算机视觉

?
尽管手语的使用和视频中有所不同，但这个示例表明当多个人出现在屏幕上时，模型可以分辨出不止一个手语实例。
模型局限性
David 发现，该模型还有一些地方有待改进。
距离
文章插图
?
许多原始图像是用手机拍摄的，手到摄像头的距离比较近，这对远距离推断有一定负面影响。
【YOLOv5的妙用：学习手语，帮助听力障碍群体】新环境?
文章插图
?
这支视频来自于志愿者，未用于模型训练。尽管模型看到过很多字母，但对此的预测置信度较低，还有一些错误分类。
?背景推断
文章插图
该测试旨在验证不同的背景会影响模型的性能。
结论
这个项目表明：计算机视觉可用于帮助听力障碍群体获取更多便利和教育资源！
该模型在仅使用小型数据集的情况下仍能取得不错的性能。即使对于不同环境中的不同手部，模型也能实现良好的检测结果。而且一些局限性是可以通过更多训练数据得到解决的。经过调整和数据集的扩大，该模型或许可以扩展到美式手语字母表以外的场景。
文章插图
资源?
Yolov5 GitHub 项目：
Yolov5 requirements：/blob/master/requirements.txt
Cudnn 安装指南：
OpenCV 安装指南：+to+install+opencv+in+python+3.8
Roboflow 增强流程：
常用图像数据增强技术综述论文：#Sec3
Pillow 库：
labelImg：
Albumentations 库：
原文链接：