YOLOv5的妙用:学习手语,帮助听力障碍群体( 二 )
?
尽管手语的使用和视频中有所不同 , 但这个示例表明当多个人出现在屏幕上时 , 模型可以分辨出不止一个手语实例 。
模型局限性
David 发现 , 该模型还有一些地方有待改进 。
距离
文章插图
?
许多原始图像是用手机拍摄的 , 手到摄像头的距离比较近 , 这对远距离推断有一定负面影响 。
【YOLOv5的妙用:学习手语,帮助听力障碍群体】新环境?
文章插图
?
这支视频来自于志愿者 , 未用于模型训练 。 尽管模型看到过很多字母 , 但对此的预测置信度较低 , 还有一些错误分类 。
?背景推断
文章插图
该测试旨在验证不同的背景会影响模型的性能 。
结论
这个项目表明:计算机视觉可用于帮助听力障碍群体获取更多便利和教育资源!
该模型在仅使用小型数据集的情况下仍能取得不错的性能 。 即使对于不同环境中的不同手部 , 模型也能实现良好的检测结果 。 而且一些局限性是可以通过更多训练数据得到解决的 。 经过调整和数据集的扩大 , 该模型或许可以扩展到美式手语字母表以外的场景 。
文章插图
资源?
Yolov5 GitHub 项目:
Yolov5 requirements:/blob/master/requirements.txt
Cudnn 安装指南:
OpenCV 安装指南:+to+install+opencv+in+python+3.8
Roboflow 增强流程:
常用图像数据增强技术综述论文:#Sec3
Pillow 库:
labelImg:
Albumentations 库:
原文链接:
- 智能手机市场|华为再拿第一!27%的份额领跑全行业,苹果8%排在第四名!
- 会员|美容院使用会员管理软件给顾客更好的消费体验!
- 行业|现在行业内客服托管费用是怎么算的
- 人民币|天猫国际新增“服务大类”,知舟集团提醒入驻这些类目的要注意
- 国外|坐拥77件专利,打破国外的垄断,造出中国最先进的家电芯片
- 技术|做“视频”绿厂是专业的,这项技术获人民日报评论点赞
- 面临|“熟悉的陌生人”不该被边缘化
- 中国|浅谈5G移动通信技术的前世和今生
- 页面|如何简单、快速制作流程图?上班族的画图技巧get
- 桌面|日常使用的软件及网站分享 篇一:几个动态壁纸软件和静态壁纸网站:助你美化你的桌面