品品科技 MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续( 二 )
文章图片
这个话题引起了谷歌研究科学家、YoshuaBengio的兄弟SamyBengio的注意 。 他认为 , 要从根本上改善弱势群体在学界的地位 , 应该从改变引用习惯做起 。
SamyBengio:建议大家多引用少数群体的论文
SamyBengio在自己的Facebook主页发帖表达了自己的看法 。
文章图片
坚持科学理性的学术立场虽然不易 , 但很有必要 , 这是提升机器学习社区质量和多样性的必由之路 。 我们大家每一小步的正确举动都将累积成社区长远发展的一大步 。 AdjiDieng这件事令我萌生了一种想法:我们所有人在引用彼此的文献时 , 可以有意识地选择那些关注度较低的作者的论文 , 而不是选择名人作者的论文;引用那些每天受系统性问题之害的作者 , 而不是那些已经受益颇多的作者 。 我们都清楚论文引用在机器学习领域至关重要 , 我的这个想法实施起来简单有效 。 大家觉得呢?有其他好的建议也请分享 。
对此 , 有人在reddit上发帖提问:学术引用真的已经只看作者 , 而不重论文实际内容了吗?
文章图片
对于SamyBengio博客中提出的「多引用关注度较低的作者的论文」 , 网友也纷纷表达了自己的看法 。
下面这位网友表示 , ta完全赞成引用关注度较低学者的论文 , 但绝不应该因为种族或者名气等外部原因而做出不理性客观的引用 , 要以论文相关性为引用基准 。
文章图片
而对于「学术引用已经基于作者 , 而非论文实际内容」的提问 , 下面这位网友表示 , 这似乎就是我们经常在做的事情 。 每篇论文都以「计算机视觉已经成功地应用于xx任务」开头 , 并且像完成任务般列举出与论文主题相关性甚小却由名人撰写的论文 。
文章图片
但也有人表示 , 虽然ta也认为不应该基于作者来引用论文 , 并且赞成支持少数群体论文的观点 。 但SamyBengio的建议是否正确仍待商榷 。
文章图片
盲目的学术崇拜肯定不利于新研究、新观点和新技术的推广 , 也不利于构建一个健康理性的社区 。 但如果真的按照SamyBengio的建议而有意识地多引用关注度较低的作者的论文 , 这是否又会走入另一个极端呢?
MIT删除TinyImages数据集
不止学者陆续发声表达自己的观点 , 学术机构也在行动 。
近日 , 为了营造健康的学术氛围 , 反对并遏制种族歧视等各类偏见 , MIT也采取了相应的行动:将存在种族歧视和性别偏见内容的TinyImages数据集永久移除 。
文章图片
TinyImages数据集中包含大量冒犯性标签的图像 。
该数据集创建于2006年 , 删除它的原因是这个有八千万张图像的数据集中含有大量的带有种族歧视等偏见的内容 。 比如 , 该数据集中有这样的照片:黑人和猴子的照片被贴上Nigger标签;穿着比基尼的妇女被贴上妓女的标签等 , 将毫无关系的图像内容和一些侮辱性词汇牵扯在一起 。 更糟糕的是 , 那些使用该数据集训练的AI模型也会带有这样的有害偏见 。
文章图片
TinyImages数据集中带有Nigger标签的图像 。
这些图像数据是基于WordNet分类词库从搜索引擎自动收集的 。 WordNet具有强大的关联性 , 会根据单词的意义将不同的词组成相应的集合 , 因而带有一定的偏向性 。 那么在搜索引擎上搜索图像时 , 获得的图片也相应地具有强烈的偏见性 。
- 科技犬君上半年用户喜爱手机盘点;小米电视大师65英寸OLED vs 索尼A9G 谁强?
- 科技生活快报TB5000mAh大电池还有65W超级快充!这些手机让你摆脱充电焦虑
- 精选泛科技一加8续航遭质疑:上半年最全机型横评出炉,结果如何?
- 阿拉图图科技说三星新机口碑虽好,但中国市场销量翻车,用户几乎跑光!
- 华为Mate30美科技界:华为再强大也只是一家民企,我们究竟在怕什么?
- 行业|高增长+高回撤!请收好这份“补票”名单,11只核心资产股入围,百亿科技股已跌出“深坑”
- 阿拉图图科技说 给做了!,雷军服不服?苹果要把雷军敢说不敢做的事情
- 网罗说科技 5G和iQOO Z1谁更强,简直不敢相信,同样是5G中端机,真我X50
- 黑叔科技 4K全面屏+独创性屏下透镜技术,你粉了吗,索尼顶级5G概念机曝光
- 快科技|阿里辟谣:不会高薪聘请黑阿里网站的人 直接交给警方