Siri|如果Siri也是养成类游戏,该如何避免它成为种族主义者?( 二 )


当然,在不断更新数据,增加数据多样性的同时,也需要注意保护个人的隐私,需要在不违反法律、不侵害用户权利的原则下,进行数据的补充与完善。
其次,在输入原始数据前,需要对其进行预处理,包括对数据的清理和相关属性的隐藏。例如上述招聘网站的推荐系统,隐藏性别属性,强调职业中所需要的技能与经历,这样便可以减缓与避免性别在职业分工中占据过大比重。
最后,在搭建模型的过程中,需要有明确的目标,避免使用过于抽象化的概念来进行预测,并且准对不同的主体,需要有不同的参考标准。
例如一家银行在考虑是否为申请者提供贷款时,往往会考虑他的盈利能力、信誉度、还贷能力等,但这些都属于较为抽象的名词,无法用具体的数据来展示,研究者认为可以用信用卡的消费金额、消费次数、还贷时间等具体指标来进行衡量。
并且,报告还特别提醒,即使是具体化的指标也不一定适用所有人群,例如,信用卡的数据便无法用于第一次贷款的年轻人,因为他们此前可能没有使用信用卡的记录。
AI能够带来更好的决策,但如果无法彻底理解与解决算法偏见,它对于人们来说是空洞的,研究员Edward Santow认为,只有严谨的程式设计、无数次的测试、与实时的监测,才可以最大程度地避免人工智能犯下错误。
综合:南都人工智能伦理课题组研究员连俊翔 冯群星