ai|可怕!被狠狠打了『马赛克』的图片,就这样被AI还原了
文章图片
文章图片
文章图片
文章图片
文章图片
『教资』成绩出来了 。
不知道大家报名考试了没?考过了没?分享了没?
昨晚 , #教师资格证书成绩#话题冲上微博热搜榜首 , 浏览量超过了21亿 , 不少网友在微博晒出自己的成绩单 。
有的高分通过 , 准备面试;有的凉凉 , 准备明年再接再厉;还有的单科卡在了69.....
这个就比较扎心了 。
不过更扎心的 , 可能是不仅教资没过 , 还因为晒图泄露了个人信息 。
你可能觉得奇怪 , 大家明明把“姓名、身份证号、准考证号”等个人敏感信息都打上了马赛克 , 为什么还会泄露信息?难不成还可以恢复?
可能还真的可以!
同样在昨晚 , GitHub上一个AI项目冲上了热榜 , 截止目前已经收获了8.4k星标 。
这个AI的主要功能就是:去除马赛克 , 还原字符密码 。
AI破解『密码』相信不少人都认为 , 只要打上了马赛克 , 就不会泄露敏感信息 , 因此 , 我们在朋友圈、微博等公开社交平台 , 经常能够看到打了马赛克的结婚照、证书照、成绩照等 。
但事实上 , 无论是图像、文字还是字符 , AI还原马赛克已经不是什么难事了 。
最近一位名为Sipke Mellema的程序员便开发了这样一款工具 。 他说 , 一些公司在内部文档中经常会使用像素化的方式显示密码 , 但没有工具可以从这样的图像中恢复密码 , 因此便创建了一个 。
我们先来看下效果图:
其中 , 第一行是被像素化后的密码序列 , 被狠狠地打了一层马赛克 , 看不出一点原始痕迹 。
第二行是经过AI还原后的密码 , 可以看到密码序列基本被还原了 , 而且准确度很高 , 只有稍加推理就能得到第三行的原始密码 。
那么 , 这个「不可思议」的AI还原技术是如何实现的?
我们知道 , 马赛克是图像像素化处理的一种手段 , 它通过将影像特定区域的色阶细节劣化并打乱色块 , 达到一种模糊图像的效果 。
像素化在许多领域被用于模糊图像信息 , 其中线性盒滤波器( Linear Box Filter)是一种较为普遍的处理算法 。 盒子滤波也称为方框滤波 , 它采用一个像素框 , 用该框中所有像素的平均值覆盖像素 。
像这样 , 表情图像被分为四个色块 , 每个色块被色块平均值所覆盖 , 最终形成了像素化表情 , 由于原始信息丢失 , 因此不能直接反转滤波器 。
Mellema正是利用了盒子滤波器 , 提出了AI还原算法-Depix 。
线性盒滤波器是一种确定性算法 , 对相同的值执行像素化通常会产生同样的像素块(Block) , 那么反之 , 使用相同位置的块对相同文本执行像素化 , 是否也会得到同样的块值?
Mellema尝试通过像素化文本来找出匹配的模式 , 结果发现确实如此 。
具体来说 , Mellema把每个块或块组合看作一个子问题 。 该算法要求在相同背景上 , 具备相同的文本大小和颜色 , 因此他没有选择创建潜在字符的查找表 , 因为现代文本编辑器可以添加色调、饱和度和亮度 , 也就是说存在海量潜在字符 。
在处理字符方面 , Mellema使用待处理字符的德布鲁因序列(De Bruijn sequence) , 将其粘贴到相同的编辑器中 , 然后截图 。 该截图可用作相似块的查找图像 , 例如:
德布鲁因序列包括待处理字符的所有双字符组合 , 这一点很重要 , 因为一些块会重叠两个字符 。
要找出合适的匹配需要搜索图像中具备相同像素配置的块 。 在测试中 , Depix 算法无法找到字符「o」 , 因为在搜索图像中 , 搜索块还包含下一个字母「d」 , 但在原始图像中这里有个空格 。
显然 , 在创建字符的德布鲁因序列时 , 如果加上空格会带来同样的问题 , 即算法无法找到后续字母恰当的块 。 有空格又有字母的图像需要更长的搜索时间 , 但结果也更好 。
- 中关村|柳传志在这里被骗、掘金,书写半部科技史的中关村经历了什么?
- vivo|热门水桶机上手体验:消费者的需求,被它拿捏得“死死的”
- iPhone|800亿没白出,台积电3nm芯片被确认,iPhone14配置良心有加
- 减值|暴风集团冯鑫被罚终身市场禁入
- 高通骁龙|仅撤离几个月,订单就被2大代工巨头“分走”?郭台铭都始料未及
- 监管机构|谷歌和Meta被俄罗斯监管机构告上法庭,或面临巨额罚款
- 联想集团|3亿消费者被“骗”,人民日报紧急“叫停”,注意这2个套路
- 华为|刚换的手机屏有绿边,被质疑不是原装,商家:是原装,没说是原厂
- 付费|腾讯奖励员工21亿港元股票;爱奇艺被曝大规模裁员;抖音短剧开启付费模式;豆瓣被约谈,所有小组回复功能已暂停丨文娱周报
- 倪光南|倪光南为何能被清理出联想?