黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片( 二 )


今年2月 , 我们报道了国外网友DenisShiryaev利用一种增强程序(GigapixelAI) , 将1896年的古董电影《火车进站》 , 转变成了4K60fps高清“大电影” 。
黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片
文章图片
在修复帧率方面 , 主要采用的技术是AI插值 。
据Shiryaev介绍 , 他采用的是一种叫做GigapixelAI的商业图像编辑软件(付费) 。 这款软件由Topaz实验室创造 , 可以让图像的质量提升600% 。
黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片
文章图片
它利用一种专有的插值算法 , 对图像做分析、识别其细节和结构 , 最后将额外的“信息”填充到图像中 。
这个工作量是什么概念?
普通的高清是1920×1080 , 总像素为2073600 , 而4K高清是3840x2160 , 总像素是8294400 。
也就是说 , 光是要把普通高清提升到4K高清 , 就需要额外填充600万个像素 。
不仅如此 , 还需要弄清楚如何显示这些额外的像素 , 这就是插值过程的用武之地 。
插值估计每个新像素要显示什么内容 , 这个过程是基于它们周边的像素 。 对于这一点 , 有许多方法可以来衡量 。
最近邻(NearestNeighbor)方法 , 会简单地用与其最近邻相同的颜色填充空白像素 。 它虽然简单而有效 , 但结果是一个锯齿状、明显像素化的图像 。
黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片
文章图片
双线性插值(BilinearInterpolation)方法需要更多的处理能力 , 但它基于最近的两个像素来分析空白像素 , 并在它们之间生成一个梯度 , 这会让图像变得更加清晰 。
黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片
文章图片
而双三次插值(BicubicInterpolation)会对其16个最近邻像素进行了采样 , 这样就会让着色变得精确 , 但仍然存在图像模糊的问题 。
黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片
文章图片
通过结合双线性插值和双三次插值 , 就可以生成光学质量损失最小的放大图像 。
而这一过程 , GigapixelAI利用深度卷积神经网络来完成 。
解决了像素低的问题 , 还需要解决视频卡顿问题 。
GigapixelAI在关键帧之间进行“想像”之后 , 把这些想像出来的帧插进去 。
而它插入的帧数多到可以让视频速率提高到60FPS 。
这就是古董电影也能变得如此清晰、流畅的原因 。
至于着色工作 , 同样是利用神经网络 , 从一堆彩色照片开始 , 将它们转换成黑色和白色 , 然后再重建彩色原图 。
那么 , 在看到百年前栩栩如生的生活状态 , 你会有想穿越回去的冲动吗?
快来评论区写下你的感受吧~
参考链接:
https://weibo.com/2395607675/J0ZsQnP6a?filter=hot&root_comment_id=4502616270201172&type=comment
https://arstechnica.com/science/2020/02/someone-used-neural-networks-to-upscale-a-famous-1896-video-to-4k-quality/
—完—
【黑叔科技还原1920年的京城生活,大神利用AI修复古董纪录片】想要获得更多数据科学领域相关动态 , 诚邀关注清华-青岛数据科学研究院官方微信公众平台“数据派THU” 。