AI|YouTube网红程序员 修复美、日、俄多国古老街景视频

油管上一位 Up 主,修复历史视频上了瘾 。目前,他已经利用 AI 技术修复了百年前的纽约、东京等地的街头视频 。继上次感受百年前老北京街景之后,让我们穿越到百年前的东京、纽约街头看看吧!
同一时期,全球其它城市又是什么模样?一位来自俄罗斯的工程师 Denis Shiryaev(丹尼斯·谢里亚耶夫),用 AI 技术修复了多部老视频,也在 YouTube 上火了一把 。
从 1896 年的莫斯科,到 1911 年的纽约,再到 1913 年的东京,Denis 让网民们感受到了百年前,这些城市的风情 。
修复《火车进站》一战成名
今年 2 月,Denis Shiryaev 在 YouTube 上传了一段用 AI 技术修复的人类史上第一部电影——《火车进站》 。
让他意外的是,这段视频一夜走红,截至目前这段修复电影已达到 400 多万次的播放量 。
修复后的彩色有声版《火车进站》
125 年后,原本仅仅 50 秒的无声黑白电影,被 Denis 利用 AI 技术加上了色彩,并将其升级为 4K、60 fps 画质的高清版本,让现在的我们,得以看到更加真实的历史画面 。
纽约、东京、莫斯科视频修复:给网友交作业
在第一次的修复作品获得巨大反响之后,Denis 应广大网友请求,接着又修复了多段老视频,带大家感受百年前的莫斯科、纽约和东京 。

AI|YouTube网红程序员 修复美、日、俄多国古老街景视频
文章图片
中图为Denis Shiryaev
1896 莫斯科:热闹的商业街头
Denis 的 AI 时光机,首先选择了 1896 年的莫斯科,这座城市于 1147 年沿莫斯科河而建,至今已有近 900 年历史 。
19 世纪末的俄罗斯,刚刚完成工业革命,各类工业和贸易的企业已达两万多个,工人人数达到了 12 万 。
特维尔大街,至今仍是莫斯科最繁华的商业、娱乐中心
视频中所记录的正是莫斯科的特维尔大街,商铺林立,马车、警察、商人熙熙攘攘 。
沿着这条街步行不到 2 公里,即可到达当时的沙皇住所,也是现在俄罗斯的总统府 —— 著名的克林姆林宫 。
1911 纽约:欧洲移民的美国梦
Denis 还选择了 1911 年纽约市的一段著名视频,进行了修复 。
这段时长 8 分 35 秒的视频,把人们带回到 1911 年,当时的美国,正处于快速城市化时期,第二次工业革命在美国创造了大量就业机会 。
原片由瑞典某公司拍摄,名为《纽约之旅》,由现代艺术博物馆于 2018 年公开
19 世纪末 20 世纪初,大批因社会停滞而陷入失业的欧洲人,选择远渡重洋去追寻“美国梦” 。
来自欧洲的移民潮达到高峰 。其中最著名的就是 1912 年 4 月,从英国出发的泰坦尼克号 。
在《纽约之旅》的开头中,也是一艘游轮缓缓驶向高楼林立,车水马龙,繁华热闹的纽约 。
1913-1915 东京:明治维新后的稳定繁荣
这段原素材,由外国摄影师在 1913 年至 1915 年间的日本东京拍摄,拍摄期间,第一次世界大战(1914-18 年)刚刚拉开序幕 。
而此时的日本,经过明治维新后的数十年平稳发展,正是一片盛世 。东京的人口恢复到明治维新前的最高水平,超过 200 万人 。
网友评论:那时候人们盯着摄像头
就像它是一个外形探测器一样
街头上身着西服的日本老师,头戴礼帽的路人,无不体现着当时的日本,正经历着西方文化与东方文化交融的变革时刻 。
能够实现这些结果,Denis Shiryaev 谦虚地表示,都要归功于 DAIN、ESRGAN、DeOldify 等 AI 技术 。通过这些技术,任何人都可以做到 。
老视频修复三步套路:提升画质、插帧、上色
提升画质利器:Gigapixel AI
据 Denis 介绍,他首先使用了 Topaz Labs 开发的商业图像编辑软件 Gigapixel AI,将原本分辨率极低的视频,按比例放大 600%,提升为 4K 画质 。
Gigapixel AI 的工作原理类似于 ESRGAN(一种超分辨率复原技术),利用其专有的插值算法(interpolation algorithm),可以分析图像并识别细节和结构,进一步“完成”图像。
为了避免放大后的图像模糊,该软件利用深度卷积神经网络技术,分析了数百万张成对的图像,了解图像中的细节如何丢失,然后在新图像中将细节填充进去 。

AI|YouTube网红程序员 修复美、日、俄多国古老街景视频
文章图片
该软件已支持常见的视频格式无损放大
补帧模型:DAIN
接着,Denis 使用深度感知视频帧插值模型 DAIN,在现有视频片段的关键帧之间,靠模型的“想象”创建并插入视频里以前并不存在的帧,以此将视频的帧率增加到 60 帧每秒 。
DAIN(Depth-Aware Video Frame Interpolation)是上海交通大学一位博士生包文博开发的插帧算法,该算法可以从把 30 帧的视频“脑补”成 480 帧,让视频更流畅 。

AI|YouTube网红程序员 修复美、日、俄多国古老街景视频
文章图片 分页标题
将 30 fps 视频补帧到 60 fps 后的效果对比
上色:DeOldify
在上色环节,作者使用了 DeOldify,该技术的开发者目的就是为旧照片着色 。其原理是使用 NoGAN 技术,它结合了 GAN 训练的优点,比如出色的上色效果,同时也消除了一些副作用,比如画面着色不稳定、闪烁的现象 。

AI|YouTube网红程序员 修复美、日、俄多国古老街景视频
文章图片
项目作者给出的上色示例,原照片拍摄于 1890 年代后期
最后,对于早期的一些无声视频,Denis 还为其加上了一些和视频相对应的音效素材,让整体的视听效果更为真实 。
Denis 表示,自己热爱机器学习技术领域,修复古老视频只是他对这种技术应用的结果展示 。他会继续在 GitHub 上寻找此类技术,并在博客持续分享自己的学习结果 。
【AI|YouTube网红程序员 修复美、日、俄多国古老街景视频】
AI|YouTube网红程序员 修复美、日、俄多国古老街景视频
文章图片
1988 年出生的 Denis 经常在 Instagram 上晒一些旅行照
看来是一位热爱技术也热爱生活的小哥哥