AIGC的“含科量”与“含资量”

编辑导语:随着时代的更迭、技术的演变,互联网的内容生产逐渐出现了新的流行趋势,即由AI生产内容(AIGC)。那么,这类内容的生产是否能够满足用户的需求,是否能够替代人工内容生产带给用户的体验?乘着元宇宙浪潮,AIGC这股风还能“吹”多远?
AIGC的“含科量”与“含资量”
文章插图
2014年的时候,我在互联网企业里做内容工作,当时业内很流行凯文·凯利的“一千个粉丝”理论,相信“找到一千个种子用户,产品就能够活下去”。
找到种子用户干嘛呢?核心KPI之一,就是鼓励他们创造内容,提高平台的UGC数量与质量。
普通人也轻松能创作的图文短视频,用爱发电的同人衍生,极具创意的鬼畜视频……UGC(User-generated content用户生产内容),以高效、丰富、多元的产出方式,和PGC(Professional-generated content专家生产内容)、OGC(Occupationally-generated Content职业生产内容)一起,让互联网数字内容呈现出前所未有的繁荣多彩。
一个时代有一个时代的主题,如今业内流行的内容生产模式,则是AIGC。
AI-generated content,字面意思是AI生产内容。AI写诗、AI作曲、AI绘画、AI换脸……甚至有创始人认为,游戏中导入图片生成模型的“捏脸系统”都是AIGC。
那么问题来了,让AI替人舞文弄墨,对话交互问答、创意写作、生成诗歌图文或是以假乱真的视频,不都是旧新闻了嚒,都属于自然语言生成Natural Language Generation(NLG)的应用,是NLP自然语言处理技术的一大类任务,已经应用将近30年了。
怎么突然就以AIGC的概念成为资本热捧的对象呢?
故事恐怕还是要从“元宇宙”说起。
一、AIGC,到底生产的是什么内容?在内外网搜索 “AIGC”时,精准匹配的是简体中文信息,而英文AI-generated content一词,在海外平台主要还是以自动化生成文本的NLG技术为主。所以,AIGC应该是一个在中国率先流行起来的专有名词。
AIGC的“含科量”与“含资量”
文章插图
AIGC的“含科量”与“含资量”
文章插图
目前为止,与AIGC相关的创作类型主要有三种:
1)内容平台的一种自动化作业方式,比如CCTV的AIGC平台,就包括智能采编、模板生成、画质优化等等;部分语音类app,通过语音合成(TTS)技术,提供文本自动转语音的能力;流媒体平台,通过算法对画面画质进行优化,提高清晰度等等。
AIGC的“含科量”与“含资量”
文章插图
2)AI科研机构的多模态应用,实现内容生成。比如中科院自动化所的跨模态通用人工智能平“紫东太初”,就能够做到“以图生音”“以音生图”。百度文心大模型的“AI画家”,则在前不久的元宵节,生成与地点相匹配的专属画作。
3)科技企业及创业公司的数字人、虚拟人制作。通过自主开发、平台开发等形式,合成全新的人物形象,与用户开展互动。比如AI手语主播,通过AI算法将文本转化为手语信息,为听障朋友提供服务;品牌代言人,火星车数字人祝融号跟广大用户进行互动;虚拟偶像,通过生动的表情、动作、语言等展示才艺,与粉丝对话;以及智能客服、游戏陪玩等等。
通过上述AIGC应用,或许不难理解,为什么NLG往往依靠夸张新闻点(比如deepfake)偶尔进入大众视野,而AIGC一词出道即爆红了。
二、小红靠捧,大红靠命:AIGC的“含科量”有多高?如前所说,自然语言生成NLG作为AI创作内容的一种主流方式,此前在大部分时间内都是行业内自娱自乐,偶尔凭借“换脸”之类的奇趣新闻火一把,但仅此而已。而AIGC这一概念,在当下能够迅速走红,可以说是时也、运也。
首先,深度学习技术本身不断迭代,能够生成更具个性化、拟人化的内容。
随着自然语言处理技术的不断发展,近年来AI的阅读理解创作能力进步飞快,已经达到了惊人的水平,技术成熟给了AIGC广泛应用的基础。
随着AI模型GPT-3的问世,机器已经能够达到人类小学的阅读写作水平,顶级AI企业的中文普通话识别准确率能够达到98%以上,多语言、小语种、方言的识别率也不断升级。此外,情感计算、因果计算、知识图谱、元学习等多种技术开始被引入深度学习,大幅改善了人机交互的自然感。
这些新成果应用在内容创作上,就是大家能看到AI写出更流利通顺的文章、用更自然的音色去朗读一本书、更声情并茂地跟人对话、对用户输入的语句理解得更准确,一句话,终于开始摆脱“人工智障”的标签了。