AI人工智能百度技术委员会主席吴华联合发布“千言”计划 共建最大中文NLP数据集( 二 )


吴华表示 , 在未来3年中 , 千言计划面向超20个任务 , 收集和建设不少于100个中文自然语言处理数据集 , 全面覆盖知识图谱、语言理解、语言生成、跨模态融合、NLP 应用系统等多个领域 。 也期待更多数据集作者能够加入共建 , 共同推动中文信息处理技术的进步 。
AI人工智能百度技术委员会主席吴华联合发布“千言”计划 共建最大中文NLP数据集
本文插图
推出算力共享计划!百度全力支持语言与知识技术开发者、研究人员
除数据外 , 算力是语言与知识技术发展中面临的另一大挑战 。 超大规模深度学习模型带来显著效果提升的同时 , 算力的需求也呈现出指数级的增长 。 算力的缺乏已经成为了许多开发者、研究人员进行技术研发的一大瓶颈 。
为此 , 百度正式发布了语言与知识算力共享计划 。 通过AI STUDIO平台 , 百度将提供算力支持 , 为语言与知识技术开发者助力 。 吴华表示 , 后续百度会邀请“千言”数据集的使用者 , 百度语言与知识开源开放的用户以及更多的中文语言与知识技术开发者、研究人员免费使用这些算力 。
传承千年的中文铸就了璀璨的华夏文明 。 在当下的人工智能时代 , 百度也希望与学术界、产业界携手 , 共同推动中文信息处理技术的进步 , 以智能技术学习并传承凝练于中文语言中的无尽宝藏 。