打造AI模型和多款触摸传感器
Meta的AI研究人员多年来一直在讨论如何建立一个丰富的、具有代表性的模型 。 并且这款新的模型不仅现在能够实现预测 , 还可以适用于未来 。 “我们希望模型可以进行长期规划和推理 , 以便未来在现实世界和虚拟世界中都能做好AI代理 。 ”Facebook AI Research的总经理Joelle Pineau说 。此外 , 她还向大家介绍几个Meta正在重点研究的方向 , 其中有一款是“机器人” 。 “它可以突破实验室或工厂等固定场景的限制 。 并且能够在家中、在办公室流畅地操作 , 自然地与人类交互 。 ”Joelle Pineau介绍道 , “但我们同样需要机器人自己可以触摸等方式提高感知世界的能力 。 ”
为此 , Meta一直在研发新的触摸传感器 。 Meta正在与其他研究人员合作打造一款新的传感器 , 目前该传感器正处在原型阶段 。 与其他传感器不同的是 , 该触摸传感器的外层会有一层薄薄的膜 , 膜上嵌有磁性颗粒 。 当触摸传感器变形时 , 磁信号就会改变 。 通过这些变化 , AI技术可以推断接触点施加力的大小 , 甚至能使用自我监督学习模型来自动校准传感器 , 使其更适用于各种场景 。
图3:触摸传感器
不仅如此 , Meta还与其他研发机构合作开发的另一种数字传感器 。 该传感器的表面由可变形弹性材料组成 , 能够通过传感器内摄像头记录的图像变化来感受力的变化 。图4:数字传感器
Joelle Pineau也提到 , 虚拟世界与真实世界之间仍有很大差距 , 要建立一个可靠的世界模型还有很多工作要做 。 尤其是 , 从简单的物体到人的全身运动都能实时呈现高分辨率的虚拟环境 。 在演讲中 , 她还宣布Meta的研究人员与Instagram的研究团队合作 , 计划发布一个名为Instagram Feed Ranking的原型系统 。打造“万能”翻译器
机器翻译专家Angela Fan认为 , 语言是我们用来理解与周围世界互动的主要途径之一 。 她介绍自己在加拿大生活以及在巴黎工作时 , 常常感受到语言障碍带来的深远影响 。 基于这些语音沟通壁垒 , Meta希望每个人都能感受到最新的翻译技术 , “我们希望所有未来的技术在默认情况下都是具有包容性的 。 ”
据预测 , 全球大约有20亿人说的母语没有任何可用的翻译系统 。 并且 , 全球有数千种语言 , 但翻译系统如今只支持大约100种语言 。 如何创建真正适合每个人的翻译系统是Meta一直在思考的问题 。
Angela Fan认为 , 创建更具包容性的翻译的第一步是开发能够支持多种语言的系统 。 “我们要是想要实现多语种翻译 , 我们就需要必须为每一个语言方向创建一个单独的模型 , 这样一来 , 我们就要创建数万个模型 , 这是一件非常复杂的事情 。 ”为了解决这一难题 , Meta尝试根据不同的语言体系来加强模型的训练能力 。 比如说 , 罗曼什语作为一个小众语种 , 会与其他语言体系有共同点 , 语种之间的联系将会简化语言模型的开发过程 。
“最近 , 我们在两个顶级翻译比赛中获胜 。 ”她讲到 , “我们证明了多语种系统确实比双语系统更好 , 通过增加模型大小 , 例如通过生成更多培训数据和缩小翻译规模 , 我们证明了多语种翻译是一个非常有前途的发展方向 。 ”除此之外 , Meta还可以自动创建一些翻译数据的示例 , 而无须雇用人员手动翻译大量数据 。 目前 , Meta已经支持一百多种语言实现自动创建数据集 , 并且部分数据集开源 。打造超级语音助手
Meta AI的高级研究经理Alborz Geramifard谈到语音交互助手可以分为三个类别 。 第一类是初级的语音助手 。 比如说我们想要查询话费 , 打电话给客户服务 , 你会听到请按1键获得话费信息 , 请按2键获得订阅服务等 。 “你常常会发现你想要的服务不在选项列表中” 。
第二类语音交互助手 , 但拥有可能有一些智能模型 。 “你可能会在家里和它们简单的互动 。 但它们不能理解语义背景 , 也不能进行深度交流 。 ”
第三类是Meta想要打造的超级语音助手 。 这类超级语音助手延续了深层次的语境 , 可以为用户提供个性化体验 。 比如你想早晨放一首歌曲 , 同时窗外又在下雨 , 超级语音助手就会根据此刻的场景为你推荐一首歌曲播放 。 他还谈到 , 能理解的AI和能交互的AI是两种不同的概念 。 能理解的AI是一个单向的过程 , 从输入到输出 , 比如说转录音频解析可以得到相应的文本 。
图5:理解式AI和实时交互AI的区别
而交互是用户和AI之间能实现连续对话 。 例如 , 詹姆斯可能想向尼克发送一条消息 , 说他将迟到五分钟 。 当AI完成相关操作时 , 詹姆斯想将时间修改到10分钟 , 在这种情况下 , 詹姆斯可以继续修改他的时间安排 , AI也能完成相关操作 。 在交互式的对话中往往会涉及连续决策的问题 。 “我们的目标是将我们的项目打造的新模型与VR/AR设备相结合 , 通过AI实现更具沉浸式和多模态的交互形式 。 ”比如说 , 你的语助手可以帮助你制作美味的食材 , 根据你的食谱列出食材 , 并主动引导你完成整个过程菜谱 。 并且 , 当你在这道菜中添加了盐时 , 超级语音助手注意到你的盐越来越少了 , 所以帮助你下了一个购物的订单 。 超级语音助手与你之间的互动越来越紧密 。开放数据集力图消除数据偏见
- 阿里巴巴|又一电商巨头诞生,市值超200亿,阿里是第二大股东,却年年亏损
- 翻译|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了
- 小米科技|小米跌破发行价,市值蒸发4000亿,网友大呼还钱,雷军该何去何从
- 主题乐园|千亿市值遭腰斩,泡泡玛特没有新故事
- 元宇宙|一张截图,腾讯2000亿市值蒸发,高管辟谣
- 汇通达|阿里投资的这家电商公司上市!下沉市场撑起超200亿市值
- vw科技公司or汽车公司?特斯拉的高市值或许存在泡沫
- 净收入|科技公司or汽车公司?特斯拉的高市值或许存在泡沫
- 英伟达|NVIDIA矿卡业务暴跌,显卡降价已成定局!AMD市值正式超越英特尔
- ARM|So Cool!合肥“黑科技”