编程|程序员又要失业?MIT 等推出新的机器编程系统( 二 )


评估的精度指标是 R(MAP@R)、平均精度(AP)和精度-Recall-Gain 曲线(AUPRG)下的面积(Aup@R) , 它们衡量模型在给定查询的数据库中检索类似(或相关)项的准确性 。 最终的实验结果表明 , MISIM 比其他三个最先进的代码相似系统的性能高出40.6倍 。
不过 , 论文还提到了可以预见的负面影响:
一级负面影响 , 给定的研究想法可以直接用于伤害性行为 , 如 DeepFake、DeepNude 等等 。
二级负面影响 , 指研究想法可能会使它的使用方式产生直接的负面或积极影响 , 例如将面部识别用于压迫少数群体、产生恶意假新闻等等 。
三级负面影响 , 研究思想被用来构建第二个应用程序 , 并根据新程序的使用产生的负面影响 。

  • 如果代码使用相似性工具发展足够成熟 , 可以自动生成正确的可编译代码 , 那么它可能被用来自动将代码从一种语言替换为另一种语言 , 或者用快速代码替代慢代码 。
  • 恶意使用者可以利用代码相似性工具爬取网络 , 在网络上窃取代码 , 并从可用代码中 , 找到常见的模式和安全缺陷 , 然后找到大规模黑客攻击的方法 。 从同一代码生成器生成的代码可能更容易受到此类攻击 。
  • 如果系统允许基于代码相似性的自动代码修补/修复 , 而不进行适当的测试 , 那么如果被黑客攻击 , 它可能会产生安全缺陷 。
  • 如果程序员习惯从编程工具获得帮助 , 可能会降低程序员的学习能力 , 除非该工具提供可解释性 , 解释性将需要了解工具正在学习的代码相似性 , 并教育程序员 。
“总之 , 代码相似性是一个抽象的概念 , 很可能有许多积极的应用 。 为了减轻负面影响 , 我们需要确保制定适当的政策和安全措施 , 防止负面使用 。 特别是 , 这种安全系统可能需要人工介入 , 以便被用来提高程序员的能力和生产力 。 ”论文最后指出 。
微软、Facebook、OpenAI 的 MP 系统机器编程被各大科技公司看做是“解放程序员”的一种方式 。
“MP 将使每个人都能以最适合自己的方式表达意图 , 无论是代码 , 自然语言还是其他方式 , 来创建软件 。 ” Justin Gottschlich 给 MISIM 提出的这个目标 , 实际上也是许多 AI 项目在 IT 领域的共同目标 。
被 MISIM 拿来作比较的机器学习代码推荐系统 Aroma , 是 Facebook 2019年推出的一个项目 , 可以自动完成小程序 , 帮助程序员找到可以“参考使用”的代码等等 。
如安卓程序员想要了解如何解码手机中的 bitmap , 可以使用代码直接搜索:
前不久 DeepMind 也发布了 AI 算法开发框架——Acme , 提供比人类设计更有效的简单算法版本 。 Acme 是一个分布式强化学习框架 , 通过促使 AI 驱动的智能体在不同规模的环境中运行 。 该框架可以简化、强化学习算法开发进程 。
此外微软也正在其软件开发工具中 , 加入基本的代码生成功能 。 OpenAI 的 GPT-3 语言模型也已经被多位开发者调用 , 从自然语言中生成简单代码段 。
【编程|程序员又要失业?MIT 等推出新的机器编程系统】这些机器编程项目或是功能 , 什么时候能发挥出多大的作用 , 目前似乎还没有一个准确的答案 。 除了 GPT-3 刚上线就直接开放给开发者调用 , 像 MISIM 还主要是在英特尔内部使用 。 不过 GPT-3 偏向强调是一个可以更广泛使用的 AI 模型 , 可以处理所有的语言任务 , 还能写诗 。 MISIM 则是专注于代码任务的一个系统 。