光子|速度超高端GPU数百倍,摩尔定律的未来是「光」?( 二 )


测试结果显示,光子芯片处理的准确率已经接近电子芯片(97%以上)。
距离这块原型板卡发布不到两年,2021年12月,曦智科技又取得新进展,发布了高性能光子计算处理——PACE(Photonic Arithmetic Computing Engine,光子计算引擎)——单个光子芯片中集成超过10,000个光子器件,运行1GHz系统时钟,运行特定循环神经网络速度可达目前高端GPU的数百倍。

光子|速度超高端GPU数百倍,摩尔定律的未来是「光」?
文章插图

“相比于2019年推出的那款原型板卡,我们的PACE在光子器件的集成度上大约提高了两个数量级,从100个光子器件到10000个光子器件;运行系统时钟提高四个数量级,基本达到目前电子芯片的时钟。”沈亦晨说道。

光子|速度超高端GPU数百倍,摩尔定律的未来是「光」?
文章插图

值得注意的是,PACE并不是纯粹的光子芯片,PACE包含64x64 的光学矩阵,核心部分由一款集成硅光芯片和一块CMOS微电子芯片以3D封装形式倒装堆叠而成。其中,电芯片主要用作数据存储和数模混合调度,光芯片主要用作数据计算。
“我们认为,电存储技术,尤其在高速存储读取方面,会在很长一段时间之内领先于光。这也是我们采用光电协同的原因。”沈亦晨解释道。
PACE运行时,每个输入向量值首先从片上存储中提取,由数模转换器转换为模拟值,通过电子芯片和光子芯片之间的微凸点应用于相应的光调制器,形成输入光矢量。

光子|速度超高端GPU数百倍,摩尔定律的未来是「光」?
文章插图


接着,输入光矢量通过光矩阵完成运算传播,产生输出光矢量,并达到一组光电探测器阵列,从而将光强转换为电流信号。
最后,电信号通过微凸点返回到电子芯片,通过跨阻放大器和模数转换器返回数字域。
沈亦晨表示,曦智科技所使用的光调制器,是基于马赫曾德干涉仪方案做光与光之间的干涉,并同算法协同优化的小尺寸高速可调的光调制器。由于光在传播时不放热,完成矩阵运算花费时间少,延时低于电芯片,矩阵乘法并行能力更强。
PACE采用迭代法来解决全球难以高效解决的数学问题——多项式复杂程度非确定性问题,涉及生物信息中蛋白质结构预测,物流交通调度、材料研发等问题,商业应用前景广阔。
曦智科技也做出了自己产品规划,计划在自2022年开始的1到3年内,在对算力、延时痛点强的应用场景落地,例如金融和云服务厂商,之后加强对训练市场的布局,最后延伸至GPU、车载芯片等市场。
“突破”摩尔定律,彻底取代还是并行发展?
事实上, 除曦智科技外,也有不少大厂开始投入光子计算芯片的研发。据了解,华为、英特尔、英伟达目前都有入局光子计算。
光子计算赛道上的玩家越来越多,是否意味着,在未来,光子计算芯片将有能力彻底取代电子芯片,“突破“摩尔定律?
回到对摩尔定律的讨论上,尽管光子计算是另一条截然不同的技术路线,但硅光芯片依然基于传统的CMOS工艺,依赖现有的生态、固件和软件就能满足基本的设计需求。工艺制造方面,只需要在步骤上稍作修改,例如在光的探测器制造方面引入其他新设备。
此前基于光的晶体管体积庞大,在与电子计算的竞争中落败,但如今光子计算改变了原先使用晶体管与电子计算竞争的路径,利用在线性运算上的优势做光学器件,一个光学器件的运算性能相当于上千个电晶体管,且65nm或45nm的CMOS工艺制程就能满足现有光芯片的所有制程要求,哪怕是在未来,硅光技术迭代也不会对制程要求特别严苛,更多是主频、波长方面的迭代。
这意味着,哪怕摩尔定律已经逼近物理极限,对光子计算芯片也不会有太大影响。不过这并不意味着光子芯片能够完全取代电子芯片。
沈亦晨表示,在可预见的未来范围内,都是光子与电子芯片深度结合的光电混合运算,曦智科技的光电混合芯片与客户的交互都是通过电芯片来完成的,所有的指令编译器和SDK都承载在电芯片上。与电芯片相比,光芯片主要承载线性计算和数据网络两大部分,电芯片的好处在于与现有的市场环境、软件环境互相兼容。
“光与电的关系就好比新能源汽车和燃油汽车,只是在引擎和电池方面有所改变,诸如轮胎之类的器件依然相同,将有效地与现有使用场景兼容。光不会完全取代电。”沈亦晨说道。