按关键词阅读:
他坦言,这条路必然充满挑战,但如果放大时间维度,看向未来15年,一定会有人能做出来。
二、大算力芯片时代到来,政策加码、资本涌入“挑战英伟达”,凡是站定AI芯片赛道的初创公司,几乎都会喊出这样的口号。
但在英伟达极厚的软件生态壁垒面前,即便有些海外创企已经大牛如云,至今仍在挑战英伟达的道路上步履维艰。
不过,中国正迎来新的时运。
从2018年开始,持续不断的中美贸易摩擦将芯片半导体这一信息产业“软肋”推至风口浪尖,国产替代的号角吹响,资本开始倾注各个“卡脖子”的关键赛道,许多行业老兵选择跳入创业的汪洋。
吴强亦是如此,他看见了中国AI芯片枝繁叶茂的远景,并关注到一个千载难逢的机会——中国人敢做大芯片了!
中国有上千家芯片设计企业,其中早期一批芯片企业大都在做小型应用芯片,包括WiFi芯片、电源芯片、蓝牙芯片等等。但做大算力芯片的玩家相对少见。这是个高投入、高门槛、高试错成本的赛道,一个芯片流片动辄要耗去几千万美元。
现在,在政策鼓励、需求激增、资本力捧的大环境下,大算力芯片创业的池子正在变大、变得活跃,很多像吴强一样在工业界做了20年的老兵开始入局。
这促使吴强在创业之初便下定决心:“第一,我要做AI芯片;第二,我要在中国做。”
做什么?是下一个要解答的问题。
吴强观察到一个现象,创业者总是一窝蜂地冲到同质化赛道,国产替代仿佛成了“金字招牌”,抢产能、抢人才等浮躁现象出现,在他看来,这些并不利于国内芯片发展。
大算力AI芯片领域存在类似的境况,“英伟达怎么做,那我也国产替代复制一遍。”吴强觉得这种用英伟达的方式打英伟达,很难实现真正的超越。
他也支持有人做传统路线的国产替代,只不过,总要有人去探些新路,选择另辟蹊径,也有助于增加中国AI芯片成功的概率。
因此,2020年下半年,面对已经聚集着一批云端AI芯片创企的国内市场,吴强决定去走一条截然不同的路——用存算一体做大算力芯片,并立下实现单芯片算力高达1000TOPS的目标。
三、“不复制别人走过的道路”为什么选择存算一体?这是综合考量的结果。
吴强在计算芯片及编译器等技术积累深厚,曾获第38届计算机体系架构顶会MICRO-38唯一的一个最佳论文奖,其科研成果被美国业内杂志IEEE Micro评选为年度最有影响的12个科技成果之一,并多次担任国际会议项目委员会委员和国际期刊的客座主编。
除了早年研究的GPU外,他也是谷歌第一代TPU论文的5个主审编之一,非常清楚TPU的技术底层逻辑。在研究过各种非常规的新兴技术后,吴强认为存算一体可能颠覆传统AI芯片的路径。
文章插图
吴强与团队交流(来源:焦点访谈)
他将AI芯片公司分为三类:(1)把AI算法与硬件高度融合,将算法一部分固化在硬件;(2)仿照英伟达的技术路径,把GPGPU做图像的东西去掉,只保留做AI计算的部分;(3)针对某一类应用场景或某一种工作负载来做相对定向优化的AI计算。
这三类都有不少公司在尝试。一方面,这些方式很难在通用性和效率上做到两全。另一方面,用这种方式去挑战英伟达,会面临巨大的工程上的挑战,很难真正超越英伟达。
而存算一体并没有遵循传统的冯·诺依曼架构,而是更多是从底层技术去重新设计,用存储介质承担计算任务,以节省数据在存储与计算单元之间搬运所导致的延时和能耗。这是一个全新的维度,是可以在不损失通用性的前提下,实现效率的提升。
做存算一体AI芯片在业内已经有公司在尝试,但用存算一体做大算力AI芯片,彼时在国内并不多见。
早先存算一体技术活跃于学术界,国内外也出现了一批团队尝试先做小算力芯片。他们对推动“存算一体”芯片的发展做出了积极的贡献,也增加了外界的关注度。
吴强不想“复制别人的存算道路”,他观察到技术发展至新阶段,用存算一体做大芯片已成可能。
存算一体芯片的实现依赖存储介质。早期存算一体技术在做大算力方面有一定局限性。近几年(特别是2018年之后), 新型存算技术和新型存储介质技术都发展到了一个新阶段,用存算一体做大算力芯片已成可能,商业落地的苗头渐显。
吴强想,结合自身积累的工业经验和学术资源,也许能抓住这个时代机遇,达到更高的天花板。
四、先攻边缘端和云端推理,首颗样片年底回片做大算力存算一体AI芯片,既离不开拥有工程实践经验、做过大算力芯片的人才,也需要存算一体技术积累深厚的人才。
稿源:(智东西)
【傻大方】网址:/c/1123a2E22021.html
标题:gpgpu|对话后摩智能CEO吴强:用存算一体解锁大算力芯片,不复制别人走过的路( 二 )