美国芯片禁令迫使中国的科技业者研究变通办法,在拿不到最新型美国芯片下继续研发AI人工智能。使用软件补强较低阶芯片或将多种低阶芯片并联的研究在中国越来越多。
「华尔街日报」检视论文和访谈相关企业人员发现,包括华为、百度及阿里巴巴集团在内的中企,正研究如何靠用较低阶芯片或少用高阶芯片下,仍能研发最先进人工智能的技术,也在研究如何整并不同类型芯片以免依赖任何单一硬件。
研究人员与分析师认为,靠这类变通办法想追上美国AI领先群难度不低,然而一些研究显示这种变通措施并非白工,若进展顺利也许真能让中国科技企业既挺过美方制裁,又增加对日后美方更多设限的免疫。
随商业化ChatGPT这类AI的竞赛加温,全球各地的业者都需要功能更强大的芯片并尽量将功能发挥到极致,好降低AI研发的成本。
AI研究人员与产业分析师指出,对中国企业而言相关课题更为关键,因为美方制裁让他们拿不到诸如英伟达(Nvidia)等公司所制的最先进芯片,且在研发比肩ChatGPT这类AI时又快速消耗手上的美国芯片库存。
继美国商业部去年10月向中国供应芯片实施全面限制后,拜登政府已表明还会祭出进一步制裁。
中国业者已无法再取得业界研发AI时最爱用的英伟达A100芯片,以及今年3月发表的下一代、有更强运算能力的H100;为符合美国政府政策,英伟达提供中国的是降级版A800、H800,这两种都削弱芯片本身与其他芯片的联通能力。
虽然A800、H800对研发规模较小AI诸如TikTok短影音app的推荐演算是不错的替代选项,却扼杀规模较大型AI的研发。
瑞士银行集团(UBS AG)分析部门估计,必须用上5000到1万片A100芯片,才能锻炼ChatGPT这种规模与等级的AI。据一个与中国政府关系密切的半导体产业协会近日于一场业界闭门会议公布的调查,中国只有区区4万到5万片A100。
经营AI基础设备公司的新加坡国立大学教授尤洋表示,许多中国企业现尝试合并3或4片较低阶芯片(含A800与H800),模拟1片最高阶辉达芯片的效能。腾讯今年4月就公布一套新的运算集群:用一套H800并联芯片组,进行大型AI模型训练。
尤洋说变通方式代价不斐,因为若美企训练大型语言运算模式需用1000片H100,中国企业就需3000片以上的H800达成类似效果。
尤洋指出,为此部分中企加速开发跨型号芯片训练大型AI模型的技术。有论文显示阿里巴巴、百度、华为都在研究整并英伟达的A100、上一代的V100与P100,以及华为的Ascends系列。
与此同时,中企也在寻求透过各种软件技术来帮助训练大型AI模型的运算强度,这种方法美国企业也有在做,然而中国业者在整合多种软件技术方面更积极。
中国研究人员已取得进展。今年3月一篇论文显示,华为研究人员展现如何用这类技术训练自有的新一代大型语言模型,且只用自家Ascends芯片。尽管仍有一些瑕疵,华为的PanGu-Σ大模型在一些华语任务里已达成最高端性能表现,包括阅读理解和文法问题。
半导体研究与顾问公司SemiAnalysis首席分析师巴特尔(Dylan Patel)表示,在拿不到最新辉达H100芯片的情况下,中国研究人员的难关只会更高。H100含有额外的性能提升功能,尤其有助训练类似ChatGPT的模型。
但去年百度公司与深圳鹏城实验室一份论文显示,研究人员正以无需H100额外提升功能的方式训练大型语言模型。巴特尔说尽管研究还在初阶,但看来有效。
巴特尔说:「若应证确有效果,他们就能有效躲过制裁。」