发布时间:2024-12-21 22:24:47 来源: sp20241221
记者7日从清华大学获悉,该校电子系方璐教授课题组与自动化系戴琼海教授课题组在智能光芯片领域取得重大进展。他们首创全前向智能光计算训练架构,研制出“太极-Ⅱ”光芯片,实现了大规模神经网络的原位光训练,为人工智能(AI)大模型探索了光训练的新路径。相关成果在线发表于最新一期国际学术期刊《自然》。
AI大模型的迅猛发展和广泛应用,使算力成为关键的战略资源。智能光计算凭借高算力、低能耗的优势,在后摩尔时代展现出巨大潜力。训练和推理,是AI大模型核心能力的两大基石。此前,智能光芯片“太极”的问世,为大规模复杂任务的“推理”带来了曙光,但未能释放光计算的“训练之能”。现有光神经网络的训练严重依赖GPU离线建模,并要求高度匹配的前向-反向传播模型。这对光计算系统的精准对齐提出苛刻要求,致使梯度计算难、训练规模小,禁锢了光计算的优势。
“与现有训练范式不同,我们摒弃了反向传播,另辟蹊径,构建了光神经网络的对称传播模型,仅用光学系统的前向传播即可实现高效高精度光训练。”方璐告诉科技日报记者。
据介绍,“太极-Ⅱ”的面世,填补了智能光计算在大规模神经网络训练这一核心领域的空白。除了加速AI模型训练外,其还在高性能智能成像、高效解析拓扑光子系统等方面表现出卓越性能,为人工智能大模型、通用人工智能、复杂智能系统的高效精准训练开辟了新路径。
(记者华凌)
(责编:郝孟佳、李昉)