近期,上海交通大学集成电路学院(信息与电子工程学院)义理林教授团队在光通信与光学领域取得重要突破,发布光领域垂直大模型Optics GPT。该成果论文以“Optics GPT: The First Vertically Pre-trained Foundation Model for Optics and Optical Communications”为题,入选OFC 2026 Post-Deadline Paper(PDP)。
研究背景
随着大语言模型在代码生成、数据分析、自动化控制等任务中展现出强大能力,光通信领域也开始探索将其应用于意图解析、告警分析、网络自治等场景。然而,通用大模型在光学领域的表现受限于领域知识不足、数据隐私风险以及部署成本高等问题。如何在保证安全性与专业性的前提下,实现真正具备光学“认知能力”的AI系统,成为亟需解决的关键技术难题。
核心创新
为解决上述问题,研究团队提出了Optics GPT,首次在通用基座模型基础上,通过三阶段渐进式认知训练,将光学知识深度内嵌于模型之中。为系统评估模型性能,团队同步构建了首个面向光学领域的综合性评测基准OptiEval。在测试中,Optics GPT(8B)在专业测试上取得了82.45分,超越GPT-4o(76.53)与DeepSeek-R1(671B)(78.52);在研究生入学考试中,以74.12分同样领先。这一结果表明:结构化、渐进式的领域知识注入,比单纯扩大参数规模更能带来本质性的专业能力提升,同时8B参数规模也使其具备了本地部署、安全可控的实用价值。

在实验验证中,Optics GPT的三大应用成果展现了其从算法生成到系统管控的全面能力:在自动代码生成方面,模型根据自然语言指令自动生成可部署的DSP代码,在1600公里传输实验中,其生成的线性DSP性能与人工设计相当,而非线性算法更带来0.4 dB的性能增益,实现了真正的算法自动生成;在自主网络管理方面,模型在20种故障场景下实现100%的诊断准确率,显著优于通用大模型;在现网性能预测方面,模型预测链路的OSNR平均误差仅0.44 dB,与专用神经网络相当,证明其已内化物理规律,具备真实的工程推理能力。

该工作不仅为光通信系统提供了从“通用AI”走向“专业AI”的可行范式,也为未来智能光网络、自动化光通信研发、光学设计等方向奠定了坚实基础。团队所构建的OptiEval基准,也为光学AI领域的标准化评估提供了重要参考。
论文及作者信息
上海交通大学集成电路学院(信息与电子工程学院)博士后牛泽坤为论文共同第一作者,牛泽坤与义理林教授为通讯作者。研究工作得到了国家自然科学基金杰出青年基金、科技部重点研发计划、上海交通大学“交大2030”计划以及中国电信研究院、鹏城实验室的支持。

牛泽坤,上海交通大学集成电路学院(信息与电子工程学院)博士后,从事智能光传输方向研究。在National Science Review, Light: Science & Applications, Laser & Photonics Reviews等光学重要期刊以及国际顶级会议发表论文十余篇,主导开发光通信仿真平台IFTS(ifibertrans.sjtu.edu.cn),在电信、华为等企业使用并受到高度评价。带领团队开发光领域垂直大模型Optics GPT,于2026年1月25日在上海交通大学发布,相关成果获评上海交通大学第一届“十大垂直领域大模型”特等奖,受到央视、中国日报等中央媒体及解放日报、文汇报等沪上主流媒体报道,并入选OFC 2026 PDP论文。

义理林,上海交通大学集成电路学院(信息与电子工程学院)特聘教授,光子传输与通信全国重点实验室副主任。主要从事智能光纤通信系统和智能光纤激光系统方面的研究。在光电子领域知名期刊Light: Science & Applications, Optica, Laser & Photonics Reviews等发表论文100余篇,入选全球前2%顶尖科学家榜单。发表在Light: Science & Applications的论文入选封面论文,并被“News & Views”栏目专题评述。发布智能光传输开源仿真平台IFTS(ifibertrans.sjtu.edu.cn)与光领域大模型Optics GPT,获得同行广泛采用。解决超快激光智能调控难题,相关工作被美国光学学会杂志《Optics & Photonics News》评为2019年度全球光学进展,并入选2019中国光学十大进展。主持国家杰出青年科学基金、国家重大科研仪器专项、科技部重点研发计划等项目。
会议信息
OFC是全球光通信领域规模最大、影响力最高的学术与产业盛会,本届OFC共接收707篇论文,入选PDP论文仅24篇。OFC PDP论文代表了光通信领域最新的记录性成果和重要技术进展。