近日,中国计算机学会推荐的人工智能领域A类国际学术会议NeurIPS 2025论文收录结果公布,我院“珠峰班”2025届本科生孙颢玮以第一作者身份撰写的论文《Open-World Drone Active Tracking with Goal-Centered Rewards》成功被大会接收。这是我院本科生首篇进入高水平国际学术会议的论文,标志着我院在拔尖创新人才培养方面迈上了新的台阶,取得了突破性进展。

NeurIPS(神经信息处理系统大会)是全球机器学习、人工智能和计算神经科学领域最负盛名的顶级学术会议之一,具有极高的学术声誉和严苛的录用标准。本次会议投稿量为21575份,录用率仅为24.52%。此次我院“珠峰班”本科阶段的学生论文能被录用,不仅充分证明了该学生在科研上的钻研精神和创新能力,还体现了其导师谭明奎教授的研究团队在人工智能与机器学习领域的深厚积累,更展示了我院在相关研究方向上对于学生培养的卓越质量。
本次被录用的论文聚焦于无人系统中的开放场景主动感知和具身智能算法领域,针对开放世界中无人机主动视觉跟踪所面临的两大核心挑战,提出了首个面向开放世界的无人机主动跟踪基准 DAT。该研究成果在无人机跟踪拍摄、安防监控以及多机器人协同等方面都具有重要的应用价值。
此次“珠峰班”学生在NeurIPS 2025会议上的亮眼表现,是我院高度重视本科教学质量、深化拔尖创新人才培养改革取得的标志性成果之一,不仅提升了我院在机器人与人工智能领域的学术影响力,也为后续人才培养树立了优秀榜样。
超级机器人研究院“珠峰班”坚持产教融合、科教融汇,创新人才培养新模式。“珠峰班”依托我院的一流师资和研发团队,推行基于项目的学习,倡导“干中学、学中干”,以真实的重大科研问题、企业实际问题为导向,打造具有“高阶性、创新性、挑战度”的“深度学习”模式,探索开展全过程综合性学业评价;鼓励学生早进课题、早进实验室、早进团队,结合重大科研项目开展毕业设计(论文)选题,深度参与科技创新,助力关键技术突破,促进科技成果转化。另外,我院还鼓励“珠峰班”大四学生来院实习,参与我院的项目和工作任务。
在课程教学中,“珠峰班”采取“理论教学-工程实践双螺旋体系”的新型模式,面向机器人学科前沿,应用构建系统的工程研究能力训练体系,采用产教融合深度学习的培养方式,系统提升学生工程创新能力和创业能力,服务于机器人产业发展。“珠峰班”开设了多个机器人实践课程,包括机械设计与材料综合创新实践、机器人操作系统与仿真创新实践、多智能体综合创新实践、嵌入式系统综合创新实践、经典控制理论与应用创新实践、图像处理与机器视觉创新实践、机器人传感器与感知创新实践、机器人导航技术创新实践、机器人驱动与运动控制创新实践等。
未来,超研院将继续优化“珠峰班”的培养体系,强化科研训练与国际化学术视野的塑造,致力于培养更多具有国际竞争力的机器人与人工智能领域的未来领军人才,为服务国家战略需求贡献力量。
面向机器人领域的前沿技术,超研院创新建设“珠峰班”,实行本-硕-博贯通培养,构建“跨学科多层级”课程体系,实施以项目为驱动的新工科人才培养模式,将优秀学生凝聚到机器人研发攻关工作中,实现人才培养与解决国家重大需求直接结合。
(一)培养模式
“珠峰班”实行“2+2+X”培养模式,从华南理工大学理工科专业本科生中选拔优秀学生,进入“珠峰班”学习两年,完成本科阶段学习后,综合评价排名在班级人数前80%且英语成绩、体质测试成绩等符合免试攻读研究生基本推荐条件的学生直接进入研究生阶段学习。
(二)培养特色
1. 学科交叉与融合。充分发挥理工融合、学科交叉的优势,在选拔、培养、评价和保障等方面进行体系化、链条式设计,给予政策特别支持和条件全面保障,培养机器人领域急需和引领科学前沿探索的机器人创新领军人才。
2. 理论教学与工程研发融合。采取“理论教学-工程实践双螺旋体系”的培养模式,面向机器人学科前沿,应用构建系统的工程研究能力训练体系,采用产教融合深度学习的培养方式,系统提升学生工程创新能力和创业能力,服务于机器人产业发展。
3. 本研贯通。进入珠峰班学生全部实行本研贯通式,导师制、团队制,小班化、个性化、本研一体化的“一式二制三化”的培养方式,从本科起步培养高水平、工程应用型的人才,统筹考虑本科与研究生阶段的教育,有效打通本科生和研究生的培养阶段。
论文题目:Open-World Drone Active Tracking with Goal-Centered Rewards
论文作者:孙颢玮,胡晋武,张至睿,田昊原,谢鑫泽,王宇丰,谢晓华,林云
通讯作者:俞祝良,谭明奎
论文概要:首次系统性地解决了开放世界中无人机主动视觉跟踪所面临的两大核心挑战:缺乏高保真、多样化的评估基准,以及现有方法在复杂干扰下难以实现鲁棒跟踪。团队提出了首个面向开放世界的无人机主动跟踪基准 DAT,涵盖24个复杂开放场景、真实目标行为与高保真无人机动力学,并配套数字孪生工具支持无限场景生成。针对现有方法因固定前向视角导致的感知局限,论文理论分析了传统基于欧氏距离奖励的失效机制,进而提出基于强化学习的 GC-VAT 框架,设计视角无关的Goal-Centered Reward与课程式训练策略。实验表明,GC-VAT在DAT仿真器上实现了约72%的跟踪成功率,达到当前最优,并在真实视频中实现83.9%的动作预测准确率,显著验证了其跨场景、跨域及仿真到现实的强大泛化能力。

拟稿 | 张昕玲
校对 | 冯杨
审核 | 孙峰