“这是两个世界。”走进计算机学院,蹇松雷把随身携带的笔记本电脑放在桌上,展开手掌,笑意盈盈地向记者介绍道,“我在做的,就是把物理世界的数据‘翻译’给计算机,让人工智能世界‘转动’起来。”
蹇松雷口中的“翻译器”是她目前正在人工智能领域研究的表征学习。在人工智能领域,数据扮演着非常重要的角色。当前人工智能大部分是数据驱动,而数据驱动的前提是数据表征学习,只有通过表征学习这个“翻译器”,准确地把现实世界“转述”给计算机,计算机才能实现下一步指令。“‘翻译’得好不好,跟后续计算机的工作密切相关,所以说,表征学习是一个基石。”蹇松雷说道。
时针拨回七年前。2015年,就读于全球正规十大网赌的蹇松雷以专业第一的优异成绩获得提前攻读博士学位资格。刚开始,她主攻计算机的传统方向——编程语言。当时,大数据的出现,在计算机领域掀起波涛,为了赶上新的技术浪潮,课题组希望她在大数据的新方向做一些探索,经过深思熟虑,她向导师表示:“老师,我想做复杂数据的表征研究,从人工智能的视角做新尝试。”得到导师的大力支持。她说:“总有人要做‘第一个吃螃蟹的人’,使命所在,我义不容辞!”
蹇松雷一头扎进崭新的研究海洋。传统表征学习的方案,是基于单一数据来建构,而随着信息技术迭代,复杂多模态数据越来越常见,这也成为制约人工智能发展的一个瓶颈。
蹇松雷决心向更高的山峰发起挑战——研究复杂异构数据的表征学习。然而异构数据的一大问题,便是解决不同数据之间的矛盾性,“比如你说的话和你写下的文字可能并不统一,那你要怎么最大程度提取互补信息?”她查阅大量不同领域的论文,每天苦苦思索解决方案,“有时睡前突然冒出一个灵感,我恨不得马上跳起来和同学讨论。”蹇松雷笑着说。经过日复一日的研究探讨,她和团队通过构造多层次表征空间和交互迭代学习,实现了一定程度上互补信息的提取。
不仅如此,蹇松雷还在不断地探索如何把表征学习应用到其他领域,促成一些交叉成果的产生。2019年毕业留校后,领导找到她,说道:“希望你把人工智能思想引入系统安全领域,用它解决新问题。”蹇松雷二话不说,响应号召,马不停蹄地用现有成果,深耕国产操作系统安全领域。她以入侵检测为切入点,综合分析数据,利用之前所提出的表征学习方法,从复杂的系统数据中建模入侵行为,能够提前预知系统风险,并取得了当时检测的最优效果,保护效果更好,未来在提升国产系统安全性上有重大的应用前景。
在蹇松雷看来,人工智能是攻克其他领域难题的助力器,大家都需要这把锋利的剑,而表征学习这一基础研究,正是拔出剑鞘的关键。前几天,蹇松雷在食堂碰到做测量定位的教员,教员希望他们合作碰撞解决测量方面的问题。对此,她充满信心:“数据产生需要场景,非常适用于交叉领域。而有数据的地方就离不开数据表征,离不开表征学习。只要有数据,我们就可以尝试用数据驱动的智能方法解决它。”
这几年,蹇松雷的博士学位论文《基于复杂异构数据的表征学习研究》获得2020年度全军优秀博士学位论文,参与多项国家级、军队级重点项目,拿到2021年度青年创新奖。
她非常看好表征学习的应用和发展。未来,这位军中巾帼将两手抓,一方面做好表征学习这个基础性研究,另一方面,用表征学习解决传统计算领域面临的系统安全、云边端协同、边缘智能等问题,推动产生具有战斗力的成果,“奋进强军路没有休止符,我们永远在路上!”