本网讯 10月29日下午2:30,香港科技大学杨强教授应信息学院邀请,在南校区图书馆多功能报告厅进行了一场以“迁移学习及其应用”为主题的精彩讲座。信息学院院长姜灵敏,副院长蒋盛益、李心广,副处长谢文新等领导出席了讲座。讲座由姜灵敏主持。
迁移学习:打破传统两大假设
讲座一开始,杨强由“芝加哥教师帮学生作弊被揭”这一事例入手引出了数据挖掘这一概念,又通过“算命先生利用看手相、问答建立测试数据来算命”、“搜索引擎通过数据挖掘排序”以及“虚拟世界的六度空间试验”等大量事实,生动形象地诠释了数据挖掘技术的广泛性和普遍性。他还指出,数据挖掘的模型虽具有多样性,但总体可分为有监督学习和无监督学习两类,其区别在于其数据模型是否给出了数据的结论。
“传统的数据挖掘有两个假设:一是训练数据与测试数据必须同概率分布;二是两者必须在同一特征空间。而面对许多实际问题,这两个假设并不成立,也就导致了传统数据挖掘办法的失败。”杨强一针见血地对传统数据挖掘的不足之处进行了批判,从而解释了提出“迁移学习”这一理念的必要性。

杨强深入分析迁移学习
他强调传统数据挖掘“种瓜得瓜,种豆得豆”的方式是不可取的,已无法满足现代生活和生产等方面的需要。相反,迁移学习可以做到举一反三,打破传统数据挖掘的两大假设,也就是“可以去发现和整理已有领域的知识和道理,并且把它们运用到全新的领域中去”。
突破界限:广泛应用具现实意义
杨强表示,迁移学习在文本数据挖掘上的应用已经十分广泛,例如文本内容分类、商品好坏评价统计等都运用了迁移学习。但现阶段迁移学习的研究需要突破文本迁移领域,改变“主要集中在科研,在工业领域几乎没有应用”的现状,尽量多的应用在其他领域上,从而推动这一学科的发展。
据杨强介绍,目前香港科技大学的研究者们正致力于将迁移学习推广到传感器网络、图像学习、生物信息学、网络商业、图像学习、机器人等领域。迁移学习的广泛应用具有十分重要的现实意义,杨强详细讲解了其中几个领域。
 |
现场座无虚席 |
在传感器网络领域,通过不同无线传感器信号的N维数据,公司可以得到新的信号,定义安全空间,进行精确定位,避免以往定位方式收集数据繁琐的问题。传感器网络还可用于人工智能国际会议,监测孤寡老人活动、及时提供服务等。而关于其在图像学习方面的应用,迁移学习可将文字描述形成模型与实物建立联系,避免歧义,提高分类水平,使模型既可“看图”又能“读书”。此外,杨强还对迁移学习在机器人推理,辅助网络商业,细胞定位问题转化为分类问题等方面的作用进行了大致的阐释。
总结互动:鼓励学生往新领域发展
最后,杨强用简洁的语言总结了下午的演讲内容。他再次强调了迁移学习的内涵就是举一反三,是一门“打破同分布、同特征的传统科学,把科学应用延伸到不同领域”的学科。
在互动环节中,不少同学都大胆地提出了自己的见解和疑惑,杨强用风趣形象的话言一一详细解答,博得了在场同学们的热烈掌声。其中,就一个同学提出的“数据进化与迁移学习在理论和应用基础上有何区别”的问题,杨强指出,数据进化是迁移学习的一个特例,它是在同一领域的提升,是平行的,而迁移学习则是跨领域的,这二者既有区别又有联系。另外,有同学提出希望进一步了解迁移学习,杨强热情地提供了几个实用的网站和学习方法。
 |
问答环节 |
讲座结束后,杨教授在接受记者采访时提到讲座的目的是与同学交流迁移学习的知识,希望国内更多的学生能认识这门学科,并将其向更多的新领域发展。另外,杨教授对同学们的提问环节表示了赞赏,他认为从提问问题中可以看出他们“清楚为什么不懂,哪方面不懂”,这是一个很好的现象。
附:杨强教授毕业于北京大学。 于美国马里兰大学获得博士学位后,先后十余年间,任教于加拿大滑铁卢与Simon Fraser大学。现任香港科技大学教授, 杨强的研究方向包括:人工智能,机器学习与数据挖掘,智能规划等。公开发表论文、专著多项,获得很高荣誉。