刘霁(刘霁：延伸机器学习算法边界｜“35岁以下科技创新35人”中国榜单)

2024-04-26 14:57 来源：爱美欣 4

OKEX欧易app下载

欧易交易所app是全球排名第一的虚拟货币交易所。

自 1999 年起，《麻省理工科技评论》每年都会推出“35岁以下创新35人”（Innovators Under 35）榜单，旨在于全球范围内评选出被认为最有才华、最具创新精神，以及最有可能改变世界的 35 位年轻技术创新者或企业家，共分为发明家、创业家、远见者、人文关怀者及先锋者五类。

2017 年，该全球权威榜单正式推出中国区评选，并已公布并首届评选结果。现在，《麻省理工科技评论》正式开设“35岁以下创新35人”中国榜单专栏，以人物报道的形式帮助中文读者了解这些来自中国的新生代科技力量。

刘霁·远见者

延伸机器学习算法的边界

获奖年份：2017年

年龄：34 岁

职位：腾讯AI Lab专家研究员及美国罗彻斯特大学助理教授

获奖事由：让机器学习算法更准确更高效，探索人工智能潜力的边界

游戏AI的研发将会进一步拓宽人类对于AI能力的认知。作为腾讯 AI Lab 的专家工程师，刘霁正在带领团队攻克多人即时战略游戏的 AI设计问题。

这件在普通人眼里看来颇好玩的任务，实际上难度非常大。因为这样的研究最终将探索的问题是： AI 能否能够通过协作超越围棋AI这种单体智能，达到更高层次的群体智能。

这个问题的解决离不开AI 的核心领域——机器学习。而在机器学习远不如当下火热的时候，刘霁就选择了这个研究方向，一是因为他对研究通用性的方法更感兴趣，二是这个方向也更具挑战。

具体而言，刘霁的工作涵盖了以下几个领域：异步并行算法、学习、张量完成、分散优化等时下非常重要的话题。其中，刘霁已经在异步并行算法创新上取得了不少成绩。

所谓异步并行指的是，本地机器各自进行自己的训练工作，一段时间以后将模型更新到参数服务器上，然后并不等待其他机器就进行下一轮的本地训练。这个过程的好处就是快，因为各个机器之间不需要互相等待，因此异步并行被大量使用。

刘霁提出的一系列异步并行算法，则解决了传统同步并行算法的瓶颈问题——快机等待慢机。同时，他的相关理论研究还解决了异步并行的深度学习算法中的一个开放性问题——关于异步 SGD 算法正确性和效率保证，该异步 SGD 并行算法已经广泛运用于各种主流的机器学习计算软件和平台，例如Google 开发的 Tensorflow、微软开发的 CNTK以及亚马逊开发的 MXNet 等。

图 | 刘霁

他还注意到机器学习领域的一个新趋势：传统机器学习的研究侧重于改变机器学习算法去适应已有的硬件，随着新一代可编程硬件的流行与普及，共同设计算法和硬件正在成为工业界和学术界的关注对象。

基于此，他提出并实践了优化算法和计算硬件的联合设计的概念，开发出第一个支持“端到端”低精度运算的机器学习框架——通过降低数据精度该框架减少了通讯代价并保证高精度求解，这解决了ETH合作者在系统层面的的困扰和瓶颈。随着可编程硬件普及到云端，该框架也被实现在了亚马逊的云平台上。目前，他正在和合作者共同探索该平台在加速世界上最大的分布在南非和澳大利亚的射电望远镜阵列、以及加速大规模蛋白质组和医学与工业三维重建等研究中的应用。

除此之外，刘霁设计了机器学习中去中心化的并行计算框架。相比于传统中心化并行计算，该计算结构可以极大地减少通讯代价，相关成果已被顶级机器学习会议 NIPS 2017 大会报告收录。

刘霁用一个成语概括了这些创新的产生，那就是“厚积薄发”。“我从来不相信随便拍脑袋就能产生有价值的创新。这是一个艰苦卓绝无比煎熬的过程，简单来说就是掉头发的过程”，他幽默地说道。

回忆起自己的科研道路，其中既有刘霁自己的坚持，“更多的是幸运得在正确的时间遇到正确的人能给我指引”，刘霁说道。他在博士阶段就遇到了很多对他影响深远的老师：从Benjamin Recht教授那里学到如何寻找有价值的科研问题；从博士导师Stephen Wright看到了最纯粹的科研本质和最严谨的科研态度；从袁明教授那里学到了从一般到特殊再从特殊到一般的科研方法论；从Jerry Zhu教授那里学到了如何开拓一个全新的研究领域……

而对于自己正在从事的游戏AI的研发，刘霁认为，“这可以算是一个open research problem。这个项目主要集中研究一些即时战略游戏，比如王者荣耀、星际争霸。即时战略游戏其实要比围棋难很多，Deepmind和openAI也在研究类似的问题。对我来说这个项目的重要意义在于探求AI能力的边界”。

在游戏AI的设计中，增强学习算法的改进将至关重要。增强学习是一种能够提高 AI 能力的核心算法，它让 AI 能够解决具有不确定性动态的决策问题（比如游戏 AI，智能投资，自动驾驶，个性化医疗），这些问题往往也更加复杂。

但是，大部分增强学习的算法研究都偏于启发式，缺乏理论支持和本质上的理解。刘霁则打破常规，把增强学习问题等价的转化成等价的 minimax 优化问题，从此建立了增强学习和优化的桥梁，很多优化的理论结果和计算方法可以更快地应用到增强学习上。该工作被 UAI （The Conference on Uncertainty in Artificial Intelligence）2015 选为 Facebook最优论文奖，相关研究和成果也正被用于研究非基因因素对于一型糖尿病的影响上。

现在，除了游戏AI的研发，刘霁仍在从事去中心化的并行计算的研究，这可能会改变当前主流机器学习平台（比如google的TensorFlow）的设计思路，同时也很有可能带来新的互联网服务方式。

值得一提的是，对于当下愈演愈烈的AI热潮，刘霁认为，自己作为AI领域科技工作者的使命是把AI转化成生产力，让AI服务于全人类，与此同时，他也有义务帮助普通大众以更科学的视角看待AI。

“普通人对于AI的看法，通常容易走向两个极端，要不是AI即将要取代人类，要不就是AI除了下下棋好像没有什么实际用处。从AI在历史上的几次大起大落的经历来看，这两种看法都过于极端，并不利于AI的发展。我对AI持有谨慎的乐观态度：AI全面影响人类的生活是大势所趋，但也还有很长的路要走。”刘霁说。

猜你喜欢的