2020,AI的研究会有哪些突破?
2020,AI的应用又会有什么变化?
吴恩达DeepLearning.ai旗下的THE BATCH刊物,分享了包括Yann LeCun、李开复、周志华、还有他们的老板吴恩达在内的10位AI大佬的新年寄语,以及对AI在2020年能有什么突破的新年愿望。
一块儿来看看吧~
吴恩达:保持学习和好奇心
在这份「新年寄语篇」的开头,吴恩达作为发起人开场,总体是一些关于学习新知识的碎碎念。
吴恩达说,他每年冬天的假期都会围绕一个新的主题进行学习。
比如10年前的那个冬天,他的学习主题是教育学,虽然当时他拖着十分沉重的书箱在机场赶路,但对教育学的研究的确为后来在线学习平台Coursera的成立起到了帮助。
而去年,当时他的宝贝女儿Nova还在母亲腹中,吴恩达就在冬天读了很多育儿书籍。
而这个冬天,吴恩达说他在研究续命包括遗传学、还有夸克什么的在内的新兴科学,还实地探访去拜见了自己101岁的爷爷,爷爷用亲身经历告诉他:
长寿的秘方,就是保持好奇心。
照这个规律,吴恩达感觉自己的关注者里会有不少人能在101岁之后依然活蹦乱跳的。
最后,吴恩达祝大家过一个充满好奇心、学到新东西、有爱的2020年。
李开复:AI将在更多行业落地
李开复的新年寄语主题,是AI无处不在。他说:
人工智能已经从发现的时代到了落地的时代。在我们主要在中国的投资组合中,我们正真看到了在银行、金融、运输、物流、超市、饭店、仓库、工厂、学校和药物研发中使用人工智能和自动化技术的应用。
但是,从整体经济的角度来看,只有一小部分企业开始使用AI,这表明还AI有巨大的增长空间。
我相信,在人类技术进步的历史上,AI将与电力同等重要。在未来的一二十年中,人工智能将渗透到我们的生活和工作中,从而提供更高的效率和更智能的体验。现在正是企业、机构和政府充分拥抱AI并推动社会前进的时机。
我对AI在医疗和教育上的影响非常兴奋。这两个行业已经为AI的部署做好了准备。
我们投资了一家使用AI和大数据优化供应链的公司,从而缓解了超过1.5亿中国农村人口的药品短缺情况。我们也在投资用深度学习来生成化合物的药物研发公司,以将药物发现时间缩短三到四倍。
在教育方面,我们正真看到一些公司正在用AI改善学生的英语发音,帮助学生提升成绩,用个性化和游戏化的方式帮助学生学习数学。这将使教师从日常工作中解放出来,并使他们能够花时间为新兴一代的学生做更多鼓励性的工作。
我希望看到更多明智的企业家和公司在2020年及以后的几年中开始使用AI来帮助他们获得更大的好处。
LeCun:自监督学习带来AI革命
深度学习三巨头之一、图灵奖得主Yann LeCun的新年寄语主题,是Learning From Observation。
让人忍不住把它翻译成格物致知。
格的是开车这件小事。LeCun提到,人类学开车只要几十个小时,但是模仿学习算法需要学几十万个小时,强化学习算法甚至需要学几百万个小时,这里面一定有什么样的问题。
人类可以高效学习,是因为我们人在脑海里建立了世界的模型。婴儿很难和世界互动,但是在刚出生的几个月里,他们通过观察吸收了大量关于这样一个世界的背景知识。显然,大脑的很大一部分被用在了理解世界的结构,并预测一些无法直接观察到的事物,比如未来才会出现的东西、或者被隐藏的事物。
因此,AI的前进方向,就是自监督学习(self-supervised learning),它和监督学习类似,但是并不会训练系统去把数据分类,而是我们隐藏一些部分,让后让机器预测丢失的部分,比如把视频的一些帧抹掉,然后训练机器根据剩余的帧来填补被抹掉的部分。
最近,这种方法在NLP方面非常成功。诸如BERT、RoBERTa、XLNet、XLM之类的模型以自监督的方式来进行训练来预测文本中缺少的单词,它们在所有主要的自然语言基准测试中都有记录。
希望在2020年,自监督学习能够用在视频和图像上。它会在视频这类高维连续数据上创造类似的革命吗?
其中一项严峻的挑战是应对不确定性。像BERT这样的模型无法判断句子中丢失的单词是猫还是狗,但是它们可以产生概率分布向量。对于图像或视频帧,我们没有一个好的概率分布模型。但是最近的研究非常接近,或许我们很快就会发现这样一个模型。
这样,我们就能用很少的视频训练样本,来实现非常好的性能预测、动作预测,而这在以前是不可能的。
当这个想法实现的时候,2020年就会是AI领域非常激动人心的时刻。
周志华:方法创新,方针明确
南京大学周志华教授对2020年有三个希望:
1、希望可以出现深度神经网络以外的高级机器学习技术。神经网络已经被许多研究人员、工程师和从业人员研究并应用了很长时间,其他机器学习技术为创新提供了相对未开发的空间。
2、希望AI可以涉足更多领域,为人们的日常生活带来更多积极的变化。
3、希望研究人员、工程师和从业者们对于如何采取措施防止AI技术的错误开发和滥用进行更多的思考和讨论。
Anima Anandkumar:模拟的力量
Anima Anandkumar是英伟达机器学习的总监,也是加州理工的计算机教授。
Anandkumar教授提到,在仿真环境学习中训练算法会让网络更为强大,并且能模拟各种复杂的情况,在一些情况下能解决研究人员数据不够的问题。
她所在的加州理工已经用物理模型来模拟真实数据,用深度学习进行地震预测的研究;英伟达也推出了仿真平台Isaac。
她希望,2020年AI科学家们能认识到在模拟环境中进行训练的价值,并在新的一年产生更为重大的AI进步。
Oren Etzioni:工具创造平等
Oren Etzioni是艾伦人工智能研究所的首席执行官、华盛顿大学计算机教授、Madrona资本合伙人。
他认为,AI界花了很多时间讨论算法的公平和透明性,但在应用上,AI还可以为社会提供更多帮助,比如为行动不便的人提供无障碍技术,解决教育、流浪者、人口贩卖的问题,AI能对人们的生活品质产生巨大的积极影响,但现在AI界对此的研究和探讨只浮于表面。
因此,他希望2020年AI界能用切实的手段让这些处于不利地位的人受益,让世界更公平。
Chelsea Finn:泛化的机器人
Chelsea Finn是斯坦福计算机科学与电气工程助理教授。
她认为,目前的许多AI技术都能在围棋等特定任务上取得非常好的成绩,但在泛化方面做得还不够,无法用一个机器人来完成多个任务。
比如,识别ImageNet上的图片需要一个模型,但如果机器人需要与环境交互,那为每个任务都创造一个ImageNet那么大的数据集是不切实际的。
因此,她也在进行更多赋予机器人泛化能力的研究。如果强化学习的临界质量发展和泛化有所突破,会是非常令人振奋的事情。如果能应对这些挑战,机器人会比现在的更加智能,而不单单是停留在实验室里。
David Patterson:快速训练与推理
David Patterso是加州大学伯克利分校的计算机科学教授,RISC-V国际开源实验室负责人,也是ACM和IEEE的Fellow。
他说,过去一年,阿里巴巴、 Graphcore和英特尔等公司都在研发专门的人工智能处理器,而这些芯片将慢慢进入研究实验室和数据中心。
他认为,投资数十亿美元打造新颖的人工智能硬件将在2020年初见成效。
并希望人工智能社区能接受其中最好的芯片,来推动这个领域朝着更好的模型和更有价值的应用方向发展。
Dawn Song:要对数据负责
Dawn Song是安全领域的顶尖学者之一,1996年本科毕业于清华大学,现在是加州大学伯克利分校(UC Berkeley)计算机科学和电子工程教授,也是Oasis Labs 首席执行官和联合创始人。
她认为,人们对敏感数据的收集正在迅速增加,几乎涵盖了我们正常的生活的方方面面。但用户几乎无法控制他们生成的数据如何被使用。与此同时,企业和研究人员在利用数据方面面临着诸多挑战。
在她看来,这种数据收集方式将个人和企业置于危险之中,她希望2020年应该是为负责任的数据经济打下基础的一年。
这需要创造新的技术、法规和商业模式。Dawn Song认为,2020年在在机器学习方面仍然存在更大的挑战,要打造可扩展的系统来为实际部署大型、异构数据集服务,联邦学习的进一步研究和部署对于某些用例也很重要等等。
Richard Socher:信息海洋已经沸腾
Richard Socher博士毕业于斯坦福大学计算机系。2016年,自己创办的公司被Salesforce收购后,加入Salesforce,现在是Salesforce的首席科学家。
他认为,怎么样处理铺天盖地的事实、意见和观点仍然是一个挑战。
比如,在你没有读过一个冗长的文档之前,你很难知道你会在里面找到什么信息。而且,想要知道某个特定的陈述是否正确也非常困难。
在他看来,自动提取摘要能解决这样一些问题,2020年,这一技术将会迎来重大发展,改变我们消费信息的方式。
不仅能帮助人们应对不断涌现的新信息,而且还能让人们进一步拥抱人工智能的巨大潜力,创造一个更美好的世界。