近日,斯坦福“人工智能百年(AI100)”专家小组(非盈利性项目AI Index)发起了一项AI指数报告,追踪学术界、产业界、开源软件和公共兴趣范畴的18个分立的视角评估人工智能活跃度,盘点计算机视觉、自然语言理解等技术发展现状(机器类人程度),从专家视角解读人工智能创业和投资的急剧增加,探讨相关领域的深入发展。
一、人工智能活跃度一览
▲AI活跃度指数(来自学术界和工业界数据,如出版物、注册创企和风险投资等)
从学术领域来看:
人工智能论文大部分隶属计算机科学的范畴,自1996年至今年度发表的论文数量已经增加9倍,作为参考,计算机科学论文数量此间增加了6倍;
高校机器学习等人工智能相关课程的开设数量和学生的参与度都大幅增加;
人工智能相关的顶级会议也变的火爆,包括如 AAAI、IJCAI、ICML等综合性会议,以及CVPR、ACL、ICRA等专注于通用技术(计算机视觉、自然语言、机器人等)的会议。
▲学术-产业动态关系(参数包含论文出版、学业课程、投资金额,其中2016年学生课程参与度的下降是由于行政原因)
从产业领域来看:
人工智能相关创企的数量从2000 年以来增加了14倍,风投金额增加了6倍;
在线招聘网站的数据显示2013年以来美国AI相关岗位增长了4.5倍,其中自然语言处理和计算机视觉技能的比重最多;
物流和工业机器人的数量和进出口急剧增加。
从开源软件来看:
▲GitHub明星软件库
这里主要参考GitHub项目:TensorFlow和 Scikit-Learn等AI和ML(机器学习)软件包被收藏(star)的次数飙升。
从公共兴趣来看:
▲AI公众兴趣提升
流媒体涉及“人工智能”的内容数量飙升,其中,正面文章高于负面。
从
技术成熟度来看:
▲AI里程碑
根据LSVRC竞赛结果,图像标注的误差率从2010年的28.5%降至低于 2.5%;
视觉问答(Visual Question Answering,一种开放式问答)数据集发展出新版本VQA 2.0 ;
自然语言理解技术范畴下的语法解析(Parsing)、语种互译(Machine Translation)、问答(Question Answering)、语音识别(Speech Recognition)等技术皆逼近人类的能力;
人工智能进行定理证明(Theorem Proving)的可追踪性提高至80%以上,但遇到新的问题解决方案时性能不理想;
SAT(美国学业能力倾向测验)中能回答的问题超过70%,应试竞争力强;
▲物体检测技术成熟度示意
▲视觉问答技术成熟度示意
▲语法解析技术成熟度示意
▲新闻翻译技术成熟度示意
▲问答技术成熟度示意
▲语音识别技术成熟度示意
▲定理证明能力示意
▲SAT测试能力示意
二、专家观点
Barbara Grosz(哈佛):小心档口
评估人工智能系统的成熟度很关键的一点是看它能对人类的生活造成怎样的影响。
根据该报告,我们正处在一个机器性能表现逼近人类能力的档口。由于报告相关数据采集涉及的时间节点、标准化测试和地区发展不平衡,我们对机器发展水平的认知可能存在偏差。举个例子,该报告阐述了自然语言理解技术中语法解析、语种互译、问答、语音识别等模块的发展水平,但没有表征聊天机器人的成熟度,也就是多模块结合起来的机器表现。当然,我们首先需要在细分的模块将机器的水准至少提高到人类水平,然后逐渐提高其综合起来的任务解决能力,追求系统的完整性(这又是另一个高难度的问题)。此外,AI指数的评估应考虑系统的设计和伦理挑战,并找到合适的方式追踪人工智能公司的数量和发展。
Eric Horvitz(微软):未来在望
将人工智能界各方指数有效的引入该评估机制中是必要的一步。
AI100项目和这份指数报告将当下的人工智能和未来人工智能的影响连接了起来。根据这份报告,我们看到了很多技术的进展,包括通用技术和机器学习,也别是卷积神经网络等算法,也看到了大规模可用数据对于AI的支持,很多AI应用表现出了落地倾向,比如游戏(西洋棋、围棋、扑克等)、医疗(组织切片、医疗影像等)。人工智能的学术界和产业界,包括人才市场都活跃,也让我们离未来目标更加接近。当然,更明确的AI系统性能标准化测定和评估机制有待建立,这需要各界的参与和支持。AI是一个多维度的命题,也让我们看到了多方面的价值潜力。
李开复(创新工场):关注中国AI
中国国务院宣布计划,在2030年成为人工智能创新中心。
AI100的指数报告主要针对了美国AI发展水平,但我很建议将中国AI市场,这个全球最大的移动端和互联网市场考虑进去,包含手机支付、食物配送、共享单车等庞大的数据量,提供更多的数据和维度。此外,中国的创企表现也相当喜人,比如Face++最近就击败了微软、谷歌、脸书和卡内基梅隆大学拿下三项计算机视觉大奖。中国政府(新一代人工智能发展规划)对科技开放鼓励的态度,以及明确的规划目标(2030年成为AI创新中心)有利于AI的快速和迭代。未来的AI时代,中美双巨头垄断的局面不可避免。
Alan Mackworth(哥伦比亚大学):要深刻
容易获得的数据未必是最有用的信息。
AI指数是一个很好的表征人工智能发展的报告,但需要警惕“路灯谬论”:不要仅在AI产业评估其发展阶段,还要关注整个社会范围的影响,注重数据获取的多样性和客观性。举个例子,美国的数据科技和AI技术,或者说硅谷人工智能社群,不能代表全球AI的发展,欧洲数据、亚洲数据,也别是中国的数据,十分重要。此外,学术界和产业界的数据也需要考虑其背景,比如来自学术成就中哪些是拨款资助的数据研究,除了出版物的进步,教职岗位数量是否增加了呢,产业如何平衡监管和研发进程,非政府组织(AI2、OpenAI、WEF、图灵研究所)的观点如何,这些都是重要的AI发展指标。换言之,不要简单的关注产业规模,要从法律、政府、城市等更丰富的维度看看规模背后的逻辑和对应的发展机会,分析AI对于社会、就业和经济影响。
吴恩达(Coursera,斯坦福):“AI新电力”
人工智能是新电力。
深度学习首先改变了语音识别,然后是计算机视觉,渐渐应用于多方面的AI程序,提供AI增长动力。人工智能将逐渐渗透各行各业并引起社会变革,AI指数报告有利于帮助我们理解AI发展现状,并帮助未来的几代人回顾和理解AI的崛起之路。目前,中美正快速的利用投资和收购发展AI产业,英国、加拿大等也贡献了很多开创性的研究成果。AI崛起是全球性的运动,国家政策很大程度影响该国AI发展进程和风险。
Daniela Rus(麻省理工学院):AI是积极的
人工智能将帮助我们更好地理解和解决我们面临的一些大挑战。
科技正为这个世界带来翻天覆地的变化,网络提供了便捷,导师能远程指导手术,机器人能帮助工厂包装商品,联网传感器能监测设备,3D打印能定制产品。我们被一个充满可能性的世界包围着,人工智能就是一个很积极的可能性,帮助我们解决庞大而复杂的各类命题(比如天气、自然灾害、饥饿等),为我们提供更安全、便利的生活(自动驾驶、医疗、工业机器人、预测危险等)。要实现这些愿景,需要高素质的研究人员和长期的研究创新来解决,这就有劳AI指数继续追踪系列进展了。
Megan Smith(第3任美国首席技术官)& Susan Alzner(联合国非政府联络服务):要人文
多样性和包容性是最重要的。我们是因为偏见和歧视而失去了人性文化模式和系统的学习行为排斥。我们应该研发和开拓应用的同时注重伦理和价值观的整合与培训。
Sebastian Thrun(斯坦福):新革命
在这场新革命中,人类的创造力将进入空前的新时代。
人工智能已经发展了60年,并被应用于谷歌搜索的核心算法,亚马逊的网站设计和Netflix的偏好推荐,数据与计算的结合达到了前所未有的规模,并将改变整个社会的格局。AlphaGo打败了围棋世界冠军,AI系统的皮肤癌图像诊断甚至优于很多专业认证的皮肤科医生,我甚至觉得谷歌自动驾驶系统要比一些普通人类司机还靠谱。相信不久的将来,AI将逐渐渗透我们的生活,使我们不必再进行重复性工作,越来也多的机器将帮助我们解放劳动力追求创造性。“蒸汽革命”将重演,就像农民变成工人、律师、会计师、医生、软件工程师等,现在的工作者也将向未来的新工种转换,我们需要掌握新技能和新技术,适应这个变化。
Michael Wooldridge(牛津):当心泡沫
我觉得当前的AI存在泡沫。
诚然,现在AI创投很活跃,但除了机器学习,没有太变革型的进展,很明显,目前存在AI泡沫,问题是,这个泡沫是不是会破裂?破灭之后我们如何面对投机冷却,如何面对新一轮AI寒冬?事实上,泡沫是不可避免的,未来几年还会迎来通货紧缩。但AI正在实现更多更复杂的任务,这毫无疑问。因此,关键在于技术发展中实现其价值,关注其社会影响和经济效益。