2018年中国人工智能行业研究报告
核心观点:
1.广义人工智能指通过计算机实现人的头脑思维所产生的效果,是对能够从环境中获取感知并执行行动的智能体的描述和构建;相对狭义的人工智能包括人工智能产业(包含技术、算法、应用等多方面的价值体系)、人工智能技术(包括凡是使用机器帮助、代替甚至部分超越人类实现认知、识别、分析、决策等功能)
2.工业革命使手工业自动化,机器学习则使机器本身自动化;开源环境大幅降低人工智能领域的入门技术门槛;视觉感知逐步实现商用价值,视觉认知仍有待探索
3.国家政策鼎力支持,指出要发展人工智能达到世界顶级水平,但人工智能道德与威胁问题关注较少
4.未来,事物的完整行为规划或事项决策的发展空间较大;前沿算法之外,商业壁垒有赖于产品、服务、市场等综合建设
5.未来不会出现岗位短缺,技术革命将提高社会整体福利;人工智能的核心价值在于提效降本、延续人类智慧
一、人工智能行业概述
通过机器实现人的头脑思维,使其具备感知、决策与行动力
广义上的人工智能泛指通过计算机实现人的头脑思维所产生的效果,通过研究和开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统所构建而成的,其构建过程中综合了计算机科学、数学、生理学、哲学等内容。形象来说,人工智能可理解为由不同音符组成的音乐,而不同音符是由不同的乐器所奏响的,最终实现传递演奏者内心所想与头脑所思的效果。本篇报告将从人工智能技术、应用、产业等维度进行探讨,其中,人工智能技术包括凡是使用机器帮助、代替甚至部分超越人类实现认知、识别、分析、决策等功能,而产业则指包含技术、算法、应用等多方面的价值体系。
人工智能三起三落,60年登上围棋之巅
20世纪50年代到70年代初,人们认为如果能赋予机器逻辑推理能力,机器就能具有智能,人工智能研究处于“推理期”。当人们意识到人类之所以能够判断、决策,除了推理能力外,还需要知识,人工智能在20世纪70年代进入了“知识期”,大量专家系统在此时诞生。随着研究向前进展,专家发现人类知识无穷无尽,且有些知识本身难以总结后交给计算机,于是一些学者诞生了将知识学习能力赋予计算机本身的想法。发展到20世纪80年代,机器学习真正成为一个独立的学科领域、相关技术层出不穷,深度学习模型以及AlphaGo增强学习的雏形-感知器-均在这个阶段得以发明。随后由于早期的系统效果的不理想,美国、英国相继缩减经费支持,人工智能进入低谷。 80 年代初期,人工智能逐渐成为产业, 但又由于5代计算机的失败再一次进入低谷。2010年后,相继在语音识别、计算机视觉领域取得重大进展,围绕语音、图像等人工智能技术的创业大量涌现,从量变实现质变。
工业革命使手工业自动化,机器学习则使机器本身自动化
将样本数据输入计算机,一般算法会利用数据进行计算然后输出结果,机器学习的算法则大为不同,输入的是数据和想要的结果,输出的则为算法模型,即把数据转换成结果的算法模型。通过机器学习,计算机能够自己生成模型,进而提供相应的判断,达到某种人工智能的结果的实现。因此,在数据的“初始表示”(如图像的“像素”)与解决任务所需的“合适表示”相距甚远的时候,可尝试使用深度学习的方法。工业革命使手工业自动化,而机器学习则使机器本身自动化。近几年掀起人工智能热潮的深度学习属于机器学习的一个子集,在思想和理论上并未显著超越二十世纪八十年代中后期神经网络学习的研究,但得益于海量数据的出现、计算能力的提升,原来复杂度很高的算法得以落地使用,并在边界清晰的领域获得比过去更精细的结果,大大推动了机器学习在工业实践中的应用。2018年2月,《麻省理工科技评论》揭晓2018年“全球十大突破性技术”榜单,GAN(对抗性神经网络,一种特殊的深度学习算法)位列其中。
国家政策鼎力支持,人工智能道德与威胁问题仍需思考
伴随政策支持的逐步深入,中国政府将有力推动新一代人工智能技术的产业化与集成应用,促进新一代人工智能产业发展,推动制造强国和网络强国建设,助力实体经济转型升级,构筑我国人工智能发展的先发优势。此外,相比美国和英国,中国对人工智能的支持力度虽更大,但较少关注人工智能的道德伦理问题、是否在开发对社会切实有益的人工智能以及应当最小化技术进步所带来的威胁问题。
人工智能产业图谱
二、人工智能典型技术剖析
语音识别、自然语言处理、语音合成等技术
人类因为具有语言的能力而区别于其他物种,自然语言处理即研究人与计算机直接以自然语言的方式进行有效沟通的各种理论和方法,涉及机器翻译、阅读理解、对话问答等,因为语言在词法、句法、语义等不同层面的不确定性及数据资源的有限性、背景知识的复杂性等各方面限制,自然语言处理技术仍有非常大的提升空间,仅在特定领域可取得较好的应用,鲁棒性存在大量挑战。在自然语言处理之前,声纹识别可根据说话人的声纹特征识别出说话人,语音识别技术可赋予机器感知能力(在深度学习的驱动下,目前近场语音识别准确率可达98%,远场、抗噪、多人等非限定或非配合条件下的识别有待进步),将声音转为文字供机器处理,在机器生成语言之后,语音合成技术可将语言转化为声音,形成完整的自然人机语音交互,这样的语音交互系统可看作一个虚拟对话机器人,具体技术流程如下图所示。
通用知识图谱与行业知识图谱
从覆盖范围的角度来说,知识图谱可分为应用相对广泛的通用知识图谱和专属于某个特定领域的行业知识图谱。通用知识图谱注重横向广度,强调融合更多的实体,主要应用于智能搜索、智能问答等领域。行业知识图谱注重纵向深度,需要考虑到不同的业务场景与使用人员,通常需要依靠特定行业(如金融、公安、医疗、电商等)的数据来构建,实体的属性与数据模式往往比较丰富。
视觉感知逐步实现商用价值,视觉认知仍有待探索
视觉使人类得以感知和理解周边的世界,人的大脑皮层大约有70%的活动在处理视觉相关信息,计算机视觉即通过电子化的方式来感知和理解影像。得益于深度学习算法的成熟应用(2012年,采用深度学习架构的AlexNet模型,以超越第二名10个百分点的成绩在ImageNet竞赛中夺冠;2017年,ImageNet图像分类竞赛Top 5的错误率降至2.25%),侧重于感知智能的图像分类技术在工业界逐步实现商用价值,但与可结合常识做猜想和推理进而辅助识别的人类智能系统相比,现阶段的视觉技术往往仅能利用影像表层信息,缺乏常识以及对事物功能、因果、动机等深层信息的认知把握。
多学科融合,帮助人类做出复杂决策
为了做出最优(经济的或其他的)决策,决策相关理论将概率理论和效用理论结合起来,为在不确定情况下(在概率描述能适当呈现决策制定者所处环境的情况下)做出决策提供了一个形式化且完整的框架。因为理性决策的显著复杂性,历史上决策相关理论一直与人工智能研究沿着完全分离的路线向前发展,但自20世纪90年代以来,决策逐步深入人工智能系统研究,经济学、博弈论、运筹学、人工智能等多领域学科思想融合,让计算机智能处理海量数据,相对实时的解决人类专家也难以及时求解的各类问题。
自动驾驶系统剖析
根据自动驾驶的拟人化研发思路,自动驾驶系统原理可理解为感知——认知——决策——控制——执行五层,通过传感器实现感知作用,并根据所感知信息完成处理与融合,对信息达成一定的认知和理解,在形成全局整体理解后,通过算法得出决策结果并传递给控制系统生成执行指令。在整个过程中,汽车能够通过V2X(Vehicle to Everything)通信实现车与外界(如道路设施、其他车辆等)的信息交换,帮助车辆实时获取更大范围的环境信息,解决“我在哪儿,周围有什么,环境将发生什么变化以及我该怎么做“等四个问题。
三、人工智能的应用场景
金融领域——主要应用场景及相关影像采集设备
与安防影像分析中人脸的“1:N”识别不同,目前泛金融领域以人脸“1:1”身份认证为主,部分场景涉及“1:N”识别,如银行网点中对VIP客户的智能识别。
公共安全领域——生物特征识别与大数据研判增加公安预测和决策能力
计算机视觉、语音识别、机器学习等多项智能技术可对人脸、指纹、虹膜、掌纹、指静脉、声纹、步态等多种生物特征进行身份识别,其中人脸、指纹、虹膜等三大生物特征共占全球生物识别市场份额的80%以上。在公安的实际业务场景中,人工智能技术还可对公安大数据进行智能分析,在构建“人、事、地、物、组织“的知识网络的基础上,实时监测预警、研判,切实增加公安的认知、预测和决策能力。伴随人工智能及大数据的技术进步,高清联网摄像头、各种传感器的硬件部署应用,从平安城市、智慧城市到雪亮工程等公共安全相关政策、人工智能相关国家战略政策的逐步深化,公共安全领域的各种智能应用将由重点区域、有条件的地区起步,完成从局部到整体的全国性拓展。
教育领域——由表及里,逐步深入学习核心环节
人工智能已在老师教学与学生学习、评测的各个环节切入教育领域,相关产品服务包括拍照搜题、分层排课、口语测评、组卷阅卷、作文批改、作业布置等功能,涉及了自适应、语音识别、计算机视觉、知识图谱、自然语言处理、机器翻译、机器学习等多项人工智能技术,正在创造着更加个性化、服务于终身学习的智能高效学习环境。
泛信息处理领域——人工智能让人与信息的连接日益高效便捷
搜索与输入法作为人工智能在信息处理领域的典型应用,已大幅改变国人获取信息与输入信息的方式。移动互联网时代,信息流推荐相关产品也成为用户浏览应接不暇的信息的一种有效工具。在人机交互方式不断升级的当下,人与信息接触的种种环节都在发生着智能化的创新变革。
医疗健康领域——改善医疗资源分布不均的问题,助力专家学者攻克医疗难关
相对生命的复杂性,人类对医疗健康的理解仍非常粗浅,现阶段人工智能技术也不能有效应对各种挑战,但这并不妨碍我们对人工智能技术寄予厚望,试图通过前沿技术改变医疗资源分布不均的现状,将医生从繁重的工作压力中解放出来,并帮助他们减少误诊率,提高准确率,甚至探索出新的诊疗方案或找到新型有效药物。
零售领域——人工智能赋能零售业,提升效率与收益,优化消费者体验
通过数据与商业逻辑的深度结合、先进感知技术的成熟运用,人工智能、运筹优化等技术将切实提升零售全链条的资产配置效率,在精细化运营为企业创造出更多效益的同时,为消费者带来更为理想的购物体验。
广告营销领域——为广告效果与营销策略提供更科学的依据和更聪明的支持
相比人工智能在传统行业的摸索尝试,人工智能与广告营销的结合已有成熟落地(得益于数字营销领域较好的信息化、网络化基础以及互联网公司卓绝的技术创新力),用户在搜索引擎、信息流产品、视频网站、电视中看到的相关广告可能都经过了人工智能算法对多维度大数据的智能分析。人工智能力图为企业提供智能创意及营销策略和效果监测,结合场景、内容及渠道向用户精准推荐,实现满足用户真实需求的高价值信息传递。
交通出行领域——人工智能有效改善交通问题,智能化交通有望全自动化
人工智能算法对交通出行所产生的信息进行了分析与预判,人工智能技术的应用衍生出一系列智能设备,并对现有设备、应用和服务提供嵌入式的智能处理能力,以协助交通管理者更好地进行决策,以便车流最有效的方式通行,提高交通流效率,实现交通升级转型——交通智能化;未来,智能化交通解决方法中,人工参与与处理将逐渐削弱,有望达到自动化运作的水平。
交通出行领域——共享出行摊低落地成本,自动驾驶引发产业融合
国内科技公司纷纷发声将在2021年前后实现L4级自动驾驶(以国际汽车工程师协会制定(SAE)的自动驾驶级别划分为衡量指标,L4级即系统完成所有操作,人类不一定需要对系统应答)乘用车的量产,但考虑到现有算法技术的能力边界,艾瑞认为,2021年的时间节点相对乐观,较难实现通用场景的L4级自动驾驶,小概率的意外缺陷都有可能引发致命事故。
但是,2021年成为创业者标杆的时候,它将促进“预言的自我实现”,技术的突破性进展及不断拓宽的行驶场景依然值得期待。
实现自动驾驶需要在汽车中装配大量的软硬件设备,而大量设备将带来高额推进成本。为减轻自动驾驶在推进消费市场时的成本等阻碍,可通过出行服务商进行系统安全性的评测并承担相关成本。智能化与共享化是汽车产业生态的重要发展趋势,车企、科技公司、出行服务商间的合作结盟也会愈发频繁,智能出行公司随之诞生。
智能客服领域——传统客服由人力密集型向人机混合升级,提升咨询效率
传统客服业是典型的人力密集型,被视为是人工智能最有可能全面颠覆和取代的工种。不过,从目前的实践情况来看,人工智能更多的是起到辅助人类决策和工作的层面,即,通过电话客服、网上客服、App、短信、微信以及智能机器人终端等产品与客户进行语音或文本的互动交流,理解客户浅层业务需求,回复客户提出的业务咨询,并根据客户语音导航至指定业务模块,实现优化人工客服咨询效率。智能客服目前的成熟应用主要在售后阶段,以重复性问题标准化回答为主,未来智能客服业的应用将继续升级,由现在的“以问题为中心”转变为“以用户为中心”的智能语音助理,由现在服务于企业/商家的机器人转变为服务于每一个用户。
四、人工智能行业发展趋势
对事物的完整行为规划或事项决策的发展空间较大
以深度学习为基础建立的人工智能技术一般是在用大数据解决小问题,而人类智能往往能够以小数据解决大问题。人类可凭借自己的观察和判断形成最终的价值决策,机器的语音识别、计算机视觉等AI能力在现阶段还很难支撑到对事物的理解、与判断,距离完整行为规划或事项决策仍有较大的发展空间。
未来不会出现岗位短缺,技术革命将提高社会整体福利
就失业问题而言,在向日益自动化的世界过渡时,机器学习和人工智能技术的发展升级定会逐步影响就业市场。我们假设人类的就业机会将大幅减少,然而,就业机会减少的同时,不得不承认的是,技术革命也会不断促进万众创新,人们会从重复性的劳动中解放出来,将更多时间和精力用于创造性活动。换而言之,人工智能将缓解劳动力危机,使人们自由追求生活及工作新方式,从而提高社会的整体福利。因此,准确地说,在未来不会出现岗位短缺,取而代之的应当是匹配职业的技能的短缺。如同工业革命、信息革命等,历史已经告诉我们,长久以来,新兴科技带来的问题都将被解决,从而使消费者们能够享受与之而来的红利。
人工智能将实现提效降本、延续人类智慧的核心价值
如同报告开篇所提,人工智能即通过智能实现人类思维的效果,从宏观层面来看,此效果体现在智能社会与智能经济层面, 即,人工智能将大幅改善依赖劳动力创造的劳动密集型、简单重复性的传统经济运行模式,并依托此经济模式构建万物互联、智能协同的产业体系,打造国际领先的智能社会。从微观层面来看,人工智能将替代传统劳动,带来新式生产方式,以提升生产效率并降低成本,进而实现企业效益提升、改善人们工作与生活。而随着机器变得聪明,我们将最终实现人性化人工智能(Humanistic AI),即通过机器达到拟人的形式并以这类形式延伸人类智慧。