人工智能产业概述
摘要: 人工智能(Artificial Intelligence 缩写 AI)是机器展示的智能,与人类和其他动物展示的自然智能(natural intelligence, NI)形成对比。
一、人工智能定义
人工智能(Artificial Intelligence 缩写 AI)是机器展示的智能,与人类和其他动物展示的自然智能(natural intelligence, NI)形成对比。AI是用机器模仿和实现人类的感知、思考、行动等人类智力与行为能力的科学与技术,目标在于模拟、延伸、拓展人的智慧与能力,使信息系统或机器胜任一些以往需要人类智能才能完成的复杂任务。人工智能是认知科学、数学、计算机科学、控制论、信息论、自动化、仿生学、生物学、神经生理学、数理逻辑、心理学、语言学、不定性论、医学和哲学等多种学科互相渗透而发展起来的一门综合性学科,是一门广泛交叉的前沿科学。
二、人工智能技术框架
人工智能是要机器模拟与实现人类智能,因此机器的感知、思考与行动三个主要环节构成了人工智能的技术框架。
感知环节类似于人类的感知过程,机器通过传感器、搜索引擎和人机交互获取所需数据,实现信息世界与物理世界的联结。该环节所涉及的关键技术包括机器听觉、机器视觉、机器嗅觉、机器味觉、机器触觉等。机器听觉技术主要实现声音识别,现阶段主要是人类语音识别,而且语音识别已经成为车载语音、智能家居、人机交互、机器同声传译等应用的基础。机器视觉技术主要实现图像识别和视频识别等,是在自动驾驶、物体检测等领域发展的基础。在图像识别领域,指纹识别已经是一种非常成熟的技术,目前的重点是人脸识别和虹膜识别。在视频识别领域,主要关注的是动态图像,目前的重点为体感识别。机器触觉技术是一种复合传感技术,是机器通过自身表面的温度觉、力觉等传感器提供的复合信息,来识别物体的冷热、尺寸、柔软度、表面形状、表面纹理等特征。相关技术包括压电式触觉传感技术、压阻式阵列触觉传感技术、成像型触觉传感技术、超大规模集成计算传感阵列技术等。目前,温度感知和压力感知技术已经基本成熟,并获得了广泛应用;材质感知等技术尚处于研究过程中。嗅觉感知和味觉感知技术主要是分子层面的感知识别,将会在危险物检测、矿床探测、食品卫生服务等领域大显身手。但目前嗅觉感知技术刚刚开始发展,而味觉感知技术的研究还未见报道。
思考环节类似于人类的思考过程,机器依托于基础存储和运算能力,对数据进行建模分析。该环节所涉及的关键技术包括机器学习、机器理解、机器思维等。机器学习(Machine learning)是AI领域的核心概念,是将所获得的数据信息进行分析处理,挖掘出有规律性的特征,训练AI的思维和理解能力。机器学习任务可分为两大类,即无监督学习和有监督学习。这取决于学习系统是否有学习“标记”或“反馈”。无监督学习没有给出学习标记,在输入样本中自己寻找结构特征。典型的算法如K均值聚类,可用于聚类分析及特征学习等。监督学习给出了带标记的输入及期望的输出,目标是获得输入与输出间的映射规则。监督学习的典型算法有支持向量机(SVM),人工神经网络等等。机器学习的应用更多是无监督与有监督学习的结合,涵盖各个领域,如医学辅助诊断,目标识别与分类以及信息检索等。机器理解部分主要是利用一些高级算法来理解所获得的数据含义,主要包括声音理解、自然语言理解、图形图像理解、运动影像理解、行为动作理解等。目前,RNN(回归神经网络)、DNN(深度神经网络)、LSTM(长短记忆神经网络)已成为常用的语音识别算法。而在诸多技术中,卷积神经网络(CNN)被人们普遍认为是一种更容易被训练并且具有更好泛化能力的前馈网络,已经广泛运用于信息检索、文本挖掘、机器翻译、以及人脸、指纹等目标检测与识别之中。机器思维部分主要是在已经获得的知识的基础上,利用回归算法、基于实例的算法、贝叶斯方法、正则化方法、聚类算法、基于核的算法、降纬算法、专家系统以及决策树学习等算法进行推理,从而得出问题求解、智能搜索、自动规划、辅助决策、程序验证和自动程序设计等需要解决的问题的答案。机器思维面临的主要问题是:即使只针对单一领域,试图建立完成的知识库也难以实现;很少有问题是简单的是非推理,都有大量的例外;同一个问题有多种表现形式。
行动环节类似于人类的行为过程,机器基于数据拟合出来的模型结果,对产品和服务终端发出指令,使人工智能设备对外部环境做出反应。包括决策执行、声音合成(尤其是自然语音合成)、智能控制、情感表达等。决策执行概念比较宽泛,依据各自不同的需求执行具体的动作,在机器人学中被大量使用。先进的机械臂和其他工业机器人在现代工厂中广泛使用,它们可以从经验中学习在摩擦力或齿轮滑移的影响下如何有效地移动。现代移动机器人在给定一个小的、静态的、可见的环境时,可以很容易地确定其位置并绘制其环境地图;但在动态的环境则构成了更大的挑战,如(在内窥镜中)病人呼吸身体的内部。声音合成技术目前已经基本成熟,通过数字化频率控制,可以将声音惟妙惟肖地模仿出来。尤其是自然语音合成(TTS)技术能将任意文字信息实时转化为标准流畅的语音朗读出来。自然语音合成技术在与声纹技术的结合后,还可以逼真地模仿出各个人物的声音,如科大讯飞的语音导航系统等。智能控制包括平衡控制、动作控制等。智能控制(尤其是工业智能控制)在与通信系统的结合后,甚至已经能够实现远程智能控制与服务。目前,智能控制技术已经在生产制造领域已经获得了较大范围的应用,智能设备以及各类生产型机器人开始在工厂车间出现,甚至出现了无人车间、智能空调、扫地机器人以及其他一些社会服务性机器人也已经陆续产品化。情感表达主要是让机器人能够表达人类的喜、怒、哀、乐、悲、忧等情感,主要用于类人服务机器人,也是目前AI领域的研究热点之一。情感计算是一个跨学科的问题,它由识别、解释、处理或模拟人类影响的系统组成。但由于人类情感表达方式比较复杂,情感识别比较困难,情感计算技术还未获得本质的突破,与情感计算相关的有限成果包括文本情感分析和多模态情感分析。
三、人工智能产业链
目前对人工智能产业概念,以及人工智能核心产业与相关带动产业的边界,有待明确。
中国电子学会认为,人工智能核心产业包括基础层、技术层和应用层,基础层包括智能传感器、智能芯片和算法模型,技术层包括语音识别、图像视频识别和文本识别等,应用层包括智能机器人、无人机、智能驾驶、智能搜索、智能教育、智能金融、智能安防、智能医疗等。
安徽省认为,人工智能核心产业包括支撑层、产品层和应用层。支撑层包括智能芯片和智能传感器,产品层包括智能机器人(智能工业机器人和智能特种机器人只包含智能控制部分)、无人和辅助驾驶方案、智能无人设备产品和解决方案、智能家电的智能模块和解决方案、人工智能软件和人工智能服务平台,应用层包括人工智能系统应用和集成服务。
比较统一的认识:人工智能技术研发应用所涉及的软硬件产品开发和生产、系统应用和集成服务可作为当前人工智能核心产业。随着人工智能应用范围的扩大和商业模式的成熟,人工智能核心产业边界与范围将逐步扩展。人工智能技术应用的辐射和扩散效应将不断推动传统制造业和服务业转型升级、改善人民民生、提升社会建设和治理水平,这些结合了人工智能技术的国民经济其它行业集合可作为人工智能带动的相关产业。
我们认为,人工智能产业链按照基础层、技术层和应用层划分比较合理,具体内容略有不同。
人工智能产业