【综述专栏】人工智能与深度学习

hzqadmin 阅读：71 2024-08-16 21:09:48 评论：0

在科学研究中，从方法论上来讲，都应“先见森林，再见树木”。当前，人工智能学术研究方兴未艾，技术迅猛发展，可谓万木争荣，日新月异。对于AI从业者来说，在广袤的知识森林中，系统梳理脉络，才能更好地把握趋势。为此，我们精选国内外优秀的综述文章，开辟“综述专栏”，敬请关注。

来源：中国人工智能学会从上世纪90年代初的互联网，到2007年的物联网，再到后来的云计算、大数据及人工智能，随着信息网络走进人们的日常生活，各行各业涌现出了海量数据。如何能让大数据产生价值，成为近十年科学技术，特别是计算机科学和信息科学领域关注的问题，催生了人工智能当前的研究热潮；这也是这次人工智能从产业界，为了让大数据产生实际价值，倒推着高校和研究所从事人工智能的研究。目前人工智能已经上升到国家战略，2016年我国出台了《“互联网 +”人工智能三年行动实施方案》。2017年7月国家又发布了《新一代人工智能发展规划》，体现了国家对人工智能产业发展的高度重视；同年8月教育部关于落实《新一代人工智能发展规划》的实施意见，以及总书记在十九大开幕上也要求推动互联网、人工智能的发展。2018年10月中共中央政治局集体学习时，强调人工智能是新一轮科技革命和产业变革的重要驱动力量，这对我国能否抓住这次机遇，在全球的科技竞争中占领制高点非常重要。2019年在全球国际人工智能与教育大会上，习总书记专门写信指出，人工智能正在深刻改变人们的生产、生活、学习方式，推动人类社会迎来人机协同、跨界融合、共创分享的智能时代。上述这些都体现了国家对人工智能的高度重视。除我国之外，世界上主要国家也都纷纷出台人工智能战略、策略和政策，推动人工智能赋能社会和实体经济。人工智能让大众全民关注，源于2017年谷歌开发的AlphaGo战胜了国际上的围棋领军选手，从而看出人工智能在某些具体方面已经超过了人类；2018年又发布的AlphaGo的升级版，让学术界特别震惊的是，它不再需要人工训练样本，第二代升级版完全是自学习过程。谈到人工智能的起源都会想到英国著名科学家，被誉为人工智能之父的图灵。1937年他发表了一篇《论可计算数及其在判定问题中的应用》的论文是现代计算机开山之文，计算机基本原理就是依据这篇论文的技术，探讨的核心问题就是只要给人足够的时间演算，数学函数都能够通过有限次运算求得解答。比如，中午你想吃什么饭是一个开放问题，判定问题只能有两个答案，是或者否。中午吃饭可以转化为一系列判定问题，在西安中午吃什么是开放问题，但是我可以转化为中午吃肉夹馍吗？如果你回答是，我就不再问了；如果你回答否，我就一直给你列举可以吃的东西。所以我们可以划定场景，把中午能吃的东西在一定范围内列举出来，直到回答是为止。这个问题是现代计算机的奠基之作，至少目前所用的计算机都是基于这个原理，不论是一幅图像还是一段视频，存到计算机都是0和1——0代表否，1代表是。所以计算机不能产生智能，这是后面要探讨的，因为它是一个确定的系统，把所有的内容都变成了0和1的表示方式。1950年10月，图灵发表了一篇划时代的论文《计算机与智能》，提出了图灵测试。图灵测试就是判断一台机器是不是智能的？人和机器中间隔了一堵墙，如果外面的人在一段时间内无法判断是人或是机器，就可以说机器是智能的。这是当时图灵测试提出来的判断机器是否智能的基本框架，到目前为止，大家仍然用它测试机器是否智能。人工智能最终如何才能实现，这里列举一些基本技术。比如，自然语言处理与机器对话，要让机器听懂你说的话，同时合成出想表达的意思，这是现在人工智能领域非常重要的一个研究方向。然而不同国家语言不同，英语、汉语各是一个体系，如何让机器理解汉语的交流非常重要。人与人之间的交流对方能听懂你说的意思，机器虽然每个字都能听出来，但是怎么用知识表述；根据与你交流的知识，怎么做推理，怎么回答你，这是非常难的事情，现在人工智能仍然做不到这种很好的推理。机器学习虽然取得了一些进展，但并没有达到同人类一样能够很快并全面地掌握知识，像人一样学习知识是非常重要，也是很难的。完全图灵测试，即把图灵测试中间的墙去掉，面对面交流，判断是人还是机器就更难了。目前不仅有前面讲到的技术，还有计算机视觉，让它和人一样能够非常准确地判断出周围环境；还有机器人技术，让它与人的皮肤，以及动作做起来和人完全相同，要判断前面站了两个人，哪个是机器，哪个是人，这时候就不完全满足图灵的要求。所以，完成完全图灵测试还需很长的路要走。人工智能的发展充满了曲折，可以追溯到1956年，这是一个非常重要的时间。在达特茅斯会议上麦卡锡组织了当时从事计算机相关科学研究的学者（大部分都是数学家和信息论研究的科学家），包括明斯基和香农等二十几个人，会上提出了人工智能。在会议的议题上列出了七个话题，一是自动计算机，是指可编程的，并无超出计算机概念的新含义；二是编程语言，编程到底怎么编，这是编程语言问题；三是神经网络，研究一群神经元如何形成的概念；四是计算规模理论，就是计算复杂性理论；五是自我改进，真正的智能应能自我提升；六是抽象，对感知及其他数据进行抽象；七是随机性和创造性，创造性思维可能来自受控于直觉的随机性。到目前为止，一部分议题已经解决了，但是第五、第六、第七还是尚未解决的关键难题。现代计算机每天都接触，从某种意义上，几乎每个人都离不开的手机也是计算机，所以计算机对我们来说非常重要。但是现在智能与人类智能相比到底处于什么水平？现代计算机让它计算确定的数字计算比人类强太多，而从另一个意义上讲，其智能抽象能力和人相差“十万八千里”，通过编程也只能做一些基础推理。比如，“树上有10只鸟，被猎人用枪打下1只，问树上还剩下几只鸟。”计算机计算肯定是9。计算机的能力和人类的智能到底差在哪里？首先探讨人类的智能在哪？智能是具有感知与认识事物、客观世界与自我的能力，如果无法感知周围，就不能表达出任何智能的行为；通过学习取得经验、积累知识的能力。我们学习的目的，就是为了通过老师的讲解取得经验、积累知识，提升自己的能力。从小学到现在都在做这样的事情，通过学习提高能力——理解知识、运用知识和运用经验分析问题和解决问题的能力。有些同学上学时表现非常好，学习成绩排名非常靠前，但是到工作岗位后并没有特别大的成就，因为他理解知识、运用知识、解决问题的能力不太强，这是很重要的一个方面，必须要学会推理。联想、推理、判断、决策的能力体现了一个人智慧，我们积累了三四十年的知识，可以快速决策遇到的核心难题，这是非常厉害的；还有发现、发明、创造、创新的能力，科研工作者都想通过自己的能力进一步提升现在科技水平。实时、迅速、合理地应对复杂环境的能力，这是人类表现出来智能的一些具体表现。智能从生物学的角度定义为“中枢神经系统的功能”；从心理学角度定义是进行抽象思维的能力；还有人把它定义为“获得能力的能力”，不同人有不同说法。人工智能很明显，相对于人类智能而言，就是用机器把人类的一些智能，通过研制智能机器、模拟、延伸和扩展的智能，实现智能行为和智能思维，解决需要人类才能处理的问题。例如解算题、猜谜语、进行讨论等都可以通过机器实现，具体的成果有模拟人的思维进行博弈的计算机，以及能够进行深海探测的潜水机器人、在星际探险中的移动机器人等。人工智能的定义非常多，不同学者有自己不同说法。比如，西蒙认为，人工智能是学会怎么编制计算机程序完成机智的行为，学习人类怎样做这些机智的行为；明斯基则认为，人工智能一方面帮助人的思考，另一方面使计算机更有用。人工智能的目标——让计算机具备听、说、读、写、思考、学习，以及适应环境变化、解决各种实际问题等能力；根本目标是要求计算机不仅模拟，还可以扩展延伸人的智能，达到甚至超过人类智能的水平。人工智能的近期目标是让计算机更聪明、更有用，短期目标是使计算机变成像人一样具有智能的机器。我们发明了汽车、飞机，很好地解决了人的出行问题，这些工具只能代替人去做一些体力劳动。可以浅显的理解，人工智能就是想办法让机器代替人做一些脑力劳动。我个人理解人工智能发展可以归结为三个阶段，第一阶段，逻辑推理阶段（20世纪50~60年代）；第二阶段，知识工程阶段（70~80年代）；第三阶段，机器学习阶段（90年代至今）。第一阶段逻辑推理的代表性成果，如一些数学问题怎么证明它的真伪，自然就想到用计算机来完成。比较代表性的工作是“四色定理”，这是到目前为止仍然困扰着数学界的一个难题。1976年6月，美国伊利诺斯大学的两位数学家通过机器证明，试图解决这一难题。第二阶段的代表性成果是专家系统。把专家判断的标准收集起来，编程序；把程序一条一条编成规格，让计算机代替专家去做决策。1976 年斯坦福大学开发了一个专家系统，判断人感冒的标准？将所有信息一条条梳理起来，再来看病人，根据各种检查就能够判断得了什么病，代替人类专家做一些智慧行为。但是这里回避了一个非常关键问题，即这个规则是人告诉机器的，虽然做判断没有问题，但是怎么判断感冒，是人不是机器提炼出来的。所以从表象上看非常乐观，因为用户不知道，它是靠人输给计算机怎么判断的。真正困难的是怎么提炼知识。第三个阶段的代表性成果是模式识别。要让机器自己学习到，而不是靠人输给它。代表性成果有人脸识别、车牌识别、指纹识别、手写体数字识别等，这是当前阶段机器学习代表人的成果来进行的模式识别。下面是人工智能未来发展的几个核心方向。一是脑机交互，这是人工智能必越过的阶段。人的大脑和小脑对抽象和推理非常强大，但对数字运算和记忆是难点，能不能突破脑机交互，未来可以直接和大脑相连，把从小到大学习的知识都存到电脑里，需要哪个知识点，就可以在大脑里调出来。一旦突破了脑机交互，人类的生活方式会发生巨大变化，我们根本不用太多精力记忆很多事情，未来大脑想做什么直接让背后的计算机一算就可以。一二十年后，手机根本不用触摸屏，大脑直接就能接触连接；文件里的内容大脑里直接阅读，这是一个非常有挑战的方向。二是人脑复制。有机构曾预测，2045年可以实现人脑复制。这都是预言，而预言有时过于乐观。人脑复制一旦实现可能会出现什么问题？如2021年年初的电影《惊魂》的内容就是人脑复制过程，如果一个非常有权势的人，八九十岁后身体不行了，可以把自己脑子里所有信息输给另一个人。一旦实现，整个社会的规则必须制定好，当然实现这个技术还要走很长的路。现在如有一部分神经元受损，可以用3D打印技术修复一些受损神经元，这逐步为复制大脑提供了基础。我国的人工智能在世界上是第一方阵，寒武纪打造的人工智能芯片全球领先；无人车方面同样也具备先进技术；还有智慧城市国家都有布局。人工智能辅助医疗方面，人工智能技术怎么进行医学辅助诊断，这在未来对于人类是有巨大潜力的市场。新华社全球首个“AI合成主播”，其形象、语言都是机器完成的。计算智能通过分析模拟人脑，构造相应的学习优化模式，再借助先进的计算工具实现高效的计算智能方法，来解决实际工程问题。这是人工智能的一个基本研究思路，特别是近年来在各行各业涌现的海量处理，如以深度神经网络为代表的实现方法。人工智能最核心的就是深度学习。深度学习诞生的比人工智能还要早，最早可以追溯到1943年。基于深度学习也进行了一些场景研究，例如，将深度学习用于智能交通，我们日常出行的堵车非常让人头痛，如何运用人工智能把交通处理好；无人驾驶也是非常火的领域，将深度学习用来做汽车的环境感知，代替人去实现周围目标，让汽车自动跑起来；还有无人超市，用深度学习去做一些跟踪识别；此外可以应用于机器翻译，未来神经网络完全可以做到实时翻译（现在的机器可以把各种语言实时翻译出来，但做的还不好）。如果这些技术真的走向社会，整体的学习就会发生重大变化。现在各种安全领域用的视觉目标检测和跟踪的不同场景都应用到机器人——代替人体力劳动的机器人，如搬运机器人、焊接机器人，以及各种作业条件下的机器人、物流分捡等。最先进的科学技术是在军事上使用的，如陆地机器人，如果在恶劣的战场环境下，尤其是在坦克汽车过不去的场景下，它的运载能力比人要强很多。空中无人机，包括探月都是人工智能的研究成果。教育机器人，疫情下在线上实现的儿童教育、知识教育，虽然智能成分不多，但已经倒逼着去研发如何把人工智能技术应用在教育的各环节，以及如何用人工智能教育改善现在的各环节。其他的人工智能产品，比如智能监控。未来一些监控是用来预测的，哪里可能有问题能够提前预防和制止。比如保安和公安可以提前把一些违法行为提前检测到，人工智能都可以进行干预。还有现在的各种直播美颜，核心还是人工智能技术。总之，人工智能改变着人们的生产、生活方式，包括我们的衣食住行都离不开人工智能。我们现在研发的方向，一是人工智能 + 教育，把人工智能的技术用在智慧教室、智慧校园。2020年我校在做困难补助时，不需要学生申请，通过大数据分析学生在食堂吃饭消费水平可以判断这个学生比较节俭，包括在各种场景下的表现又比较好，学校就会提供补助；把人工智能用在教育教学的各环节，打造了智慧教室。二是人工智能 + 军民融合。三是人工智能 + 健康医疗。四是人工智能芯片。我们研发了神经网络芯片，实现了深度学习的一些基本功能。五是人工智能 + 安全。人工智能要可控可信安全发展，一定要确保人工智能是安全的。现在容易犯的错误就是，研制出一个成果马上投入社会使用，其实它有安全隐患，包括现在的手机、购物、交友等各类信息很容易被别人窃取。大家有可能会观察到，现在你和别人的通话后，一些软件就会推出你提到的话题，从而证明通话被窃听。这些都是违反相关规定的。人工智能面临着很多困难。一是对脑认知的机理模拟还缺乏有效途径。对人大脑本身的研究还在不完善阶段，再去研究机器也像大脑一样工作是很难的；二是人工智能的基础理论仍然薄弱，尚未取得突破；三是人工智能的安全与伦理问题急需重视。人工智能的战略发展方向，包括医疗、养老、教育、文化、体育、金融各领域赋能，让它产生新价值；把脑科学与人工智能深度融合，构造类脑芯片和类脑系统，以及人机混合增强智能；小样本、自监督是提高深度学习泛化能力的关键；还有轻量化神经网络压缩与加速、可解释的人工智能系统，以及人工智能安全保护与伦理。