百分点与赫拉利的观点交锋,看大数据和人工智能的未来进化

就人类而言,我们其实还不知道“意识”是如何产生的,意识产生的过程对于我们而言实际上是一个黑箱。要让机器产生“意识”从而成为真正意义上的人工智能,其难度可想而知。

 

7月6日,中信出版集团与大数据及人工智能公司百分点集团联合举办“XWorld大会”,邀请了全球畅销书《人类简史》、《未来简史》的作者尤瓦尔·赫拉利等多位全球前沿学者、科学家和知名企业领袖,一起交流人工智能与人类未来进化的深度话题。

尤瓦尔·赫拉利曾以宏大的历史视角对人类未来展开大胆预测而闻名全球,在XWorld大会上,他再次分享了对人工智能和未来的看法。他认为随着大数据的不断积累以及计算能力的快速发展,未来人类可能会越来越多地将自身的决策权让位给无意识的算法,从“人类做主”演变到“算法做主”。 在机器能否产生“意识”这一问题上,赫拉利认为要实现起来非常困难,可能只出现在科幻小说中。虽然目前人类在计算机的智能研究上有了很大的进展,但是在“意识”这一领域上几乎进展为零。

人类之所以对人工智能的问题如此着迷,其实反射了人类对自身和宇宙终极奥秘的追求和探索。人工智能是人类根据自己的思维方式和行为方式对机器进行的高级设计,然而人类对于自身的了解依然相当有限,例如大脑如何进行创造性思维、语言如何影响思维等,依然是悬而未决的谜题。因此,在人工智能的发展和人类关系的探讨上,总是充满了思辨和争议。

百分点首席架构师兼技术副总裁刘译璟在大会上分享了他对人工智能的看法,他认为由于意识在量子物理中的特殊地位,人们有可能利用量子计算一窥“意识”的究竟,因此量子计算是人工智能继续发展的重要条件。另外,他还讲到是语言造就了思维,如果能够研究清楚人类的语言奥秘,人工智能的问题就会迎刃而解。

 

语言造就思维,解锁人工智能的秘密

数据量的爆发、机器算法的突破以及GPU等高性能计算硬件的成熟运用,令人工智能技术在经历多年的不温不火后,重新吸引了大众的眼球。

运算智能,指的是快速计算和记忆存储能力;感知智能,即视觉、听觉、触觉等感知能力,主要用于对语音、图像、视频的理解,比如语音识别、视频识别等。现阶段中国在这两个方面已经有了很好的突破。

认知智能,则是指机器能够基于对综合信息的理解,帮助人做出决策,通俗地讲是“能理解会思考”,比如概念、意识、观念等都是人类认知智能的表现。然而,人工智能在认知技术开发领域存在很大挑战,仍需要长期研究。

这也是为什么虽然人工智能得到了资本的大力追捧,机器人、自动驾驶等人工智能应用才刚刚起步,实际效果却离理想中的“叫好叫座”尚有不少的距离。认知智能的缺乏,令人工智能还不能像人类一样理解世间万物,更谈不上与人类自然地交互。

对此,刘译璟认为,要想更好的解决现实问题,人工智能还需要在理论、技术和数据上进行大的突破。“要解决自然交互的问题,需要机器不止听得见,还要听得懂才行,这里面就会衍生出语义理解的问题。这也是百分点早在2009年就开始布局自然语言处理领域的原因。往下延伸,我们还会做知识图谱,把人的业务知识告诉机器,它才能理解得更好,这是从技术一直到应用的脉络。

刘译璟谈到,如果解决了自然语言处理的问题,人工智能的问题也就全部解决了。这是因为他坚信,语言和思维本身就是密不可分的,甚至可以说语言造就了思维。

现有的研究表明,人类利用大脑左半球额叶的“布罗卡区”以及颞叶等区域处理语言,若左脑的不同区域受损,会导致不同种类的语言障碍或失语症。同时,中国科学家研究发现,中文母语者和英文母语者处理语言的方式存在显著差异:在处理英文时,大脑额叶的布罗卡语言区接收来自左侧颞叶皮层后部的信息,在处理中文时则接收来自左右两侧颞叶前部的信息。

刘译璟认为,这些研究都说明了语言对思维塑造的作用,也是人工智能研究很多数时候都集中在自然语言处理上的原因。虽然已有技术在这一重要领域取得显著突破,然而,理解语言在大脑中是如何实现的还远远没有完成。

 

从what到why,逼近人工智能的终极目标

人工智能是一门非常综合的学科,它与哲学、数学、物理学、信息学、心理学和生命科学等密切相关。当前,针对人工智能的讨论非常之多,也带火了像深度学习等人工智能相关的技术。

据刘译璟介绍,自 1956 年人工智能的概念提出开始,出现了三个主流的研究学派,分别是:符号主义、连接主义和行为主义。

简单来说,符号主义是研究并模拟人的思维方法,进而打造一个像人那样思维的机器,其典型的技术就是知识推理、知识工程等;连接主义受仿生学影响,期望通过模拟人脑的结构实现智能,其中的典型代表是人工神经网络的深度学习;行为主义则认为智能是一个生命体在和环境的不断交互中习得的,这一派的典型技术是强化学习,在反馈中不断优化模型的效果。

在刘译璟看来,虽然深度学习目前非常流行,但深度学习只是属于连接主义流派中的一种方法。人类的思维有推理和归纳两种,深度学习解决的主要是归纳的问题,不能解决演绎的问题。

他认为,深度学习仍然存在着四大不足:一是从模型层面缺乏反馈;二是对数据量要求高,训练时间非常长,应用范围比较窄,很难用到现实中很快需要做决策的场景里;三是与训练的领域强关联,离‘通用途径’仍然很远;四是本质上的局限性,不具备可解释性,即使机器看起来真的会“思考”了,我们也不知道它们到底是怎么思考的,是不是像人类一样在思考。

“人工智能如果要真正用起来,产生商业价值一定是在垂直行业里,垂直行业真的没有那么多数据。”刘译璟表示,人工智能如果仅仅依靠深度学习一种方法是远远不够的。

当机器学习将面临冷启动的问题,刘译璟认为要把小数据好好地用起来。一种很重要思路是利用人们在该领域中已有的经验和知识,将这些知识变成数据给到计算机,让机器利用这些知识和场景做出推理和判断。“知识图谱是人工智能里非常关键的一个技术,百分点做的用户画像一直是这个领域,相信以知识图谱为代表的知识工程将会得到更多的关注。”

这些年百分点从大数据营销服务入手,逐步扩展到了用大数据做销量预测、智能运营、风控管理、政府与公共领域的数据治理等。刘译璟认为,企业应该思考如何利用大数据、人工智能等技术与业务结合,并解决实际问题。“现在的数据分析技术确实还需要相当多的专业性,离业务端还是远,我们希望解决的是从非常模糊的语义到精确的计算机操作过程的转变。我们会在自然交互里投入更大的工夫,核心是自然语言处理,加上很多交互方面的内容。”

正如《未来简史》书中提到的,人工智能将会是人类有史以来最伟大的发明。人工智能技术正在经历不断迭代升级的过程,无论是机器学习、自然语言处理还是量子计算,我们都在等待人工智能奇点的到来。毫无疑问,当人工智能产生“意识”,将成为人工智能史上最激动人心的一刻。