徐明昆
人工智能转入深度学习时代的方法论原因
2021-9-11 21:23
阅读:983

    本文属于计算机,控制论,人工智能的学科交叉领域。

   传统的人工智能已经发展了有半个世纪,尝试或采用了多种技术路线和方法,

   其中的神经网络(深度学习,Deep Learning)基本和传统人工智能同期提出,

   但长期得不到推广。2016年以AlphaGo战胜人类围棋大师为契机,深度学习

   重新焕发了生命力【1,3】。

  其原因有三个:

  1. 由于计算机硬件和数据采集技术的发展,神经网络所需要的大算力和大数据得到

    了解决,以前的计算能力不足以支撑实时大数据运算;

  2. 很多问题用传统的确定性的/可观可控的方法太复杂,甚至找不到确定性算法,

    科学家们被迫放弃采用传统的确定性计算和推理路线。

  3. 科学家们发现,神经网络可以套用自动控制等其他学科里的模式识别,最优化等理论

    和技术, 这样神经网络理论和技术得以大幅度丰富和完善。


   这三个因素推动人工智能技术里传统方法和深度学习方法此消彼长,

   造成了人工智能进入深度学习时代的局面。

 

 以图形图像中的目标识别为例。

门禁系统识别一张脸是否是登记在册时,      拍照当前实际人脸图像和库中人脸图像

比对。

 

  一.门禁系统做比对时,有两种方法。

   方法1。传统图形学方法。

   计算出当前人脸的五官和面廓的比例角度等数据,简称为脸部

  数据,  如果和库中存储的某张脸的脸部数据达到一定的吻合值,就认为当前人脸确实

  属于  登记 在 册的人脸。

 

   方法2。深度学习方法(人工智能的一个重要技术分支)。

  设计一个神经网络模型,用若干有标注的数据训练该模型,实际是根据训练数据

  选择较优的模型参数。模型参数设定以后,给模型输入登记在册的脸图和当前人脸图像,

  这个模型能回答当前人脸图像以多大概率属于已登记注册的人脸图像。

 

 

 二.谈深度学习的本文为什么要引用控制理论?

      因为控制理论为深度学习理论有如下支撑:

     第一。系统可观性与可控性【2】

可观性与可控性概念的出处在于现代控制理论,本文借用了这两个概念,

1 传统图形学方法设计的门禁系统,是完全可观可控的。

2 深度学习方法设计的门禁系统,一般是不完全可观可控的。

多大程度上可观可控不一定,取决于对模型结构的了解,或许随着理论和技术的进步,

可观可控性能得到提高。


 第二。模式识别【4】

 模式识别出自传统控制理论,神经网络文字图片语音识别和自控里

模式识别的理论与技术基本一样。


注意传统控制论与现代控制理论是不同的理论。


第三。最优化。

 最优控制的理论与方法,比如最速梯度下降,最小二乘法等大多数都可以用来

  优化神经网络的模型参数。

   

控制理论为深度学习提供了重要的理论基础,

但不是全部的理论基础,比如本例图形识别里的传统算法,

并一定需要引用控制理论。


三.既然有传统图形学方法,为何还用深度学习方法?

原因

 1.     传统图形学方法的算法也不是很可靠,可能识别错误 

 2.     戴上眼镜,年纪变了,帽子和发型变了,深度学习方法有时候会有优势(不一定)。

3.     有时候传统图形学方法运算可能比较复杂比较慢。

4.     最重要最核心的原因在于,对某些图形图像目标识别,很难找到图形学的识别

  算法。比如从禁止或运动影像里判别是否有一只猫。

 

  好了,结论就是,深度学习方法有自己的特点或者特长。


四. 深度学习方法的方法论

  如果需要一个对数据(含图形图像,语音文字广义数据)分类或识别系统,由于

这种分类或识别的机理相对复杂,我们还不清楚,或者清楚了其机理但算法太复杂

运算量太大,换言之我们不容易(编程)造出可观可控的运算系统,这些情况下我

们可以尝试(编程造出)不完全可观可控的神经网络系统。

 

 推论:当造一个可观可控系统很困难时,我们就不造了,转而造一个神经网络系统。

同时我们的技术焦点也转移了,以前精力放在找可观可控系统的确定性算法,现在精力

放在寻找和设计神经网络模型。而有许多神经网络模型(库)可以由专门人员设计好,

一般应用程序员调用就行了。这样能把各种各样专业领域(相当于机理不清楚)的工作

只要有数据,就可以统一用神经网络的一般方法来近似。



   但是,给学术浇点凉水,深度学习里神经元模型比生物神经元要简单很多,

     深度学习离人类智能还无限遥远,且听下回分解。

 

 

【1】  科学网—深度学习基本原理 - 徐明昆的博文 (sciencenet.cn)   

【2】 线性系统的可控性和可观测性 - 百度文库 (baidu.com)

系统的可控性和可观测性,这两个特性是经典控制理论所没有的。在用传递函数描述的经典控制系统中,输出量一般是可控的和可以被测量的,因而不需要特别地提及可控性及可观测性的概念。现代控制理论用状态方程和输出方程描述系统,输出和输入构成系统的外部变量,而状态为系统的内部变量,系统就好比是一块集成电路芯片,内部结构可能十分复杂,物理量很多,而外部只有少数几个引脚,对电路内部物理量的控制和观测都只能通过这为数不多的几个引脚进行。这就存在着系统内的所有状态是否都受输入控制和所有状态是否都可以从输出反映出来的问题,这就是可控性和可观测性问题。如果系统所有状态变量的运动都可以通过有限的控制点的输入来使其由任意的初态达到任意设定的终态,则称系统是可控的,更确切的说是状态可控的;否则,就称系统是不完全可控的,简称为系统不可控。相应地,如果系统所有的状态变量任意形式的运动均可由有限测量点的输出完全确定出来,则称系统是可观测的,简称为系统可观测;反之,则称系统是不完全可观测的,简称为系统不可观测。 可控性与可观测性的概念,是用状态空间描述系统引伸出来的新概念,在现代控制理论中起着重要的作用。可控性、可观测性与稳定性是现代控制系统的三大基本特性。

【3】科学网—人工智能(机器深度学习..)无关乎人的智能 - 

【4】模式识别与智能系统_百度百科 (baidu.com)






转载本文请联系原作者获取授权,同时请注明本文来自徐明昆科学网博客。

链接地址:https://m.sciencenet.cn/blog-537101-1303808.html?mobile=1

收藏

分享到:

当前推荐数:2
推荐人:
推荐到博客首页
网友评论1 条评论
确定删除指定的回复吗?
确定删除本博文吗?