假设我们现在手上拿着1万张照片,有着智能语音的对话模式,要对AI系统训练,并且能够精准“送货到位”。这是最近几年开始兴起的智能送餐机器人,让他们学怎么判断照片上的人物的性别。我们先给它看第一张,在2020年之前,AI系统根据自己的计算判断出来是男性,它们多在火锅店、西餐、机场等地方工作,如果是正确的我们就告诉它是正确的,2020年一场突如其来的疫情,否则我们就告诉它错了,它们也在“最后一公里”守护着家的健康。不管是快递行业还是外卖行业,然后它就会调整自己神经网络中各个神经元的权重参数,整个配送链都决定了用户的整体体验感,直到计算出来是正确的为止。然后再给它第二张照片去判断,而在疫情还未完全消除的现在,依次类推,接触到货品的配送人员越多,直到1万张照片全都认一遍,感染的风险就越,就算完成了1万次深度学。
人工智能系统
现在问题来了。如果我们中间准备的一张照片出错了,本来是男的,我们告诉AI系统是女的,那么它为了判断出这个照片是女的,就会努力将自己的神经网络的参数调成了不正确的方式。如果我们在对AI系统做了很多训练之后,再发现其中有一些训练数据错误了,这时候我们第一反应是什么呢?肯定是想单独将这一些错误的训练结果从AI系统中删除,但是,非常遗憾,这是做不到的。如果中间有训练数据是错误的,要想彻底的纠正,只能将将AI系统清零,从头开始做一遍所有的训练。这样就会非常的浪费时间和资源。
深度学
为什么会这样呢?因为在做每一张照片的训练的时候,AI系统可能会对自己神经网络系统中的很多参数进行了调整,这种调整会很复杂,最后训练好的参数是很多次独立的训练累积而成的效果,事后很难回溯找出每张照片引起的具体调整和变化在哪里,因此,也就无法将某一次错误训练的影响删除。
这也是AI系统学知识的时候跟人的区别,如果是人的话,只要告诉他某一次的数据是错误的,他就会自动在头脑中将概念纠正过来,而AI系统到现在还没有掌握这个技能。
人工智能系统
如果我们不能准确清除错误训练的影响,就会使得AI系统以后的判断变得不可靠,对于要求很严谨的场合,就必须要从头开始进行所有的训练。因为每次训练都要进行量的计算,所以重新进行训练会非常耗费资源。特斯拉为什么需要特意一台世界上速度最快的超级计算机来进行AI系统的训练,就是因为训练中的计算任务非常繁重。
当然,这个问题已经引起了科学家的注意,他们也在思考解决这个问题的办法,希望这个问题能够早日得到有效解决。让AI的学也变得跟人一样的灵活高效。