注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

 
 
 

日志

 
 

从"机器学习"到"学习机器"  

2017-02-07 00:15:33|  分类: IT |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

1月31日,在第五届CCTV贺岁杯中日韩围棋争霸赛决赛上,面对卫冕冠军柯洁,井山裕太数度模仿AlphaGO在横扫弈城时的着法。现场观战的罗建文对记者说:“自从AlphaGO出现后,以前的很多理论都被颠覆了……像这种下法,以前是要被老师骂的!

在AlphaGO和李世石的历史性对局之后,所谓“AlphaGO流”的围棋风格就开始在职业棋坛流行起来,并且在“master”的连胜之下愈演愈烈。

和20年前的“深蓝”一样,AlphaGO同样选择一项棋类游戏对人类发起挑战,这不是偶然。和语言翻译、新闻推荐、语音理解不同,这是胜负分明的领域,失败者必须尊重和学习胜利者,而不是挑剔它们偶尔出现的误差。

至少在围棋领域,机器向人类学习的时代已经开始接近尾声,而人类向机器学习的时代正在黎明。

为什么在“深蓝”击败人类大师的20年后,AlphaGO仍然让我们感到空前的不安?

国际象棋的游戏复杂度是10的46次方,对于现代计算机来说不是一个天文数字。“深蓝”采取的策略非常简单粗暴:在人类对手下完之后,利用计算力的优势,穷尽棋盘上的每一种可能性,并从其中排除掉会令自己落败的着法。

所以,“深蓝”其实从来没有被人们看作一种“智能”,她只是一套从数学上“破解”了国际象棋的“程序”——这门游戏尽管已经非常复杂,但相比现实中的人类智力活动还是很简单的,这种“穷举法”无法直接应用于社会实践中。

围棋的游戏复杂度达到了10的172次方——要穷尽它的策略选择,是不可能的。AlphaGO的“深度学习”是一种基于统计数学的方法论:通过获取人类对弈的记录,以及直接与人类或自身对弈,AlphaGO能够获得大量用于统计分析的“学习样本”。通过对着子纪录和胜负关系进行数学分析,AlphaGO可以逐渐理解在不同的棋局里哪些下法更容易赢、哪些下法更容易输。接着,她用分析得到的策略去和人类对弈,或者和自身对弈,保留更优的着法——不断重复。

人工智能的文化影响:从

AlaphGO并不是“深蓝”那样算无遗策的机器,而是人类的模仿者。她观察、分析、训练、总结……不知疲倦地重复。

终于,她用人的方式战胜了人——昔日的学徒成为了大师。

在和机器打交道的数百年里,人们已经习惯于机器绝对的精密和准确。但AlphaGO不一样,正因为她用以对抗人类的“思考方式”远比“深蓝”更像人类本身,所以AlphaGO的着法不像“深蓝”那样无可挑剔。

当需要解决的问题足够复杂时,每一个现实样本都有其自身的特殊性,一个能完美吻合所有学习样本的数学模型是不可能的。不够复杂的模型会拟合不了现有的学习样本(欠拟合),而过于复杂的模型则会在实践应用中出现太大的误差(过拟合)。机器学习的优化目标,不是对于每一个样本都完美拟合,而是在“欠拟合”和“过拟合”之间找到整体最均衡的状态。

这刚好就像围棋一样:为了交换整体局势的最优,在局部付出一些代价是必须的。

对于当下任何足以胜任复杂任务的“人工智能”,都应当作如是观。当我们挑剔AlphaGO、谷歌翻译和Siri们所犯下的各种错误时,最好别忘了,因为这些”智能“在计算中的误差,才让她们看起来比以前更像人类——人类是会犯错误的。

机器的“深度学习”会让人联想到人类儿童接受的早期教育。我们的“学习样本”被标注为“圆形、方块、三角”、“红色、绿色、蓝色”或者“大的、小的”。一旦这些抽象概念的模型在我们的头脑中被成功建立起来,我们会开始练习使用这些基本概念去组合形成更加复杂的概念:“红色的大三角”、“绿色的小方块”……再接下来,和生活实践相结合,我们开始区分猫和狗、男性和女性、房屋和车辆……

区别在于,如果AlphaGO的团队认为有必要,她可以每天进行数以万计的自我对弈以获取大量的新的学习样本——即便把这个标准降低到每天几盘,也只有极少数人类才能坚持下来。

要保持终身、高专注度的学习,人需要不断克服自己的惰性、欲望、挫败感。而这些是机器永远不需要面对的。

所以,人类的思想很容易陷入僵化。阶层、教育、家庭背景的制约会逐渐减少一个人生活的选择,因而让他陷入对既有生活经验的简单重复中,而当你花了太多时间在少量、高度相似的学习样本上,你很容易得到对这些样本“过度拟合”、缺乏泛化能力的思考模型。

有一篇流传甚广的鸡汤不无道理,它说:大多数人在30岁的时候就死了,他们只是不断重复自己在30岁以前的人生——除非他能始终保持开放的心态,主动去接触那些超出自己经验范围的样本,不断泛化自己的思想模型。

但那很不容易。大多数人面对超出既有生活经验的新现象,几乎会出于本能地提出质疑和否定,从而换得停留在既有经验和思想上的舒适感。

AlphaGO的胜利是一个毋庸置疑的信号,它让人类不得不正视这样一个事实:人类思考的过程与机器的相似之处也许远比人们过去以为的高。尽管机器常被认为没有灵感、联想和视觉思维等人类“独有”的思考模式,但仅凭借对逻辑的充分运用,机器一样可以恰当地模拟人类的思考,甚至比人类干得更好。

这其实提出了一个很好的问题:人类真的存在那些非逻辑的思维方式吗?或者说那只是出于对自身认知模式的无知而提出的一些不符合事实的假设呢?完全有理由相信,机器学习在人类社会中的影响还远没有开始充分释放。这不仅是指机器学习将如何进一步应用于人类的社会实践中。更关键的一种影响可能是文化意义上的,机器在人类领域设立的更多成功样本可能成为人类学习和模仿的对象。

AlphaGO不是天才,李世石才是天才——他用远比AlphaGO更少的训练样本,达到了与它旗鼓相当的思考水平。

AlphaGO其实向我们再次证明了那些我们很早就知道却没能做到的道理。

就像一位大师说过的那样:“真正的大师永远都是学徒。A true master is an eternal student.”

  评论这张
 
阅读(25)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017