在日前的中關村創(chuàng)業(yè)講壇上,神州數(shù)碼首席科學家謝耘對人工智能進行了主題演講;在演講時,謝耘分享了人工智能研究的幾個階段,并表示,隨著讓計算機運算的速度越算越快,IT產(chǎn)業(yè)迎來了第二個關鍵性的轉(zhuǎn)變,“就是在讓計算機越算越快的道路上又出現(xiàn)了一個重大的轉(zhuǎn)折--今天基礎技術平臺在絕大多數(shù)的情況下足夠富裕了,不再成為應用的瓶頸。
謝耘認為,在1956年,一群來自于神經(jīng)學、邏輯學、數(shù)學計算機等的牛人,在美國開了兩輪會提出了人工智能的概念,這是人工智能研究的標志性時間;隨后一直到上世紀八十年代,科學家們一直認為模擬人的大腦神經(jīng)做一個網(wǎng)絡,就會出現(xiàn)智能,但這個在90年代遭遇了重大挫折;在九零年,IT產(chǎn)業(yè)發(fā)生了一次歷史性的轉(zhuǎn)折,就是從對智能的追求回歸到了對計算能力的追求,而到目前為止,IT產(chǎn)業(yè)仍在讓機器越算越快、把機器越做越小、用機器把所有的設備都連起來;因此謝耘認為,“但凡能變成計算的問題,計算機都可以解決。如果一個人沒有本事把一個問題變成計算問題的話,計算機就解決不了。”
謝耘認為,大數(shù)據(jù)引發(fā)了對智能的無限遐想,“大家覺得用了云計算成本可以降低,其實這個話可以倒過來說,因為成本降低了今天才可以用云計算的方式提供這種服務。云計算本質(zhì)是產(chǎn)業(yè)服務層面的變化,不是有了云計算技術突破了開始搞云計算,而是因為里面的技術和產(chǎn)品不斷的進步,而導致整個計算資源、通訊資源、存儲資源成本大幅度降低了,所以今天才開始搞云計算,這是這個產(chǎn)業(yè)真正發(fā)展的邏輯。大數(shù)據(jù)也是一樣,因為無所不在才產(chǎn)生了大數(shù)據(jù),就是因為計算資源很便宜了,處理器很便宜了,所以才會產(chǎn)生大量的數(shù)據(jù)。我一個人帶了好幾臺計算機,現(xiàn)在手機也是一臺計算機,現(xiàn)在手機計算機的能力,相比八零年花天文數(shù)字的投資造出的第一臺銀河一號巨型計算機的能力快了不只一個量級,今天的計算資源就是如此的豐富,所以產(chǎn)生了云計算和大數(shù)據(jù)。”
以下是謝耘演講實錄:
各位來賓,大家好!剛才涂老師把大數(shù)據(jù)的情況跟大家做了很好的介紹,而且涂老師快到最后了,講到大數(shù)據(jù)會進入到智能的社會。我的話題是從智能開始講。
今年年初我參加了一個年輕朋友的讀書會,咱們中組部的一個朋友就問了我一個問題,“謝老師,現(xiàn)在都大數(shù)據(jù)時代了,你能不能幫我們設計一個系統(tǒng),我把一個局長的材料等等的信息全放在系統(tǒng)里,然后你就能告訴我這個人能不能當副部長,以后能不能當部長?”大數(shù)據(jù)確實引發(fā)了我們對智能的這種無限的遐想。當時我給他的回答,如果一件事情沒有人知道該怎么做的話,其實計算機也不會替你做。大家聽懂這句話了嗎?在座的朋友可能很奇怪,計算機做的很多事我就不知道該怎么做啊,不是還替我做了嘛。但是一定有某個人知道這件事該怎么做,計算機才會來做。
為什么講這個題目?也就是因為大數(shù)據(jù)引發(fā)了很多對智能的議論,所以我今天就想圍繞這個話題講一下,看看能不能講清楚。這也是我個人的觀點,不一定對,供大家參考。
其實人類創(chuàng)造的工具分成兩大類,一類是輔助體能的工具,計算機其實是作為一個計算的工具輔助人的智能活動。能不能以后代替智能活動,這是很多人夢寐以求的活動,下面我會做一些分析。
因為計算機是輔助智能的一種工具,而且計算本身其實是人的智能活動的一部分。上個世紀四十年代計算機誕生之后,整個的產(chǎn)業(yè)很快把興趣從制造能計算的機器,而轉(zhuǎn)向了制造有智能的機器。這件事情的一個標志性的時間,就是在1956年的時候一群來自于神經(jīng)學、邏輯學、數(shù)學計算機等等的牛人,在美國開了兩輪會提出了人工智能的概念。當時人類對造智能的機器還是非常樂觀的,這是兩個典型的牛人。一個是已經(jīng)不在世了,叫做hebert,他獲得過諾貝爾將來學將,1965年講20年內(nèi)機器能完成人能做的一切工作。另外一個牛人還在世,叫做Minsky,1970年時講在三到八年的時間里將得到一臺具有人類平均智能的機器,他們在說什么?大家知道前一段美國一臺機器在答問題的時候還贏了,還有一臺機器通過了圖靈測試,他們說的是不是這樣的機器?不是,當年討論人工智能的時候講的不是我們現(xiàn)在看到的事情。
當機器能完成人能做的一切工作的時候意味著什么?意味著當年科學家想造一臺機器,這臺機器就和人一樣在開始的時候內(nèi)置了一些機制,但是是很蒙昧狀態(tài),什么也不知道。讓這臺機器和外界的交互能夠?qū)W習,能夠擁有智慧,能夠獲得知識,這是當年討論智能時候最原始的想法。當年認為這種機器花一二十年能造出來,結(jié)果是什么?在九十年代的時候這個努力遭到了重大的挫折。底下那臺是日本造的第五代計算機,1981年開始的,當時引起了全世界的轟動。這臺計算機當時日本傾全國之力來造,他們認為從九十年代開始人類在人工智能領域已經(jīng)積累了大量的經(jīng)驗,再經(jīng)過十年的時間我就能夠造出這么一臺機器來。這臺機器只需要內(nèi)置基本的機制和人工接口,它就會自己獲得智慧和知識,不需要你去編程。到1990年的時候這個項目徹底失敗了。
八十年代人工神經(jīng)網(wǎng)絡,號稱模擬人的大腦神經(jīng)做一個網(wǎng)絡就有智能,當年我做博士就是研究這個問題,在九零年前后冷下去了,事實證明并不能達到我們的期望。所以IT整個產(chǎn)業(yè)其實是在九零年發(fā)生了一次歷史性的轉(zhuǎn)折,就是從對智能的追求回歸到了對計算能力的追求。發(fā)現(xiàn)造一臺和人大腦一樣的計算機不靠譜,什么靠譜嗎?讓計算機越算越快比較靠譜。IT產(chǎn)業(yè)今天我們看到的格局是在1990年的時候發(fā)生了根本的轉(zhuǎn)折才變成這樣的,在那之前對智能的追求是非常熱的。
這就是我們看到的今天IT產(chǎn)業(yè)在做什么?就是讓機器越算越快,把機器越做越小,機器可以把所有的設備都連起來,為什么?就是因為計算機越做越小。計算機核心還是在做計算,但凡能變成計算的問題,計算機都可以解決。如果一個人沒有本事把一個問題變成計算問題的話,計算機就解決不了。剛才中組部的人問我,一個局長能不能當副部長,如果沒有人能夠把這個問題當作計算問題的話,對不起解決不了,給計算機灌多少數(shù)據(jù)都沒有用,一定有人懂這個事情怎么做計算機才能算。
隨著讓計算機越算越快,做到今天整個IT產(chǎn)業(yè)迎來了第二個關鍵性的轉(zhuǎn)變,就是在讓計算機越算越快的道路上又出現(xiàn)了一個重大的轉(zhuǎn)折,什么轉(zhuǎn)折呢?就是今天基礎技術平臺在絕大多數(shù)的情況下足夠富裕了,不再成為應用的瓶頸。所以IT產(chǎn)業(yè)從現(xiàn)在開始往未來看,基礎技術平臺主宰整個產(chǎn)業(yè)發(fā)展的階段已經(jīng)結(jié)束了。在九十年代買PC會問主頻多少,主頻不夠有的銷售商說可以給你升頻,為什么?因為計算能力不夠。但是到今天買手機或Pad的時候知道主頻是多少嗎?沒有人關心了,為什么?基礎技術平臺的能力在絕大多數(shù)的情況下已經(jīng)足夠的富裕,不成為應用的限制瓶頸。從今天開始在IT產(chǎn)業(yè)里面基礎技術平臺將不再主宰未來產(chǎn)業(yè)的發(fā)展,真正主宰未來產(chǎn)業(yè)發(fā)展的將會是應用。為什么發(fā)生這件事情?就是因為集成電路技術的發(fā)展導致這個樣子。
現(xiàn)在集成電路線寬做到最小22納米,就是在一個大頭針的針頭上可以放一億個晶體管,為什么做這么小已經(jīng)做成了立體的。原來的晶體管是平面二維的,現(xiàn)在已經(jīng)是立體的了。
再往下做,集成電路還能做到多小?我和英特爾的人談過,他們說最小做到2納米,也是可以在未來十年里再降低一個數(shù)量級,十年里硅走到頭了,可以再用別的。
IT產(chǎn)業(yè)之所以發(fā)生第二個轉(zhuǎn)折就是因為集成電路走到了這個程度,在今天開始IT產(chǎn)業(yè)真正進入了青年時期,也就是真正開始了黃金時代。在此之前無論IT產(chǎn)業(yè)創(chuàng)造了什么樣的不可思議的奇跡,那都是序幕。真正的奇跡將會在未來發(fā)展,整個IT產(chǎn)業(yè)波瀾壯闊的前景還剛剛掀開一角。現(xiàn)在好多人在談產(chǎn)業(yè)替代的問題,就是IT之后誰來驅(qū)動社會的發(fā)展,我覺得談論這個話題還太早了,IT產(chǎn)業(yè)對于整個社會整個顛覆性的影響剛剛開始。
舉一個很簡單的例子,《阿凡達》都看過對吧?IT在顛覆一個很傳統(tǒng)的產(chǎn)業(yè),就是咱們的電影,可以不用演員了。以前做不到,為什么?因為需要超級計算能力,原來的基礎計算能力做不到,它會非常昂貴?,F(xiàn)在基礎計算能力以后足夠富裕,我可以完全用電腦把片子做出來,不需要演員了,以后演員可能會事業(yè),這是完全典型的例子。未來IT將會在各個領域里產(chǎn)生今天可能想不到的現(xiàn)象。
另外整個產(chǎn)業(yè)的格局不會像今天這樣,比如數(shù)據(jù)庫由甲骨文來統(tǒng)治,你只要想做這個東西就要用甲骨文的東西。未來也會散開,散的面會非常之大,在各個領域會有專門獨特技術的公司在一個領域里把應用真正做好。這是我看到未來IT產(chǎn)業(yè)的基礎,當一個領域的基礎技術不再是瓶頸的時候就會真正成熟,我們的汽車產(chǎn)業(yè)是這樣,我們的航空產(chǎn)業(yè)也是這樣,比如說波音和空客是做什么的?做應用的,它不是做核心技術的,不生產(chǎn)發(fā)動機??湛拖朐斐鋈魏蔚娘w機,發(fā)動機公司都能給你配一個合適的發(fā)動機,這就是基礎技術、核心技術不再構(gòu)成瓶頸,這個產(chǎn)業(yè)在真正繁榮。
IT產(chǎn)業(yè)到今天我認為剛剛進入門檻,未來會非常熱鬧,大家可以好好在這個產(chǎn)業(yè)干。
因為這個原因產(chǎn)生了大數(shù)據(jù)、云計算,大家覺得用了云計算成本可以降低,其實這個話可以倒過來說,因為成本降低了今天才可以用云計算的方式提供這種服務。云計算本質(zhì)是產(chǎn)業(yè)服務層面的變化,不是有了云計算技術突破了開始搞云計算,而是因為里面的技術和產(chǎn)品不斷的進步,而導致整個計算資源、通訊資源、存儲資源成本大幅度降低了,所以今天才開始搞云計算,這是這個產(chǎn)業(yè)真正發(fā)展的邏輯。大數(shù)據(jù)也是一樣,因為無所不在才產(chǎn)生了大數(shù)據(jù),就是因為計算資源很便宜了,處理器很便宜了,所以才會產(chǎn)生大量的數(shù)據(jù)。我一個人帶了好幾臺計算機,現(xiàn)在手機也是一臺計算機,現(xiàn)在手機計算機的能力,相比八零年花天文數(shù)字的投資造出的第一臺銀河一號巨型計算機的能力快了不只一個量級,今天的計算資源就是如此的豐富,所以產(chǎn)生了云計算和大數(shù)據(jù)。
大數(shù)據(jù)引出的是大家對智能的遐想,下面專門講一下智能,我怎么看智能,包括在大數(shù)據(jù)環(huán)境下未來到底要怎么做。這兩個圖一邊是計算機系統(tǒng),一邊是人的系統(tǒng),人腦底層是不是計算?這個問題現(xiàn)在沒有辦法回答。我們不知道人腦最底層的機制是不是計算,但是計算機很簡單,計算機最底層的機制就是計算,底層是計算的能力。往上走有一個中間層,這個中間層是架在計算能力和應用之間的,包括了操作系統(tǒng)、數(shù)據(jù)庫等等,本身并不直接是應用,它有一個中間層。在中間層之上才是我們看到的各種各樣的應用,大腦是什么樣的?大腦最底層是神經(jīng)原,一個一個神經(jīng)原連接在一起,現(xiàn)在心理生理學家可以測這些信號,但是說不清楚到底是不是計算,只是可以測一些信號。
大腦再往上還有一層,這一層更說不清楚,在這一層之上是平時的表現(xiàn),我們會說話、學習,也有各種各樣的心理過程,就是所謂的心理學講的顯意識過程,這個過程是可以監(jiān)測、分析,也可以看到的。最關鍵是大腦中間這一層是什么?2009年中央十臺放了一個節(jié)目講的是半腦人,孩子一歲的時候得了病,最后醫(yī)生說他得了腦膜炎,實際說不是,而是他得了癲癇。到了十幾歲這個孩子開始犯癲癇病,一直很正常,沒有太大的毛病。癲癇犯病的就是抽風,咱們俗話說是羊角風。原來是一年到一年半犯一次,后來間隔越來越短,一兩個月犯一次,到十七八歲的時候家長就受不了,帶他去醫(yī)院檢測,發(fā)現(xiàn)孩子是癲癇。最有意思的是這個照片,大家能夠看到左邊的大腦已經(jīng)萎縮了,看不到了。醫(yī)生最后就決定給他開顱,干了件什么事呢?把他左邊大腦切掉,切掉之后怎么著了呢?這個孩子基本上還是正常的。在從小生病這段時間大腦整個完成了重構(gòu),因為大腦左右是分工的,一邊管邏輯,一邊管形象思維,最關鍵是右邊的運動受左腦控制,左邊的運動受右腦控制,所以人中風之后看哪一側(cè)腦袋中風,這一側(cè)腦袋中風,這側(cè)的肢體運動受影響。但是現(xiàn)在醫(yī)生把整個大腦的一半切掉之后而沒有受影響?這說明什么?說明大腦有中間一層。底下神經(jīng)原一層出現(xiàn)故障以后,像云計算中心一臺機器出現(xiàn)故障云平臺重構(gòu),保證系統(tǒng)上面的應用可以正常跑,實際上大腦有這樣的功能,也就是中間有一層。中間這一層到底是什么?其實到現(xiàn)在神經(jīng)心理、生理學家都不知道。
為什么講這件事情?我們今天對智能本質(zhì)的理解還是非常膚淺的,對于人的大腦中到底在發(fā)生什么,對于整個過程的理解是非常膚淺的。包括今天世界上的很多科學家經(jīng)過了九十年代所謂人工智能的冬天,到今天大數(shù)據(jù)時代又開始蠢蠢欲動,試圖構(gòu)造一個號稱是和人一樣有聰明、能夠?qū)W習、能夠獨立、具有智能的機器。我聽說有一家企業(yè)放了一臺這樣的機器到大學課堂跟著學生去學習,認為還是很有可能造出和人完全有一樣智能的機器。我認為這個理想還是非常之遙遠,以后能不能造出來我不知道,但是從人類今天對整個自身智能過程理解的局限,我認為我們不足以支撐造出這樣的系統(tǒng)。
我們現(xiàn)在能夠?qū)崿F(xiàn)的所謂的智能還是在上面的一層,就是能夠觀察到、測量到、分析到的人的智能活動。對不起,人的智能活動更重要的是底下這一層,為什么呢?剛才我說了這個孩子剛生下來是蒙昧無知的,腦子里沒有任何東西,完全憑著和外界的交互成長起來。但是今天的計算機不行,我們要內(nèi)置很多的東西。
下面就講一下人在實現(xiàn)智能的這條路上有幾個基本的方法,實際上有三個。第一個是形式上的模仿,剛才我說的是人工神經(jīng)網(wǎng)絡,什么意思呢?我們發(fā)現(xiàn)人的神經(jīng)原是有巨量的神經(jīng)原,他們之間有大量的連接。從五十年代開始搞人工智能的有一批人認為,我也造一些很簡單的處理單元,然后把大量的處理單元連接在一起,我覺得就可能會有智能。這句話聽起來有點像開玩笑,大家不要驚喜,科學家經(jīng)常也搞不靠譜的事情。如果你們仔細讀科學史的話,其實科學發(fā)展歷史上有很多不靠譜的事情,包括很有名的科學家也干很不靠譜的事情,所以大家要記住不要把科學變成一種宗教迷信。
這個事情形式模仿到今天為止別沒有產(chǎn)生很了不起的結(jié)果,所謂結(jié)果就是非線性函數(shù),非線性函數(shù)對樣本集合按照最小差來擬合的過程,這個幾百年就有了,所以形式模仿并沒有成果。
真正成功的是后兩個,分別是機制模仿和機制替代。什么是機制模仿?我們做一件事情完全是按照人的大腦做事的方式做,比如下棋,比如計算機可以挑戰(zhàn)世界冠軍,贏了當年俄羅斯的世界冠軍,機器怎么下棋?也會推演,因為計算快比人推演的過程很要多,最后把世界冠軍贏了。這是通過機制模仿實現(xiàn)特定的活動,前提是要理解這個機制。
第二個是機制代替。這個事情人是怎么做的,我可能不知道。比如說人的視覺,人的視覺過程還是非常復雜的,搞不太清楚視覺過程最后是什么過程。沒有關系,我可以用另外一套機制來實現(xiàn)同樣的效果,所以手寫識別的過程和我們識別漢字是不一樣的,我們識別漢字是拿一個漢字來識別。手寫識別會把整個寫字過程記錄下來,利用寫字過程的信息和筆劃的信息來識別,所以整個機制和我們不太一樣,但是效果可以是一飲的。
這三個是核心的三個實現(xiàn)智能的方式,來兩個是最重要的。
下面是用機制實現(xiàn)智能走了什么樣的路,這個和大數(shù)據(jù)就有關系了。最開始實現(xiàn)智能,人們希望發(fā)明一些基本的機制,用這些基本的機制就能使得機器和人一樣通過與外界的交互變得聰明,可以來學習,這就是日本第五代計算機典型的思路,但是這種思路后來碰的頭破血流,事實證明是不可以。到了上個世紀七八十年代在對智能追求上,人就退了一步??磥砦覀儧]有辦法理解人的智能過程最底層的機制是什么,靠這個實現(xiàn)不了。退了一步是什么?就是把人的知識灌到機器里,加上一些機制來實現(xiàn)智能,這就是一種混合的方式。機器其實是預制了人的知識在里面的,這叫什么?這就叫專家系統(tǒng),這是在上個世紀八十年代非?;鸬?。這個時候我們會發(fā)現(xiàn)機制和信息結(jié)合了,和數(shù)據(jù)開始結(jié)合了,知識也是一種數(shù)據(jù)、一種信息。
到了今天我們在談大數(shù)據(jù)的應用等等,其實是第三步,我們會有一些機制,加上知識,再加上大量的數(shù)據(jù)去實現(xiàn)目標。這就是人類在追求智能化過程上,用機制來實現(xiàn)智能化過程的演變過程。最開始僅僅希望找到一些智能的機制,后來發(fā)現(xiàn)不行,所以把這些機制加上知識、數(shù)據(jù)來做。在整個的過程中,對于智能概念在不斷的放松、放寬,所以我們今天談的智能和五六十年代談的智能其實不完全一樣。因為我們碰壁了,所以把智能放寬了。今天當我們在談很多智能應用等等東西的時候,其實很多東西在歷史上都是有的,比如這些算法或機制,而且在歷史上并不把這些東西當作智能的東西,因為那時候?qū)χ悄艿臇|西要求比較高。只是說后來實現(xiàn)不了,所以這些東西慢慢都變成了智能的東西,融進了智能的概念。
今天我們談智能的概念還是非常寬泛的概念,容納了很多傳統(tǒng)的東西,也包括現(xiàn)在的東西在里面,這就是整個智能機制實現(xiàn)演變的過程。
到今天我們走了機制+知識、的數(shù)據(jù)的年代,回過頭來再看一下數(shù)據(jù)在計算機應用歷史上的演變過程,計算機最開始是做數(shù)值及的。數(shù)值計算采用的數(shù)據(jù)是物理量,剛才涂老師講對外在世界的測量,所以是一種微觀的反應局部的物理的數(shù)值,這是計算機最開始使用的數(shù)據(jù)。后來計算機進入到所謂的在線事務處理、在線交易,比如做銀行系統(tǒng)、ERP系統(tǒng)、飛機票務系統(tǒng),這個時候計算機用的是什么時候?用的是所謂的結(jié)構(gòu)化數(shù)據(jù),比單一的數(shù)值就復雜了,不再單一的微觀數(shù)據(jù),我說的是變成了中觀的數(shù)據(jù)。一個電子機票是最典型的結(jié)構(gòu)化數(shù)據(jù),可以用固定的字段來描述所有人的機票,所有人的機票都是這個格式,這就是結(jié)構(gòu)化的數(shù)據(jù)。這是計算機從五六十年代開始到今天依然是占主流地位的應用,計算機使用的數(shù)據(jù)在演變,從微觀演變到中觀,內(nèi)涵變復雜了。到今天有大量的非結(jié)構(gòu)化數(shù)據(jù)實現(xiàn)了,比如網(wǎng)上的聊天和拍的照片等等。
這兩個階段和前兩個階段有非常大的不同,前兩個階段的數(shù)據(jù)都是和具體的應用綁在一起的,數(shù)據(jù)服務于應用,應用會需要你必須采集這些數(shù)據(jù)。但是今天不是,今天大量的數(shù)據(jù)出現(xiàn)可能沒有特定的目的。比如說拍照,以前覺得這個景點特別好,咱們照一張留個紀念。今年是拿著相機到這里想照一張,到了那里想再照片一般張。大量的數(shù)據(jù)涌現(xiàn)了,我們不知道有什么意義和價值,所以大家才說我們蒙不能從數(shù)據(jù)里挖出一些東西用起來。這個是計算機整個數(shù)據(jù)的變化。
數(shù)據(jù)和信息我這里已經(jīng)通用了,我認為比較復雜的是信息,簡單的是數(shù)據(jù),這一點就不細究了。這里想講一個很重要的概念,就是今天大家在談論大數(shù)據(jù)的時候,絕大多數(shù)人都在談論怎么去用數(shù)據(jù)。我這里想講一下,數(shù)據(jù)、信息從產(chǎn)生到使用是分了不同階段。首先有一個生成采集的階段,然后有存儲和傳輸?shù)碾A段,存儲、傳輸之后并不是馬上是應用,其實有一個管理的過程,怎么樣把信息管起來。信息的存儲不等于管理,或者說存儲是最粗放的一種管理。但是真正要想對信息用好,其實信息是需要比較復雜的管理,根據(jù)這些信息的內(nèi)容和邏輯真正管起來。甲骨文搞數(shù)據(jù)庫是為了管理數(shù)據(jù),真正把信息有效的管理起來。
回過頭來再看一下人腦和計算機系統(tǒng),再對比一下這張圖。計算機系統(tǒng)的數(shù)據(jù)和應用是一一對應的,每一個應用都有自己的數(shù)據(jù),所以我們講計算機今天都是一個信息孤島。比如銀行有自己的數(shù)據(jù),銀行的應用是用的自己的數(shù)據(jù),機票的應用是用的自己的數(shù)據(jù),他們至今各有各的數(shù)據(jù),每一個數(shù)據(jù)都是為一個特定應用準備的,這是今天在計算機應用里面最典型的特征。
我們看一下人腦是不是這樣?人腦不是這樣。我們腦袋里存儲的信息是什么樣的?是整體。我們腦袋里并不是說這個信息是為這件事用的,那個信息是為另一個應用用的。帶人腦底下有一層統(tǒng)一的信息管理層,所有的信息在人腦是做整體的結(jié)構(gòu)存在在一起的,從人腦的角度看和計算機最大的區(qū)別。當今天的計算機系統(tǒng)也發(fā)生了變化,進入了所謂大時代之后,我們要到底怎么管理信息?還是按照原來的方式把數(shù)據(jù)按照應用管起來,或者它就是一個塊,咱們先堆起來再說,用的時候再挖。
我在這兒的建議,后面講的會是另外一個我提出的思路。大數(shù)據(jù)在這里想講一下未來到底有什么樣的技術、有什么樣的應用模式。我想的也是非常龐雜,會有很多不同的做法,我下面講的可能只是其中的一個,而不是全部。但是我認為這個做法可能是非常重要的一點,甚至這個做法顛覆整個IT產(chǎn)業(yè),但是它不是萬能的,不是一個包治百病的藥,有人賣這種藥,但是我不賣。
在大數(shù)據(jù)時代信息到底應該怎么管理?咱們先不談應用,先談信息到底應該怎么管理。傳統(tǒng)的管理是按照一個一個應用把數(shù)據(jù)管起來,在大數(shù)據(jù)時代大量的數(shù)據(jù)產(chǎn)生的時候是沒有明確應用的,或者說也明確的應用,但是這個數(shù)據(jù)的價值絕不僅僅在于這一點的應用。到底我們應該怎么管這個數(shù)據(jù)?因為管好數(shù)據(jù)才能有好數(shù)據(jù),如果連管都管不好,談大數(shù)據(jù)的應用就有點瞎扯了,或者只能在很淺的層次上用。我個人一個基本的觀點,在這個時代我們應該按照主體、按照人、按照企業(yè)、按照城市,按照一個一個主體界定的范圍把這些數(shù)據(jù)起來。怎么管?按照數(shù)據(jù)之間、信息之間反應的邏輯,而不是像邏輯一樣堆起來。
這是剛才看到的圖,對于一個個人這個信息應該怎樣管?人腦中的信息不是雜亂無章的,信息在腦里也不是一堆垃圾,是有內(nèi)在邏輯,也是相關的。當我們個人信息要管的時候應該怎么管?我們應該按照這些信息具有的人所感知的么在邏輯,把它組織在一起,最后形成一個什么?形成人腦這一部分的虛擬映像,在計算機里構(gòu)造出了人腦信息集合的映像,它不是一個倉庫,更不是一個垃圾堆。
建這種映像圍繞主題把信息管起來,這是非常有挑戰(zhàn)的事情。你既要理解信息是什么,信息不是簡單的照片,它需要其他的補充信息才能夠變得有意義的可以使用。同時還要理解對象是如何理解信息的,這些信息反應了你對象的哪些內(nèi)在的邏輯關系。這個是我花了三年時間構(gòu)成的針對個人信息的數(shù)學結(jié)構(gòu)。這種方法會在大數(shù)據(jù)時代和未來IT發(fā)展過程中解決一類特定的問題,但是不會解決所有的問題。
說的這些東西可能太玄,用這種方式把信息有效的管起來,在這個基礎上構(gòu)造出應用系統(tǒng)和傳統(tǒng)的本質(zhì)到底有什么區(qū)別?這兒給一個智慧城市典型的例子。這是一個智慧城市管理系統(tǒng),在上面大家可以看到有智慧交通、智慧旅游、城市安全等等的管理系統(tǒng)。傳統(tǒng)的IT系統(tǒng)怎么建?比如智慧交通系統(tǒng)會自己采集數(shù)據(jù),城市安全系統(tǒng)也會自己采集數(shù)據(jù),所以導致一個場所能放多個攝像頭在城市里,因為針對的是不同系統(tǒng)。這是非常傳統(tǒng)的做法,就是數(shù)據(jù)和應用緊密的綁定在一起,數(shù)據(jù)的產(chǎn)生就是為了應用,這個應用也就用這些數(shù)據(jù),所以我們抱怨信息孤島等等的問題。
反過來如果按照一個城市主體把信息管起來,整個的系統(tǒng)就會變成這樣子,最底層是所有的信息采集設備,包括攝像頭、傳感器,以及包括在網(wǎng)絡上的虛擬傳感器去監(jiān)測整個網(wǎng)絡的活動。所有的數(shù)據(jù)采集起來并不是灌到應用讓應用去使用數(shù)據(jù),而是按照數(shù)據(jù)所反應的城市各個部分的內(nèi)在邏輯關系,把他們組織在一起。組織在一起成為了什么?成為了這個城市在虛擬世界里的一個映像。這個數(shù)據(jù)不是一個垃圾堆,這個數(shù)據(jù)有了內(nèi)在整體的含義。在這個基礎上可以對這個數(shù)據(jù)做更充分的利用,可以做各種各樣的分析、各種各樣的模擬。然后上面的應用可以到映像里去獲取需要的各種各樣的信息,而不是像原來僅僅局限在自己的系統(tǒng)里。
信息的價值用這種方式會被更加充分的挖掘出來,而應用也能獲得更加完整豐富的信息,而且上層應用的變化不影響底層。所以這種方式是和傳統(tǒng)IT系統(tǒng)建設完全不同的一個方式,我個人認為未來很多IT系統(tǒng)可能會用這種方式來構(gòu)建,當然不是所有的,也不是所有的信息都用來構(gòu)建虛擬映像。但是這會成為一個非常核心的,或者非常重要的一種應用構(gòu)建的模式,而且這種模式將會對IT產(chǎn)業(yè)、IT應用產(chǎn)生重大的影響。它不僅僅會改變應用,而且會產(chǎn)生核心的一些基礎的技術、基礎的產(chǎn)品、基礎的平臺,整個IT產(chǎn)業(yè)未來的變化可能遠遠超出我們的想象。
回到個人的例子,如果把個人的應用也按照這種方式來建,底層就是一個個人的虛擬映像,中間是在這個映像基礎上融合的服務,界面層可以人更加自然的交互。這個不是解決大腦低層看不到的智能過程,而是用來和我能夠感受到、看到大腦的部分想辦法無縫的結(jié)起來。這就是用這種方式構(gòu)建應用未來出現(xiàn)的場景,計算機和你不僅僅在人機交互界面上,你會覺得計算機用起來很順手,而且計算機的應用,特別是計算機對信息的存儲、管理的方式和你的思維習慣、生活方式,將會很自然的融合在一起。因為這些信息就是按照你的習慣和思維方式組織和管理起來的,這樣信息系統(tǒng)和人的接縫更小,最終形成無縫的連接。
放到整個網(wǎng)絡的世界里是什么景象?在整個網(wǎng)絡世界里可能有不同的意義,有不同主體構(gòu)造出來的核心應用系統(tǒng),這些應用系統(tǒng)都是以主體的虛擬映像為基礎,最后網(wǎng)絡世界把他們聯(lián)結(jié)在一起。所以網(wǎng)絡世界也將更加變得有序,更加像真實世界的映像,而不是像今天這樣雜亂無章。
計算機的應用,剛才涂子沛老師講到無人駕駛汽車,也是將汽車和人無縫結(jié)合起來,汽車駕駛和個人信息管理系統(tǒng)也會結(jié)合起來,信息應用系統(tǒng)和信息控制系統(tǒng)也會無縫連接的。最典型的無縫連接是今年世界杯拿了一個殘疾人開球,我沒有查到視頻。這個是機械手,這個手直接連接人在神經(jīng)上,完全是由神經(jīng)控制,這個手已經(jīng)進入到臨床應用階段了。這個手拿一個葡萄吃,葡萄不會捏碎的。
未來的發(fā)展如果總結(jié)成一句話,就是讓輔助人類體能的工具和輔助人類智能的工具,都和人逐步無縫接起來,這就是我認為智能的未來。而不是說我們造一臺機器,讓它和我一樣,和我同樣的智能,最后來挑戰(zhàn)我。我認為這個目標也許幾百年有可能能夠?qū)崿F(xiàn),但是在現(xiàn)在來看未來幾十年、上百年的歷程往后看的話,我認為智能更多的會按照這個方向去走,而不是造出有獨立人格和人完全有同樣能力的機器。無論數(shù)據(jù)有多大,我想這個目標在目前看都很難實現(xiàn)。
我大概花點時間把整個智能的過程的理解跟大家講一些,都是個人的觀點不一定對,供大家參考。而且一定不是包治病的藥,只是我認為未來IT產(chǎn)業(yè)很重要的主線,而且這條主線將會對整個產(chǎn)業(yè)產(chǎn)生很重大的影響。
更多資訊請關注自動化軟件頻道