大家上午好!今天跟大家報告的題目是人工智能,快速掃描一下快速落地中的全球自動駕駛產業(yè),三個方面都有:第一,是從智能駕駛到無人駕駛;第二,產業(yè)的平靜與技術路線之爭,里面包括三個方面的內容;第三,人工智能在自動駕駛產業(yè)落地中新的機遇。
我們知道美國SAE關于自動駕駛的分級,從L0—L5,總共6級,大家可能關心的是L2和L3,目前一個是部分的自動駕駛,一個是有條件的自動駕駛,我們認為L0和L1是一種輔助駕駛或者智能駕駛,L2和L3是我們的自動駕駛,我們更關注無人駕駛的L4和L5,L5是完全跟人一樣的,比較遙遠,但是產業(yè)關注重點可能L3、L4。我們看到自動駕駛,在L0和L1方面,駕駛主要半自動和輔助駕駛方面,L0是告警式的開環(huán),L1是閉環(huán)的。我們看到L2階段,全球搞自動駕駛,不管是科研還是產業(yè)基本上在L2階段,實際上已經把手腳解放了,需要隨時的接管,需要一個安全駕駛員、還有一個監(jiān)控駕駛員,但是機器不能夠處理極端環(huán)境和緊急情況。在L3階段我們把眼睛解放了,我們不需要去看了,不需要非常緊張的看到周邊的行車環(huán)境,是一個絕對可靠的機器感知,有監(jiān)控駕駛員,顯著的標志是司機的位置沒有人,這樣就可以認為這應該是L3的水平的一個自動駕駛。還可以看到,如果在L4階段或者L5階段,就是把腦袋徹底解放了,我們可以完全放心它的安全性,這個自動駕駛出去以后我們不用擔心會因為安全問題給你帶來任何麻煩,這是一個真正意義上可以顛覆未來出行方式的技術。他們之間區(qū)別在于,L4要限定區(qū)域和限定功能,L5不用限定任何的功能和區(qū)域,跟人類駕駛相同的,人可以去的地方它也可以去,人去不了的地方它也去不了,這個時候顯然我們不需要方向盤、也不需要踏板和后視鏡了。
我們現在關心的重點可能是在L4這個水平上面,他也有限定區(qū)域和限定功能,也要遵從一個商業(yè)模式,就是從簡單到復雜的商業(yè)模式,比如我們首先開始在封閉區(qū)域里面做軌跡跟蹤,這種自動駕駛,就是園區(qū)、景點、工業(yè)區(qū),可以在封閉里邊沿著固定線路或者是一個固定的車道自動駕駛,這個場景是比較簡單的,也是比較容易實現的,也容易獲得商業(yè)模式,比如機場、港口。另外一種是更加復雜一點的,比如簡單的城區(qū)路況做自動駕駛,在高速公路或者在城市特定里邊里邊做自動駕駛,這個應用場景相對簡單,需要用高精地圖,障礙物檢測和行為預測,比較容易L3和L4。更復雜的,在高速公路與城區(qū)的全部道路自動駕駛,最后擴大所有道路可以實現,就是到L的階段了。應用場景其其復雜,全路網高精地圖,還有障礙物檢測,行為預測和復雜檢測。
我們看到還有關于產業(yè)的瓶頸,這個方面首先看到環(huán)境感知與環(huán)境建模之爭,我們到底是完全用環(huán)境建模的方法、還是完全用純感知的方法,如果用環(huán)境建模的方法,優(yōu)點我們采取RTK厘米級精度的軌跡跟蹤,可以做到像人類這樣的水平道路行使能力又快又好,但是他的缺點是明顯的,沒有環(huán)境適應性、沒有自主性、成本高,僅適合于封閉場景,比如采用厘米級的拓補+RTK和障礙物的檢測方法。
這是全路網的拓補地圖,這是高精地圖,激光雷達掃出來的??吹礁呔貓D有什么好處呢?用他來做地圖匹配,可以進一步降低導航系統的硬件成本,而且容易實現全路網的自動駕駛,采用這種軌跡跟蹤RTK裝置。還有純感知的,完全用攝像頭、完全用視覺解決自動行駛的問題,優(yōu)點就是可以全路網的自主行駛,人靠兩個眼睛什么地方都可以去,根本不用地圖,也不用GPS,這樣具有高度的自助行和環(huán)境適應性,因為他依靠攝像頭、激光雷達,無高精地圖,無RTK,成本低,缺點是受車道線質量的影響較大,車速降低,可靠性差,機器視覺和人的視覺是有很大區(qū)別的,這樣有很大問題,應該把環(huán)境感知和環(huán)境建模結合起來,同時獲得高興能的路面行駛能力,還要有自主性。
第二,視覺主導還是激光雷達之爭。我們知道有兩個產業(yè)化落地平靜,其中之一從L2到L3,一個是特斯拉的方案,還有一個是規(guī)格Waymo的方案,就是采用激光雷達的主導。這兩個方案都是要面向低成本,因為產業(yè)化落地瓶頸的觀點是要高可靠、低成本。這里邊有兩種,一個是視覺可能攝像頭+毫米波+超聲波+低成本激光雷達,激光雷達以低成本的激雷達+毫米波+超聲波+攝像頭。
視覺主導的解決方案,被動視覺,受光照影響大,目標檢測與SLAM較不可靠,但成本低。特斯拉Autopilot2.0,8個攝像頭,有一個OTA空中下載,還有云平臺進行ECU軟件和功能升級,它的功能是通過軟件OTA升級的,自動駕駛可以從L2演化到L4+。視覺主導的技術,特斯拉Mobileye技術過渡到運行于NvidiaDrivePX2上。激光雷達主導方案,主動視覺,目標檢測與SLAM都比較可靠,但是成本比較貴,缺乏紋理和顏色。所以現在Waymo把這個激光雷達成本降下來了,自己搞了一個削減了90%以上,他今年剛剛上個月在美國鳳凰城進行無人駕駛出租車的社會公測,完全無人的,上面沒有一個人,不像Uber那個,他在匹茲堡上面有工程師的,現在一個人沒有了,實現了無駕駛員社會公測的無人駕駛出租車,已經看到在進行公測了,所以它的技術應該是相當可靠。激光雷達主導就是進一步,比如攝像頭跟激光雷達組成一個模組,使用彩色激光點運輸局,進一步降低激光雷達的硬件成本,現在比如4萬6就可以買一個16線的激光雷達,如果研發(fā)固態(tài)激光雷達成本可以進一步的降低。
循環(huán)漸進還是一步到位之爭。我們知道第二幕,我們說科研主導是第一幕,很早做科研、做自動駕駛、做無人駕駛,這一幕基本上結束了,以市場為主導的自動駕駛開始上演,因為現在看到全球競爭產業(yè)競爭格局非常激烈,這里邊有兩個技術路徑,一個是漸進路線,我們從很多傳統的主機廠可能愿意就這件事情,從L2逐步演化到L3,再演化到L4,另外一個路線就是這些互聯網企業(yè)或者科技巨頭,他們愿意做一個完全無人干預的L2+L4+以上的技術路線,因為他不需要人干預,人干預反而干預不了,因為人往往注意力不集中,要說讓他隨時接管可能他不愿意做這個事,可能注意力不集中反而容易引起事故。我們可以看到現在全球產業(yè)的格局,我們看到大量的企業(yè),尤其創(chuàng)業(yè)公司特別多搞的動駕駛的,我們看到老的車企,比如通用的Cruise,福特的通過收購ArgoAI,還有日產的、沃爾沃、奧迪、大眾、奔馳,還有我們國內的這些企業(yè),基本上都在搞自動駕駛。新的車企可以看到特斯拉、Wheego,還有國內很多新的互聯網的新能源汽車,還有Tier1,我們可以看到跨界科技巨頭像GoogleWaymo、Uber、Apple,還有百度、騰訊、華為等等。初創(chuàng)企業(yè)特別多,初創(chuàng)企業(yè)可以列出很長的名單出來,有nuTonomy,很多都是有華人背景的企業(yè)。
這是百度的阿波羅,可能集中在云上面的服務,提供云的服務,高精地圖,在數據平臺的服務上面、云服務上面。自動化自動駕駛,我們覺得應該以信息化汽車作為底層平臺,我們說互聯網汽車如
此重要的原因,因為我們知道數字化和總線化或者網聯化是智能化的基礎和條件,所以需要在信息化汽車里面使用OTA還有云,還有使用SDU,我們用軟件定義它的功能,跟我們現在智能手機一樣,通過軟件來實現它,這就為我們的自動駕駛或者無人駕駛打下了一個非常好的基礎。
第三次變革,有可能從電動汽車到智能汽車,然后到自動駕駛汽車。我們看到新的“四化”趨勢非常明顯,就是要做電動化、信息化、智能化、共享化,自動駕駛有可能是人工智能最具商業(yè)價值,而且有可能是最早落地的垂直領域之一,要解決絕對的安全性、低成本,還要提供整體的解決方案,還要形成產業(yè)生態(tài),還要催生商業(yè)模式。我們可以看三個核心問題,第一個問題是目標識別的問題,比如我們對交通稠密的復雜情緒,怎么可靠的進行周邊障礙物的檢測、行為意圖的預測,還有自主導航,它不受比如GPS衛(wèi)星導航的影響,比如激光的SLAM、是覺得SLAM,還有多傳感器的信息融合。
人工智能新機遇,我們知道深度學習是完全用真實大數據,不需要進行預處理,一般數據包括了視頻的圖像,包括激光的點云、毫米波雷達等等,而且實時性有GPU、TPU、FPGA、ASIC和類腦芯片,已經成為自動駕駛感知、決策、控制的基礎技術,深度學習是環(huán)境感知和自主決策的決定性技術,可望使自動駕駛汽車具有人的環(huán)境感知還有駕駛技能的自主學習能力。我們人通過學習或者駕駛技能的,我們在駕校通過監(jiān)督學習,師傅手把手教,我們離開駕校以后到你開了幾十萬公里,完全靠強化學習、好自主學習,靠經驗失敗與成功進行學習的。我們可以看到環(huán)境感知與基于認知地圖的自主導航,比如深度卷積神經網絡,加上低成本的激光雷達,還有高精地圖、5G通訊、智能網聯以及智慧交通系統和智慧城市的合力支撐,有可能使極端環(huán)境的感知與低成本、高可靠自主導航成為現實,這是兩個關鍵的問題,成為L2跨越到L3最大的產業(yè)瓶頸,就是要做到可靠的感知,還有低成本、高可靠的自主導航。我們可以看到自主學習的智能決策和控制,由AlphaGo推動的深度強化學習的應用,讓我們汽車以后是不是像人駕駛汽車一樣的,駕駛技能有自主學習能力。
人工智能我們可以說主要涉及到五個維度,有算法、有數據、有計算、有細分的場景,還有垂直整合,這個算法包括卷積深度神經網絡,深度強化學習,數據包括目標大數據、行為意圖大數據、駕駛行為大數據、駕駛軌跡大數據,計算有移動端、云端、離線訓練深度學習和加速器。我們看到學習算法,大家知道深度學習的開源算法,包括TensorFlow等等。還有他的共享技術,我們看到深度卷積神經網絡,深度學習可以用環(huán)境感知、信息融合、決策/控制,里邊可以有行為意圖的預測、認知地圖的創(chuàng)建、多模態(tài)導航信息融合,還有基于深度學習的自主學習與控制。與高精地圖的結合,極端環(huán)境下的比如說可行駛區(qū)域的檢測,還有車道線的檢測。
這是我們做的用KITTI基于深度卷積神經網絡做的,可行駛路面與車道線檢測,這是完全語義分割的。還有基于深度卷積神經網絡作障礙物檢測與識別,機動車、非機動車、行人識別。做行為意圖的預測,通過與高精地圖的結合,高精地圖是非常重要的,超越了人類的先驗知識。還有認知地圖。用端到端的自主決策,用AlphaGoZero這樣的技術,用Actor—critic做控制,與知識驅動結合,效果非常好。
我們看到大數據,看到大數據對自動駕駛如此重要,在深度學習算法中,看到采集喂食大數據越多,獲得更好的駕駛知覺??梢钥吹皆诿绹又萋窚y企業(yè)已經有37家企業(yè)以上,很多都是創(chuàng)新企業(yè),尤其是互聯網的創(chuàng)新企業(yè)。產業(yè)競爭的焦點兩個,一個是基于大數據的里程數,還有就是看人工干預頻度,比如1萬公里干預多少次,比如人可能10萬公里一次,最好的水平是谷歌的水平,最好已經做到1萬公里干預次數是1.25次,所以這個代表了最高的一個技術水平??梢钥吹酵ㄓ昧慨a的無人駕駛汽車,這是在量產的,量產車間出現的無人駕駛其他。
我們看到要解決這個問題其實做到后面是更難的用大數據,因為現在方法必須要用完備的大數據,所以他就是要瘋狂的追逐自動形勢大數據,而且大數據還有一個什么問題呢?就是長尾效應,我們現在識別率比如從99.999%提高到99.99999%,99.99999%需要大數據是指數增長的。我們看到計算能力,GPU/TPU。計算能力,還有云端的、終端的。
也可以看到汽車芯片巨頭,包括我們全球的芯片巨頭都開始聚焦人工智能芯片,尤其是關注自動駕駛的芯片,自動駕駛芯片形成了好幾個陣營,其他的基礎條件,我覺得今后基于深度學習高精地圖,包括柵格地圖和認知地圖,可能形成巨大的產業(yè),因為是充分的先驗知識,會形成數字化、網絡化、智能化的交通基礎設施。原因是目前的學習不能解決語義理解的問題,這是存在根本的缺陷,現在只能夠進行,如果有完備的大數據他能夠做到人類水平的檢測、分割與分類,但是他沒有理解,人開車為什么兩個眼睛就可以開車呢?因為我們對環(huán)境有理解,就是有抽象或者顯象,這個可以理解有語義,因為這個缺陷,這個缺陷就是你用多大的數據也不能解決他語義理解的問題,到目前的算法,這樣就必須要利用其他方面的合力,來解決環(huán)境絕對可靠的感知問題,因為剛剛說L2到L3一個瓶頸。我們怎么辦呢?要注意其他條件,一個條件非常重要的,就是我們高精地圖,包括偶然的柵格地圖,另外一個條件是5G和NB—IoT,還有智能網聯技術,還要用智能交通系統ITS,可以在基礎設施道路上做一些改造,還有智慧城市等等,形成合力,這樣才有可能解決極端和緊急情況下的可靠感知問題。
我們會在這個上面,如果有L2、L4技術的瓶頸突破以后,我想很快會邁向共享化的無人駕駛汽車社會。比如說這個時候共享無人駕駛,還有人工智能的增值服務,會成為我們最終的目標,包括智慧共享出行,包括發(fā)展智能的增值服務,智能增值服務很多人為自動駕駛可能有1萬億美元的市場空間,如果加上智能增值服務的話,可能要乘以10,我們手機現在每天打電話可能打不了一次,都是干其他事情了,今后可能在無人駕駛出租車或者汽車上面也會出現這樣的模式,可能出行是一個基本的功能,更多是在上面享受很多增值的商業(yè)服務,最終是要建立一個共享的網聯電動的無人駕駛的生態(tài)。
最后結語,具有巨大產業(yè)價值的L4,正遵循限定區(qū)域可以從簡單到復雜的商業(yè)模式演變之路。就是說不管是簡單的商業(yè)模式、簡單區(qū)域的還是復雜區(qū)域的都會有商業(yè)模式,都會找到他的商業(yè)價值。環(huán)境感知還必須與環(huán)境建模(高精地圖)結合起來,原因就是我們現在無論算法或者人工智能算法還存在缺陷,不能對環(huán)境進行理解,這樣的話他需要與高精地圖結合,需要與5G通信、與NB—IoT、車聯網、ITS、智慧城市形成合力,這樣才可以解決極端環(huán)境和緊急情況這種可靠感知,助推L2到L3,為自動駕駛產業(yè)的落地邁出最關鍵的一步。高可靠、低成本是視覺或者激光雷達主導技術路線的共同要求,要求高可靠、低成本,這個事情要做成最后我們要多傳感器融合的解決方案,多傳感器融合就成為必須要解決的共性的核心的關鍵技術問題。深度學習是環(huán)境感知與自主決策的決定性技術,可望使自動駕駛汽車具有類似于人的環(huán)境感知與駕駛技能的自主學習能力,其中大數據與干預數成為評測的關鍵。人工智能的深度融入,必將加速L4+無人駕駛產業(yè)的商業(yè)落地。