【「無人車特輯」欄目由播客《硅谷101》與鈦媒體聯合推出:盤點美國L4級無人車巨頭們的策略;討論爭議中前進的視覺派Tesla;訪談中國無人車創始團隊。鈦媒體App為文字首發媒體。】
特斯拉引發的視覺派與激光雷達之爭:選擇它不是因為簡單,而是因為難?
采訪|泓君,文字|王晶?
在電動車領域,特斯拉是全球市值最高的車企。它吸引大眾關注的另一點是,是它的「自動駕駛技術」。
在2021年計算機視覺和模式識別會議上,特斯拉還公布了其超級計算機Dojo,超強的算力、大規模的數據收集以及雄厚的資金,背后是馬斯克對自動駕駛的野心,他曾宣稱,要在2020年實現「L5 完全自動駕駛」。
根據 SAE 對自動駕駛級別的劃分,L5級別的自動駕駛意味著,車輛可以在任何情況下進行駕駛,車內乘客無需參與任何駕駛行為。當前無論是從技術還是從公認的分級標準來看,要達到L5級別的自動駕駛還有很長的路,特斯拉目前的自動駕駛只能算是L2.5。
與馬斯克大肆宣傳自動駕駛功能相悖的是,特斯拉頻頻發生的自動駕駛交通事故,也引發了對自動駕駛安全性以及視覺派與激光雷達派的爭論。許多車企為了保障安全,選擇了在傳感器上做“加法”,車輛不僅搭載多種雷達,還有視覺派的攝像頭。但作為視覺派堅定的支持者,馬斯克卻選擇了做“減法”,甚至去掉了毫米波雷達。
人都會依靠自己的經驗形成路徑依賴。激光雷達與視覺派相爭已久,馬斯克是否選擇了一條更難的路?
本期嘉賓 |?齊蕾,前上汽資本硅谷投資總監;劉冰雁,Kargo軟件主管
接下來我們會出一系列的關于自動駕駛的節目,來盤點美國巨頭Waymo、Cruise、Amazon、Tesla、Uber這些公司的無人車策略,也會有更多中國的無人車創始團隊加入到我們的訪談中。我們一起看看,這個市場上最聰明的人和錢,到底在賭一個怎樣的未來。
你將會聽到:
【01:15】 特斯拉不是無人駕駛,而是L2.5的輔助駕駛
【03:29】 用戶體驗特斯拉:進步與恐慌
【10:03】 如何看待特斯拉去掉了毫米波雷達?
【14:50】 路徑之爭:視覺派與激光雷達之爭是偽問題?
【24:04】 定義不明,自動駕駛的分級界限有待更新
【26:30】 特斯拉自動駕駛更安全嗎?
【37:24】 無論是視覺還是激光雷達,實現全無人駕駛很遙遠
【44:30】 特斯拉視覺識別上的進步:從2D到3D
【46:30】 人工智能的黑盒子
【50:23】 路線之爭:我們選擇它,不是因為簡單,而是因為難
【音頻收聽地址】:無人車特輯 |?特斯拉自動駕駛到底怎么樣?
《硅谷101》:我們之前討論Waymo、Cruise的無人駕駛,都是完全無人駕駛L4甚至是L5級的無人駕駛,準確來說特斯拉應該不算無人駕駛而是輔助駕駛。
齊蕾:現在很多車都有ADAS(Advanced driver-assistance systems)高級輔助駕駛系統,可以進行跟車,保持在兩條線之間行駛,跟著線稍微拐彎。現在特斯拉的所有功能,都可以歸為ADAS。
《硅谷101》:冰雁是特斯拉的老用戶,也見證了特斯拉這幾年自動駕駛的進步,可以聊聊你剛用特斯拉和現在使用感受上的區別?
劉冰雁:我最開始拿到車應該是2018年前后,近些年特斯拉進步很明顯。最開始如果遇到開山路比較多彎,它就會放棄,但現在基本上到處都可以開了,包括高速和一些非高速地方。內測或半公開測試的一些版本基本上從家到公司都不需要接管,目前用戶用到的版本,基本上是輔助駕駛。
現在通用的 Super Cruise也做得非常好,手都不用碰,特斯拉是如果你30秒手不碰方向盤,它一定會提醒你,之后就會讓你靠邊停車,要全權接管。
《硅谷101》:你是覺得現在特斯拉在上下高速方面已經比較順暢。
劉冰雁:一方面是上下高速,一方面是在高速之間切換,有一些路它會告訴你這個轉盤轉不過去,你就需要接手,但是在能處理的范圍內,它還是處理得相當不錯的。
所以如果把它當作自動駕駛,是很危險的。但如果把它當做很好的輔助駕駛,對我來說,是真的離不開的東西。
我每天開車上班大概40分鐘左右,如果沒有這個功能的話,開車很累,但有了輔助駕駛,基本上全程我只要看路就可以,不需要隨時準備反應。這條路我每天都在開,熟的路、熟的車、熟的軟件,除非前面突然有輛車停下來,否則基本上都做得很好。
齊蕾:會有擔心嗎?特斯拉好像在辨別特殊車型上,如校車或大水泥車,比較差。
劉冰雁:對,這確實要注意,但特斯拉自動駕駛技術和其他公司不一樣,我認為是UI上的區別,這是一個用戶體驗的問題,技術上的差距未必那么大。
在很長一段時間里,很多技術是靠毫米波雷達完成,很多家都做得不錯,但他們沒法告訴你,是否有看到前面車輛,所以前面出現車時,你一定會害怕。
特斯拉相較于傳統汽車巨大的一個升級是它有個大屏幕,可以提供很多交互信息,如果能看到前面車輛,出現問題的可能性就小,即使技術差別不大,但這樣的交互模式還是確實感覺好用了很多。
圖 | 特斯拉車輛行駛的可視化界面
《硅谷101》:不管在大屏幕上有沒有看到車,駕駛員還是要保持很高的專注力,觀察自動駕駛開得如何。
劉冰雁:這實際上是另一個問題,激光雷達派還是視覺派的核心區別,是在Reception上。從這個角度來說,除非是軟件寫得太差,只要看到了,一般不會說看見了還撞上去。
《硅谷101》:在5月份的時候,特斯拉把毫米波雷達去掉了,你們怎么看這件事情?
齊蕾:特斯拉現在有四款車,量產車拿掉了,剩下兩款還是有的。
劉冰雁:之前認為有一種可能性是供貨,很有可能會是這樣的原因:對于小規模的車,他照樣能供得上,但是對于大規模這個量產的話,為了不影響交貨,他把毫米波雷達去掉了。
這個事情發生之后,又有幾個消息可以對比看,第一是當時最開始特斯拉的所謂的Autopilot,應該是L1.5,是Mobileye提供的技術,后來被英特爾收購了Mobileye這家公司的技術,于是特斯拉跟Mobileye分道揚鑣。
那時候特斯拉的自動駕駛技術,退步了相當多,我剛拿到車的時候,應該是退步還沒追上的時候,有一些技術屬于老車反而更好的。
《硅谷101》:為什么會退步?
劉冰雁:因為Mobileye專注做這一方面相當長時間,也有一些自己的專利。
《硅谷101》:退步是因為特斯拉和Mobileye掰了?
劉冰雁:這是很久以前的事兒了。但是一兩年之內特斯拉就完全追上了,并不斷有新功能出現。
這個角度來說,毫米波又出現非常類似的事情。剛開始這個事情發生的時候,車交貨之后,他會發現定速巡航不能超過75英里,還有一些雨天夜晚會出現一些問題,但是最近的更新,已經把這些東西彌補的差不多了,這些事情上做的還是挺快。??
《硅谷101》:毫米波雷達的作用是什么,它可以看多遠?
齊蕾:應該是二三十米。
《硅谷101》:激光雷達是遠的,毫米波雷達是近的,如果開高速的話主要是靠激光雷達。
圖 | 特斯拉自動輔助駕駛
劉冰雁:很多在之前出現的幽靈剎車事件,實際上是毫米波雷達造成的。往往出現在頭頂上有個橋,之前認為是立交橋的影子會對視覺造成影響,后來更多的情況,他們是說立交橋本身對毫米波雷達產生了影響。
《硅谷101》:如果是這種情況,不管白天還是晚上,如果遇到立交橋的話,特斯拉的車在自動駕駛的過程中可能都會出現卡頓,或者急剎車。我在特斯拉論壇上看過的報告,晚上出現這種情況比較多,所以大家猜測是因為立交橋的影子。
劉冰雁:難道不是應該說,晚上發生的情況比較多,正是因為影子相對不強。因為當白天視覺比較確定的時候,視覺可能會占上風,這里面就涉及到傳感器融合技術。
我們最終是在試圖認識和理解這個世界,這屬于測量問題。這個世界上不存在可測量的真值,因為測到的東西一定是不準的,所以在有一定偏差的情況下,幾個偏差之間怎樣融合?而一般意義上的傳感器融合,是當它們的偏差在范圍重合的情況下,可以進行融合的。
我們現在討論的這種情況,可能出現的情況是,兩個測量密度已經低到了沒有融合的機會了,可能存在的問題是視覺如果沒有看到這個立交橋,而雷達看到了這個立交橋,這是一個非常夸張的事情。前面突然出現一堵墻,這東西要怎么處理,兩邊最后會出現打架。
這就是為什么馬斯克說,它這個東西在融合過程中反而會造成問題。如果視覺和毫米波雷達不一致的情況下,一般是毫米波雷達錯了,這樣的話干嘛還留著它。這個說法不是內部人士不好評判,但是從現在他們的車做到的效果來看,還真是有一些可能性。
齊蕾:這是你的一個推論。另外一個事實是,毫米波雷達有一個缺陷,當周圍的毫米波雷達都在作用時,會有互相干擾的情況,激光雷達沒有。
我不是技術,但是我周圍所有做毫米波雷達的人,最關注的核心問題是當路上有100輛車,每個人都在開自動駕駛和毫米波雷達時,由于互相干擾,可能會有很嚴重的偏差。
《硅谷101》:這樣說如果L4或L5自動駕駛成規模時,豈不是也會有互相干擾的問題。
齊蕾:對,這就是視覺派的合理之處,另外就是考慮怎么解決現在的短板。
因為我之前看過很多做新型毫米波雷達,會把頻段變成不同的頻段,可以去更小的避免互相干擾。
劉冰雁:他們可以用一些信息加載之類的辦法,讓它知道這是別人的車,或者通過別的技術來跳頻,這是無線電中已經有成熟的技術了。現在是怎么在這樣的設備中,把以前作為雷達技術或者探測的技術,變為用無線電類似的技術進行優化。
齊蕾:我覺得特斯拉還有很厲害的一點是,第一個提出fleet learning(車隊學習網絡)、neural network learning(神經網絡學習)。
靠著所有特斯拉的車,去共享學習到的東西,只要我的車鋪的夠多,按道理來講視覺會更精準,比如前兩輛車看到了前面大卡車,可以給我的車預警一下,讓我知道前面有個大卡車。如果真的能實現這一點,是很厲害的。
劉冰雁:我理解的fleet learning,應該不會試圖用前兩輛車的信號去做這件事。理想狀態所有車都互聯互通,信任對方的信息,相當于500米之外有個事情,大家一起減速,這非常美好。但在這個世界上,幾乎永遠不可能成功,因為總是存在作惡者的。
你要相信絕大部分人都是好人,但是總有壞人。因為我有朋友研究人工智能安全相關的內容,里面確實存在很多非常恐怖的問題。
特斯拉最大的優勢是,它能落地;雖然它的水平跟Waymo有很大的差異,但是它有很多的車隊數據,從這方面講,它是有很大的可能性突破自動駕駛的。
齊蕾:還有它積累的數據是真實的發生在路上的數據,而不是在云里跑出來的模擬數據。
《硅谷101》:關于特斯拉,一直有一個討論很熱的問題,就是大家怎么看視覺派跟激光雷達派?
劉冰雁:相對于激光雷達來說,視覺的數據量級小很多。另一個好處是,相對于激光雷達,視覺可傳輸的數據量級要小很多,激光雷達即使有這樣的規模,對于目前的網絡條件來說,也沒有辦法收集這樣的數據。
首先特斯拉可以有百萬輛級的車,另一方面對于這些車的攝像頭數據,目前有非常成熟的攝像頭視頻壓縮技術,本身傳輸的話數據上量級要小很多。
《硅谷101》:視頻有很成熟的數據壓縮技術,我采訪過的公司,在07-08年做視頻在線教育的時候,沒有辦法做,因為他視頻壓縮技術達不到,網上卡,后來等視頻技術成熟了,一批在線教育公司就做出來了。無人駕駛的出現,就是依賴于激光雷達能看的更遠了,激光雷達行業還有待發展,因為視頻成熟的壓縮技術也經歷了很多年。
劉冰雁:對,視頻技術屬于推動互聯網發展的核心技術之一,所以確實發展會好一些。另外,做一個激光雷達或者L4-L5技術需要的算力,是做L2-L3技術或者做視覺的算力相比,是好幾個量級上的差別。
我道聽途說的,現在每一輛Waymo、Cruise這些廠商的自動駕駛車里,他們都相當于還是背著一個雙路至強(Intel CPU)加8臺GPU,市面上買的價錢至少要大概1萬到2萬美元,更不說存儲成本。之前每天換硬盤,現在可能一次背了20塊硬盤,隔幾天換一次。
齊蕾:所以現在很多自動駕駛公司在做小巴,因為小巴的成本劃得來,空間也大,可以塞計算設備進去,另外載的人多,里程數更高,算下來會劃算很多。
同時我們期待,無論是英特還是Nvidia,尤其是Nvidia,得把這個事兒給做出來,一致去搞自動駕駛的芯片;如果芯片成本能降下起來,大小能變小,也是一個里程碑。
圖 | 自動駕駛系統??
《硅谷101》:激光雷達的數據,比如像Waymo,是他們晚上回去,車都歇著的時候傳輸嗎?
齊蕾:他們之前在做的時候,唯一的辦法是,晚上把硬盤拿了出來,再拿到他們的機房,然后進行傳輸。5G到來會帶來一些方便,但是它的數據量確實是比較大的。
劉冰雁:我覺得激光派和視覺派的爭論可能是個偽問題,L5技術,現在看來還有點遙遠。
齊蕾:所謂L5本身技術含量是非常高的,我們可能不會去定義是L5、L4還是L3,而是說真的應用起來應該是什么樣的感覺。
劉冰雁:非常有道理,我確實一直覺得SAE(美國汽車工程師協會)的這套分級,現在看來值得推敲。
《硅谷101》:大家說特斯拉現在是L2的技術,L2和L3的區別在哪里?
劉冰雁:簡單的說法是這樣的:L2是人在開車;L3是車在開車,但人要負責;L4是車在開車,但車負責,也就是說L4是人不需要接管,L3人還需要接管。
齊蕾:L2和3其實界限沒有那么大,就是程度的問題,比如手放在方向盤上面,L3是你可能可以停一下,但要回來一下,如果說離開30秒可以算2.5。
圖 | 自動駕駛分級??
劉冰雁:絕大多數定速巡航或自動跟車都可以算L2,但特斯拉應該算是L2.5,到L3好像又沒有到,分級其實是純從產品的角度來定義,而不是從技術路線角度定義的。
從技術路線角度,你會發現L3到L4非常難,甚至可以說L4到L5都沒有L3到L4難,現在的Cruise、Waymo也到不了完全L4,就是不需要人接管,這是很難做到的事情。一旦人可以不接管了,把它擴展到在一個城市都能用,在另一個城市也能用,可能反而比從L3到L4更容易。
齊蕾:回到剛才說的從一個城市到另一個城市,我覺得難度非常大,可能視覺派還不太一樣,激光雷達的是必須得掃地圖。
劉冰雁:激光雷達是依賴于高精地圖的,沒有地圖的話,就不能這么去運作,特斯拉雖然很多地方不靠譜,但做視覺絕大部分體驗還是很好的。
齊蕾:從用戶體驗和商業角度來講,特斯拉的體驗肯定是更好的。但是從一個車廠的安全和責任的角度來講,大家愿意選擇激光雷達,是因為認為激光雷達更安全更負責。
我自己對視覺不安的一點是,我很擔心在它遇到一個沒有見過的情況,要怎么做決定。
劉冰雁:激光雷達不會有同樣的問題嗎?它也有沒有見過的東西。
齊蕾:它有,但至少它可以判斷前面是一組障礙物,但對于視覺來講,它不一定是障礙物,有可能那個東西很小,但可能會導致很大的事故。
劉冰雁:我之前在Oculus做的是,基于視覺建圖與定位,用視覺,和一些非常簡單的加速度、陀螺儀這樣的傳感器,這樣是可以進行對深度和物體有相當不錯的感知,相當于對與定位的感知。
因為雙目視覺可以做深度,在運動過程中,即使不用傳播視覺也可以做深度,更進一步就是人眼看很多事情也可以知道它大概的位置的深度,那么機器不見得會做得比人差,所以說深度感知,也就是說,知道前面到底是不是一堵墻,并不是那么難處理。
相反,激光雷達遇到反光或雪花,并不是那么準。
圖 | 激光雷達
齊蕾:對,雨天,激光雷達會有很多問題。
劉冰雁:視覺上也可以做很多深度,這些不依賴于是否見過這個場景。
回到做深度定位這個問題上,我們找的是,連字母都算不上的小東西。你看到有兩個非常小的點,原來離得很近,后來突然離得很遠,就說明這個東西離你很近了。它并不依賴于認出這個東西本身,只需要知道一些從圖像處理、甚至光學上幾乎對人眼和人腦來說不可識別的一些東西,就可以提供非常好的深度的認知。
齊蕾:會不會出現的是一個活物,比如一個正在彎腰撿球的小孩,系統會誤以為是個垃圾桶?
劉冰雁:不管是垃圾桶還是小孩都是不能撞的。
齊蕾:有意思的一點是,馬斯克是堅定的視覺派,連毫米波雷達都可以拿掉,只相信視覺,但激光派就是,我們都上,我不僅有激光雷達,還有毫米波雷達和視覺。
《硅谷101》:激光雷達和視覺派的一個差異在于,不管激光雷達是否比人開車安全,對激光雷達派來說,要做的是降低總體事故率,不僅要比人更安全,還要讓車的事故率降到最低,安全性提升到最高;而不是說達到了和人差不多的水準就可以了,他們不是這個標準。
劉冰雁:我們仔細深究的話,車一定比人自己更安全,這是一個簡單的概率問題,人不是100%安全,車也不是100%安全,但只要不同時犯錯,我們就是安全的。
但我們討論不同傳感器融合時,就不是直接這樣的關系,不是說只要激光雷達看到了,或者視覺看到了,就一定不會出事,看到不代表不會出事,也可能看到了假的東西,于是做了錯誤的躲避,造成更多失誤。
從這個角度來說,更多傳感器不一定代表更好的精度,因為這是幾個不同的傳感器,它們之間沒有典型的可以用統計的方法進行融合。
齊蕾:就是回到了傳感器融合權重的問題。可能高速上傳感器的權重更偏向激光雷達,在城區的話就更偏向視覺。
從車廠商業化角度來講,之所以選擇多傳感器融合,是要兩倍三倍的保險,這也是為什么行業里大部分車廠的商業化路徑會選擇多重保險。
另外,現在很多人想解決的問題是在高速公路上怎么可以看得更遠,因為攝像頭沒有辦法看到更遠,這是個巨大的問題。如果我是卡車,在無法看到更遠、制動又很慢的情況下,就會出事。
《硅谷101》:特斯拉的終極目標是不是要去成為Waymo的競爭對手?
劉冰雁:我的核心觀點是,L5非常遙遠,要達到L5技術,需要的人工智能技術相對現有技術還有一個代差,不是現在可以解決的一個問題。等到那個時間,當視覺比激光雷達有了更好的感知能力,我覺得不是問題。
L5在時間線上并不是非常近的,我一定程度同意馬斯克的一個觀點,激光雷達是作弊,相當于拿了一張開卷考試,拿了一張地圖在做駕駛問題。他做的事,就是模仿人,人用肉眼可以開車,那么車也可以。激光雷達并沒有提供比視覺在遠期上來看,更多的東西。
《硅谷101》:上次我們討論的一個結論是,自動駕駛更安全,但人類更聰明,如果這句話套用到特斯拉這個案例上,其實就不成立了。
劉冰雁:我不同意,在安全這個問題上,特斯拉就是一個新聞吸引器,不管是正面的負面的新聞都往它頭上放。
《硅谷101》:所以你認為特斯拉的自動駕駛更安全?這是不是建立在正確使用的方法上?
劉冰雁:Yosemite有個說法是,造不出完美的防熊箱,最愚蠢的人和最聰明的熊之間的交集比人們想象的大得多,就是說總有人犯傻,總有人不要命。技術并不是核心問題,沒有什么安全措施,防得住犯傻的人。
《硅谷101》:所以你的說法還是建立在,我們要普及技術,要在正確使用的情況下評判它是否安全。但問題在于,當一個人開車時,如果使用自動輔助駕駛系統,但要還有集中注意力觀察,這是很難的,這是人性的問題。
劉冰雁:我非常同意,我想提兩個點,第一,安全氣囊在錯誤使用的情況下也非常危險;第二,我的體驗是,之前開車4小時去滑雪,到場就已經很累不想滑了,但后來開特斯拉就覺得開車根本不是問題。
齊蕾:他的經歷我也有,我開的不是特斯拉,是英菲尼迪。因為以前我自己開去洛杉磯,五六個小時很累,中間每兩三個小時就要休息一次。但自從開了可以定速巡航的車,接觸了更好的產品,就不會再退回到沒有這個功能的產品。
這個體驗可能在特斯拉身上更重。一旦體驗了這個功能,我再也不會去買沒有這個功能的車了。
《硅谷101》:所以你下一輛車打算買特斯拉了。
圖 | 特斯拉的自動輔助駕駛
齊蕾:我有對電動車的里程焦慮,我開到中間的時候,可能要繞到一個根本不想去的地方充電,坐在里面坐半個小時。另外從消費者的角度來講,我在新聞上天天看特斯拉出事兒,我的信任感沒那么高。
劉冰雁:我想說的恰恰是另一方面的情況,特斯拉救了命是大家是看不到的新聞。
齊蕾:就像剛剛說的,人總是有特別傻,讓你不理解的人,比如之前在北灣,有兩個開特斯拉的人直接撞到了樹上導致死亡,是因為他們倆都坐在后排。
也正是因為特斯拉如此高調宣傳自動駕駛,導致很多人要去試試。
劉冰雁:特斯拉在全自動駕駛上的宣傳,到后來已經到了笑話的程度了。馬斯克說2016年底的時候要Coast to Coast全程是吧?現在已經這么多年過去了對吧?馬斯克前兩天還說下周就要發布。
齊蕾:他老說這些話,他不是明天就要去火星了嗎?
劉冰雁:這些都是玩笑了,但我們開車中都會焦慮會走神,特斯拉可以在你走神的時候幫一把。如果你走神的時候沒有人幫一把的話,很可能就真的出事了。
齊蕾:我有很大的兩個感受,一是特斯拉用戶非常熱愛特斯拉,是發自內心的熱愛。二是在我對車有了信任和依賴感時,作為司機我是不是會更加放松,導致我不愿意再關注在開車上,而這個車可能在一兩年還沒有達到質的飛躍的時候,我自己本身的心態卻達到質的飛躍。
特斯拉有做什么事情讓用戶更警醒嗎?
劉冰雁:如果手不在方向盤,它會很快各種提醒。
《硅谷101》:其實最開始馬斯克談自動駕駛的時候,大家不會去揪著馬斯克問是在說L2的自動駕駛還是L4的,就都覺得是一個可以完全撒手的自動駕駛。
直到特斯拉自動駕駛發布好幾年后,出了很多事故,他才說這只是輔助駕駛,大家開車時手得扶著方向盤,用戶才意識到特斯拉并不是完全自動駕駛。我們之前說特斯拉不是技術問題,其實是一個宣傳問題,這點非常重要。
劉冰雁:說到技術的發展,可以再往下延伸一點,科技最終是為了什么?不管是自動駕駛技術還是別的技術,除了科學家們的好奇心之外,我覺得更多的是為了拯救生命。Waymo是最先提出不能信任人,不做L3系統,只做L4L5的系統。
《硅谷101》:Waymo提出這個,是因為他們在做自動駕駛研發中,安全員在路測過程中發現,如果不開車,還要專注看前面有沒有障礙,隨時準備接管,這是一件反人性的事情。背景是在自動駕駛很不成熟,需要隨時接管的情況下。
劉冰雁:在這個事情上我不同意他們的這種觀點。實際上他們做的事情,可以說是為了自己手上不沾血,他們在殺掉很多沉默的人。
他們相當于是說,我的自動駕駛技術沒有殺掉任何一個人;但是推遲了一個足夠好的自動駕駛技術,廣泛地進入市場中,實際上已經殺掉了很多人。
《硅谷101》:你認為即使在自動駕駛不成熟的情況下,也是比人開車更安全的?
劉冰雁:我想說的是,在人和自動駕駛一起開車的情況下,它一定比人開車更安全。
《硅谷101》:一起開車指的是,人還是集中注意力。
齊蕾:理論來講可能是成立的,但對于個體來講,你永遠都不知道現實是什么樣的,因為人的變化因素太大了。
劉冰雁:自動駕駛比人開的好應該沒錯,我就肯定沒自動駕駛開的好。
齊蕾:人肯定是更相信自己,和自己比較熟悉的東西,以及自己過去的經歷和判斷。機器會做決定,但可能會出錯,因為我們不知道里面的編碼是什么,是誰在編碼,也不知道機器是否純潔,還是被黑客黑過。
《硅谷101》:特斯拉在視覺的方案上,有哪些技術方向的升級與進步?
劉冰雁:隨著超級計算機Dojo的公布,一個比較大的改變是從基于2D的識別變為3D,在運動狀態下的識別,他們最終去分析的是3D空間中每輛車的朝向這樣的信息,而不是基于之前對二維圖片的識別。
還有很多要發展的地方,比如需要對三維空間單目或雙目的物體姿態的估計,這確實也是非常值得做的方向。特斯拉最大的優勢是,有錢又有數據,我們花錢給它當試駕員,相比Waymo的話,它的數據量級是海量的。
《硅谷101》:特斯拉披露了超級計算機Dojo,它的算力據說達到了全球第五,馬斯克還說想要達到超算能力的百億億次浮點,簡單解釋一下,具體的用途是什么?
劉冰雁:它可以用來做人工智能的模型訓練。大家是否還記得Open AI做的的語言模型GPT-3?它當時花了1600萬美元專門訓練這個模型,讓這個模型從一片混沌到能夠知道一些事。
Dojo也是用來做訓練這個過程的,讓一個什么也做不了的模型,變成一個能認出貓,認出狗,認出人,認出車的一個模型。
《硅谷101》:可以理解為它如果用于視覺識別,視覺識別的效率會提升得更快,因為之前的算力達不到?
劉冰雁:對,可能以前我訓練一個這樣的模型需要幾年的時間,在真實世界中這個時間是不可接受的。但如果加速100倍,一個電腦比它快100倍,幾年的事情可能就變成了幾天幾周,就是可被實施的事情。
齊蕾:它就是算得更快,找東西的速度更快,是嗎?
劉冰雁:差不多是這個意思,模型的規模決定了它分辨不同東西的能力,包括它的分辨精確度,規模越大越難訓練。
齊蕾:會不會有一個問題,我們并不知道模型是通過什么樣的方式算出答案的,它就是很不安全,是一個黑盒子,對于人來講它已經不可控了。
劉冰雁:我們現在整個人工智能行業,不管是激光派還是視覺派,我們所依賴的都是一個黑盒子一樣的東西。
往往都是實踐先行然后理論跟上。現在也有一些理論物理學家在這方面進行一些研究,用一些更好的方式去理解這樣的模型。現有的數學工具,是沒有辦法理解這樣一些非線性系統的,但理論物理中有一些工具能進行大規模非線性理解。所以現在有很多理論物理學家在進行這方面的研究,用更好的方式來理解模型。以后可能不是黑盒,但目前幾乎就是黑盒。
《硅谷101》:我們剛剛說了很多視覺派的優點,但即使特斯拉的人出去創業了,也是選擇做激光雷達派,比如說像RoadStar之前也做視覺派,后來轉向了激光雷達派,Auto X做攝像頭解決方案的,最后也上激光雷達了,所有一開始就向著L4和L5的自動駕駛公司,最后不約而同走向了這條路。
劉冰雁:有這樣一條簡單的路,并且成本越來越低,干嘛不走。當然還有非常有名的一句話,我們選擇它不是因為簡單,而是因為難,這就是另外的一個故事了。
《硅谷101》是一檔起源于硅谷的科技播客,分享最前沿的技術創新與商業趨勢,大家也可以在蘋果、小宇宙、喜馬拉雅、蜻蜓FM、荔枝等主流音頻渠道或者泛用性客戶端訂閱《硅谷101》的音頻節目。
更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App
2022-09-14 鈦媒體 App發布了 《星巴克加碼中國市場,未來三年要新增開3000家門店|鈦快訊》的文章
2022-08-11 鈦媒體 App發布了 《白云山麾下公司虛抬藥價“把戲”,被拆穿了》的文章
2022-07-06 鈦媒體 App發布了 《為了幫00后卷王找到工作,簡歷修改師們拼了》的文章
2022-07-06 鈦媒體 App發布了 《威尼斯向游客收“進城費”,國內城市如何借鑒?》的文章
2022-03-25 鈦媒體 App發布了 《蔚來2021年財報發布:年營收361億元,整車毛利率達到20.1%》的文章