•  汽配軟件使用幫助  汽修軟件使用幫助  
    •  汽配號:
    •  密碼:
    •  
    •   忘記密碼
    •   免費注冊
    •  汽車配件城市聯(lián)盟
    •   新聞投稿
    •   

    汽車配件110網(wǎng)

    • 資訊中心國際國內(nèi)企業(yè)地方
      行業(yè)快報 展會統(tǒng)計研究政策特種車
    • 汽配黃頁電動車摩托車重型車配件
      加盟商家修理廠農(nóng)用車軸承物流
    • 配件搜索品牌專區(qū)汽車用品
      汽配采購 汽配供求
    • 汽修百科電動車汽車改裝保養(yǎng)
      摩托車汽車裝飾
    • QQ群
      汽配城
    當(dāng)前位置:汽車配件110網(wǎng) >> 汽配資訊 >> 行業(yè)快報 >> 理想創(chuàng)始人李想再度發(fā)聲:不追特斯拉 FSD,自己的老師是 DeepSeek

    理想創(chuàng)始人李想再度發(fā)聲:不追特斯拉 FSD,自己的老師是 DeepSeek

     愛范兒  匿名 行業(yè)快報 2025/5/9 1  

    今年 3 月,英偉達(dá) 2025 春季 GTC 大會,理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在臺上介紹了他們的最新成果:MindVLA 大模型。


    這是一個擁有 22 億參數(shù)的視覺-語言-動作(Vision-Language-Action Model,VLA)模型,賈鵬進(jìn)一步介紹稱,他們已經(jīng)成功將該模型部署于車端。在理想看來,VLA 模型是解決 AI 與物理世界交互難題最有效的方法。


    在過去的一年里,端到端架構(gòu)成為智能駕駛領(lǐng)域的技術(shù)熱點,推動車企從傳統(tǒng)的分模塊規(guī)則設(shè)計轉(zhuǎn)向一體化系統(tǒng)。曾憑借規(guī)則算法領(lǐng)先的車企面臨轉(zhuǎn)型陣痛,而后發(fā)者則抓住了彎道超車的機(jī)會。


    理想便是其中的代表。


    理想去年在智能駕駛上的進(jìn)步可謂飛快,7 月份就率先實現(xiàn)了全國無圖 NOA(導(dǎo)航輔助駕駛),還推出了獨特的「端到端(快系統(tǒng))+VLM(慢系統(tǒng))」架構(gòu),受到行業(yè)廣泛關(guān)注。




    今晚,隨著理想 AI Talk 第二季進(jìn)行,我們對李想口中的「人工智能公司」有了更深的了解。


    是「司機(jī)大模型」,也是你的司機(jī)
    理想汽車 CEO 李想第一次提到 VLA,是在去年 12 月的與騰訊新聞科技主筆張小珺對談的 AI Talk 第一季上。當(dāng)時他說:


    我們在做的理想同學(xué)和自動駕駛,按照行業(yè)的標(biāo)準(zhǔn)其實是分割開的,處于早期階段。我們做的 Mind GPT,其實是大語言模型;我們在做的自動駕駛,我們自己內(nèi)部叫行為智能,但是像李飛飛(斯坦福終身教授、前 Google 首席科學(xué)家)的定義,叫空間智能。只有你真正大規(guī)模去做的時候,你才知道,這兩個之間,有一天一定會連在一起,我們自己內(nèi)部叫 VLA(Vision Language Action Model,視覺語言行動模型)。


    李想認(rèn)為,基座模型到一定時刻一定會變成 VLA。原因在于,語言模型只能通過語言和認(rèn)知去理解三維的世界,這是顯然不夠的!杆枰嬲蛄康,用 Diffusion(擴(kuò)散模型)的方式,用生成的方式(去認(rèn)識世界)」。


    可以說,VLA 的誕生,既是對語言智能和空間智能深度結(jié)合的一次大膽嘗試,也是理想汽車對「智能汽車」概念的一次重新詮釋。




    李想在今晚的 AI Talk 中進(jìn)一步定義:「VLA 是一個司機(jī)大模型,像人類的司機(jī)一樣去工作!顾粌H是一項技術(shù),更是一個能與用戶自然溝通、自主決策的智能伙伴。


    那么,VLA 究竟是什么?核心其實非常直白:通過整合視覺感知、自然語言理解和動作生成能力,讓車輛變成一個能與人溝通、能自己做決定的「司機(jī) Agent」。




    導(dǎo)航走 ETC 時,駕駛員可以直接命令系統(tǒng)走人工通道(輔助駕駛開啟狀態(tài))


    想象一下,你坐在車?yán),隨口說一句「今天有點累,開慢點吧」,車輛不僅能聽懂你的意思,還會調(diào)整速度,甚至選擇一條更平穩(wěn)的路線。這種自然流暢的交互,正是 VLA 想要實現(xiàn)的。李想透露,所有的短指令,都有由車端直接處理,復(fù)雜指令則交由云端 32 億參數(shù)模型解析,確保高效與智能兼得。




    實現(xiàn)這樣的目標(biāo)并不容易。VLA 的特別之處在于,它把視覺、語言和動作三個維度打通了。用戶的一個簡單指令背后,可能涉及到對周圍環(huán)境的實時感知、對語言意圖的精準(zhǔn)理解,以及對駕駛行為的快速調(diào)整,三者缺一不可。


    而 VLA 的厲害之處就在于,它能讓這三者無縫協(xié)作。


    從愿景到現(xiàn)實,VLA 的研發(fā)是一片無人區(qū)。李想坦言:「視覺和動作數(shù)據(jù)的獲取最為困難,沒有公司能替代。」


    要理解 VLA 的技術(shù)底色,還得看看理想汽車在智能駕駛上的演進(jìn)脈絡(luò)。


    李想表示,早期的系統(tǒng)是「昆蟲級別」智能,僅有百萬參數(shù),靠規(guī)則和高精地圖驅(qū)動,遇到復(fù)雜路況就束手無策。后來,端到端架構(gòu)和視覺-語言模型讓技術(shù)躍升至「哺乳動物級別」,擺脫地圖依賴,全國無圖 NOA 成為現(xiàn)實。


    實際上,這一步已經(jīng)讓理想汽車走在了行業(yè)前列,但他們顯然不滿足于此。在李想看來,VLA 的出現(xiàn),標(biāo)志著理想汽車的智能駕駛技術(shù)邁入了「人類智能」的新階段。




    相比之前的系統(tǒng),VLA 不僅能感知 3D 物理世界,還能進(jìn)行邏輯推理,甚至生成接近人類水平的駕駛行為。


    舉個簡單的例子,假設(shè)你在一條擁堵的街道上說「找個地方掉頭」,VLA 不會機(jī)械地執(zhí)行指令,而是會綜合路況、車流和交通規(guī)則,找到一個最合理的時間和位置完成掉頭。


    李想表示,VLA 能通過生成數(shù)據(jù)快速適應(yīng)新場景,哪怕初次遇到復(fù)雜修路,三天內(nèi)也能優(yōu)化應(yīng)對。這種靈活性和判斷力,正是 VLA 的核心優(yōu)勢。


    理想的老師,是 DeepSeek
    支撐 VLA 的,是理想汽車自研的一套復(fù)雜而精妙的技術(shù)體系。這套體系讓汽車不僅能「看懂」世界,還能像人類司機(jī)一樣思考和行動。


    首先是 3D 高斯表征技術(shù),即用很多個「高斯點」來拼出一個 3D 物體,每個點都含有自己的位置、顏色和大小等信息。這項技術(shù)通過自監(jiān)督學(xué)習(xí),利用海量真實數(shù)據(jù)訓(xùn)練出一個強(qiáng)大的 3D 空間理解模型。有了它,VLA 就能像人一樣「看懂」周圍的世界,知道哪里是障礙物,哪里是可通行區(qū)域。




    當(dāng)記憶車位被占,系統(tǒng)會自動尋找其他車位。還能聽懂駕駛員指令,通過墻上的指示牌找到「C3 區(qū)」


    接著是混合專家架構(gòu)(MoE),該架構(gòu)由專家網(wǎng)絡(luò)、門控網(wǎng)絡(luò)和組合器組成。當(dāng)模型參數(shù)超過千億級別時,傳統(tǒng)方法會讓所有神經(jīng)元參與每個計算,比較浪費資源,MoE 架構(gòu)中的門控網(wǎng)絡(luò)會根據(jù)任務(wù)的不同調(diào)用不同的專家,保證激活參數(shù)不會大幅增加。


    聊到這里,李想還順帶夸了一下 DeepSeek:


    DeepSeek 運用了人類的最佳實踐…… 他們在做 DeepSeek V3 的時候,其實 V3 也是一個 MoE 的,671B 的一個模型。我覺得 MoE 是個非常好的架構(gòu)。它相當(dāng)于把一堆專家組合在一起,然后每一個是一個專家能力。


    最后,理想為 VLA 引入了稀疏注意力機(jī)制(Sparse Attention) ,說人話就是 VLA 會自動調(diào)整關(guān)鍵區(qū)域的注意力權(quán)重,從而提升端側(cè)的推理效率。


    李想表示,在這個新的基座模型訓(xùn)練過程中,理想的工程師們花了很多時間去找到最佳的數(shù)據(jù)配比,融入了大量 3D 數(shù)據(jù)和自動駕駛相關(guān)的圖文數(shù)據(jù),并減少了文史類數(shù)據(jù)的比例。


    從感知到?jīng)Q策,VLA 借鑒了人類思維的快慢結(jié)合模式。它既能快速輸出簡單的動作決策,比如緊急避讓,也能通過短思維鏈進(jìn)行「慢思考」,應(yīng)對更復(fù)雜的場景,比如臨時規(guī)劃一條繞開施工區(qū)域的路線。為了進(jìn)一步提升實時性,VLA 還引入了投機(jī)推理和并行解碼技術(shù),充分利用車端芯片的算力,確保決策過程快而不亂。


    在生成駕駛行為時,VLA 用到了 Diffusion 模型和基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。Diffusion 模型負(fù)責(zé)生成優(yōu)化的駕駛軌跡,而 RLHF 則讓這些軌跡更貼近人類習(xí)慣,既安全又舒適。比如,VLA 會在轉(zhuǎn)彎時自動減速,或者在并線時留出足夠的安全距離,這些細(xì)節(jié)都體現(xiàn)了對人類駕駛行為的深度學(xué)習(xí)。




    世界模型是另一關(guān)鍵技術(shù),理想通過場景重建和生成,為強(qiáng)化學(xué)習(xí)提供了高質(zhì)量的虛擬環(huán)境。李想透露,世界模型將驗證成本從每萬公里 17-18 萬元降至 4000 元。它讓 VLA 在模擬中不斷優(yōu)化,應(yīng)對復(fù)雜場景如履平地。


    說到訓(xùn)練,VLA 的成長過程也頗有章法。整個流程分為三個階段:預(yù)訓(xùn)練、后訓(xùn)練和強(qiáng)化學(xué)習(xí)!割A(yù)訓(xùn)練像學(xué)習(xí)知識,后訓(xùn)練像駕校學(xué)車,強(qiáng)化學(xué)習(xí)像社會實踐!估钕胝f。




    預(yù)訓(xùn)練階段,理想汽車為 VLA 打造了一個視覺-語言基座模型,塞進(jìn)了豐富的 3D 視覺數(shù)據(jù)、2D 高清影像和駕駛相關(guān)的語料,讓它先學(xué)會「看」和「聽」;后訓(xùn)練加入動作模塊,生成 4-8 秒駕駛軌跡,模型從 32 億參數(shù)擴(kuò)大到 40 億。




    強(qiáng)化學(xué)習(xí)分為兩步:先用 RLHF 對齊人類習(xí)慣,分析接管數(shù)據(jù),確保安全舒適;再用純強(qiáng)化學(xué)習(xí)優(yōu)化,基于 G 值(舒適性)、碰撞和交通規(guī)則反饋,讓 VLA「開得比人類更好」。李想提到,這一階段在世界模型中完成,模擬真實交通場景,效率遠(yuǎn)超傳統(tǒng)驗證。




    這樣的訓(xùn)練方式,既保證了技術(shù)上的先進(jìn)性,也讓 VLA 在實際應(yīng)用中足夠可靠。


    李想坦言,VLA 的成功離不開行業(yè)標(biāo)桿的啟發(fā)。DeepSeek 的 MoE 架構(gòu)不僅提升了訓(xùn)練效率,還為理想提供了寶貴經(jīng)驗。他感慨:「我們站在巨人的肩膀上,加速了 VLA 的研發(fā)。」這種開放學(xué)習(xí)的態(tài)度,讓理想在無人區(qū)中走得更遠(yuǎn)。


    從「信息工具」到「生產(chǎn)工具」
    當(dāng)下,AI 行業(yè)正經(jīng)歷一場從「信息工具」到「生產(chǎn)工具」的深刻變革。隨著大模型技術(shù)的成熟,AI 不再局限于處理數(shù)據(jù)和提供建議,而是開始具備自主決策和執(zhí)行任務(wù)的能力。


    李想在 AI Talk 第二季中提出,AI 可分為信息工具(如搜索)、輔助工具(如語音導(dǎo)航)和生產(chǎn)工具。他強(qiáng)調(diào):「人工智能變成生產(chǎn)工具,才是真正爆發(fā)的時刻。」隨著大模型技術(shù)成熟,AI 不再局限于處理數(shù)據(jù),而是開始具備自主決策和執(zhí)行任務(wù)的能力。


    這種趨勢,在「具身智能」概念中體現(xiàn)得尤為明顯——AI 系統(tǒng)被賦予物理實體,能夠感知、理解并與環(huán)境互動。




    理想汽車的 VLA 模型正是這一趨勢的生動實踐。它通過整合視覺、語言和動作智能,將汽車打造成一個能夠自主駕駛、與用戶自然交互的智能體,完美詮釋了「具身智能」的核心理念。


    只要人類會雇傭?qū)I(yè)司機(jī),人工智能就能成為生產(chǎn)工具。當(dāng) AI 成為生產(chǎn)工具時,人工智能才會真正爆發(fā)。


    李想的這段話,點明了 VLA 的核心價值——它不再是簡單的輔助工具,而是能夠獨立執(zhí)行任務(wù)、承擔(dān)責(zé)任的「司機(jī) Agent」。這種轉(zhuǎn)變,不僅提升了汽車的實用價值,也為 AI 在其他領(lǐng)域的應(yīng)用打開了想象空間。


    李想對 AI 的思考,總是帶著一種跳出框框的視角。他還提到:「VLA 不是突變的過程,是進(jìn)化的過程!惯@句話精準(zhǔn)概括了理想汽車的技術(shù)路徑——


    從早期的規(guī)則驅(qū)動,到端到端的突破,再到如今 VLA 的「人類智能」水平。這種進(jìn)化思維,不僅讓 VLA 在技術(shù)上更具可行性,也為行業(yè)提供了可借鑒的范式。相比一些一味追求顛覆的嘗試,理想的務(wù)實路徑或許更適合復(fù)雜的中國市場。


    從技術(shù)到信念,理想的 AI 探索并非坦途。李想坦言:「我們在 AI 領(lǐng)域經(jīng)歷了很多挑戰(zhàn),就像黎明前的黑暗,但我們相信,堅持下去就會看到光!筕LA 的研發(fā)面臨算力瓶頸、數(shù)據(jù)倫理等難題,但理想通過自研基座模型和世界模型,逐步迎來了屬于他們的技術(shù)曙光。


    李想在采訪中還提到,VLA 的成功離不開中國 AI 的崛起。


    他表示,DeepSeek、通義千問等模型的出現(xiàn)讓中國 AI 水平迅速接近美國。其中,DeepSeek 所秉持的開源精神尤為令人振奮,它直接直接促使理想開源星環(huán) OS。李想稱:「這不是出于公司戰(zhàn)略考量,DeepSeek 給我們那么大幫助,我們應(yīng)該為社會貢獻(xiàn)點什么。」




    在追求技術(shù)突破的同時,理想汽車并未忽視 AI 技術(shù)的安全性和倫理問題。VLA 引入的「超級對齊」技術(shù),通過基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF),讓模型的行為更貼近人類習(xí)慣。數(shù)據(jù)顯示,VLA 的應(yīng)用使高速 MPI(平均干預(yù)里程)從 240km 提升至 300km。


    更重要的是,理想汽車強(qiáng)調(diào)打造「有人類價值觀的 AI」,將道德和信任視為技術(shù)發(fā)展的基石。從更宏觀的視角看,VLA 的意義還在于,它重新定義了車企這一角色。


    過去,汽車是工業(yè)時代的交通工具;如今,它正在演變?yōu)槿斯ぶ悄軙r代的「空間機(jī)器人」。李想在 AI Talk 中提到:「理想以前走的是汽車的無人區(qū),以后走的是人工智能的無人區(qū)!估硐氲倪@種轉(zhuǎn)變,為汽車行業(yè)的商業(yè)模式帶來了新的想象空間。


    當(dāng)然,VLA 的發(fā)展并非沒有挑戰(zhàn)。算力的持續(xù)投入、數(shù)據(jù)倫理以及消費者對自動駕駛的信任建立,都是理想汽車需要面對的課題。此外,AI 行業(yè)的競爭日趨激烈,國內(nèi)外巨頭如特斯拉、Waymo 和 OpenAI 都在加速布局多模態(tài)模型,理想需要在技術(shù)迭代和市場推廣上保持領(lǐng)先!肝覀儧]有捷徑,只能深耕。」李想說。


    毫無疑問,VLA 的落地將是關(guān)鍵節(jié)點。


    理想汽車計劃在 2025 年 7 月與純電 SUV 理想 i8 同步發(fā)布 VLA,并在 2026 年實現(xiàn)量產(chǎn)。這不僅是對技術(shù)的一次全面檢驗,更是市場的一塊重要試金石。


    李華 (李華)

    汽配新聞目錄索引

    • 國際新聞
    • 國內(nèi)新聞
    • 行業(yè)快報
    • 企業(yè)資訊
    • 地方新聞
    • 展會快訊
    • 汽配城動態(tài)
    • 行業(yè)統(tǒng)計
    • 研究報告
    • 政策法規(guī)
    • 原料報價
    • 電動車
    • 分析預(yù)測評論
    • 品牌汽車維修
    • 汽車保養(yǎng)維修
    • 汽車電器維修

    最新汽配加盟商

    更多>>

    • 河北鈦通濾清器有限公司
    • 珠海市鴻業(yè)汽配
    • 烏魯木齊恒威達(dá)汽配
    • 寧鄉(xiāng)天合汽配新城店
    • 廣州祥達(dá)拆車件昆明分店
    • 懷化市鑫輝汽配商行
    • 臨滄志鵬汽車服務(wù)有限公司
    • 中興汽配
    • 東石汽配批發(fā)
    • 喀什鑫日日產(chǎn)服務(wù)中心
    • 廣東福運汽車配件商行
    • 山東欣豐動力設(shè)備有限公司
    • 杭州誠信德汽配有限公司
    • 綿陽華裕汽車零部件有限公司
    • 昆明華銳汽配

    最新汽配供求

    • 聚合物POM 150-NC010
    • 聚合物POM II150E-BK
    • 聚合物POM 7467
    • 聚合物POM 988P
    • 聚合物POM 907F
    • 聚合物POM 900F
    關(guān)于汽配110網(wǎng) | 各地汽配QQ群 | 網(wǎng)站建議反饋 | 友情鏈接 | 聯(lián)系我們 | 代理合作 | 會員服務(wù) | 全國汽車配件聯(lián)盟 | 廣告招商 | 收藏本站 | 網(wǎng)絡(luò)交易安全提示 | 網(wǎng)站免責(zé)聲明

    版權(quán)所有:汽配110網(wǎng) m.js459.com 汽車后服務(wù)市場專業(yè)網(wǎng)絡(luò)平臺 懷化好易簡科技有限公司 湘ICP備12007470號 E-mail:21398357@qq.com
    汽車配件110網(wǎng) Weixin

    湘公網(wǎng)安備 43120202000083號

    感谢您访问我们的网站,您可能还对以下资源感兴趣:

    天天高清无码347