在科技浪潮的席卷下,汽車行業(yè)正經(jīng)歷著一場顛覆性變革。AI 技術(shù)的融入,如同給傳統(tǒng)汽車產(chǎn)業(yè)注入了一股強勁的創(chuàng)新活力,加速其向智能化、數(shù)字化轉(zhuǎn)型的步伐。2025 年 2 月 18 日,汽車與人工智能領(lǐng)域迎來了一個具有里程碑意義的時刻 —— 吉利汽車集團與階躍星辰達成深度合作,將兩款階躍 Step 系列多模態(tài)大模型面向全球開發(fā)者開源。這一舉措在行業(yè)內(nèi)激起千層浪,為智能汽車的發(fā)展開辟了全新的路徑。

早在 2023 年,吉利與階躍星辰就敏銳洞察到智能汽車與 AI 融合的巨大潛力,迅速開啟深度戰(zhàn)略合作。在預(yù)訓(xùn)練大模型、垂直領(lǐng)域大模型構(gòu)建,以及應(yīng)用場景設(shè)計和工程開發(fā)等多個關(guān)鍵環(huán)節(jié),雙方緊密協(xié)作、協(xié)同創(chuàng)新。吉利憑借在汽車領(lǐng)域的深厚積累,在場景設(shè)計、模型測評和工程開發(fā)方面發(fā)揮主導(dǎo)作用,確保技術(shù)與汽車實際應(yīng)用場景完美契合;階躍星辰的國際頂尖算法團隊則在模型預(yù)訓(xùn)練中發(fā)揮關(guān)鍵作用,為模型的卓越性能筑牢根基。
從技術(shù)層面來看,階躍 Step-Video-T2V 大模型在全球開源視頻生成領(lǐng)域表現(xiàn)亮眼。它擁有 300 億參數(shù)量,能夠直接生成 204 幀、540P 分辨率的高質(zhì)量視頻,這一強大的生成能力讓它在眾多同類模型中脫穎而出。而階躍 Step-Audio 大模型同樣表現(xiàn)出色,它能根據(jù)不同場景需求,生成包含情緒、方言、語種、歌聲以及個性化風格的語音表達,實現(xiàn)與用戶自然流暢的交互,突破了傳統(tǒng)語音交互的限制,樹立了行業(yè)新標桿。

作為中國汽車行業(yè)的領(lǐng)軍者,吉利始終將智能汽車 AI 科技的創(chuàng)新與普及作為核心發(fā)展方向。2021 年,吉利以前瞻性的戰(zhàn)略眼光,搭建起端到端的自研體系與生態(tài)聯(lián)盟,涵蓋芯片、軟件操作系統(tǒng)、數(shù)據(jù)和衛(wèi)星網(wǎng)等關(guān)鍵領(lǐng)域,構(gòu)建起 “智能吉利科技生態(tài)網(wǎng)”,為后續(xù)智能駕駛和智能座艙的持續(xù)升級奠定了堅實基礎(chǔ)。2022 年,吉利建成全球首個 “云、數(shù)、智” 一體化的星睿智算中心,強大的算力為技術(shù)突破提供了有力支撐。2023 年,吉利發(fā)布全球首個汽車行業(yè)全棧自研全場景 AI 大模型 —— 星睿 AI 大模型,憑借卓越性能榮獲中國通信院 “4 + 級” 最高評級。2025 年,吉利再次發(fā)力,推出行業(yè)首個 “智能汽車全域 AI” 技術(shù)體系,展現(xiàn)出在智能汽車領(lǐng)域持續(xù)深耕、不斷創(chuàng)新的決心與實力。
在兩款開源多模態(tài)大模型以及汽車行業(yè)全場景大模型的綜合賦能下,吉利在智能汽車應(yīng)用層面取得了顯著突破。在行車安全、緊急避險、智慧泊車等場景中,用戶能夠享受到更高級別的自動駕駛體驗,行車安全性大幅提升;與此同時,更具智能化的汽車情感座艙正在加速構(gòu)建,通過自然交互的方式,為用戶帶來更加個性化、人性化的出行體驗,有力推動了 AI 科技在智能汽車領(lǐng)域的廣泛應(yīng)用。
以吉利星睿 AI 大模型中的 ADrive 大模型為例,它具備強大的場景生成與規(guī)劃能力,能夠精準模擬各種復(fù)雜的駕駛場景,無論是惡劣的雨雪天氣、復(fù)雜的道路結(jié)構(gòu),還是擁堵的路況以及特殊的交通目標,都能輕松應(yīng)對。通過利用真實駕駛視頻數(shù)據(jù)對階躍 Step-Video-T2V 進行優(yōu)化,成功將其轉(zhuǎn)化為自動駕駛數(shù)據(jù)合成器,為自動駕駛系統(tǒng)提供海量、豐富的訓(xùn)練數(shù)據(jù),從而顯著提升車輛應(yīng)對復(fù)雜路況的能力,全方位保障行車安全。

得益于階躍 Step-Audio 強大的交互能力,吉利星睿 AI 大模型在語音交互方面實現(xiàn)了質(zhì)的飛躍。當用戶下達 “導(dǎo)航,快遲到了” 這樣的指令時,系統(tǒng)不僅能快速規(guī)劃出最優(yōu)路線,還能敏銳感知用戶的情緒,主動提供舒緩的音樂,給予用戶貼心關(guān)懷。此外,該系統(tǒng)還支持多種方言識別,提供個性化聲音定制服務(wù),用戶既可以從系統(tǒng)預(yù)設(shè)的人聲音色中自由挑選,也能錄制家人的聲音,甚至可以模擬自然音效,為每一次出行增添更多溫馨與舒適。
值得一提的是,吉利在 AI 融合發(fā)展方面走在了行業(yè)前列,成為首家與 DeepSeek 深度融合的車企。通過與 DeepSeek-R1 模型合作,吉利將對星睿車控 FunctionCall 大模型、汽車主動交互端側(cè)大模型等進行蒸餾訓(xùn)練。未來,吉利智能汽車 AI 將具備更強大的能力,不僅能精準理解用戶意圖,準確調(diào)用約 2000 個車載接口,還能基于車內(nèi)外場景主動洞察用戶的潛在需求,主動為用戶提供全方位的服務(wù),極大提升智能交互體驗,加速 AI 在智能汽車領(lǐng)域的普及。

目前,基于 “智能汽車全域 AI” 技術(shù)體系打造的 A 銀河精靈、Flyme Auto 智能座艙、無界空間、AI 云動力、AI 繪本、AI 哨兵等一系列 AI 應(yīng)用,已在銀河 E8、銀河 E5、銀河星艦 7EM-i 等車型上成功搭載,為用戶帶來了前所未有的智能化駕乘體驗。今年 3 月初,吉利還將發(fā)布重磅 AI 智能化戰(zhàn)略,加速 AI 數(shù)字底盤、高階智能駕駛等前沿技術(shù)在更多車型上的應(yīng)用,持續(xù)引領(lǐng)智能汽車行業(yè)的創(chuàng)新發(fā)展潮流,為用戶帶來更加智能、便捷、舒適的出行新體驗。