吉利携手阶跃星辰共建多模态大模型

“独行快,众行远”。

先分享个挺有意思的设想:以后咱们挑车,销售员不再只强调百公里加速,而是自豪地说:“咱这车代码是开放的,全球程序员都在帮着优化,稳定程度堪比你家电视!” 听到这,是不是瞬间觉得科技感十足?

这并非空穴来风。

不久前,吉利与阶跃星辰联手,做了件引人瞩目的大事:直接把两款多模态大模型——负责视频生成和语音交互的,向全社会开放。

以往,车企将核心技术视若珍宝,如今却选择共享,这转变着实令人意外。

事情的脉络是这样的:四月十日,吉利汽车发布公告,宣布与阶跃星辰携手,开源Step-Video-T2V视频生成模型和Step-Audio语音交互模型。

其中,Step-Video-T2V模型参数高达三百亿,号称目前全球规模最大的开源视频生成模型,能够生成540P分辨率的影像。

它的优势在于能够模拟各种自动驾驶场景,从而大幅减少车企在实际道路上采集数据的成本。

据估算,这能使智能驾驶系统的训练效率提升超过四成。

要知道,自动驾驶训练向来是资金消耗的大头,这无疑能节省不少开支。

另一款Step-Audio,则是首个产品级别的开源语音模型,不仅支持多种方言,还能定制个性化的声纹。

这项技术已应用于银河E8等车型,用户对语音交互的满意度提升显著。

想象一下,未来行车途中,你用熟悉的家乡话与车辆交流,它不仅能准确理解,还能用你的声音回应,这种体验是不是更贴心?

那么,此举究竟有何深远意义?吉利这步棋,蕴含着深刻的战略考量。

其战略意图在于构建一个蓬勃发展的生态圈。

通过开源策略,吸引全球开发者共同参与技术迭代,形成一个“技术共享-应用拓展-数据反哺”的良性闭环。

当下,吉利星睿智算中心的算力已达到102EFLOPS,结合DeepSeek-R1模型蒸馏训练,能够精准调用超过两千个车载接口。

这如同搭建乐高积木,只有遵循统一标准,各方才能协同合作。

为何要采取这种策略?

关键在于,智能汽车领域的竞争,已不再局限于硬件性能的比拼,更侧重于软件实力和生态构建。

以苹果手机为例,其卓越之处不仅在于硬件,更在于其庞大的App Store生态系统。

吉利希望借鉴这一成功模式,通过开源在车用AI标准制定方面抢占先机,成为行业规则的制定者。

这对普罗大众而言,又意味着什么?

最直接的益处是,将来购车时,或许无需再为昂贵的智能驾驶选装包额外付费。

吉利携手阶跃星辰共建多模态大模型-有驾

因为随着开源的推进,相关技术的普及速度将加快,成本也将随之降低,最终惠及广大消费者。

以特斯拉的Autopilot为例,虽然技术领先,但价格相对较高。

如果更多车企采用开源的智能驾驶技术,市场竞争势必加剧,价格也会更加亲民。

如同智能手机的发展历程,最初只有少数高端机型具备智能功能,如今几百元的手机也能实现各种智能应用。

再来看语音交互方面。

过去,车载语音助手反应迟缓、识别率低,实用性大打折扣。

然而,随着人工智能技术的飞速发展,车载语音助手正变得越来越智能。

若有更多车企采用开源语音模型,用户体验必将得到显著提升。

未来,只需动动嘴,便能轻松控制车辆,实现导航、听音乐乃至在线购物等功能。

当然,开源并非毫无风险。

人们可能会担心技术被滥用,或者商业机密遭到泄露。

这些都是需要认真权衡的问题。

开源就像一把双刃剑,运用得当,能推动技术进步;反之,则可能反噬自身。

回顾吉利的发展历程,2023年新能源汽车销量同比增长超过六成,其中搭载AI银河精灵等应用的E系列车型贡献了超过六成的营收增长。

此次开源行动,无疑将加速AI数字底盘、高阶智能驾驶等技术在银河星舰7EM-i等新款车型上的应用。

预计到2025年第二季度,相关技术模块的普及率将突破50%。

有研究机构预测,吉利AI技术模块对外供应的潜力或将于2026年得到释放,届时相关业务的利润率有望达到65%-70%。

这表明,开源不仅是一种情怀,更是一种商业模式。

目前,我们需要密切关注吉利在五月份发布的2024年第一季度财报中,研发费用率的变化,以及极氪分拆上市的进展。

这些数据将有助于我们更深入地剖析吉利开源战略的真实意图。

综上所述,吉利此次开源举措,不仅仅是一家车企的技术革新,更是一次对智能汽车产业生态的深刻重塑。

它如同一颗石子,投入平静的湖面,激起阵阵涟漪。

至于这涟漪最终会将智能汽车产业引向何方,让我们共同拭目以待。

我们所能做的,是保持敏锐的洞察力,勤于思考,并满怀憧憬地迎接一个更加智能、更加便捷的未来。

0

全部评论 (0)

暂无评论