产品 +

iEnter|智慧企业 +

企业资源计划管理系统

智钉

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

710公海EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

寰宇智能网联云平台

新能源汽车监控平台

商用车企业监控平台

电检系统

行驶记录仪

车载T-BOX

710公海寰宇汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

智慧质量

线索运营

智慧广告

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎(QKP)

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

数据中台

智能运维平台

服务 +

咨询 +

车路协同解决方案

IT咨询

云原生技术架构规划与咨询服务

评测 +

网络安全等级保护测评

实施 +

电子电气检测服务

网联产品组装制造

运维 +

桌面及外围设备运维服务

云服务(IDC)

销贷服务

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

K8s运维

关于710公海寰宇 +

企业简介 +

企业简介

企业价值 +

企业荣誉

行业地位

资质认证

社会责任 +
企业文化 +
投资者关系 +
麾下企业 +
加入710公海寰宇 +

业务发展规划

福利待遇

人才招聘

信息公开 +

企业基本信息 +

企业概况

经营范围

市场主体登记基本信息

组织机构

成员单位

资质荣誉

企业重大事项 +

股权信息

产权信息

研发成果

企业经营管理 +

财务与经营状况

品牌与产品

安全环保 +

安全信息

招标招募 +

招标信息

人力资源 +

招聘信息

社会责任 +
企业公告 +

上市公司

公告信息

投资者关系

加入710公海寰宇

客户留言

中国·710公海寰宇-对话千寻智能韩峰涛:真正的机器人是生产力,不是展品和玩具
2026-04-14 10:05:54

  

雷峰网讯 “就于这栋楼下面,26年就会有一个上千人的数据收罗团队,打击100万小时数据年夜关。”韩峰涛忽地探身,手指地面,恍如下一代具身模子已经经被他攥于掌心。

1月12日,千寻智能公布开源具身模子Spirit v1.5。于RobotChallenge的最新榜单中,它逾越此前国际标杆Pi0.5,成为迄今为止,全世界最强开源具身模子。

开源前两天,咱们于千寻智能北京总部,见到了开创人韩峰涛,举行了一次深度对于话。

对话千寻智能韩峰涛:真正的机器人是生产力,不是展品和玩具

具身智能技能的繁荣暗地里有另外一番情形:花腔迭出的演示demo层见叠出,但试验室外一项叠衣服使命就能够难住年夜大都厂商。于这类配景下,Spirit v1.5让人看到了具身智能真正解放人类出产力的可能。

RobotChallenge测试项目中包罗插花、桌面清算等30个桌面项目,旨于还有原真什物理世界的同时,引入随机扰动增长泛化挑战。当名为试验室的“温室”被移除了,Spirit v1.5仍旧到达了50%以上的使命乐成率,作为对于比的是Pi0.5模子42.67%的成就。

一个要害的问题于在,Spirit v1.5究竟是“挤牙膏”之作,还有是标记着具身模子快速爬升期的最先?韩峰涛坚信是后者。

2026年被他描写成一个布满竞争及但愿的年份,数据及算法收敛,具身模子机能经由过程scaling的方式快速爬升,火热的融资紧随其后。近似的故事发生于2023年,主角是年夜语言模子。

“26年之在具身智能,就是23年之在年夜语言模子,”韩峰涛说,“具身智能的GPT moment必然会于26年呈现。”

数据数目加数据质量决议模子质量。为此,千寻智能要将自建的数据工场扩张至近千人范围。而作为行业少见的模子、本体并举的全栈公司,韩峰涛选择自研硬件的初志也是为模子提供更高质量的数据。由于模子及硬件绑定,结合设计,软硬一体,效果最佳。

“最佳的呆板人就是你本身做的呆板人。”他说。

韩峰涛的另外一重身份,也许可以注释他对于具身模子的深信。

2014年被称为中国工业呆板人元年,同年年末,韩峰涛及火伴创建了珞石呆板人,这家公司于往后跻身国产工业呆板人前三。一段差未几同期的汗青进程,是整个中国工业呆板人行业的突起。从2015年到2024年,国产工业呆板人的市场据有率从3%跃升至50%。

读懂已往的人会看到将来。当韩峰涛创建千寻智能时,他知道具身智能其实不新鲜。曾经经的研究者测验考试把深度进修技能用于呆板人身上,但其时AI的智能程度还有不足以胜任严厉的出产力场景,终极落地的只有NLP、智能音箱或者是扫地呆板人。

那为何咱们今天会期待,呆板人可以真正干活?

“这一代具身智能的焦点变量只有一个,就是AI技能发生的革命性变化,让呆板人的年夜脑真正有可能可用了。以是真实的具身智能公司,要思索的焦点问题只有一个,怎么让具身模子进化?”

一个无可反驳的事实是,一样于百亿级资金的投入下,具身智能的成长速率远掉队在年夜语言模子及主动驾驶。韩峰涛将之归因在数据的匮乏。

已往20余年里互联网上堆集的数字资产撑持了年夜语言模子的快速发作,主动驾驶虽然一样遭受过数据欠缺,但没有智驾功效的车也会有人买,这为边卖产物边采数据提供了可能。相较之下,没有年夜脑的呆板人彻底没用,这类产物性子让具身智能的数据飞轮更难以启动。只有先收罗充足的冷启动数据,让模子可以或许支撑呆板人进入严厉的出产场景,才能再现昔时人们边开车边采数的历程。

怎样把能干活的呆板人卖出去成了千寻最要害的命题。·“干活”,一个半小时的采访中韩峰涛平均每一两分钟提到这个词一次。“跳舞跳一万次也是一条数据,展品卖出去上千台等在卖出一台。你必需要把那种由模子驱动的、能干活的呆板卖出去,才能让数据飞轮转起来。”他说。

特斯拉、蔚小理……你可以从韩峰涛的讲述中看到许多公司的影子。而归根结柢,千寻是千寻智能,而不是千寻呆板人。

如下是雷峰网及韩峰涛的对于话,作者举行了不转变原意的编纂收拾:

千寻智能,再也不拿着锤子找钉子

雷峰网(公家号:雷峰网):于千寻智能以前,你于2014年创建了珞石呆板人。这十多年里先是中国呆板人行业履历了快速成长期,然后整个行业从工业呆板人转向了智能呆板人的竞争。作为两个汗青进程的亲历者,你会怎么给中国于世界呆板人行业所处的位置划分阶段?

韩峰涛:四个阶段。2010年以前,海内的工业呆板人还有是全入口。10年到20年算是成长期,这段时间里国产的零部件、整机于逐步成长,可是市场据有率的晋升不高,可以说还有比力弱势。一方面其时方才起步,海内客户对于国产机的接管度低。并且相干人材也少,许多厂商都是去航空航天、机械这些专业把人招来,本身造就。还有有一部门缘故原由是工业周期长,市场比力小,以是那会的投资人对于工业没甚么观点。直到2015年摆布,呆板人、半导体、高端设备、医药这些泛工业标的目的的投资才最先逐步变多。

20年疫情最先以后,外洋的厂商停产比力严峻,只有中国还有于正常运行。以是当外洋缺货的时辰,也只有中国的呆板人能供上货,客不雅上讲疫情给了中国呆板人行业一个巨年夜的助推。那几年里国产呆板人的市场据有率上来了,零部件由于各人用患上更多,也更成熟了。

2015年国产呆板人的市场据有率年夜概3%,2024年就到50%以上了。国产工业呆板人的突起,也就是19年到23年的事。

从24年最先,就是具身智能的竞争了。23年以前中国呆板人行业处于以硬件、小脑为焦点的入口替换阶段,从24年最先,就要进入以年夜脑为焦点的智能机型时代。于这个时代,有人认为未来年夜脑成熟以后必定需要许多本体,以是为了办事年夜脑最先弄本体、呆板狗。有人认为既然焦点是年夜脑,就最先弄年夜脑,好比咱们。总之24年是个分界点,这以前的机型都因此小脑、运控及硬件为主,以后因此年夜脑为焦点。到今天颠末两年的成长,具身模子于26年就要进入快速进化的阶段。

前三个阶段咱们都于追逐,可是到第四个阶段,中国可以说真正跟海外的敌手齐头并进了。

雷峰网:高阳曾经经说,假如海内的具身团队买了呆板人,练习历程中出了妨碍可以寄归去修,一周就能邮回来。如许几台呆板人轮流上,效率会很快。但宇树不克不及如许给美国的科研团队维修,只能一次性多寄点配件,致使很华侈时间。你认为中国于工业呆板人范畴的上风,会怎样影响今天缭绕具身智能的竞争?

韩峰涛:本来常常有人说,中国有供给链,以是中国的企业就能够拿到自制的零部件。但特斯拉的供给链也于中国,假如中国有好的供给链,外洋的厂商也会买,以是价格这件事上中国企业不存于上风。

那末供给链的重要上风于在甚么呢?于在这个供给链系统可让咱们的迭代速率很是很是快。高阳给你举的例子还有只是于科研,当供给链就于我24小时包邮区以内,我的产物可以根据天来迭代。一小我私家于深圳做智能硬件,打板厂、芯片厂、焊接厂、维修厂城市于一个半小时车程以内。一个有问题的硬件今天寄回厂商,明天收回来,可能两天就解决了。假如你于美国,发个特快已往也患上一周,特朗普还有要加关税。这类环境下,我的迭代速率是美国公司彻底没措施相比的。

但客不雅来说,今朝美国还有是于年夜脑、小脑及硬件上都有一些上风。硬件范畴,中国硬件的重要上风于在自制,可是要论绝对于机能,仍旧是波士顿动力及特斯拉领先。你看波士顿动力的现场演示,AI能力虽然弱一点,可是他们的动作不变性、和婉度、流利性都很好,这就象征着他们的整个硬件设计、运控能力很是强。

雷峰网:既然存于这些差距,为何你仍旧认为中国于及海外的敌手齐头并进?

韩峰涛:此刻咱们弄具身智能,许多点上就是全世界领先的。3月份的时辰,咱们的模子是海内第一个完成叠衣服使命的,这也是具身模子里最难的使命之一。到了25年末26年头,咱们基模的综合能力于RoboChallenge的评测榜单中位居全世界第一,逾越了Pi0.5。原先于工业呆板人及主动驾驶的时代,全世界第一是不太敢想象的。此刻咱们就是敢,由于时代机缘纷歧样了。

从中国最先有危害投资到疫情以前,中国险些所有的硬科技创业都是于弄国产化替换。光刻机、船、飞机、汽车、手机、家电、无人机、全景相机,甚至是灯,都于干这件事。这是汗青任务,国度要财产进级就必然要国产化替换,但对于在创业者来说这也是疾苦的。我做呆板人,上面有ABB、库卡、发那科,海内还有有汇川、埃斯顿这些竞对于。可是你此刻转头看中国制造2025,这个计划2015年发布,年夜部门规划都提早完成为了。疫情以后中国于全世界的科技硬实力,客不雅来说是很强的。以是于AI,特别是具身智能范畴,咱们起步虽然跟美国还有有点差距,但基本上是齐头并进的。

雷峰网:除了了面临的时代机缘,你认为千寻智能此次创业,本身还有有甚么差别?

韩峰涛:一个重要的区分是我对于创业的认知。第一次创业的时辰,是我会干啥我创啥业,以是我弄工业呆板人。并且我也没有很是存眷市场角度,去思量应该做甚么样的工业呆板人。而是我感觉甚么呆板人好,我喜欢甚么样的工业呆板人,我就做甚么样的。这就是拿着锤子找钉子,客不雅来说是命运好,沾了时代的光,但咱们也没有成为一家伟年夜的公司。

以是第二次创业最焦点的变化,就再也不是我会干啥我干啥。假如还有根据这个思绪,那我是做硬件的,我就应该去卖硬件。但此次具身智能焦点的时机来历在AI。Embodied AI,embodied是形容词,素质还有是AI,以是咱们叫千寻智能,不叫千寻呆板人。我去找高阳的时辰说,咱们要做AI,要做具身年夜模子,由于这才是最年夜的时机。

这就是我小我私家认知的变化,第一次是拿着锤子找钉子,但此次是时代需要甚么,我就干甚么。站于你的创业时机上,做甚么样的公司才能捉住时代机缘?这决议了你创甚么业。

会叠衣服比旋风踢更主要

雷峰网:你为何判定,具身智能行业的时代机缘是具身年夜模子?

韩峰涛:你想没想过,为何会有具身智能这个赛道?缘故原由很简朴,就来历在AI技能前进,就来历在年夜模子。宇树16年景立,珞石15年景立,乐聚、云深处也都许多年了。本来也有呆板人,但为何上一代呆板人干不了活,跳不了舞,为何本来没人讲具身智能?实在上一代也有人于做具身智能,英文名词就叫Embodied AI,也是把AI从虚拟世界带到物理世界。这一批具身智能用的是深度进修技能,但其时的AI智能程度太弱了,以是真正落地的只有NLP、智能音箱,或者者给扫地呆板人做视觉计划这些场景。

今天这一代具身智能的焦点变量只有一个,就是AI技能发生了革命性的变化,这类技能前进让呆板人的年夜脑真正有可能可用了。以是真实的具身智能公司,要思索的焦点问题只有一个,怎么让具身模子进化?

具身模子实在也是年夜模子,有三要素,数据、算力、算法。算力及算法基本上是收敛的,或者者说具身模子于练习范式上跟练习多模态的年夜语言模子同样。年夜语言模子是怎么进化过来的?一最先只有LLM,厥后最先有图象有视觉了,叫VLM。GPT-4o收罗了许多真人的声音,措辞的语调音色就更天然了。o就是Omni,全的意思。可是它的周全只存于在虚拟世界,是虚拟的全模态。呆板人需要物理全模态,除了了能说会道以外,还有要能干活。以是从VLM到VLA,实在就是于本来图象、文字、声音的基础上加之动作。这整个范式都是同样的,就是不停给模子增长模态。

黄仁勋去年于CES的演讲里有一张图,画的是从Alexnet深度进修,到商汤旷视做的第一代AI,再到OpenAI这类第二代的天生式AI,再到Agent,末了到 Physical AI。这些是一脉相承的,技能线路已经经相对于确定了。

雷峰网:但千寻智能此刻也于本身做硬件,是出在甚么思量?

韩峰涛:具身智能是一个长坡厚雪的赛道,后边这个曲线就是咱们说的长坡。下面2016 ~ 2020是年夜模子的时间线。这个点,对于在年夜模子来讲是2016年OpenAI起步,2020年他们发了 Skillful Learning的论文,后面就是Scaling Law。上面是具身模子时间线。许多具身公司是2024年景立的,到今天,基本可以认为具身模子到了GPT-2的时代,接下来咱们要到GPT-3。GPT-3干了甚么?鼎力大举出古迹。当数据及算法的都收敛了,各人就知道应该投钱采甚么数据,模子就要快速增加了。

对话千寻智能韩峰涛:真正的机器人是生产力,不是展品和玩具

具身智能和年夜语言模子成长阶段对于比,韩峰涛办公室图

以是你看美国的具身智能公司都于干甚么?可以援用一下特斯拉的思绪,他们不弄贸易化,甚至不着急量产,而是于一点点优化呆板人。那为何特斯拉不买宇树的呆板人做模子?由于模子跟硬件是绑定的,最佳的呆板人就是你本身做的呆板人。模子跟呆板人结合设计,软硬一体,效果最佳。并且你看特斯拉的发布会,主动驾驶的仿真效果尤其好。他们有全世界最佳的仿真器,为何呆板人不消?由于仿真数据不行,必然患上是真实数据,并且患上是用本身的呆板人采的真实数据。

别的各人常常讲,长坡厚雪,沿途下蛋,做硬件也有市场目的。模子能力每一到达一个级别,咱们就能够下个蛋,做个工具。好比咱们做三指手而不是五指,一方面是由于于糊口场景,三指手已经经能完成百分之八九十的活。别的一个缘故原由是五指手此刻还有不可熟,咱们沿途下蛋的时辰,能量产的产物必然是基在成熟技能。就像做新能源车,完善的新能源车应该是 L5 加固态电池。但你14 年做Model S、 Model 3的时辰怎么选?17年做抱负One的时辰怎么选?那必定是L0加增程,L0加速充,L0加换电,逐步再换成L1加增程,L2加三元锂,L3 加固态,一步步来。咱们此刻的三指,就近似在增程。

以是一家好的具身智能公司,必然因此 AI 为焦点,可是有世界一流硬件的撑持。这个硬件既从数据角度撑持模子,又从发卖角度支撑公司运营。

雷峰网:你们是一家模子公司,但又要做本体,又要做手,会不会太多头了?

韩峰涛:但你必需患上做。具身智能于贸易逻辑上更像主动驾驶的新能源车,魂灵是主动驾驶软件,但客户买的是一台更智能的车,以是这两件事你都患上干。于具身智能行业,只卖模子的买卖模式基本不存于。固然咱们畅想一下,10 年、20 年以后有无可能?也有可能。主动驾驶,有无可能特斯拉的领先幅度愈来愈年夜,未来就不造车,只卖FSD?也有可能。可是年夜几率不会,由于只有于本身的车上才能练习患上最佳。

雷峰网:千寻智能规划甚么时间进入量产阶段?

韩峰涛:看你怎么界说量产。假如咱们说的是有出产力、可以干活的呆板人,那年夜概是26年末。今天的模子能力还有没有快速攀升,就像于GPT-2时代,年夜模子机能及商汤、google做的Bert模子可能没那末年夜差异。但咱们融资的时辰就会告诉股东,咱们是从建立第一天起就想着干模子的公司,咱们需要两年时间探索,去找最好的数据配比、最佳的数据管线、最佳的模子布局及算法。

千寻是2024年景立的,这两年咱们把基础举措措施全都搭好了,第三年就要最先数据上量,模子机能晋升。很快咱们会开源一款具身模子Spirit v1.5,于RobotChallenge榜单排第一,比Pi0.5还有要强。将来到Pi0.6打榜以前,咱们城市是全世界最强的开源模子。

咱们可以用智驾的逻辑梳理具身智能行业,可是具身智能跟智驾有个素质区分,那就是车没有智驾仍旧可以开,但没有年夜模子的呆板人就是没用的。当你还有没有充足好的模子,你的呆板人卖出去就只能舞蹈,只能做导览、数采,这些都不算干活。这固然也有价值,但它是一个小市场。

未来的具身智能,会是略低在汽车的价格,乘以略少在手机的数目,这是个巨年夜的市场空间。玩具、舞蹈、导览是客不雅存于的市场,但这个市场过小了,一年撑死卖5, 000台。每一年全世界能卖7, 000万台车,10亿部手机,这彻底不是一个量级的市场。展品及玩具,不算是真实的呆板人。

雷峰网:能干活的才算吗?

韩峰涛:或者者说卖能干活的才成心义。呆板人跳一万次舞,素质上也只有一条数据,由于每一个动作都跳患上同样。展品卖出去上千台,素质上等在卖出一台,只能孕育发生点营收,对于在模子进化没有帮忙。你必需要把那种由模子驱动的、能干活的呆板卖出去,才能让数据飞轮转起来。

并且产物能不克不及量产,实在暗地里就一个卡点,有啥用。工具只要有效,再贵也有人买。九几年买个房才三万,年老年夜一万多一个,为啥有人买?私家飞机几万万上亿,为啥有人买?有效就必然有人买,那怎么让呆板人有效?就卡于一个处所,模子。以是咱们选的场景都是能帮忙模子进化的场景。

雷峰网:2025年海内部门具身厂商把量产作为重要方针,但与此同时具身模子的进展其实不显著,你怎么看?

韩峰涛:特斯拉的AI能力必定没问题,但为何各人都感觉特斯拉的人机交互做患上欠好?他是全世界最强的AI公司之一,莫非他做的模子不如其他的公司吗?不成能。那缘故原由是甚么?第一特斯拉不需要融资,第二特斯拉是直接奔着结局去的。结局就是构建一个通用的本体,加一个通用的具身模子。

PI于练习模子,Sunday于练习模子,美国没有人于卖硬件。所有厉害的模子公司都有厉害的硬件,反而只有硬件没有模子的公司,未来碰面临很年夜的挑战,这是个战略选择的问题。海内有许多公司出在股东压力最先卖硬件,但那不于主航道,焦点就只有模子。

雷峰网:你怎么权衡具身模子的进化程度?

韩峰涛:可以参考主动驾驶。工业呆板人是L0,加点工业视觉就是L0.5。但这些工具运用场景都很小,只能做那一件事。到2024年末,呆板人可以叠衣服了,就是L1。主动驾驶的L1叫单功效辅助驾驶,就是可以主动刹车、车道连结。那具身的单一功效是甚么?比喻说叠衣服、帮我开门、拿瓶水。只做一件事就是L1。此中叠衣服是L1里最难的。假如能叠衣服,那L1级另外所有使命就都能干。此刻各人都选这个场景,实在就是于秀肌肉。

我适才讲具身智能的时机来历在年夜模子,它的落地也受限在年夜模子。由于当你只有L0的时辰,呆板人就只能舞蹈。L1的呆板人会叠衣服了,可是只有于工场流水线这个场景才有价值,由于流水线就只要求人做一件事,响应地于商用及家用处景就不行,以是咱们L1阶段落于了宁德时代。

模子能力继承爬坡,L2叫组合辅助驾驶,能干一长串的事。落到具身上,就从叠衣服进化到找到脏衣服、扔进洗衣机、倒洗衣粉、操作洗衣机、晾衣服、叠好放进衣柜这一长串。你只需要给一个指令,呆板人就能干一长串的事,就是L2。2025年末,模子年夜概于L1.8摆布,我感觉26年炎天就能够到L2了。

雷峰网:那末L2阶段,千寻智能抱负的落地场景是甚么?

韩峰涛:咱们此刻比力看好零售、物流这些办事场景。实在L2阶段的场景也要一个一个霸占,只是选择场景的时辰,起首要选一个有贸易价值的年夜场景。

工业场景为何选宁德时代?由于工业里新能源电池行业的利润是很可不雅的。物流为何选京东及华为?也是由于这些场景有很好的贸易化及利润程度。L一、L2的所有场景里,必定要选那些利润高且愿意为呆板人付费的场景。

具身年夜年将至,决斗数据之巅

雷峰网:对于在具身企业来讲,2026年最紧急的使命是甚么?

韩峰涛:具身末了的竞争会是通用年夜脑的竞争,这至少于美国已经经是共鸣了。数据数目加数据质量决议模子质量,那末于训模子的时辰你就需要回覆,用甚么数据训这个模子,以和数据从哪来。今天领先的具身智能公司,都于解决这个问题。

你可以买第三方呆板人采数,但这只能做科研写论文。并且模子终极要驱念头器人干活,于其他呆板人上采的数据落到差别型号的呆板人上,数据差别构会致使模子机能降落,也就干不了活。

别的一种是特斯拉的方案,他们于用本身的呆板人弄数据。当呆板人的外不雅、灵巧手、腿、胳膊所有部门都确定下来,就能够多量量出产。到这一步,特斯拉就能够像曾经经卖它的车同样,让呆板人一边干活一遍采数。有了数据,加之它最年夜的算力中央及AI人材,就能够训具身模子了。这也是千寻的方案,咱们做了一个呆板人数据工场。此刻咱们楼下的数据工场年夜概有四五十个收罗工位,26年会增长跨越10倍。比拟之下特斯拉会花更多的人工成本,但各人暗地里的逻辑都同样,就是只管即便收罗更多真正的、重构型的数据,然后再去练习模子。

雷峰网:智驾厂商的许多路况数据是客户收罗的,他们只需要投入很少的人组建本身的数采团队。千寻智能已经经堆集了许多客户,为何不选择近似的方案?

韩峰涛:为何具身智能的成长速率比年夜语言模子及主动驾驶慢?就是由于缺数据。年夜语言模子的快速发作,来历在人类已往20多年于互联网上积攒的数字资产。主动驾驶一最先也没数据,但没有主动驾驶功效的车也能卖出去,以是客户可以一边开车一边帮他采数。呆板人不行,没有年夜脑就彻底没用。

这也是为何这两年咱们于做本身的数采装备,弄咱们本身的数据管线。由于咱们要只管即便模拟昔时人们一边开车一边采数的历程,想措施让人一边干活一边采数。让人学会遥操呆板人,效率低成本高,安全性也不行,末了的方案收敛到了可穿着装备上。让人穿上数采装备,该干啥干啥。

雷峰网:此前主动驾驶或者年夜语言模子的成长,可以给具身数据的收罗提供甚么启迪?

韩峰涛:好比主动驾驶,客户收罗回来的数据是用来做预练习的,这部门数据多了之后,回传的年夜部门数据就没用了。这时候候车厂会弄个小的数采团队,收罗特定城区街道,及某种路况下的特定命据,这些数据就是用来微调模子的。

具身智能的数据也分这两类。咱们会于工场、物流、家庭,不限定场景地收罗预练习数据,然后于宁德、京东、华为更多地收罗后练习的微调数据。微调数据也分两类。书房、客堂这些场景,咱们会本身搭建,本身收罗,由于此刻咱们没有如许的客户。可是电池、物流这些场景的微调数据,咱们就提供数采装备,让客户到他们的现场去采。

雷峰网:练习具身模子,到底需要收罗多大要量的数据?

韩峰涛:此刻PI及咱们加于一路,真机数据也就1万小时,可能患上1,00万小时数据才会有比力好的模子效果。但现实上咱们只需要本身采冷启动数据。只要模子能到达L2程度,能支撑呆板人干活,咱们的呆板人就能多量量卖出去。然后咱们再开发一个萝卜快跑那样的接受体系,年夜部门时辰呆板人自立干活,出问题的时辰长途接受。如许数据飞轮就能转起来,呆板人用患上越多,数据越多,模子越好,卖患上越多。

并且训到一样的模子效果,咱们的数据效率比海内竞对于要高峻概5倍。叠衣服这个动作只用了100多小时数据,海内竞对于都患上上千或者者年夜几百小时。

雷峰网:主动驾驶能力可以经由过程百千米急停或者接受次数权衡,对于在具身模子有近似的权衡尺度吗?

韩峰涛:定这类权衡尺度,起首要限制场景。主动驾驶现实上就限制了开车场景,但呆板人要干的活许多。假定咱们限制于造电池场景,我也能够用主动驾驶的逻辑,看平均出产几多电池需要接受一次。假如想收敛于一路权衡,最少要比及26年,各人都能做这些工作了再比力。

客不雅来说,初期很难评价一个模子的优劣,开源模子的榜单测评是一个很好的方式,以是26年必定是一个打榜的年份。实在打RobotChallenge咱们还有是亏损的,由于咱们是基在本身的硬件来做,于测评中利用第三方差别的硬件必定会影响模子机能。可是考卷对于咱们来说更难,咱们反而分数更高,那就是咱们的能力更强。

雷峰网:千寻智能的模子团队此刻有几多人?

韩峰涛:快要40小我私家,做硬件的也是40小我私家摆布,今朝整个公司咱们年夜概110人。硬件团队重要以上半身为主,一体化枢纽关头、手臂、感知体系,就是摄像头,还有有三指的手。此中手的研发投入会比力多,腿好解决,咱们的底盘就是一个近似在室内的主动驾驶方案。双腿对于平凡的家用呆板人意义不年夜,你患上把坐着能干的活,或者者轮式底盘能到之处的活先干了。

雷峰网:2026年你们还有有融资规划吗?

韩峰涛:融,这一次冲L2必定要拿年夜钱。26年是模子能力快速进化的元年,也会是具身智能年夜额融资的元年。本来除了了智元及星河融患上轻微多一点,估值上了100亿,其他家都没像六小虎那样一次融几亿美元,可是26年具身智能也会有如许的融资。

26年对于在具身智能,就相称在海内年夜语言模子的23年,各人会看到这件事可以scaling,会信赖具身年夜模子的能力要最先快速爬升了。此刻的具身年夜模子处于预练习阶段,预练习差未几了,基在GPT-3.5才能开发出ChatGPT。具身智能的GPT moment必然会于26年呈现,只要于学术上可以或许证实就能够,快的话就于上半年。当模子能力快速爬升的时辰,融资就会变患上很火热。

前两天智谱及Minimax上市,我感觉是一个标记性的事务,虚拟AI最先向物理AI交棒了。不管是技能的进展、投资的热门、行业的存眷度都要交放到物理AI上,接下来具身智能要重走一遍年夜语言模子从2023年到2025年走过的路。

雷峰网文章

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-中国·710公海寰宇


地址:长春净月高新技术产业开发区百合街1009号

版权所有:710公海寰宇信息技术股份有限公司

电话:0431-85861717/ 4001182299