||贝塔资本|||

搜索历史

热搜词

互联网

傅盛：我不看好双足机器人的商业化

来源：网易科技频道作者：中国企业家杂志 2024年07月29日 16:53

导语：不看好双足机器人商业化，而用双臂做一些以前不好做的工作是可能的。

今天有两个超级端：一个是Phone，一个是PC。下一个超级端是汽车，下下一个就是机器人。

7月27日，由《中国企业家》杂志社主办的2024（第二十四届）中国企业未来之星年会在上海举行，本届年会的主题是“向新求质，生成未来”。猎豹移动董事长兼CEO、猎户星空董事长傅盛现身【洞见：AIGC特别分享】环节，并发表主题为《端模合一：大模型赋能机器人的创新实践》的演讲。

以下为演讲的核心要点:

1.如果再过几十年回头看这一波AI浪潮，可能和现在看牛顿和爱因斯坦一样。

2.现在创业就关注两件事：第一，真正追求快速闭环；第二，做一些穿越周期的事。

3.今天在企业用大模型的时候，它回答得都很对，但没有什么用，都是常识性的回答，很难和私有的知识连接起来。如果真的要企业应用，私有数据是关键。

4.大模型和云最大的不同，云更像仓库，是不拆包的，只要租用我的仓库，我不关心你存了什么。大模型不一样，存的数据它都要看一遍，才能写报告和整理，这些数据都经过它了。所以企业就应该有自己的私有化大模型。

5.今天人形机器人很火，但是我对双足机器人在商业化上的成功不是很看好，作为科研是可以，如果落地到产线上工作，没有三五年就不可能。

6.为什么做机器人还要做大模型？大模型就是机器人的大脑，你做机器人，自己不做大脑去买别人的大脑，你的竞争力就有限了，体验也不会好。我们就是要做端模一体化，根据场景应用找一款好的模型，做自己的大模型机器人。

以下为傅盛演讲实录（有删改）：

要做穿越周期的事

我从2010年开始创业，创立了猎豹移动，经历了三个时段：第一个时段，把金山毒霸这款工业时代的软件变成了互联网时代的软件，现在还有营收，同一期的其他软件都没有了；第二个时段，我们开始去做全球出海的业务，全球6亿月活用户，4亿来自海外，Musical.ly也是我们投的天使投资，后来卖给了字节跳动，也就是现在大家熟知的TikTok；第三个时段，2016年，我们看到了AI，并提出All in AI，当时我们认为AI可以快速改变人类。

但有时候技术不是一直高歌猛进，有高潮期，也有低谷期，现在终于等来了ChatGPT。我们当时就认为AI是底层的技术变革，要做机器人就要以AI为核心，做好端模一体，才能把一款产品真正做出革命性的体验。我们的Slogan是在AGI时代成为全球领先的新质生产力工具提供商。

很多人问我卖掉Musical.ly会不会后悔，没什么后悔的，因为我们没有这个基因，字节就是做得好。如果我们自己做，肯定不如今天TikTok做得好。况且我们也收获了很高的投资回报。每个人、每个团队都有自己的能力圈，做工具就是因为我们的基因，能把工具做好就非常了不起了。

如果再过几十年回头看这一波AI浪潮，可能和现在看牛顿和爱因斯坦一样。前段时间我去拜访罗振宇，聊现在如何创业，我们一起探讨就两件事：第一，真正追求快速闭环，我是个摆摊的，哪怕出现很大的变化，也有自己的小循环；第二，做一些穿越周期的事，就像爱因斯坦1905年的四篇论文，“相对论”奠定了现在的信息技术基础。

ChatGPT不是技术的胜利，而是技术信仰的胜利

2022年底ChatGPT的出现，改变了人类社会的方方面面。最近，阿里巴巴的王坚说AI也会改变科研，为什么这次AI和2016年那一波不一样呢？因为那时候看到AI很激动，觉得计算机可以识图、认人脸，就觉得它可以做一切。今天知道识别并不是人类独有的技能，语言才是人独有的技能，尤其是逻辑推理的语言。今天看起来能够突破语义理解，是人工智能的重大突破。

OpenAI之所以牛，是因为它改变了学习路线，之前的大部分路线是让计算机学规则，但是OpenAI相信只要给它足够多的语言数据，OpenAI就会像小孩一样突然有一天开口说话。在此之前，大家都没有那么相信，所以其实在GPT3.0出现之前，OpenAI在硅谷都不被看好。所以，ChatGPT不是技术的胜利，而是技术信仰的胜利。

因为人工智能就像大树下的根基都是一点点长出来的，一直长到Transformer，OpenAI相信只要做好下一次预测就能产生智能。这条路线非常艰难，艰难在于并不知道它的核心原理，但必须坚信，不断地试。它最难的是每次试都要花几千万美元，再去试，试完之后再调整。这也解释了，今天的“百模大战”不是技术的难度，而是技术信仰的难度，真的敢于相信、敢于投钱，才能真的把“ChatGPT”做出来。

今天有很多文章说它产生意识，说它替代人类，都不用相信，ChatGPT就是预测下一个词的计算器，不断预测下一次概念的时候就产生了智能。为什么能出现这样的智能，它的原理还属于黑盒，就是没有数学公式推导能证明会出现这样的智能。我们这个行业有一个俗语，每次训练大模型就像炼丹，开始炼的时候不知道效果怎么样，一定要最后结果出来才持续。

为什么OpenAI很厉害呢？2016年我们开始做语音识别、视觉识别的时候，随着数据量的增加，以前系统的智能水平很快就上来了，但是它只能上到一定的水平，这次给了大量的数据，它一直不怎么样，突然某一个时刻，水平一下子就起来了，到了原来系统到不了的智能化水平。

正是因为技术信仰，今天我们也认为OpenAI的道路也未必是唯一正确的。因为技术有意思就在于它会不断地分支，不断产生新的可能性，当OpenAI在大参数模型上一骑绝尘的时候，越来越多的小参数模型开源社区开始出现。今天也有一帮人没有那么有钱，技术没有那么强，能不能做一个平民化的模型，只要解决专门的问题就行了，今天开源阵营就是在做这件事，用更便宜的算力成本、更小的参数量在某一个领域实现更好的效果，我们都坚定走在开源阵营的道路上。

模型还是应用？

去年我和朱啸虎有一次“吵架”，做AI到底是应用重要还是模型重要？当时由于大模型出来，太震惊了，很多人都说大模型会占据99%的产业链价值，但当时我就说应用是核心。今年世界人工智能大会（WIAC），几乎每个大佬都在谈应用，大家终于意识到给一个聊天窗口，给一个用户，就可以解决他生活中的所有问题，这件事情不可能，只有结合实际的需求，足够多的应用，才能让大模型为更多用户所用。

前两天苹果发布会演示iOS 18后，股价涨了近10%，涨出了一个茅台和腾讯，这是苹果历史上第一次没有发布任何的硬件产品，而是发布一个概念，就是因为把Siri的概念重新升级，它就变成了你的助理，它用GPT技术做了交互。未来Siri就是我们和手机最重要的交互窗口，苹果的展示里就有Siri说：明天你妈妈要来机场了，记得去接她。这是主动提供助理的方式，以前是很难想象的。

虽然以前我们有很多智能系统，但每个智能系统都要做开发、做适配，所以它并不能实现边际成本趋近于零，这次是可以实现的。

推荐大家用一下秘塔搜索，搜一下就是一份报告，把需要一个晚上时间整理的报告变成了2分钟，搜索一定是重要的革命。这两天ChatGPT推出了自己的Search GPT，搜索就是一个强应用。

还有就是微软的Copilot PC，它没有用英特尔的芯片，而是高通的芯片，高通的芯片是有45TOPS的NPU（神经处理单元），它可以独立处理AI的各种运算，有可能你对电脑说今天晚上把哪些文章搜一遍，整理出哪些东西，它就帮你搞定了。以前计算机也是一个生产力工具，但必须人伴随它，以后就是把计算机一放，它就把该做的做了。

大模型落地要和企业深度打磨

现在看起来AI非常热，但好的案例几乎没有，除了大模型公司自己讲，真正在客户端，没有落实好的案例。而且今天很多人都在说，我们都在期待一个好的to C应用，好像都没有出现。

尤其是我们在做企业应用，在做机器人，它有三大阻碍：第一，我们的训练数据来自互联网，但互联网实际上是人类知识系统冰山显露出的一部分，书本是批量教育的产物，真正好的知识是深入的询问。很多知识来自日常的探讨，来自会议，来自各种讨论，但是今天大模型得不到这些数据。所以，造成的问题是今天在企业用大模型的时候，它回答得都很对，但没有什么用，都是常识性的回答，很难和私有的知识连接起来。如果真的要企业应用，私有数据是关键。

这次苹果发布iOS 18那么成功，因为它把手机里的各种数据打通了，邮件等等都让大模型处理。其实都不是大参数模型，它是在端上处理的2.7亿参数的模型，但数据打通之后，爆发出来的能量惊人。所以我们提供的解决方案是一定要结合企业的私有知识。

第二，数据的安全性。大模型和云最大的不同，云更像仓库，是不拆包的，只要租用我的仓库，我不关心你存了什么。大模型不一样，存的数据它都要看一遍，才能写报告和整理，这些数据都经过它了。

即便美国OpenAI这样的公司都经常被爆出窃取私有数据等问题，所以企业就应该有自己的私有化大模型。个人以后要用好大模型，也应该有自己的大模型。苹果iOS 18就是个人端的Copilot。

第三，生成式的模型，大模型的幻觉和一本正经的胡说八道，它不可避免，但它不知道自己不知道。人说错话，马上就知道，但大语言模型不是，它一本正经地讲林黛玉拿绣花针打虎的故事，它没有反思能力。今天我们发现和大模型打通以后，客服需要95%以上的能力，但大模型只能做到70%，这是大模型目前落地时天然的缺陷。

今天业界提出了Agent的方式，通过一套规则或者自我反思、规划等等，和大语言模型在一起，去完成对一个具体场景的落地。很多大模型公司觉得“找人用一下”就可以把大模型做好，不是的，我们应该基于客户的诉求，做深度评估，才能做落地部署。我认为真正要把标杆，把很多东西抽象出来，形成标准化。

ChatGPT到今天发布才不到两年，产业链上还有很多不成熟，它没有很好的供应商，很多苦活只能自己干。就跟特斯拉做第一辆车，整个电路都要自己干一遍，才能做自己的产品，大模型处于很早的时代，真的要做企业案例就要和企业深度打磨。

如何做好机器人，通过私有化部署的方案，不需要特别强的模型，但是做好Agent应用，再加上私有知识库在很多场景可以做到95%左右准确率，满足客户的需求。

我们提出一个企业应用大模型有三个段位：青铜段位是企业发动大家结合公有数据应用；黄金段位是把私有数据做好，做出数字员工；真正的王者是企业如何运营，大模型可以给出判断。美国就有这样的公司，专门通过大模型分析，给企业提供决策经营建议。

今天大家都问应用什么时候会崛起？至少要到明年，会在C端看到一些应用开始出现，比如高通的那款芯片一出来，很多大厂都会在CPU上加上一个AI模块，本地应用机会崛起。这次苹果发布iOS 18，专门说会给手机配上开发图形的API，只有这样才能出现好的AI应用，或者深度化的AI应用。最后是物理的AI，今天最火的是具身智能，就是自动驾驶、智能座舱都是这个范畴。

今年我们训练了一个14B的模型（Orion-14B），我们训练这个模型的核心就是让团队先学习。第二我们就是瞄准小参数，因为以后我们的机器人上，要跑本地化的模型，并与云端相结合。

机器人是下一个大模型终端

2018年我就提出机器人公式，AI、软件、硬件和服务，为什么这些年一直不温不火呢？因为以前AI的体验做不上去。我女儿经常讽刺我说：老爸，你做了一个人工机器人？我告诉她，不是老爸不行，是当时的技术不行，那时候雪不够厚、坡度不够长，今天大语言模型会把这个体验一下子提升很多。美国基金说可能会出现一个新物种，GPU+大语言模型+数据+电力，我觉得机器人就是这样的新物种。

为什么我们做机器人还要做大模型？大模型就是机器人的大脑，你做机器人，自己不做大脑去买别人的大脑，你的竞争力就有限了，体验也不会好。我们就是要做端模一体化，根据场景应用找一款好的模型，做自己的大模型机器人。现在我们在1.0阶段，但至少要做到3.0、4.0才有体验上革命般的进步。

大家都看到过餐厅的递送、讲解机器人等等，但加入了大模型就不一样。其实，Robot来源捷克语，这个词本没有那么强的人的概念，是“劳动力、奴役”的意思，在外国人眼里自动的就是Robot，只是我们翻译为“机器人”。事实上在大模型出现之前，机器人绝大部分都是自动化机器，产线上的机械臂看上去那么精密，都是写好的规则，事实上它是没有智能的。机器人有了大模型之后才能真正理解和决策，这是很大的改变。以前大部分都是基于规则，现在是端到端。

它会像人一样理解世界，并作出决策，这个决策不需要人管中间的过程，这是机器人的极大提升。我们投资的一家公司做走播机器人，在直播间说话的声音像一个小姐姐一样，都是AI生成的，评论区说带我去生蚝区看看，她就去生蚝区，告诉你：“我们的生蚝又大又新鲜，赶快来吧。”

之前请小姐姐直播一个月大概卖几千块优惠券，但用走播机器人一天卖3000块钱，用小姐姐播3个小时就太累了，但是机器人一天可以12小时，如果你愿意甚至可以24小时。

今天人形机器人很火，但是我对双足机器人能成功商业化不是很看好，作为科研项目是可以，如果落地到产线上工作，没有三五年就不可能。尽管马斯克认为可以，但还是很难。而双臂这件事还是有机会的，用臂做一些以前不好做的工作，所以我们在具身智能发展的是双臂。

今天我们发现海外也是一个巨大的市场，今年上半年我跑了几次日本，日本真的劳动力极其稀缺，所以他们对机器人的需求非常大，我们机器人能够为服务员省时、省力，他们非常愿意买单。

今天有两个超级端：一个是Phone，一个是PC。下一个超级端是汽车，下下一个就是机器人，我相信让机器人插上AI翅膀就会完全不一样。最后希望所有企业家、创业者都一起全力用好AI，插上AI的翅膀。

（文章为作者独立观点，不代表贝塔网立场）

机器人双足双臂