这两天看了一些openclaw的东西,有些感触,本想发圈,但是发现内容也不少,就写文吧,正好也有些朋友在问这方面内容。全文挺长,也有些硬度,需要就自取吧
有几个概念需要理清一下:
先说三个概念,ai、模型、豆包,打个比方:AI 是饭店,模型是厨房,而豆包是饭店之一,比如全聚德。餐厅不止一家,豆包、千问、gpt等等,都是饭店之一,所以ai是个人工智能的通用称呼,豆包是个专有名词。同样,每个饭店都有自己的厨房,豆包的厨房是seed,阿里的是qwen,gpt的是gpt,而seed、qwen、gpt也都有个统一称呼,就是模型
再说agent与skill,开饭店是为了赚钱,但是开店是没钱的,得有员工做菜卖出去才有钱,首先要有个店长,就是agent,接下来要有员工,做饭的、摆盘的、送菜的、擦桌子的等等,这些做具体事的员工就是skill。到这里也就清楚了,agent负责统筹调度,做决定,skill负责干活
以上是简单的比喻,不是很贴切,比如ai的含义就窄化了,但是好懂,能有个大致的概念,这就行了,要是奔着讲明白去,每个概念都能写个一两篇,还得画图辅助,太麻烦了,就这样吧,简单理解就行
openclaw呢,就是你的私人助理。你有一个店,但是你懒,不想管,那它帮你管,你要看报表、调整菜系等等,也只需要一两句话,它就给你干了。24小时全年无休,随叫随到,毫无怨言,极其忠诚,实乃天选打工人
介绍完,吹完之后,说说几点看法跟感受:
1.这波热潮之后,会有99%的人退出来。看起来是很强大,但是有那么多事需要做?或许图文生成是个方向,但是openclaw实在太简单,看不出有什么门槛,人人都能做的,也就没什么价值。当然有人会做一人公司,花几十上百万塔一个,那就是另一个故事了
2.经常会说“养”龙虾,我觉得“养”并不贴切,应该说是“调教”,调教龙虾,你说什么,它就秒懂你的意思,不需要废话。要达成这样,就需要好好调教,而这个过程大概需要20~30小时的投入。大多数事要是有这个耐心,不如自己做了
3.长期记忆问题。所有的模型都有这个问题,你用各种ai,之所以感觉它们能记住你,都是长期记忆做的。这个记忆,简单说就是把所有历史会话都传给模型,模型就知道怎么回答了。现在大部分是百万字的长度,相当于七本《哈利波特》,看着很长,但记忆也很长。各家ai针对这个问题都做了很多优化,具体怎么做的就不说了
openclaw同样有这个问题,而且为了帮你做事,它不仅需要写记忆,还需要你的“画像”、skill描述等等,有兴趣可以看一下它每次的对话内容。为了处理记忆,它也是用了压缩、轻量级向量数据库等技术,但这也就是局限了,个人做的优化,怎么可能比gemini等公司做的更好呢?它要是记不住了,就宕机了
4.长度问题。模型支持百万字问答,但并不是问题越长,得到的答案越好,甚至可能副作用。举个粗俗的意思,你骂人,四个字问候父母,就挺好,但要是写一百万字去骂,那别人未必知道你在骂他
5.费用问题。由于问题很长,那么token的花费就是惊人的,如果用gemini等国外模型,一天可能要几百上千美元,结合上述的长度问题,就发现,钱花的越来越多,事做的越来越差。那你说,那我用国内的不行吗?我还能自己搭。这就牵扯到模型问题了
6.模型问题。小龙虾这个名字起的很好,传神在于龙虾是没有脑子的,openclaw也是没有的,之所以你觉得它很聪明,那是模型的功劳。模型强它就强,反之亦然,而国内的模型都没有国外的好,自己搭的就更逊色了
7.工程化问题。openclaw是私人助理,那也就是单独的,但实际上,中小型的公司就已经是多人的协作,批量处理问题,在技术上就是工程化。目前为止,还看不出龙虾怎么做到
8.没有新技术。openclaw可以工作的不错,是模型能力足够强的体现。它确实将模型能力用的很好,将现今的技术整合在一起,整合的很好,并且做的易用。但主要是整合,没有什么新的内容,agent的调用模式,也是2023年langchain的三种模式,背后的ReAct思想在2022年提出。唯一的新东西,或许就是加入了shell,这个强大且危险的工具
9.风险问题。官方都在说openclaw风险很高,为什么高呢?很大一部分就在于shell。shell也不是新东西,很早就有了,用电脑的每一次点击,每一个操作,最终都是一个个命令,看黑客电影,黑屏打字,那个就是shell,是跟计算机直接对话。openclaw拥有shell权限,就可以访问所有的文件,同时也可以删除。openclaw没有脑子,它只会执行,别人恶意植入,它没有办法。当然,你是有办法的,可以对操作做限制,必须要你允许才能执行,那么问题来了,openclaw24小时工作,那么多事,每个你都要确认?你忘了,你是个懒人啊。那你说等下再确认,那好,openclaw就停在那,说好的24小时工作呢?
10.黑客攻击。除了shell问题,还有黑客攻击。你跟openclaw对话,是因为能找到你的电脑,既然你能找到,那别人也能。而且风险问题并不止这两个
多说一点,我觉得openclaw最大的好处是,让普通人离编程更近了,以前很多事都是程序员的事,现在都可以接触了,并且做点什么,这很好。另一个好处是提示词,很多人不知道怎么写提示词,那可以看龙虾每次对话内容,看看skill的内容,所有的一切,说穿了,都是提示词的问题,现在别人免费都给你了,能看了
除此之外,我觉得,学会去用gemini、gpt,看看YouTube、推特,这比openclaw有用的多