openclaw 思考

发布时间:2026/7/3 2:31:16
openclaw 思考 维度Claude Code SkillOpenClaw Pi核心定位通用模型 领域技能偏“知识/流程专家”本地自托管 Agent 运行时偏“执行型操作系统”技术核心文件系统 Skill指令/模板/脚本按需加载嵌入 Pi AgentSession 自建 Gateway、Queue、Memory、Sandbox状态管理以对话历史 按需读 Skill 文件为主状态弱JSONL transcript Memory.md Session Tree状态强且可审计[4][8][9]工具体系以 Excel/PowerPoint/Docx/PDF 等文档操作为核心[1][2]Shell、FS、Browser、消息通道、定时任务等全系统工具[4][8][9]安全治理主要靠运行环境限制API/Code/CLI 模式各自约束[1]工具白名单、结构化命令过滤、沙箱容器执行[8][9]使用方式在 IDE、CLI 或 Claude Web 里加载技能执行特定流程安装在本机/服务器上通过消息/终端持续调用像“常驻数字员工”典型场景财务建模、数据分析、文档撰写与审阅、领域报告邮件/日程自动化、DevOps 运维、浏览器操作、跨应用工作流从技术本质来看都是“能写代码并调用工具的模型 执行环境”。区别不在“是不是智能体”而在于Claude Code 把“领域知识 办公工具”封装成可插拔技能 → 在具体办公/金融场景形成巨大生产力飞跃。OpenClaw 把“编程智能体内核 操作系统级控制”封成一个可部署基础设施 → 变成所有行业都能套的 Agent Runtime。OpenClaw 为何能出圈OpenClaw 是建在 Pi coding agent 之上的本地自托管 AI Agent 运行时它不是“又一个聊天机器人”而是一个真正控制电脑 / 服务器执行任务的编程智能体平台[4][5]。1. Pi Agent极简但可扩展的“编程大脑”Pi 本身的特征从 Pi 文档和集成说明[4]提供createAgentSession()创建一个完整的 Agent 会话负责 prompt、上下文管理、工具调用、思维链、历史压缩等通过事件流message_start / tool_execution_start / turn_end 等暴露整个 Agent 运行过程[4]内置 coding 工具读写文件、bash、编辑器指令非常适合做编程类智能体内核。Pi 的定位一个最小可用的“AI 编程内核”你可以在上面自己搭一整套 agent 系统。OpenClaw 就是这样做的。2. OpenClaw 的关键技术设计从「模型」到「可控系统」OpenClaw 没有把 Pi 当作“外部进程 RPC 调用”而是直接在 TypeScript/Node 里嵌入Pi 的 AgentSessionrunEmbeddedPiAgent[4]在其外面再包一整套“工程级外壳”1Agent Loop Gateway把“对话”变成「全流程执行」架构上OpenClaw实现了一个标准化的 agent loop[4][6][8]输入统一化Channel Adapter来自 WhatsApp / Telegram / Slack / Web 的消息都转成统一结构[6][8]。Gateway Lane QueueGateway 把会话放进「Lane」队列每个会话一个 lane默认串行执行防止状态冲突[8]。避免多轮并行调用导致文件状态或进程状态被写乱这一点在“能执行 shell / 文件操作”的 agent 中极其关键。Agent Runner调用 Pi 的会话、构造系统提示、挂载工具、控制思考模式、处理模型切换与 Failover 等[8]。Agentic Loop模型输出 → 工具调用 → 执行结果写回上下文 → 下一个决策直到任务完成为止[6][8]。输出与审计所有交互写入 JSONL transcript可重放、可审计[8][9]。这套 loop 实际上是**“一个能真正跑生产的 Agent 操作系统”**而不是“一个好玩的编程助手”。2工具体系从「会写代码」到「会操作系统 / 浏览器 / 消息通道」OpenClaw 在 Pi 的基础工具read/write/bash/edit之上自行构建了完整的工具层[4][8][9]重写/包装原有工具bash → 受控的exec/process可选择在宿主机或 Docker 沙箱中执行[4][8]文件读写 → 根据是否启用 sandbox限制访问路径新增一大堆工具消息类Telegram、Slack、Discord、WhatsApp 操作浏览器类基于可访问性树ARIA的页面语义快照和点击/输入能力降低 token 成本、提高解析精度[9]调度类定时任务cron、会话跨设备、网关控制等工具策略层每个工具都通过策略过滤按 profile、provider、agent、group、sandbox 等[4]防止误用高风险指令。这就让 Pi 从一个“编程助手”变成了一个能真正操控电脑 / 服务器 / 浏览器 / 消息平台的操作层智能体。3记忆与可观测性工程级的“可追溯智能体”OpenClaw在记忆和观测上做了两件关键事[8][9]双层记忆结构JSONL transcript事实级审计日志——所有请求、工具调用、模型输出都在这里适合审计/重放[8][9]。Markdown MemoryMEMORY.md更抽象的经验总结、偏好、项目进度等[9]。上面再叠加混合检索向量搜索 SQLite FTS5 关键词索引[9]。Context Guard 自动压缩监控 token 用量触发自动压缩历史、合并对话、保留关键信息[4][8]。提供“compaction-safeguard”和“context-pruning”等 Pi 扩展按任务重要性/TTL 过滤保留内容[4]。直接效果长期运行的 agent 不再靠“不断堆叠聊天记录”而是有结构化记忆。企业可以把 OpenClaw 当成“一个持续在线、可审计的数字员工”符合金融、政企对合规和可追责的要求。4安全与多模型治理Shell 安全白名单命令模式只允许特定形态如 git / npm / ls 等[9]阻断带,$(),,||等高风险结构的命令[9]多模型、多 Key 管理Auth Profile Store管理多个 API Key自动轮换、遇到错误自动 failover[4]Model Resolver根据 providerAnthropic / OpenAI / Gemini 等和任务类型选择合适模型[4][8]这一套东西本质是把 LLM 当作一个不可靠组件套上工程级治理与防护。这就是为什么安全圈和大厂架构师在分析 OpenClaw 架构时会认为它是「真正适合进生产的 Agent 框架」而不是单点工具[8][9]。3. 为什么它能在几个月内成为 GitHub 最多 Star 的“实际软件项目”从公开数据看OpenClaw 从 2025 年 11 月开源到 2026 年 3 月已经超过 25 万 Star成为 GitHub 上 Star 数最高的非“列表类”软件项目[10]。React 用了 13 年才达到了 24万 Star而 OpenClaw 约 100 天就达到了类似量级[10]。这不是纯粹“炒作”而是技术形态决定了它的传播路径定位是“能真正替你干活”的本地 Agent自托管、本地-first极大缓解企业和开发者对隐私、合规的担忧[4][8]。可以运行在家用 Mac mini / 树莓派 / VPS 上门槛极低[4]。开发者直接感知价值开箱可以清理邮箱、管日程、登录网站、下载文件、运行脚本、跑 CI 等[4][6][8]。对很多个人开发者/小团队等于突然免费多了一个全栈 DevOps 助理。社区易于扩展工具有统一适配层toToolDefinitionssplitSdkTools写一个工具基本就是写一个普通 TypeScript 函数[4]。结合 Pi 的扩展体系可以很快做出新类型 agent开发团队、客服团队、运营团队等。一句话OpenClaw 做的是“把 Pi 编程智能体做成一个完整的、可落地的系统”刚好踩在“大家都在问我能不能让 AI 真正替我干活”这个需求点上。实现原理OpenClaw的架构由三个模块组成Agent Loop、Tools、Gateway。Agent Loop是龙虾的大脑它负责决策和思考它会根据当前任务判断下一步要做什么并在需要的时候调用各种工具来完成行动。Tools是龙虾的手脚为Agent Loop提供各种能力比如浏览网页、执行命令、调用 API、处理文件等让龙虾真正具备干活的能力。Gateway是龙虾的身体它让整个系统能够持续在线接收来自不同渠道的消息比如 Telegram、飞书等并把任务交给Agent Loop处理再把结果返回给用户。Agent LoopAgent Loop是AI接到一个任务之后自己一步一步把事情做完的机制。OpenClaw的Agent Loop是基于Pi SDK的这是一个独立的开源项目GitHub - earendil-works/pi: AI agent toolkit: unified LLM API, agent loop, TUI, coding agent CLI · GitHubAgent Loop不是OpenClaw的独家优势Claude Code和Codex都有Agent Loop的逻辑光从脑子的设计来看OpenClaw跟Claude Code、Codex没什么本质区别。Tools第一层是基础工具。这是最底层的一些能力比如读写文件、执行命令、浏览网页、搜索和抓取信息这些工具让 AI 能够真正操作电脑而不是只停留在聊天里。第二层是 Skills。Skills本质上是在教AI怎么像人一样干活。它会告诉AI在任务场景下应该怎么做、应该调用哪些工具、步骤是什么。比如写代码前先扫描项目结构、修改文件前先做备份、写完代码之后自动运行测试这些经验都可以写成 Skills让AI在类似任务里自动复用。第三层是外部工具。这一层主要是接各种第三方服务比如调用外部 API、接入 SaaS 服务、扩展新的工具能力。所以从底层来看OpenClaw 的手脚并不是简单的一堆工具而是一整套基础工具 Skills 外部扩展组成的能力体系。但工具体系本身并不是OpenClaw的独家优势像Claude Code和Codex都有同样的工具体系。Gateway第一不关机。龙虾是常驻在线的就算系统崩了也会自动恢复重启之后还能记住之前的对话。比如凌晨3点服务器突然挂了Gateway会自动把龙虾重新拉起来并恢复之前的对话上下文继续处理那些还没做完的任务。等你第二天早上再来看它就像从来没有断过一样一直在工作。第二接所有平台。Telegram、飞书、钉钉等20多个平台的消息都可以统一接收和处理。这意味着什么你不需要为飞书单独写一个 bot也不需要再为钉钉写个 bot。Gateway在中间做了一层消息适配不管消息来自哪个平台到AI 这里都会被转换成同一种格式。你在飞书上给它发消息它就在飞书上回复在钉钉上发它也会在钉钉上回你。第三会话隔离。每个聊天窗口都是独立的你和它的对话不会被别人的任务干扰。比如你让它帮你查一份数据同时又在另一个群里让它写一段文案。这两个任务在Gateway里是完全隔离的各自有各自的上下文不会串。就像两个独立的员工在分别处理两件事各干各的。第四排队控制。同一时间只处理一个任务不会因为消息太多而搞混。比如说在一个飞书群里我和同事同时发消息给龙虾Gateway的处理策略很简单谁先来做谁的后面的任务排队。这个设计看起来有点笨但其实很聪明。因为 LLM 的推理本来就不太适合并发同时处理多个任务反而更容易出错最后可能两个任务都做不好。第五心跳巡查。心跳巡查是龙虾可以主动做任务的核心。OpenClaw的主动执行能力主要靠两套机制Heartbeat负责周期性巡检Cron负责精确定时调度。Gateway会定时主动检查有没有待办任务如果有它就自己去执行不需要你催它。举个例子你让它每天早上8点整理一份AI资讯摘要推送给你。