LLM 学习笔记 Day 4：Agent

发布时间：2026/7/3 2:59:21

一、LLM 的边界为什么它不能直接完成复杂任务一个场景用户说“帮我生成一份 Java 简历。”如果直接丢给 LLM它会生成一份“看起来不错”的简历——但很可能是凭空捏造的。LLM 没有用户的真实经历不知道目标岗位的具体要求也无法调用外部工具去搜索、匹配、排版。真正需要的执行流程用户输入 → 理解意图 → 收集 JD需要用户上传或描述 → 解析 JD提取技术要求 → 收集简历需要用户提供 → 解析简历提取技能、经历 → 匹配排序精确对比 JD 和简历 → 重写优化 → 生成 PDFLLM 能完成其中的“理解意图”“解析 JD”“重写优化”——这些属于语言理解与生成。但它做不了获取外部信息搜索、读文件精确计算打分排序执行动作调用 API、生成 PDF多步循环根据中间结果调整策略LLM vs Agent 本质区别LLMAgent只能“回答”可以“行动”被动的单次生成主动的循环执行不知道的只能编不知道的可以去查输出文本调用工具输出文本Agent LLM 规划能力工具调用记忆反思LLM 是一个“思考器官”Agent 是一个“完整的执行者”。二、 Tool工具Tool 的准确定义Tool 是 LLM 不具备的能力的外部扩展。它让 Agent 能够“做事情”而不只是“说事情”。为什么 LLM 需要 Tool精确计算LLM 擅长语言概率不擅长数学规则实时信息LLM 的知识有截止日期执行操作LLM 不能调 API、读写文件、操作数据库Tool ≠ 函数“Tool 就是函数”——这个理解不完整。判断标准Tool 是一个可以被调用来完成具体任务的能力单元有明确的输入输出。三、Function Calling为什么比 ReAct 稳定以前的做法ReAct让 LLM 在输出文本中嵌入特殊标记Action: Calculator Action Input: 123 * 456然后用代码解析文本提取出工具名和参数。问题格式不稳定多一个空格或换行就可能解析失败依赖正则匹配复杂场景容易出错Function Calling 的做法LLM直接输出结构化 JSON{name:calculator,parameters:{expression:123 * 456}}为什么更稳定结构化输出JSON 格式确定不会因文本差异解析失败Schema 约束可以预定义参数类型、必填项LLM 被训练去遵守这些约束训练有素现代 LLM 在训练阶段已学过 Function Calling四、Tool Calling 全过程——Agent 的核心循环所有 Agent 的通用骨架用户输入 → ① LLM 分析需要调用什么工具 → ② 决定调用 Tool → ③ 执行 Tool → 得到 Observation观察结果 → ④ Observation 返回给 LLM → ⑤ LLM 判断任务完成了吗还需要再调工具吗 → ⑥ 如需要回到②如完成生成最终回答Observation 是什么为什么一定要回传 LLMObservation Tool 执行后返回的原始结果。比如计算器 Tool →56088检索 Tool →[简历段落1, 简历段落2]为什么不能直接返回给用户用户问“我的简历匹配吗” → Agent 调检索 Tool 拿到一堆文本片段 →如果直接返回用户看到的是碎片数据不是答案。正确做法Observation 回传给 LLM → LLM 阅读并理解 → 生成自然语言回答“您的简历在 Java 方面匹配度很高但在微服务经验上有所欠缺……”Observation 必须回传 LLM 的三个原因LLM 是唯一的“理解者”和“表达者”LLM 需要判断任务是否完成LLM 需要整合多步 Observation 生成完整答案

相关新闻

无真实标签时如何评估模型性能：CBPE校准监控实战

015计算运费

Codex深度评测：从AI代码助手到项目级执行者的16个核心功能拆解

OpenRGB终极指南：3步统一控制所有RGB设备，告别多软件混乱

EV 代码签名能通过软件检测吗？

秦皇岛高空跳伞全攻略：安全刺激体验点推荐

原神帧率解锁终极指南：打破60帧限制的免费解决方案

Python控制流完全指南

【单片机毕业设计】基于 STM32 的室内智能照明控制系统设计与实现 ，基于单片机的人体感应光照自适应灯光调控系统（014901）

GPT-5与Veo3双引擎AI开发实战与避坑指南

AutoRaise终极指南：3分钟掌握macOS鼠标悬停自动激活窗口技巧

AI Agent五大设计模式解析与实战优化

管理者的六个层次

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

别再死记硬背了！用‘分界线’思维彻底搞懂C++ set的lower_bound和upper_bound

TwitchDropsMiner：无需观看直播，自动化获取Twitch掉落奖励的终极指南

从提示工程到上下文工程：2026年AI开发者的核心技能转换

【单片机毕业设计】基于 STM32 的室内智能照明控制系统设计与实现，基于单片机的人体感应光照自适应灯光调控系统（014901）