上下文管理实战：理解Context，高效省Token的全方位指南

May 31, 2026

很多用户在使用AI对话工具时，习惯在一个窗口里持续交流，不愿意重新开启新的对话。从早期的豆包、元宝，到如今的Claude Code、Cursor等开发辅助工具，这种“舍不得重开”的现象十分普遍。

对于“上下文”（Context）这个概念，不少人最初并不清楚它的含义，也未曾在意过。

随着对AI工具的深入使用，大家才逐渐理解Context的意义，以及上下文工程（Context Engineering）的重要性。回顾过去，因为长期在一个窗口堆积大量信息而浪费的Token，难免让人惋惜。

可能很多你身边的朋友也和你一样，虽然用了很久AI，但对上下文的理解仍停留在模糊阶段。本文就将帮助你彻底搞懂上下文——从基础概念到高阶技巧，一网打尽。

说明：本文中的命令示例基于Claude Code和Cursor，使用方法在各主流工具中均可通用。

上下文到底是什么？

一句话概括：上下文指的是AI对话窗口中，你与AI的所有交流内容、你让AI读取的文件信息，以及AI如何理解并处理这些信息的一整套过程。

基础使用方法

使用过AI聊天工具的人，基本都懂得一些“喂上下文”的基础操作——提供背景信息、粘贴文本、@引用某个文档等。这些常规操作这里不再赘述。

然而，仅仅知道“怎么用”还远远不够。只有避开常见的坑、掌握高阶技巧，才能真正拉开差距。

你可能不知道的：上下文的坑和技巧

技巧1：喂材料要精准，别“All-in”

很多人以为给AI的材料越多越好，恨不得把整个项目文件夹全部丢进去，期待它能“全面了解”。

但结果往往事与愿违：重点被海量信息淹没，AI在庞杂的材料中难以抓住关键，反而给出平淡无奇的回答。

正确的做法是：能引用单个文件就不要引用整个目录，能提取相关段落就提前手动缩小范围。先提供摘要，再补充长内容，切忌一股脑地甩出大段文本。

在Cursor中使用时，尽量@单个文件而非整个文件夹；在Claude Code中，可以指定路径让AI自己搜索，而不是将大段代码直接粘贴到对话中。

技巧2：不相关的任务一定要分开聊

不同性质的任务不放在同一个窗口里讨论，这一点比较好理解。混在一起有两大坏处：一是无关内容白白占用上下文空间，二是AI容易被之前的话题干扰，给出牛头不对马嘴的答复。

需要特别强调的是：即便是同一个项目，如果是完全不同的工作任务，也建议开设不同的窗口。

举个例子，你刚用AI完成了一份PPT，效果不错，下一个PPT还想在同一窗口里做。这种做法不太合理。首先，窗口可能已打开很久，缓存早已失效，继续使用意义不大。其次，即便时间不长，前后两个PPT的主题差异过大，原来积累的上下文对新的工作毫无帮助，只会占用宝贵空间。

Claude Code中有一个很好用的命令/btw（by the way），意为“顺便问一下”。询问完毕即删除，不会占用上下文。这个命令充分体现了程序员的巧思，值得善用。

技巧3：上下文超过50%就该另开窗口——但别开得太频繁

这是广为认可的经验，Claude的开发人员也给出过类似建议。

上下文的空间并非无限。每个模型都有上下文窗口的上限，通常用百分比来衡量。当占用达到50%左右时，AI就会开始“挤占”——前面的内容被压缩，重要细节可能丢失，回答质量显著下滑。

因此，养成这样的习惯很有必要：上下文占用到50%时，该清理就清理，该另开窗口就果断重开。不要不舍得那个对话，继续堆积只会让效果越来越差。

在Claude Code里，输入/context可以查看当前上下文占用情况。Token即将超出时，不妨及时查看，做到心中有数。

Cursor中没有直接查看占用的命令，但在聊天界面有一个上下文栏，能够显示当前引用了哪些文件、上下文大致填满了多少。一个用命令，一个用界面，直观程度差不多。

不过，这里有一个反直觉的要点：频繁开新窗口不一定省钱。

背后的玄机在于缓存机制。AI每次收到你的消息，都需要从头“阅读”整个上下文——系统指令、工具定义、CLAUDE.md中的规则、此前所有的对话记录。在同一个窗口中，前面那些不变的内容会被缓存起来，下次读取缓存的成本只有重新计算的十分之一。

而一旦你新建了一个窗口，之前积累的缓存全部作废，数万Token的“基础设施”又需要重新全价加载。频繁使用/clear或每做一步就开新会话，等同于反复为这些不变的内容支付全价。

这个缓存机制在Claude Code和Cursor中同样适用。Cursor虽然没有/clear命令，但新建Chat的效果是一样的——之前的缓存白存了。

因此，正确的心态是：能继续就继续，开新窗口是有条件触发的操作。

什么条件该继续？

任务没换、距离上一条消息不超过1小时、之前的上下文对当前工作仍有帮助——那就继续聊，缓存还是热的，几乎不花钱。如果暂时没有新想法但不想让缓存过期，可以发一条简短消息来保持活跃。

什么条件该重开？

任务已更换、闲置超过1小时（缓存大概率已过期）、上下文塞满了不相关的“噪音”——那就果断重开。

个人的实践心得是：一个会话只专注完成一件事，这样一来几乎不会触发配额问题。

技巧4：超出上下文限制怎么办？用命令“续命”

有时一个窗口聊了很久，内容确实很重要，不想就此放弃，但上下文眼看就要塞满了。这时有两个“续命”方法：

/compact：压缩对话历史，对之前的内容进行总结，腾出更多上下文空间。交流多轮之后，用它能有效延续会话寿命。这是Claude Code的命令，Cursor目前没有对应的手动命令，但它会在上下文接近满载时自动压缩（侧边会提示“Summarizing chat context”），效果相同，只是不能主动触发。

/summarize：如果不想丢失历史信息但对话已经过长，可以用这个命令让AI提取核心信息（关键背景、已做决策、待解决问题），上下文能被压缩到原本的15%以内。Claude Code和Cursor都支持此命令。

两者的思路一致：上下文快满时，要么压缩，要么另起炉灶。

技巧5：长内容给路径，别往对话里贴

面对报错日志、大段代码、长文档时，很多人的第一反应是复制粘贴到对话中让AI自己去查找。

请不要这么做。

将10000行日志直接复制粘贴到对话里，这些内容会永久占据你的上下文空间，每一轮新的对话都要重新“阅读”一遍。更聪明的做法是把文件路径发送给AI，让AI自行检索需要的信息，只把真正相关的内容拉入上下文。

在Claude Code中，直接把路径写在对话中即可，AI会使用grep等工具去搜索。在Cursor里，用@引用文件——注意，能@单个文件就别@整个文件夹，引用粒度越细，上下文越干净。

请牢记一句话：最便宜的Token，是根本没进入上下文的Token。

上下文管理并非玄学，而是一种可以培养的良好习惯。给AI喂对材料、控制好用量、将不相关的任务分开讨论、长内容传递路径而非直接粘贴——做到这几点，你已经领先了大多数用户。

善用上下文，另一个直接的好处就是节省大量Token。当下算力竞争日趋激烈，AI不断进化，各大模型的Token单价持续走高。未来谁能用最少的Token完成工作，谁就更有可能获得效率优势。学会管理上下文，其实就是掌握了节约Token的关键能力。