免费AI工具Agnes全模态API深度评测：周调用4.11万亿Token，4K图像与1M上下文接入实战

June 25, 2026

Agnes AI 近期对其免费开放的全模态能力进行了重大升级，目前提供文本、图片、视频 API，TTS 语音能力也正在灰度测试中。

文本模型为 Agnes-2.0-Flash，支持 1M Token 上下文；图片模型 Agnes-Image-2.1-Flash 可生成最高 4K 图像；视频模型 Agnes-Video-2.0 支持 720P / 1080P 输出。这些能力可以直接嵌入到以下工作流里：

生成 4K 封面、商品图、人像、城市夜景和图标；
处理长文档、代码库、会议记录等长材料；
通过本地工具把文本模型接入开发流程；
用视频 API 完成图生视频和分镜草稿；
通过官方 GitHub Issues 跟踪开发进度、已知问题和错误处理建议。

Agnes 官方在 GitHub 上专门建立了 Issues 反馈区和 Projects 看板，方便用户集中反馈问题并跟进进度。

地址：

**https://github.comhttps://watermelonwater.tech/insights_imgs/免费ClaudeCode等AI工具被薅爆3.webp)

文本模型 Agnes-2.0-Flash 贡献约 2.67T Token；
图片与视频模型 Agnes-Image-2.1-Flash、Agnes-Video-2.0 合计贡献约 1.44T Token；
图片模型周度生成 567 万+ 张；
视频模型周度生成 237 万+ 秒。

这些数字比单纯宣称“免费开放”更具参考价值。文本侧的 2.67T Token 表明 Agent、多轮对话、文档处理和代码任务等高 Token 消耗场景正在大量运转；图片和视频侧合计 1.44T Token，叠加 567 万+ 张图片与 237 万+ 秒视频，证明视觉生成并非附带功能，用户确实在批量试产素材。

这释放出两个信号。

一是需求极强。免费 API 降低了连续尝试的心理成本：一篇文章封面可以多跑几版，一段视频镜头可以多试几段，一个代码任务可以多让模型检索几轮上下文。

二是压力也真实存在。调用量攀升后，高峰期变慢、排队、偶发失败都会更常见。若准备接入自己的工作流，超时、重试、日志和人工复核机制最好从一开始就预留好。

4K 图片：不要只看缩略图

Agnes-Image-2.1-Flash 现已支持 1K、2K、3K、4K 分辨率。最高可生成 4096x4096 的 1:1 图片，也支持 1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9 等常见比例。

调用方式变化不大。此前 1K 请求大致如下：

{  
  "model": "agnes-image-2.1-flash",  
  "prompt": "一张 AI Agent 产品落地页首屏图，干净明亮，不要文字，不要水印",  
  "size": "1K",  
  "ratio": "16:9"  
}

若要尝试 4K，只需将 size 改为 4K：

{  
  "model": "agnes-image-2.1-flash",  
  "prompt": "一张 AI Agent 产品落地页首屏图，干净明亮，不要文字，不要水印",  
  "size": "4K",  
  "ratio": "16:9"  
}

返回格式仍可选 url 或 b64_json，根据自己工作流接入即可。不过 4K 生成耗时更长，官方也明确说明存在 RPM 限制：4K 图片 1 分钟 只能请求 1 次。若需批量出图，更建议先用 1K 快速筛选风格，最后仅将最有希望的一版切换到 4K。

评测 4K 图片时，缩略图意义有限。真正需要关注的是边缘、材质、反光、手部、头发、背景层次和小物件等细节。以下提供几组可直接测试的提示词（第 1、2、5 组为新增场景，更偏向内容生产与真实素材用途）。

关于接入方式可参考：Claude Code 接入Agnes AI

案例一：技术文章封面背景图

技术文章封面容易陷入两个误区：画面与通用科技海报雷同，或者细节过乱导致后续添加标题时难以压住。这组提示词仅需背景，不含文字，便于自行排版：

16:9 横版 4K 技术文章封面背景图。  
主题是一个开源项目的工程化工作台，画面中有一张深色木质桌面，桌面上放着打开的笔记本电脑、几页打印出来的架构草图、便签纸和一支黑色签字笔。  
笔记本屏幕不要出现可读文字，只保留抽象的代码编辑器色块、终端窗口和文件树轮廓。  
整体真实摄影风格，光线从左侧窗户进入，桌面有细腻纹理和自然阴影。  
画面左侧留出较干净的暗色区域，方便后期放中文标题。  
不要文字，不要品牌 Logo，不要水印，不要夸张霓虹，不要复杂 UI 小字。

需要重点观察三点：桌面材质是否足够稳重，屏幕里的 UI 是否会生成乱码文字，左侧留白区域是否真正干净。

案例二：咖啡器具电商主图

电商主图不只要求物体清晰，金属、玻璃、陶瓷、液体反光都是容易暴露问题的细节。

1:1 4K 电商产品主图。  
主体是一套极简风格的手冲咖啡器具，包括透明玻璃滤杯、细口手冲壶和白色陶瓷咖啡杯。  
器具放在浅灰色石材台面上，背景是明亮但虚化的厨房空间。  
光线从右上方进入，玻璃边缘要清晰，金属壶身有真实反光，陶瓷杯有柔和高光。  
画面适合电商详情页首图，主体居中，背景干净，不要文字，不要品牌 Logo，不要水印。

可重点查看玻璃边缘、壶嘴形状、杯口椭圆以及台面接触阴影。若这些区域模糊，4K 分辨率也难以挽救。

案例三：美食特写图

美食类图片在公众号和生活内容中使用频率很高，但也最容易出现问题：热气显得虚假、汤汁糊成一团、食材呈现塑料质感。

1:1 4K 美食微距特写。  
主体是一碗热气腾腾的日式豚骨拉面，汤面上有半熟溏心蛋、两片叉烧、葱花和一小撮海苔。  
镜头略微俯拍，景深很浅，面条和配料清晰，背景的木质餐桌和筷子自然虚化。  
汤面有真实热气升腾，叉烧有油脂光泽，溏心蛋断面有柔和高光。  
真实摄影风格，暖色灯光，高细节，不要文字，不要品牌 Logo，不要水印。

重点观察热气是否自然、汤汁和叉烧的油脂反光、溏心蛋断面的层次。这几个区域一旦模糊，高分辨率也无法弥补真实感的缺失。

案例四：扁平风概念插画

公众号正文中经常需要概念插画来表达抽象流程。矢量风格看似简单，却非常考验边缘干净度，画面中也极易出现无法辨认的乱码小字。

16:9 4K 扁平矢量风格概念插画。  
主题是一条数据处理流水线：左边是若干文档和数据库图标，中间是一个抽象的处理节点，右边输出整齐的图表卡片。  
用简洁的几何形状和柔和的撞色配色，主色为蓝色、青色和少量橙色点缀。  
线条干净，色块平整，留白充足，整体适合放进技术文章正文。  
不要任何文字和数字，不要复杂渐变，不要写实质感，不要水印。

主要考察两点：色块边缘与线条是否干净利落，画面中是否会生成无法阅读的乱码文字。即便明确要求“不要文字”，不少模型仍可能添加若干乱码标签。

案例五：播客节目视觉图标

图标类素材看似简单，实则对边缘控制要求很高：小尺寸下要具备识别度，大尺寸下则不能充斥廉价渐变。

1:1 4K 播客节目视觉图标。  
主题是面向开发者的技术访谈节目。  
主体是一个简洁的桌面麦克风，旁边有抽象的代码括号符号和一小段声波线条。  
圆角方形底，主色为深墨绿色、白色和少量暖黄色，高对比但不要刺眼。  
整体干净、现代、适合移动端播客封面，小尺寸下仍然能看清主体。  
不要文字，不要品牌 Logo，不要水印，不要复杂纹理。

可将图像缩小到手机桌面尺寸查看主体是否仍然清晰可辨。

1M 上下文：大窗口不等于乱塞材料

Agnes-2.0-Flash 支持 1M 上下文后，接口与模型名无需变动。只要请求中 messages 的总内容量在 1M Token 范围内，即可按原有方式调用。但有一点需要提前说明：官方 GitHub issue 中明确指出，为保证初期稳定性，高峰期可能会将上下文临时限制到 512K，待系统负载恢复后再放宽至 1M。因此测试长上下文时，不要默认任何时段都能稳定用满 1M。

这对长材料任务极具吸引力。以往处理长文档、会议记录或代码库，往往需要先切片、再检索，并将 topK 片段填进上下文。该流程虽可行，但切片位置可能截断信息，而检索未覆盖的内容模型完全看不到。上下文容量扩大后，可以减少被迫切碎的操作，但仍不建议一次性将所有仓库、文档和聊天记录全部倾入。材料越多，越应让模型先确认范围、列出证据，再给出结论。

上下文窗口（Context Window）= LLM 的工作记忆

可优先针对以下几类任务进行测试：

长技术手册、合同、论文、会议记录，需要跨章节问答或风险点检查；
中等规模代码库，要求理解模块关系、调用链、配置流向以及潜在改动影响；
多份关联文档，要求找出前后矛盾、重复结论或被忽略的约束。

若测试代码库，可向本地代码助手提供一个真实项目，并要求其回答：

请帮我看看这个项目的多模型切换模块是如何实现的。  
  
要求：  
1. 先列出你读取到的关键文件；  
2. 说明请求从入口到模型调用的完整链路；  
3. 找出当前实现里最容易出问题的 3 个点；  
4. 不要修改代码，只输出分析结果。

这比解释一个孤立函数更具参考意义。真正的项目理解需要考察文件之间的关系。若只提供一个函数，模型容易得出似是而非的答案；而提供一个完整模块，它需要知道配置来源、路由发生位置、异常处理路径和日志插入点。更稳健的做法是分两步：先让模型查看目录、文件名和搜索结果来确定模块范围，确认后再逐步读取关键文件。1M 上下文可以让工作台变大，但材料如何摆放、重点如何标注、证据如何回查，仍需依赖上下文工程来兜底。

代码审查、合同风险点、线上故障复盘等任务更应保持保守。模型给出的风险清单只能作为初筛，最终必须回到原始文件、段落、日志或测试结果中进行验证。

接入本地开发工具的最小配置

若想将文本模型接入本地开发工具，可通过 CC Switch 实现一层转发。链路可简化为一句话：

本地开发工具 -> CC Switch -> Agnes API

需要准备 Agnes API Key、CC Switch 以及一个 支持自定义供应商的开发工具。

第一步：获取 Agnes API Key

访问 Agnes API Platform：https://platform.agnes-ai.com/，注册登录后进入 API Key 页面，创建并复制一个新的 Key。

第二步：安装 CC Switch

CC Switch 地址：https://github.com/farion1231/cc-switch/releases。安装完成后打开 CC Switch，进入对应工具的配置页，重点是将 Agnes 配置为自定义供应商。

第三步：添加 Agnes 供应商并拉取模型

新增供应商时，供应商类型选择 claude，配置方式选自定义配置，主要填写四项：

API Key：粘贴已创建的 Key；
请求地址：https://apihub.agnes-ai.com/v1；
API 格式：openai chat completions；
模型：agnes-2.0-flash。

填完后点击一次“获取模型列表”。若能拉取到 agnes-2.0-flash，说明 Key、地址和模型名基本无误，再按照 CC Switch 提示完成模型映射。

第四步：添加兼容参数

某些工具请求中会携带第三方模型暂不支持的字段，例如 thinking、context_management。为避免请求直接失败，建议在 CC Switch 中添加以下配置：

{  
  "allowed_openai_params": [  
    "thinking",  
    "context_management"  
  ],  
  "litellm_settings": {  
    "drop_params": true  
  }  
}

第五步：开启路由并验证

供应商添加完毕后，回到 CC Switch 设置页，进入路由配置，选择本地路由，找到对应工具的路由并启用。

验证时不要一上来就修改项目，先执行一个轻量任务：

请用 5 句话解释 Java 中 HashMap 扩容为什么可能影响性能。

若能正常回复，说明基础链路已通。如果卡住，应先查看 CC Switch 日志确认请求是否到达，再核对 API Key、请求地址和模型名。

GitHub：开发进度和报错别靠猜

AgnesAI-Labs 已将官方仓库和 Issues 公开，用户反馈、Bug、功能排期与排错说明都集中在一处：

官方仓库：https://github.com/AgnesAI-Labs/Agnes-AI
Issues：https://github.com/AgnesAI-Labs/Agnes-AI/issues
Project 看板：**https://github.comhttps://watermelonwater.tech/insights_imgs/免费ClaudeCode等AI工具被薅爆15.webp)

测试视频链接：https://mpvideo.qpic.cn/0bc3qacboaaehmac4nz6rnvfjagdc6aaifya.f10002.mp4?dis_k=2da4bb60ab0e9497f0f6967827e3e5a3&dis_t=1782320200&play_scene=10120&auth_info=LoWV0NwAcwM1i7X5uQV+YkE+MR9kNW1OaWADZxkEajETHEcnfiloTkIJYwItb3NCVTQ=&auth_key=146e52c1cfa0d81f9dec325a3580c0a2&vid=wxv_4573611559641366530&format_id=10002&support_redirect=0&mmversion=false

/agnes-image2-video 使用 Agnes 把这张图片生成一段电影感视频。

TTS 可以放在最后考量。一套完整多媒体流程可以先由文本模型撰写脚本和分镜，图片模型生成关键视觉，视频模型产出片段，TTS 负责旁白或角色台词。语音能力最终还需观察音色自然度、长文本稳定性、停顿控制以及批量任务表现，待灰度稳定后再整体接入更为稳妥。

更适合哪些任务

Agnes 更适合优先投入三类任务。

第一类是内容素材。4K 图片免费后，封面、海报、商品图、视频关键帧都可以多试几版。过去可能反复纠结“这一版要不要重新生成”，现在可以先把大致方向跑出来，再挑选一版高清重生成。

第二类是长材料分析。长技术手册、项目文档、会议记录、合同条款、代码库模块分析均可用于测试。关键在于要求模型给出证据位置，而非仅仅提供一段看似完整的总结。

第三类是 AI 应用原型。文本、图片、视频均能通过同一套 API 调用，适合先将流程跑通。例如一个自动生成短视频脚本、封面和演示片段的小工具，在早期不必接入过多供应商即可验证核心流程。

不过，免费并不代表可以省略工程兜底。高峰期可能变慢，视频任务本身耗时较长，长上下文请求也更为沉重。接入生产流程时，超时、重试、降级、日志和人工复核机制必须妥善保留。图片和视频的生成结果更需要人工筛选，人物、产品、文字、品牌素材等场景切勿仅凭第一眼判断。

最后

本轮 Agnes 更适合连续任务场景：连续生成多版封面、连续让长上下文模型检查多份文档、连续将一个脚本拆解成分镜并生成图像与视频片段。这些动作单个看似不大，但日常工作流正是由这些小动作串联而成。

若准备接入，建议从最小任务开始：图片先测 4K 细节，文本先测长材料分析，视频先测图生视频。每一步都保留日志与人工复核节点，这样即使在高峰期出现波动，也能准确定位问题根源。

Agnes AI 文档地址：https://agnes-ai.com/doc/

Agnes API Platform：https://platform.agnes-ai.com/