免费AI工具Agnes全模态API深度评测:周调用4.11万亿Token,4K图像与1M上下文接入实战
Agnes AI 近期对其免费开放的全模态能力进行了重大升级,目前提供文本、图片、视频 API,TTS 语音能力也正在灰度测试中。
文本模型为 Agnes-2.0-Flash,支持 1M Token 上下文;图片模型 Agnes-Image-2.1-Flash 可生成最高 4K 图像;视频模型 Agnes-Video-2.0 支持 720P / 1080P 输出。这些能力可以直接嵌入到以下工作流里:
- 生成 4K 封面、商品图、人像、城市夜景和图标;
- 处理长文档、代码库、会议记录等长材料;
- 通过本地工具把文本模型接入开发流程;
- 用视频 API 完成图生视频和分镜草稿;
- 通过官方 GitHub Issues 跟踪开发进度、已知问题和错误处理建议。
Agnes 官方在 GitHub 上专门建立了 Issues 反馈区和 Projects 看板,方便用户集中反馈问题并跟进进度。


地址:
**https://github.comhttps://watermelonwater.tech/insights_imgs/免费ClaudeCode等AI工具被薅爆3.webp)
- 文本模型
Agnes-2.0-Flash贡献约2.67T Token; - 图片与视频模型
Agnes-Image-2.1-Flash、Agnes-Video-2.0合计贡献约1.44T Token; - 图片模型周度生成
567 万+张; - 视频模型周度生成
237 万+秒。
这些数字比单纯宣称“免费开放”更具参考价值。文本侧的 2.67T Token 表明 Agent、多轮对话、文档处理和代码任务等高 Token 消耗场景正在大量运转;图片和视频侧合计 1.44T Token,叠加 567 万+ 张图片与 237 万+ 秒视频,证明视觉生成并非附带功能,用户确实在批量试产素材。
这释放出两个信号。
一是需求极强。免费 API 降低了连续尝试的心理成本:一篇文章封面可以多跑几版,一段视频镜头可以多试几段,一个代码任务可以多让模型检索几轮上下文。
二是压力也真实存在。调用量攀升后,高峰期变慢、排队、偶发失败都会更常见。若准备接入自己的工作流,超时、重试、日志和人工复核机制最好从一开始就预留好。
4K 图片:不要只看缩略图
Agnes-Image-2.1-Flash 现已支持 1K、2K、3K、4K 分辨率。最高可生成 4096x4096 的 1:1 图片,也支持 1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9 等常见比例。
调用方式变化不大。此前 1K 请求大致如下:
{
"model": "agnes-image-2.1-flash",
"prompt": "一张 AI Agent 产品落地页首屏图,干净明亮,不要文字,不要水印",
"size": "1K",
"ratio": "16:9"
}
若要尝试 4K,只需将 size 改为 4K:
{
"model": "agnes-image-2.1-flash",
"prompt": "一张 AI Agent 产品落地页首屏图,干净明亮,不要文字,不要水印",
"size": "4K",
"ratio": "16:9"
}
返回格式仍可选 url 或 b64_json,根据自己工作流接入即可。不过 4K 生成耗时更长,官方也明确说明存在 RPM 限制:4K 图片 1 分钟 只能请求 1 次。若需批量出图,更建议先用 1K 快速筛选风格,最后仅将最有希望的一版切换到 4K。
评测 4K 图片时,缩略图意义有限。真正需要关注的是边缘、材质、反光、手部、头发、背景层次和小物件等细节。以下提供几组可直接测试的提示词(第 1、2、5 组为新增场景,更偏向内容生产与真实素材用途)。
关于接入方式可参考:Claude Code 接入Agnes AI
案例一:技术文章封面背景图
技术文章封面容易陷入两个误区:画面与通用科技海报雷同,或者细节过乱导致后续添加标题时难以压住。这组提示词仅需背景,不含文字,便于自行排版:
16:9 横版 4K 技术文章封面背景图。
主题是一个开源项目的工程化工作台,画面中有一张深色木质桌面,桌面上放着打开的笔记本电脑、几页打印出来的架构草图、便签纸和一支黑色签字笔。
笔记本屏幕不要出现可读文字,只保留抽象的代码编辑器色块、终端窗口和文件树轮廓。
整体真实摄影风格,光线从左侧窗户进入,桌面有细腻纹理和自然阴影。
画面左侧留出较干净的暗色区域,方便后期放中文标题。
不要文字,不要品牌 Logo,不要水印,不要夸张霓虹,不要复杂 UI 小字。

需要重点观察三点:桌面材质是否足够稳重,屏幕里的 UI 是否会生成乱码文字,左侧留白区域是否真正干净。
案例二:咖啡器具电商主图
电商主图不只要求物体清晰,金属、玻璃、陶瓷、液体反光都是容易暴露问题的细节。
1:1 4K 电商产品主图。
主体是一套极简风格的手冲咖啡器具,包括透明玻璃滤杯、细口手冲壶和白色陶瓷咖啡杯。
器具放在浅灰色石材台面上,背景是明亮但虚化的厨房空间。
光线从右上方进入,玻璃边缘要清晰,金属壶身有真实反光,陶瓷杯有柔和高光。
画面适合电商详情页首图,主体居中,背景干净,不要文字,不要品牌 Logo,不要水印。

可重点查看玻璃边缘、壶嘴形状、杯口椭圆以及台面接触阴影。若这些区域模糊,4K 分辨率也难以挽救。
案例三:美食特写图
美食类图片在公众号和生活内容中使用频率很高,但也最容易出现问题:热气显得虚假、汤汁糊成一团、食材呈现塑料质感。
1:1 4K 美食微距特写。
主体是一碗热气腾腾的日式豚骨拉面,汤面上有半熟溏心蛋、两片叉烧、葱花和一小撮海苔。
镜头略微俯拍,景深很浅,面条和配料清晰,背景的木质餐桌和筷子自然虚化。
汤面有真实热气升腾,叉烧有油脂光泽,溏心蛋断面有柔和高光。
真实摄影风格,暖色灯光,高细节,不要文字,不要品牌 Logo,不要水印。

重点观察热气是否自然、汤汁和叉烧的油脂反光、溏心蛋断面的层次。这几个区域一旦模糊,高分辨率也无法弥补真实感的缺失。
案例四:扁平风概念插画
公众号正文中经常需要概念插画来表达抽象流程。矢量风格看似简单,却非常考验边缘干净度,画面中也极易出现无法辨认的乱码小字。
16:9 4K 扁平矢量风格概念插画。
主题是一条数据处理流水线:左边是若干文档和数据库图标,中间是一个抽象的处理节点,右边输出整齐的图表卡片。
用简洁的几何形状和柔和的撞色配色,主色为蓝色、青色和少量橙色点缀。
线条干净,色块平整,留白充足,整体适合放进技术文章正文。
不要任何文字和数字,不要复杂渐变,不要写实质感,不要水印。

主要考察两点:色块边缘与线条是否干净利落,画面中是否会生成无法阅读的乱码文字。即便明确要求“不要文字”,不少模型仍可能添加若干乱码标签。
案例五:播客节目视觉图标
图标类素材看似简单,实则对边缘控制要求很高:小尺寸下要具备识别度,大尺寸下则不能充斥廉价渐变。
1:1 4K 播客节目视觉图标。
主题是面向开发者的技术访谈节目。
主体是一个简洁的桌面麦克风,旁边有抽象的代码括号符号和一小段声波线条。
圆角方形底,主色为深墨绿色、白色和少量暖黄色,高对比但不要刺眼。
整体干净、现代、适合移动端播客封面,小尺寸下仍然能看清主体。
不要文字,不要品牌 Logo,不要水印,不要复杂纹理。

可将图像缩小到手机桌面尺寸查看主体是否仍然清晰可辨。
1M 上下文:大窗口不等于乱塞材料
Agnes-2.0-Flash 支持 1M 上下文后,接口与模型名无需变动。只要请求中 messages 的总内容量在 1M Token 范围内,即可按原有方式调用。但有一点需要提前说明:官方 GitHub issue 中明确指出,为保证初期稳定性,高峰期可能会将上下文临时限制到 512K,待系统负载恢复后再放宽至 1M。因此测试长上下文时,不要默认任何时段都能稳定用满 1M。
这对长材料任务极具吸引力。以往处理长文档、会议记录或代码库,往往需要先切片、再检索,并将 topK 片段填进上下文。该流程虽可行,但切片位置可能截断信息,而检索未覆盖的内容模型完全看不到。上下文容量扩大后,可以减少被迫切碎的操作,但仍不建议一次性将所有仓库、文档和聊天记录全部倾入。材料越多,越应让模型先确认范围、列出证据,再给出结论。

上下文窗口(Context Window)= LLM 的工作记忆
可优先针对以下几类任务进行测试:
- 长技术手册、合同、论文、会议记录,需要跨章节问答或风险点检查;
- 中等规模代码库,要求理解模块关系、调用链、配置流向以及潜在改动影响;
- 多份关联文档,要求找出前后矛盾、重复结论或被忽略的约束。
若测试代码库,可向本地代码助手提供一个真实项目,并要求其回答:
请帮我看看这个项目的多模型切换模块是如何实现的。
要求:
1. 先列出你读取到的关键文件;
2. 说明请求从入口到模型调用的完整链路;
3. 找出当前实现里最容易出问题的 3 个点;
4. 不要修改代码,只输出分析结果。
这比解释一个孤立函数更具参考意义。真正的项目理解需要考察文件之间的关系。若只提供一个函数,模型容易得出似是而非的答案;而提供一个完整模块,它需要知道配置来源、路由发生位置、异常处理路径和日志插入点。更稳健的做法是分两步:先让模型查看目录、文件名和搜索结果来确定模块范围,确认后再逐步读取关键文件。1M 上下文可以让工作台变大,但材料如何摆放、重点如何标注、证据如何回查,仍需依赖上下文工程来兜底。
代码审查、合同风险点、线上故障复盘等任务更应保持保守。模型给出的风险清单只能作为初筛,最终必须回到原始文件、段落、日志或测试结果中进行验证。
接入本地开发工具的最小配置
若想将文本模型接入本地开发工具,可通过 CC Switch 实现一层转发。链路可简化为一句话:
本地开发工具 -> CC Switch -> Agnes API
需要准备 Agnes API Key、CC Switch 以及一个 支持自定义供应商的开发工具。
第一步:获取 Agnes API Key
访问 Agnes API Platform:https://platform.agnes-ai.com/,注册登录后进入 API Key 页面,创建并复制一个新的 Key。

第二步:安装 CC Switch
CC Switch 地址:https://github.com/farion1231/cc-switch/releases。安装完成后打开 CC Switch,进入对应工具的配置页,重点是将 Agnes 配置为自定义供应商。

第三步:添加 Agnes 供应商并拉取模型
新增供应商时,供应商类型选择 claude,配置方式选自定义配置,主要填写四项:
- API Key:粘贴已创建的 Key;
- 请求地址:
https://apihub.agnes-ai.com/v1; - API 格式:
openai chat completions; - 模型:
agnes-2.0-flash。
填完后点击一次“获取模型列表”。若能拉取到 agnes-2.0-flash,说明 Key、地址和模型名基本无误,再按照 CC Switch 提示完成模型映射。

第四步:添加兼容参数
某些工具请求中会携带第三方模型暂不支持的字段,例如 thinking、context_management。为避免请求直接失败,建议在 CC Switch 中添加以下配置:
{
"allowed_openai_params": [
"thinking",
"context_management"
],
"litellm_settings": {
"drop_params": true
}
}

第五步:开启路由并验证
供应商添加完毕后,回到 CC Switch 设置页,进入路由配置,选择本地路由,找到对应工具的路由并启用。

验证时不要一上来就修改项目,先执行一个轻量任务:
请用 5 句话解释 Java 中 HashMap 扩容为什么可能影响性能。
若能正常回复,说明基础链路已通。如果卡住,应先查看 CC Switch 日志确认请求是否到达,再核对 API Key、请求地址和模型名。
GitHub:开发进度和报错别靠猜
AgnesAI-Labs 已将官方仓库和 Issues 公开,用户反馈、Bug、功能排期与排错说明都集中在一处:
- 官方仓库:https://github.com/AgnesAI-Labs/Agnes-AI
- Issues:https://github.com/AgnesAI-Labs/Agnes-AI/issues
- Project 看板:**https://github.comhttps://watermelonwater.tech/insights_imgs/免费ClaudeCode等AI工具被薅爆15.webp)
/agnes-image2-video 使用 Agnes 把这张图片生成一段电影感视频。
TTS 可以放在最后考量。一套完整多媒体流程可以先由文本模型撰写脚本和分镜,图片模型生成关键视觉,视频模型产出片段,TTS 负责旁白或角色台词。语音能力最终还需观察音色自然度、长文本稳定性、停顿控制以及批量任务表现,待灰度稳定后再整体接入更为稳妥。
更适合哪些任务
Agnes 更适合优先投入三类任务。
第一类是内容素材。4K 图片免费后,封面、海报、商品图、视频关键帧都可以多试几版。过去可能反复纠结“这一版要不要重新生成”,现在可以先把大致方向跑出来,再挑选一版高清重生成。
第二类是长材料分析。长技术手册、项目文档、会议记录、合同条款、代码库模块分析均可用于测试。关键在于要求模型给出证据位置,而非仅仅提供一段看似完整的总结。
第三类是 AI 应用原型。文本、图片、视频均能通过同一套 API 调用,适合先将流程跑通。例如一个自动生成短视频脚本、封面和演示片段的小工具,在早期不必接入过多供应商即可验证核心流程。
不过,免费并不代表可以省略工程兜底。高峰期可能变慢,视频任务本身耗时较长,长上下文请求也更为沉重。接入生产流程时,超时、重试、降级、日志和人工复核机制必须妥善保留。图片和视频的生成结果更需要人工筛选,人物、产品、文字、品牌素材等场景切勿仅凭第一眼判断。
最后
本轮 Agnes 更适合连续任务场景:连续生成多版封面、连续让长上下文模型检查多份文档、连续将一个脚本拆解成分镜并生成图像与视频片段。这些动作单个看似不大,但日常工作流正是由这些小动作串联而成。
若准备接入,建议从最小任务开始:图片先测 4K 细节,文本先测长材料分析,视频先测图生视频。每一步都保留日志与人工复核节点,这样即使在高峰期出现波动,也能准确定位问题根源。
Agnes AI 文档地址:https://agnes-ai.com/doc/
Agnes API Platform:https://platform.agnes-ai.com/