DeepSeek V4三大实战场景深度实测:从红楼梦续写到代码重构的完整报告
DeepSeek V4预览版于昨日低调亮相,未设发布会,亦无倒计时提醒,仅在Hugging Face平台悄然更新了DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。消息一经传出,科技媒体便迅速跟进报道。确实,国内用户已翘首期盼V4版本数月之久。

自R1震动全球市场已逾一年,此次DeepSeek并未主打"性价比"策略,而是直击能力核心——百万级token上下文处理作为默认配置,而非附加增值功能。
笔者在发布后立即上手实测,设计了三个极具挑战性的真实应用场景。以下为完整测试记录,每个案例均附实际使用的提示词,可供直接复现。
场景一:百万上下文驱动下的《红楼梦》智能续写挑战
作为理科背景从业者,笔者对中国四大名著怀有深厚情结。初中阶段便已通读其中三部,中考假期啃完《红楼梦》后,方真正理解张爱玲所言"三大恨事"——鲥鱼多刺、海棠无香、《红楼》未完之深意。
借助AI续写红楼,一直是萦绕心头的心愿。Gemini 2.5时代曾尝试未果,不仅语言风格迥异,剧情走向更易失控。如今AI在Agent能力与长文本处理方面实现跨越式进步,恰逢DeepSeek V4在此领域有所突破,遂决意再度挑战。
首要任务是让DeepSeek推导后四十回剧情走向,构建完整大纲。
请完整阅读《红楼梦》前 80 回。
然后基于前 80 回的人物命运、伏笔、诗词判词、人物语言习惯、叙事节奏和整体悲剧气质,续写一个后 40 回大纲。
要求:
不要照搬通行本后 40 回;
每 5 回为一个单元,写出主要情节;
标出每个重要人物的命运走向;
说明你的续写依据来自前 80 回哪些伏笔;

DeepSeek输出的推导内容极为详实,与主流红学观点高度契合。

紧接着令其续写完整第八十一回,此项挑战难度极高。
给出完整的续写第81回。
续写要求:
1. 文风须严格对标原著回目体例,使用文白相间的叙事语言,对白须符合各人物的语言个性
2. 必须承接第80回的结尾情节,不得另起炉灶
3. 人物性格须与前80回保持高度一致,重点人物:贾宝玉、林黛玉、薛宝钗、王熙凤
4. 在续写中自然融入至少3处前80回埋下的伏笔,并在正文后注明你引用的是哪处原文伏笔
5. 回目名须符合对仗格式,共7至9字
正文字数:4000字左右
格式:正文 + 【伏笔注释】

不过当前提示词似乎对大模型限制过严,特别是"续写中自然融入至少3处伏笔"这一要求,迫使DeepSeek强行堆砌情节,导致剧情推进过快。

整体表现仅属中等水准,但伏笔解析部分仍显功底。

综合评价:中规中矩。大模型在古典名著续写任务上仍显吃力,需分层看待。
其一,阅读理解能力突出。能准确把握宝黛钗关系脉络、贾府衰败轨迹、王熙凤失势进程及宝玉出走结局,亦能精准调用"太虚幻境"“金陵十二钗判词"“通灵玉"“花落"等核心意象。这印证了百万上下文的价值——确实能从浩瀚文本中打捞关键线索。
其二,文学创作尚有差距。续写正文时问题浮现:虽知《红楼梦》应有梦幻、泪痕、花月意象,也能模仿"且说"“不觉"“一时"等古典句式,但韵味仍显浅薄。人物对白偏现代,情绪阐释过于直白,留白不足。尤其黛玉形象易流于"敏感才女”,却难现其尖刻、轻盈、孤傲、痛楚交织的复杂层次。
结论:V4堪当优秀红学助理,尚无法比肩曹雪芹。它能协助梳理伏笔、推演命运、搭建大纲,但要写出文学气韵,仍需人类创作者完成最后一公里的艺术凝练。
场景二:从OpenLovart到Infinite Luobo Canvas的完整代码重构
第二个场景聚焦于代码理解与Agent能力测试。选取GitHub开源项目OpenLovart作为改造对象。

鉴于笔者长期规划开发无限画布工具,此次直接以DeepSeek V4驱动完整重构。
提示词设计如下:
你现在是一名资深全栈工程师和产品架构师。
我会给你一个开源项目 OpenLovart 的完整代码仓库,https://github.com/xiaoju111a/OpenLovart。请先完整阅读项目结构、README、package.json、src/app、src/components/lovart、src/lib、API routes 和数据库相关文件。
你的任务不是简单解释项目,而是基于它改写一个新的产品:
产品名称:Infinite Luobo Canvas
产品定位:一个 AI 驱动的无限画布创作工具。
目标:
把 OpenLovart 现有的 AI 设计助手和智能画布能力,改造成一个更完整的无限画布项目。用户可以在画布上自由拖拽、缩放、旋转、组合元素,也可以通过 AI 对话生成图片、文本卡片、灵感板、分镜板、品牌视觉方案,并自动排布到画布上。
请按以下步骤输出:
第一步:项目理解
1. 用一张表说明 OpenLovart 当前的核心模块。
2. 找出和画布相关的关键文件。
3. 找出和 AI 对话 / AI 图片生成相关的关键文件。
4. 找出和项目保存、用户认证、数据库相关的关键文件。
5. 判断当前项目最适合复用的代码,以及需要重写的代码。
第二步:产品改写方案
请设计 Infinite Luobo Canvas 的 MVP,必须包含:
1. 无限画布:支持拖拽、缩放、平移、框选、多选。
2. 元素系统:支持 text、image、sticky、frame、shape、group 六类元素。
3. 画布操作:支持新增、删除、复制、层级调整、锁定、隐藏。
4. AI 生成:用户输入一句话,AI 生成一组画布元素,并自动插入到画布。
5. AI 编辑:用户选中元素后,可以让 AI 改写文案、生成配图、扩展视觉方向。
6. 项目保存:把 canvas elements、viewport、history 保存到数据库。
7. 导出:支持导出 PNG 或 JSON。
8. 历史记录:支持 undo / redo。
第三步:技术方案
1. 给出推荐的前端状态结构。
2. 给出 CanvasElement 的 TypeScript 类型定义。
3. 给出 Zustand 或 React state 的状态管理方案。
4. 给出核心组件拆分。
5. 给出 API route 设计。
6. 给出 Supabase 数据表结构。
7. 给出 AI 返回 JSON schema,确保模型输出可以直接转成画布元素。
第四步:代码修改计划
请基于现有仓库,输出需要新增、修改、删除的文件列表。
格式如下:
- 文件路径
- 修改目的
- 核心改动
- 风险点
第五步:生成代码
请优先生成以下文件的完整代码:
1. src/types/canvas.ts
2. src/components/lovart/InfiniteCanvas.tsx
3. src/components/lovart/CanvasElementRenderer.tsx
4. src/components/lovart/CanvasToolbar.tsx
5. src/hooks/useCanvasStore.ts
6. src/app/api/canvas/ai-generate/route.ts
7. src/app/api/projects/[id]/canvas/route.ts
第六步:自检
请检查:
1. 是否有 TypeScript 类型错误风险。
2. 是否有 Next.js App Router 使用错误。
3. 是否有客户端组件和服务端组件边界问题。
4. 是否有 Supabase 权限风险。
5. 是否有 AI 输出 JSON 不稳定的问题。
6. 哪些代码只是 demo,哪些可以进入生产环境。
输出要求:
1. 不要只给概念,要给可落地代码。
2. 不要一次性重写整个项目,优先围绕 MVP 改。
3. 每段代码前说明文件路径。
4. 每个关键文件后说明为什么这样设计。
5. 如果你无法确认某个文件内容,请明确标出【需要读取原文件后确认】。
鉴于代码生成任务的特殊性,此次未使用网页版,而是通过Claude Code接入API完成。API切换工具采用CC Switch,配置便捷高效。


配置完成后即可直接下发任务指令。

本轮测试中V4表现亮眼,迅速完成核心模块拆解并精准执行各项任务要求。

尽管部分博主反馈V4执行速度偏慢,但实测响应迅速,且价格优势极为明显。

如此规模的项目重构任务,总花费仅3元有余,性价比表现卓越。

结合官方Token定价策略,足见其诚意。

最终效果展示(中间调试过程略去)。
已关注
Follow
Replay Share Like
Close
观看更多
更多
退出全屏
切换到竖屏全屏**退出全屏
萝卜AI笔记已关注
Share Video
,时长01:22
0/0
00:00/01:22
切换到横屏模式
继续播放
进度条,百分之0
00:00
/
01:22
01:22
全屏
倍速播放中
继续观看
DeepSeek V4 悄悄上线,我拿它干了三件真活,结果。。。
观看更多
转载
,
DeepSeek V4 悄悄上线,我拿它干了三件真活,结果。。。
萝卜AI笔记已关注
Share点赞Wow
Added to Top StoriesEnter comment
整体效果令人满意,后续强化部分功能即可具备上线条件。
另因Google新政策,Pro会员每月享有免费API额度,足以覆盖调测需求,实属利好。
综合评估:V4如同一位高效的初级工程师,具备代码通读、原型搭建、方案设计能力。但在某些关键时刻,仍需资深开发者(如GPT)协助,差距客观存在,需正视。
场景三:50页企业级PPT的HTML实现与自动化生成
本场景未采用常规PPT大纲生成模式,而是直接挑战50页HTML演示文稿制作。
主题设定为《2026年AI Agent在企业办公场景中的应用趋势》,并提前规划每页核心内容(完整提示词较长,后台回复"dp"可获取)。
你现在是一名资深战略咨询顾问、企业数字化专家和前端工程师。
请为我生成一份 HTML 版本的 PPT,主题是:
《2026 年 AI Agent 在企业办公场景中的应用趋势》
这份 PPT 面向对象:
企业 CEO、CIO、数字化负责人、业务部门负责人、办公协同产品负责人。
核心目标:
帮助企业管理层理解 AI Agent 在 2026 年办公场景中的真实价值、落地路径、风险边界和组织影响。
请你直接输出一个完整、可运行的单文件 HTML。
要求我把代码保存为 `agent-office-trend-2026.html` 后,可以直接用浏览器打开,并进行幻灯片式演示。
一、整体要求
1. 总页数:50 页。
2. 页面比例:16:9。
3. 每一页都必须是一个独立 section。
4. 支持键盘左右方向键翻页。
5. 支持点击右下角按钮翻页。
6. 支持显示当前页码,例如 12 / 50。
7. 支持首页、上一页、下一页、末页按钮。
8. 页面需要有统一视觉风格。
9. 所有 CSS 和 JS 都写在同一个 HTML 文件里。
10. 不要依赖本地图片文件。
11. 可以使用 CSS 绘制图形、流程图、卡片、表格、时间线、矩阵图。
12. 不要使用外部字体文件。
13. 如果使用 CDN,请保证即使 CDN 失效,主体内容依然能正常展示。
14. 所有内容用中文。
二、视觉风格
整体风格:
高级、克制、科技感、适合企业汇报。
设计关键词:
深色背景、蓝紫渐变、玻璃拟态卡片、细线框、轻微发光、数据感、留白充足。
页面要求:
1. 每页只讲一个核心观点。
2. 每页标题不超过 24 个中文字符。
3. 每页正文不超过 120 个中文字符,特殊页除外。
4. 多使用图表、卡片、流程、矩阵、时间线。
5. 不要出现大段密密麻麻的文字。
6. 重点数字可以用大号字体突出。
7. 每一章之间要有章节页。
8. 第 1 页要有封面视觉冲击力。
9. 第 50 页要有明确结论和行动建议。
三、内容结构
请分为 5 个章节,每章 10 页。
第 1 章:为什么 2026 年是 AI Agent 办公落地的关键年
第 2 章:AI Agent 会优先改造哪些办公场景
第 3 章:企业落地 AI Agent 的真实门槛
第 4 章:不同部门如何部署自己的 Agent
第 5 章:从试点到规模化,企业下一步怎么做
四、50 页具体结构
请按以下结构生成:
第 1 页:封面
标题:《2026 年 AI Agent 在企业办公场景中的应用趋势》
副标题:从智能助手到工作流执行者
视觉:中心大标题 + 抽象网络节点背景
...
请现在直接输出完整 HTML 代码。

本场景聚焦三大核心能力验证:
第一,长结构控制能力。50页内容易发散,多数模型写到后期会重复观点或遗忘章节安排。
第二,演示文稿质感塑造能力。PPT非简单分段文章,每页需呈现独立观点、视觉焦点与停留价值。
第三,超长可运行代码生成能力。HTML、CSS、JS必须真实可用,键盘翻页、按钮交互、页码显示等功能需完整实现而非仅概念描述。
DeepSeek运行约十余分钟后输出结果。

提示词中明确规定的五章结构——2026年关键节点判断、优先改造场景识别、真实落地门槛分析、部门级部署方案、规模化演进路径——相比"帮我写份PPT"的模糊指令,更贴近真实工作场景。决策者需要的是可落地的灵感,而非空泛创意。
实际效果直接观看录屏。
已关注
Follow
Replay Share Like
Close
观看更多
更多
退出全屏
切换到竖屏全屏**退出全屏
萝卜AI笔记已关注
Share Video
,时长00:32
0/0
00:00/00:32
切换到横屏模式
继续播放
进度条,百分之0
00:00
/
00:32
00:32
全屏
倍速播放中
继续观看
DeepSeek V4 悄悄上线,我拿它干了三件真活,结果。。。
观看更多
转载
,
DeepSeek V4 悄悄上线,我拿它干了三件真活,结果。。。
萝卜AI笔记已关注
Share点赞Wow
Added to Top StoriesEnter comment
表现超出预期,前端实现能力尤其令人惊喜,翻页动画效果精准呈现。整体视觉风格统一,深色背景、蓝紫渐变、玻璃拟态卡片、数据图表与章节划分均符合要求。
当然,内容深度尚不足以直接用于高层汇报,战略判断、行业案例、风险评估等模块仍需人工补全。但作为初稿已完全达标——更重要的是,它不再是"提供大纲"的辅助层级,而是直接交付可修改、可演示、可深度打磨的半成品。
这一跃迁至关重要。
深度总结:当AI开始处理"完整工作流”
三轮实测结束,DeepSeek V4的定位已然清晰——它已具备处理"完整工作任务"的能力,而非局限于单句回复或简单问答。
它能通读《红楼梦》前八十回并整理伏笔脉络,能解析开源代码仓库并设计产品重构方案,能生成五十页可演示的HTML报告。但它仍未达到"开箱即用"的完美状态。
因此,V4最值得关注的并非"替代焦虑”,而是工作的前60%-70%正在被以极低价格重构。资料阅读、结构拆解、方向罗列、初稿撰写、原型搭建、PPT初版制作等体力密集型环节,将加速贬值。
真正的价值高地,正在向最后的决策关卡集中——价值判断、审美取舍、责任担当。
你我皆须为此做好准备。

