AI 生成文档这件事,最容易被低估的不是内容能力,而是交付形态。
模型现在能写研报、简历、方案、演示稿,也能把一堆资料整理成像样的结构。但很多输出一落到页面上,还是那种熟悉的“AI 默认样”:纯白底、冷灰字、段落松散、标题随手加粗、卡片阴影像 SaaS 后台。内容可能没问题,阅读欲望先被版式消耗掉一半。
Kami 想解决的就是这个缝隙:不是再造一个在线文档工具,也不是给 Claude 套几张漂亮模板,而是把“好文档应该长什么样”拆成一套 Agent 能稳定执行的约束语言。
这一步挺关键。AI 文档生成真正进入交付场景后,问题不再只是“写没写出来”,而是每次生成能不能保持同一套审美、同一套密度、同一套可打印的页面节奏。说白了,内容生产已经被模型拉起来了,纸面质量不能还停在随手导出的 Word。
Kami 真正做的不是模板库
Kami(紙,かみ)这个名字很直白:纸,最终承载交付物的那一层。
项目作者 tw93 把它定义为一套给 AI 使用的文档设计系统。它目前是一个开源 Skill / 模板系统,可以被 Claude Code、Codex、OpenCode、Pi 这类能读取 Skills 的 Agent 使用,也能通过 Claude Desktop 上传 kami.zip 作为 Skill。
它的核心不是“我给你八个模板,你自己挑一个改改”。更准确地说,它把文档交付拆成三层:
- 第一层是文档类型:One-Pager、Long Doc、Letter、Portfolio、Resume、Slides、Equity Report、Changelog。
- 第二层是设计约束:背景、字体、行距、强调色、阴影、标签、图表风格。
- 第三层是生产规则:用哪条模板、怎么判断语言、怎么处理品牌资料、怎么用 WeasyPrint 导出 PDF、怎么做页面溢出和视觉 QA。
这就让 Kami 更像“文档交付的操作系统”,而不是一组截图好看的模板。Agent 接到任务后,不只是把内容塞进 HTML,它还会按文档目的、语言、读者和交付格式去选路线。
比如你说“帮我把这份调研做成长报告”,它应该走 Long Doc;你说“做一份公司介绍一页纸”,它走 One-Pager;你说“做一套演讲幻灯片”,默认走 WeasyPrint HTML 到 PDF 的 slides 路径,只有明确要求可编辑 PPTX 时才切到 Python PPTX。
这个判断看着细,其实是 Agent 工程里很值钱的一步:把“凭感觉生成”变成“按规程交付”。
八条设计铁律,比花哨模板更重要
Kami 的视觉风格很克制:暖米色纸面、油墨蓝强调、serif 字体、紧凑行距、很轻的阴影。它没有走当下 AI 工具常见的紫色渐变、玻璃拟态和三张大卡片。
这套约束里最有意思的不是“好看”,而是它有明确的反面清单。
页面背景固定为 #f5f4ed,不用纯白。纯白在屏幕上刺眼,打印出来也容易显得便宜;暖米色更接近纸面,也能让长文阅读没那么累。
强调色只有 #1B365D 油墨蓝一种,而且占比要很低。很多 AI 生成页面的问题就是颜色太多,红的绿的紫的全上,最后看起来像主题市场。Kami 把颜色收得很死,让读者只在真正需要的位置看到重点。
字体也很讲究:中文走仓耳今楷 02,英文走 Charter,日文走 YuMincho,每种语言尽量只用一套 serif。标题和正文靠字号、间距、左侧竖线建立层级,而不是动不动加粗。这个决定会让文档更像出版物,而不是后台管理页。
还有一个很工程化的小细节:Tag 背景必须用实色 hex,不用 rgba()。原因不是审美洁癖,而是 WeasyPrint 渲染 PDF 时,透明色可能在 padding 区和字形区叠加,出现双层矩形 bug。这个点很小,但能看出 Kami 不是只在浏览器里摆个样子,它确实考虑了导出 PDF 的坑。
这些规则单看都不复杂,组合起来才是价值。Agent 最怕的不是不会设计,而是每次设计都不稳定。Kami 的做法是把可变空间压小:少颜色、少字重、少阴影、少随机发挥,换来每次输出都像同一个系统里出来的。
安装以后怎么用
Claude Code 用户可以直接通过 skills 安装:
也可以走 Claude Code plugin marketplace:
Codex、OpenCode、Pi 以及其他读取 ~/.agents/ 的通用 Agent,可以用通配安装:
Claude Desktop 用户更简单,下载最新的 kami.zip,在 Customize → Skills → “+” → Create skill 里上传 ZIP,不需要解压。
装完以后,不需要记复杂命令。直接用自然语言描述交付物就行:
如果只是想验证 Skill 是否触发,可以先给它一个低风险任务,比如做一页纸项目介绍。看输出是否符合 Kami 的纸面风格,再把真实业务材料交给它。
最小可用流程:从素材到 PDF
更稳的用法不是把一句话丢给 Agent 让它“自由发挥”,而是给它一点边界。
可以按这个顺序来:
- 先告诉它文档目的:融资、内部评审、销售介绍、个人求职、技术分享,不同目的决定信息密度。
- 再说明读者:老板、投资人、开发者、客户、招聘经理,不同读者决定术语解释程度。
- 给出硬约束:一页、两页、A4、中文、英文、是否要 PDF、是否要可编辑 PPTX。
- 提供素材:产品介绍、项目链接、数据、截图、Logo、品牌色;缺什么就让它标出来,不要让它瞎编。
- 让它先产出 HTML/PDF,再做视觉 QA:标题是否过长、页面是否溢出、中文字体是否正常、图表是否真的有信息量。
一个比较实用的提示词可以这样写:
如果你要的是长报告,可以把“一页纸”换成长文档:
这类提示词的重点不是“请你排版得好看一点”,而是把文档场景说清楚。Kami 负责稳定的纸面系统,Agent 负责内容整理和模板填充,两边边界越清楚,结果越稳。
Brand Profile:让文档有你的固定口味
Kami 还支持一个可选的品牌配置文件:
这个文件可以写你的身份、网站、默认语言、页面尺寸、语气习惯、品牌色等信息。官方参考里把它设计成“最低分辨率上下文”:只有当前任务没说清楚时才补位,不能覆盖这次明确要求。
一个简化版可以这样写:
这东西适合经常做同一类交付的人:咨询顾问、独立开发者、投资分析师、设计师、求职者、产品负责人。你不用每次都重复“我是谁、我喜欢什么语气、我的默认页面风格是什么”,Agent 可以从这个文件里拿到基础偏好。
但这里也要克制。Brand Profile 不是万能设定集,不要把几千字私货塞进去。写太多,反而会污染当前任务。稳定信息放进去,具体项目要求放到当前提示词里,这样最稳。
真要放进团队流程,要补三道闸
Kami 很适合个人和小团队做高质量文档交付,但如果要放进公司流程,不能只看生成效果。
第一道闸是字体和授权。中文默认字体仓耳今楷 02 个人使用免费,商业用途需要授权。内部实验问题不大,对外商业交付前要确认字体许可。如果团队不想处理授权,可以改成已有商业授权字体或系统 fallback,但要重新做视觉检查,因为字体变化会影响页数和溢出。
第二道闸是事实来源。Kami 能把页面做得很漂亮,但漂亮页面会放大错误事实的伤害。研报、简历、投资备忘录、客户方案,都要把数据来源、日期、口径和不确定项标清楚。Agent 可以帮你整理,但最后责任不该甩给排版系统。
第三道闸是导出验证。WeasyPrint、字体、CJK fallback、分页、图片路径、SVG 图表,都可能导致 PDF 和浏览器预览不一致。交付前至少检查这些点:
- PDF 页数是否符合预期;
- 标题、表格、图表有没有被截断;
- 中文、英文、日文是否有缺字或字体跳变;
- 代码块、表格、脚注是否保留换行;
- 图片是否是本地可访问资源,不依赖临时链接;
- 对外文件里是否残留占位符、内部说明或测试数据。
如果你的文档里有客户资料、研发计划、财务数字,最好在独立环境里跑 Agent,不要把密钥和内部数据丢进一台日常乱试插件的机器。
顺手提一嘴,如果你最近正搭这种 Agent 实验环境,建议把“试模板、跑 WeasyPrint、导出 PDF、接对象存储”单独放到一台干净云服务器里,别和生产数据库混在一起。雨云这类轻量云服务器拿来做隔离测试机就挺合适:环境可重建,权限好收口,也方便把失败版本直接删掉重来。
Kami 适合谁,不适合谁
如果你只是偶尔让 AI 写一段文字,Kami 可能有点重。它真正适合的是那些经常要把 AI 输出变成正式交付物的人。
比如咨询顾问要交一页纸方案,投资人要快速整理公司研究,独立开发者要做项目介绍,求职者要打磨简历,产品团队要把调研沉淀成内部报告,技术负责人要把架构说明做成能给老板看的 PDF。
这些场景里,文档不是“顺手导出一下”那么简单。版式会影响信任,密度会影响阅读,字体和颜色会影响专业感。很多时候,读者先感受到的是页面气质,再决定要不要认真看内容。
Kami 不适合拿来做花哨营销页,也不适合替代 Canva、Figma 或成熟的在线协作套件。它更像一个安静的文档工匠:把 Agent 已经写好的东西,装进一张更靠谱的纸面里。
这类项目的意义:Agent 开始管理交付审美
Kami 值得看,不只是因为它能让 PDF 好看一点。
更大的变化是,Agent 的能力边界正在从“写内容”往“管理交付标准”移动。以前我们让 AI 写完,再人工拿到 Word、Keynote、Figma 里一点点调。现在更合理的路径是:把审美、版式、字体、导出、验收都写成 Skill,让 Agent 在生成阶段就遵守。
这和代码领域的 lint、format、test 很像。没人指望程序员每次靠手感统一缩进和风格,大家会把规则写进工具链。文档交付也一样,不能每次靠“再好看一点”这种抽象提示词碰运气。
Kami 给出的答案很朴素:把好纸面的规则写死,把不该随机的东西收起来,把文档从聊天窗口里拎出来,变成一个可以交付、可以复查、可以重复生产的文件。
AI 生成内容已经不新鲜了。下一步真正拉开差距的,是谁能把内容、设计和生产流程接成一条稳定链路。Kami 这类 Skill 的价值,就在这里。