Codex PPT Skill
一个面向 Codex 的 PPT 生成 skill,也可在 Claude Code、OpenClaw、Hermes Agent 等支持 SKILL.md 的 agent 中使用;在这些非 Codex 环境中通常需要配置 gpt-image-2 或第三方 OpenAI 兼容格式的生图 API。它把文章、报告、论文、课程笔记等内容转换成“整页图片式”的演示文稿:先规划大纲和视觉风格,再生成每页幻灯片图片,最后用本地脚本组装为 .pptx。
[!TIP] 本 skill 负责从文章、报告、大纲或想法生成图片式 PPT,适合强视觉表达,但页面元素本身不可直接编辑。如果你需要进一步转换成可编辑 PPT,可以在生成完成后尝试使用 image-to-editable-ppt-skill 进行转换。
关于
codex-ppt和image-to-editable-ppt这两个技能的详细介绍,参见 skill_duo_intro.pdf。该 PPT 由codex-pptskill 生成,提示词为:“请分别阅读 Codex PPT和 Image to Editable PPT 这两个技能的内容,然后用 Codex PPT 帮我做一个PPT吧,20页,每个技能的介绍10页。”
[!NOTE] 想查看更多用户用这个 skill 做出的 PPT 效果,可以前往置顶 Issue 的案例展示区:欢迎分享 codex-ppt 使用案例和 PPT 效果。
温馨提示
这个 skill 主要给大家提供一个还不错的 PPT 生成流程。为了尽量通用,它的流程设计会稍微复杂一些;复杂也会带来不稳定性或者冗余性。比如它同时兼容 Codex 内置生图和 API/CLI fallback 生图,也会兼容有无子 agent 可用这两种情况,但大部分人日常使用时其实只会固定走其中一条路线。
建议大家在走通自己常用的路线之后,让 AI 帮你改一下这个 skill,把你的偏好固定下来,省得每次都重新选择。比如固定使用内置生图或固定使用某个 API,固定是否使用子 agent,固定常用输出目录、风格、页数节奏等。
另外,如果你在做 PPT 的过程中遇到了自己喜欢的版式或排版,无论是这个 skill 做出来的,还是从别的地方找到的 PPT 风格图片,都可以让 AI 加到这个 skill 的 references/ 里,逐步形成你自己的风格库。Skills 本质上是非常个性化的流程,鼓励大家在使用这个 skill 的基础上,按自己的偏好持续调优,让它更适配自己的工作流。
关于 skills 如何设计和使用,可以参考 good-skill-design.pptx。这个 PPT 也是用本 skill 做的,采用的是手绘技术解释风;内容基于 Claude 在设计 skills 方面的最佳实践文章 The Complete Guide to Building Skills for Claude。祝大家玩得愉快!
特点
- 多 agent 可用:支持 Codex、Claude Code、OpenClaw、Hermes Agent 等支持
SKILL.md的环境;最推荐在 Codex 中使用,优先走内置生图和编辑图能力。 - 第三方中转站接入:支持 OpenAI 兼容接口、
base URL和自定义模型名配置,方便通过 API/CLI fallback 使用gpt-image-2或兼容模型。 - 稳定的阶段化流程:先确认大纲、页数、视觉风格、生图后端和样张,再进入整套生成,降低一次生成完整 PPT 时的返工和偏航。
- 不是无脑生成:会先引导你确认
outline.md、每页要点、风格方向和样张效果,再按确认后的方案继续。 - 低门槛输入:文章、报告、论文、课程笔记、Markdown、大纲、PDF、Word 等材料都可以作为起点。
- 内置 10 种 PPT 风格参考:包括清爽专业、科研答辩、电子墨水杂志、手绘技术解释、仪表盘、麦肯锡等;不会写提示词也可以先从内置风格开始,尤其推荐手绘技术解释风。
- 支持自定义风格复刻:可以上传喜欢的图片、PDF 或 PPT/PPTX,让 agent 先分析配色、版式、字体和视觉元素,再按该风格生成新 PPT。
- 可沉淀个人风格库:生成满意后,可以把当前风格保存到 skill 的
references/目录,下次直接复用,让这个 skill 越用越贴合你的偏好。 - 多 agent 并发生成:样张确认后,支持一个子 agent 负责一页,并对文字清晰度、风格一致性和内容完整性做自检,发现问题及时返修。
- 支持指定图片插入:可以要求某一页必须放入论文原图、实验结果图、截图、架构图等素材,并让页面围绕这些图片适配主题和版式。
- 自动生成演讲稿:会生成
speech.md,并在组装 PPTX 时写入每页备注,方便直接演示或二次修改。
生成效果
下面是一套技术分享 PPT 的生成效果示例。每页都是由 gpt-image-2 生成的完整 16:9 幻灯片图片,再由本地脚本组装为 PPTX。

下面是一套论文答辩风案例,来源于论文 Attention Is All You Need。它展示了如何在指定页中插入论文原始图片作为输入素材,例如模型架构图、attention 模块图和 attention 可视化图,并围绕这些图片生成统一风格的 PPT(见 Issue #14)。

风格示例
以下是已生成预览图的风格,示例图均由 gpt-image-2 生成,用于帮助用户在开始制作前选择视觉方向。
| 清爽专业风 | 创意杂志风 |
|---|---|
![]() | ![]() |
| 电子墨水杂志风 | 数据仪表盘风 |
![]() | ![]() |
| 复古扁平插画风 | 手绘技术解释风 |
![]() | ![]() |
| 手绘白板风 | 温暖手工风 |
![]() | ![]() |
| 科研答辩风 | 麦肯锡风格 |
![]() | ![]() |
输出结构
每个 PPT 会生成一个独立项目目录:
{基础目录}/{PPT名称}/ # 当前 PPT 的独立项目目录 ├── origin_image/ # 正式幻灯片图片目录,只放最终采用的页面 │ ├── slide_01.png # 第 1 页幻灯片图片 │ ├── slide_02.png # 第 2 页幻灯片图片 │ └── ... # 后续页面图片,按页码顺序命名 ├── outline.md # 经确认的 PPT 大纲、页数、每页标题和要点 ├── speech.md # 演讲稿,会写入 PPT 每页备注 └── {PPT名称}.pptx # 最终组装生成的 PowerPoint 文件
你可以在 origin_image/ 里查看每一页最终采用的幻灯片图片,文件会按 slide_01.png、slide_02.png 这样的顺序排列。想预览整套 PPT 的视觉效果,或只挑某一页继续修改时,直接看这里最方便。
speech.md 是配套演讲稿。生成 .pptx 时,这些内容会自动写入每页 PPT 的备注区,你可以在 PowerPoint 里直接查看、修改,或演示时作为讲稿使用。
适用场景
- 技术文章转分享 PPT
- 论文或报告转演示稿
- 课程笔记转课件
- 科研项目申报、中期检查、结题验收和论文答辩
- 商业汇报、产品介绍、调研总结
- 需要强视觉统一性的图片式演示文稿
安装
一句话安装
【推荐】可以直接把下面这句话发给你的 Agent,让它帮你安装:
请帮我安装这个 codex-ppt skill,链接是:https://github.com/ningzimu/codex-ppt-skill
手动安装到 Codex
如需手动安装到 Codex,可以使用 skills CLI 安装到 Codex 的全局 skills 目录:
npx -y skills@latest add ningzimu/codex-ppt-skill \ --skill codex-ppt \ --agent codex \ --global
安装完成后,重启 Codex 让新 skill 生效。
也可以从 GitHub Releases 下载 codex-ppt-skill-v*.zip,解压后把其中的 codex-ppt 文件夹放到 ~/.codex/skills/codex-ppt,然后重启 Codex。
如果你是在本地开发这个仓库,也可以把 skill 目录链接到 Codex skills 目录,方便实时调试修改:
mkdir -p ~/.codex/skills ln -s /path/to/codex-ppt-skill/skills/codex-ppt ~/.codex/skills/codex-ppt
OpenClaw
可以通过 ClawHub 安装:
openclaw skills install codex-ppt
ClawHub 页面:clawhub.ai/ningzimu/codex-ppt
如果使用 OpenClaw 的 skill allowlist,需要把 codex-ppt 加入允许列表。
Claude Code、Hermes Agent
这些 agent 都可以读取 SKILL.md 形式的 skill。也可以使用 skills CLI 安装:
# Claude Code npx -y skills@latest add ningzimu/codex-ppt-skill \ --skill codex-ppt \ --agent claude-code \ --global # Hermes Agent npx -y skills@latest add ningzimu/codex-ppt-skill \ --skill codex-ppt \ --agent hermes-agent \ --global
常见目标目录是:Claude Code 使用 ~/.claude/skills/codex-ppt,Hermes Agent 使用 ~/.hermes/skills/codex-ppt。
如果你是在本地开发这个仓库,也可以用软链接替代复制,方便实时调试修改。
生图模型配置
[!TIP] 你可以先正常使用 Codex PPT 开始制作 PPT。一般不需要自己手动配置生图模型;当流程走到“选择生图后端”时,AI 会根据当前环境判断是否需要配置,并在需要时引导你提供相关信息。
- 如果你使用的是 Codex 内置图片生成能力,通常不需要额外配置 API key。
- 如果你使用第三方 API 或 OpenAI 兼容中转站,请把中转站关于如何使用
gpt-image-2的文档发给 AI,让它先阅读文档,再帮你配置相关脚本和参数。
下面的手动配置说明主要用于 API/CLI fallback 场景。指定图片分辨率、提高质量或要求修改某一页,本身不会触发第三方 API 配置。典型需要配置的情况包括:
- 在 Codex 中使用第三方 API 或兼容中转站接入时,通常无法使用内置的图片生成工具。
- 在 Claude Code、OpenClaw、Hermes Agent 等环境中使用该 skill。
如果你是通过 GPT 会员订阅使用 Codex,并且 Codex 内置图片生成工具可用,就不需要额外配置 gpt-image-2。即使你在提示词里写“使用 gpt-image-2”,通常也可以继续使用 Codex 内置生图能力,不需要准备 API key。
如果确实需要外部生图接口,配置文件会写入 ~/.codex-ppt-skill/.env。使用第三方中转站时再填写 base URL;模型名默认是 gpt-image-2,除非中转站明确要求别的名称。配置完成后,Codex、Claude Code、OpenClaw、Hermes Agent 可以复用同一套配置。
确实需要手动配置或排查时,也可以直接运行配置命令:
python3 /path/to/codex-ppt-skill/skills/codex-ppt/scripts/codex_ppt_runtime.py config \ --api-key "your-api-key" \ --model gpt-image-2
其中 --api-key 是你的 API key;--model 是图片模型名,默认可使用 gpt-image-2。配置会写入 ~/.codex-ppt-skill/.env。不要把 API key 写进项目目录或提交到仓库。
如果使用第三方中转站,再加上 --base-url。如果中转站使用自定义模型名,就把 --model 改成中转站提供的名称:
python3 /path/to/codex-ppt-skill/skills/codex-ppt/scripts/codex_ppt_runtime.py config \ --api-key "your-api-key" \ --base-url "https://your-openai-compatible-endpoint/v1" \ --model openai/gpt-image-2
使用方式
在 Codex、Claude Code、OpenClaw 或 Hermes Agent 中明确指定使用 codex-ppt skill,例如:
请使用 codex-ppt skill 把 /path/to/article.md 做成 10 页左右的 PPT。
skill 会按以下流程执行:
- 阅读内容并规划 PPT 大纲
- 生成
outline.md,并请求你确认页数、标题和每页要点 - 给出 2-3 个视觉风格选项,并推荐一个让用户确认
- 在首次生图前说明将使用的生图方式,并请求你确认
- 使用确认后的图片生成后端生成 1 页样张,让用户确认风格、版式节奏和文字质量
- 创建 PPT 项目目录
- 使用同一图片生成后端逐页生成全部幻灯片图片
- 检查文字清晰度、风格一致性和内容完整性
- 生成
speech.md - 使用
assemble_ppt.py组装.pptx - 可选:如果生成的 PPT 风格你很喜欢,可以保存到风格库;如果使用的是内置风格,则无需重复保存
使用技巧
- 默认脚本分辨率是 2K 16:9 横屏。这个设置主要适用于你自己提供第三方
gpt-image-2API 或 OpenAI 兼容中转站的 API/CLI fallback 场景;如果生成的幻灯片图片比较模糊,尤其是文字较多的页面,可以让 AI 改用 4K 分辨率生成。Codex 会员默认会优先使用内置生图工具,内置工具目前不能手动指定图片分辨率。如果你不想额外购买第三方gpt-image-2API,但又想用会员身份生成 4K 级别的高清 PPT,可以组合使用 ningzimu/codex-gpt-image skill;它会使用会员登录,并以 API 方式调用gpt-image-2生图,再配合 Codex PPT 生成高清页面。 - 如果只是不满意某一页的内容、排版、配色或文字表达,可以直接让当前 agent 针对这一页做细致修改,不需要整套 PPT 重新生成。

- 你也可以提供喜欢的 PPT 风格参考,可以是一张截图、多张截图,或完整 PPT/PDF。建议先让当前 agent 分析参考材料的配色、版式、字体和视觉元素,再按这个风格生成新 PPT。生成满意后,也可以让 agent 把这套风格保存到本技能的
references/目录里,方便以后复用。 - 如果需要插入论文原图、实验结果图、截图或架构图,可以在大纲中指定这些图片对应的页码和用途。
QA
- 飞书文档:codex-ppt 常见问题与使用说明
交流群
扫描二维码加入 Skill 交流群,分享使用经验、反馈问题,并获取更新通知。
我的其他项目
- image-to-editable-ppt-skill:把幻灯片截图、PDF 页面或图片版 PPTX 重建为可编辑 PowerPoint,适合在
codex-ppt生成整页图片后继续做可编辑化。 - codex-gpt-image:通过 Codex OAuth / 会员登录调用
gpt-image-2的生图 skill,可和codex-ppt组合,用会员身份生成更高清的 PPT 页面。 - handdrawn-tech-illustrations:面向中文技术内容的手绘配图 skill,可以把技术文章、产品笔记、截图、大纲或粗略想法生成正文配图、概念解释图、微信公众号封面和小红书封面;风格强调亲和、轻卡通、中文可读和适中的信息密度。
- awesome-ai-ppt:精选的 AI PPT 相关开源项目,按 HTML-first、图片生成式、PPTX-native、转换与自动化基础设施等工作流分类,关注能帮助 agent 或开发者创建、编辑、转换、检查 PPT 的 GitHub 仓库。
- claude-code-lens:Claude Code 本地观测工具,用来查看 API 流量、日志、prompt 和工具调用,适合排查 agent 实际在做什么。
许可证
MIT









