Star 历史趋势
数据来源: GitHub API · 生成自 Stargazers.cn
README.md

Document Format GUI (公文格式处理工具)

软件截图

一键修复 Word 文档格式,让排版不再头疼。

立即下载 · 核心能力 · 使用方法 · 常见问题 · English

Platform License Language


项目简介

这是一个专为解决 Word 文档格式混乱问题而设计的极简工具。它采用了现代化的纸质感 UI 设计,能够智能识别文档中的标点、排版和字体问题,并可以根据国家标准(GB/T 9704-2012)进行一键自动化修复。

特点:

  • 🎯 极简操作 — 即使是电脑小白也能上手即用
  • 🔒 安全离线 — 纯本地运行,数据不联网,保障公文安全
  • 📋 标准规范 — 严格遵循党政机关公文格式标准

v1.8.1 更新:

  • 📋 AI 粘贴生成 docx — 支持直接粘贴 AI 生成的纯文本或 Markdown 内容,自动生成 Word 文档并进入公文格式处理流程
  • 📝 Markdown 解析增强 — 支持 # / ## / ### 标题、**加粗**、列表、引用和代码块,兼容 ##标题 这种省略空格的中文 Markdown 写法
  • ⚙️ 多预设管理 — 自定义格式升级为多条命名预设,支持新建、切换、重命名、删除
  • 📤 配置导入导出 — 自定义预设可导出为 JSON 备份或分享,也可导入旧版配置文件
  • 📁 文件夹批量导入 — 支持选择文件夹后递归读取 .doc/.docx/.wps 文档批量处理
  • 🧹 强力清洗模式 — 可在排版前清除 AI 粘贴或复制来源带来的脏格式,再统一套用公文格式
  • 🐛 附件列表修复 — 修复落款后附件 2.xxx / 3.xxx 被误识别为正文或三级标题的问题,并按规范应用附件悬挂缩进
  • 🐛 粘贴标题修复 — 修复短标题或无公文关键字标题在 AI 粘贴流程中被误识别为正文的问题
  • 🪟 弹窗体验优化 — 自定义设置与粘贴文本弹窗会按屏幕自动放大,并补齐滚动体验

v1.7.2 更新:

  • 🐛 标题段间距修复 — 修复使用 Word 内置 Heading 样式的文档处理后,各级标题段前段后无法清零的问题(根因是样式表里的 Autospacing 强制覆盖直接属性)
  • 🐛 落款日期修复 — 修复 2026.04.20 等点分日期被误识别为三级标题并加粗的问题
  • 🐛 联合发文落款修复 — 落款单位长度上限从 30 字提至 60 字,覆盖联合发文场景
  • 🐛 落款单位后缀扩展 — 新增"指挥部 / 领导小组 / 管委会"等单位后缀的识别
  • 🐛 结构性空段修复 — 修复标题→正文、正文→落款之间的可见空行被错误压缩到 1pt 高的问题(根因是 Python 对象 id 在段落修改后失效)
  • 🖱️ 拖拽功能就位tkinterdnd2 加入默认依赖,输入框 placeholder 文案根据可用性动态切换

v1.7.1 更新:

  • 🐛 多行标题修复 — 修复文档前面有空段或文号时,多行标题第一行被误识别为正文(仿宋)的问题
  • 🐛 段落拆分修复 — 修复"1. 第一阶段:完成xxx"等行内段落被错误拆分为"标题段+正文段"的问题(默认禁用,需要的用户可在 preset 里设 split_heading_at_punct=true)
  • 🐛 内部参数修复 — 修复 bold_serial 入参被内部代码覆盖的逻辑
  • 🧹 清理仓库脏数据 — 重置被误提交的 custom_settings.json 默认值,新用户首次启动不会再得到异常配置
  • ✅ 加入回归测试 — 引入 pytest,新增 8 个 detect_para_type / split_heading 测试用例

v1.7.0 更新:

  • 🐛 表格对齐修复 — 修复处理后表格单元格对齐被覆盖的问题;默认保留原始对齐格式,自定义设置中可开启智能对齐规则
  • 🐛 页码重复修复 — 修复对已有页码的文档处理后出现两套页码并存的问题
  • 🐛 标题识别修复 — 修复机关名称作为标题第一行时被误识别为主送机关的问题
  • 🐛 自定义加粗丢失修复 — 修复处理不含三级标题的文档后,三级标题加粗设置丢失的问题
  • 📐 首行缩进单位 — 处理后文档在 Word 中显示首行缩进为"字符"单位而非厘米
  • ↕️ 段前段后间距 — 自定义设置中可统一调整全文段前、段后间距
  • 📏 页码位置可调 — 自定义设置中可调整页码距页面底边的距离
  • 🖱️ 文件拖拽支持 — 可直接将文件拖入输入框(需安装 tkinterdnd2)
  • ▶️ 处理后自动打开 — 新增可选开关,处理完成后自动在 Word 中打开输出文件
  • 🔡 序列词加粗开关 — 自定义设置中可控制「一是/一要/第一条」等序列词是否自动加粗

v1.6.0 更新:

  • 📂 批量处理 — 支持同时选择多个文件一并处理,自动输出到指定目录
  • 🔤 系统字体读取 — 字体下拉框从电脑实际安装的字体库动态读取,公文常用字体置顶显示
  • 🧠 标题识别优化 — 修复过长标题因换行导致第二行被误识别为正文或主送机关的问题
  • 📝 输出修订标记 — 新增可选模式,处理后的文档在 Word 中可逐条接受或拒绝格式更改
  • ␣ 空格规范处理 — 默认删除文档内多余空格;自定义模式支持规范英文/数字前后恰好保留一个空格
  • 🐧 Linux ARM64 支持 — 新增飞腾、鲲鹏等 ARM64 架构的国产系统预编译版本

更早版本:

  • v1.5.0:新增 Windows 7/8 兼容版本(Python 3.8 构建)
  • v1.4.0:新增 macOS 支持(.dmg 安装包,Intel 和 Apple Silicon);修复自定义配置回显问题;增强加粗控制
  • v1.3.0:新增 .doc / .wps 格式支持;表格自动调整;自定义格式配置;开箱即用打包

核心能力

本工具不仅仅是简单的格式刷,它能深度识别并修复以下常见痛点:

  1. 🔣 符号标准化:自动检测并修复括号、引号、逗号、句号、分号等全角半角混用问题,一律调整为中文规范符号。
  2. 📏 页边距校准:强制统一页边距设置,符合公文版心要求。
  3. 🔤 字体智能适配:智能识别小标题与正文层级,自动匹配对应的字体(如黑体、仿宋)和字号。
  4. 📝 缩进自动补全:扫描全文,为缺失首行缩进的段落自动添加标准的 2 字符缩进。
  5. 📐 行距统一规范:识别文档中不统一的行距设置,一键调整为标准行距(如 28 磅)。
  6. 1️⃣ 序号风格修正:自动清洗混乱的序号格式,统一风格(例如将混用的"1、"和"1."统一规范化)。
  7. 🎨 视觉背景调整:支持调整页面背景颜色,提供更舒适的编辑阅读体验。
  8. 🧹 字体样式清洗:深度清理文档中不规范的字体颜色、粗细、下划线及斜体,还原清爽版面。
  9. 📂 .DOC / .WPS 兼容:完整支持 .doc.wps 格式的输入与输出,无需手动转换,兼容 WPS 及 Microsoft Office 生态。
  10. 📊 表格自动调整:智能识别文档中的表格,自动调整列宽、行高及单元格格式。默认保留原始对齐方式,自定义模式下可开启按内容类型智能对齐(数字靠右、短文本居中等)。
  11. ⚙️ 自定义格式配置:支持用户自定义页边距、行距、字体字号等格式参数,满足不同排版需求。
  12. 🅱️ 灵活加粗控制:标题、各级标题、正文等均可独立设置加粗,高级设置中可逐元素精细控制。
  13. 📦 开箱即用:内置 pywin32 组件,无需额外安装 Python 环境,下载即用,真正的绿色免配置。

下载安装

Windows 10/11 用户

  1. 点击下载Document_Format_GUI.exe
  2. 下载后双击即可运行,无需安装 Python,绿色纯净。

注意

  • 支持 .docx.doc.wps 格式文档。

Windows 7/8 用户

  1. 点击下载Document_Format_GUI_Win7.exe
  2. 下载后双击即可运行,无需安装 Python。

注意

  • 需要 Windows 7 SP1 或更高版本
  • 需要安装 Microsoft Office 或 WPS Office 才能处理 .doc / .wps 格式
  • 推荐使用 .docx 格式以获得最佳兼容性
  • 如果双击后闪退,请安装 Visual C++ Redistributable 2015-2022

macOS 用户

  1. 点击下载Document_Format_GUI.dmg

  2. 安装步骤

    1. 双击下载的 .dmg 文件,弹出安装窗口
    2. 将应用图标拖拽到 Applications(应用程序) 文件夹中
    3. 关闭安装窗口,弹出(推出)DMG 磁盘映像
  3. 首次打开(重要⚠️)

    由于本应用未经过 Apple 公证签名,macOS 会阻止首次打开。请按以下步骤操作:

    1. 打开 访达(Finder) → 进入 应用程序 文件夹

    2. 找到「公文格式处理工具」,右键点击(或按住 Control 键单击)→ 选择 「打开」

    3. 弹出安全提示对话框,点击 「打开」 确认

    4. 之后再次使用时,双击即可正常打开,无需重复此步骤

    如果右键打开仍然被阻止(提示"无法验证开发者"),请尝试:

    1. 打开 系统设置隐私与安全性
    2. 向下滚动,在「安全性」区域找到被阻止的应用提示
    3. 点击 「仍要打开」 按钮
    4. 输入系统密码确认,即可正常使用

注意

  • macOS 版本仅支持 .docx 文件;.doc/.wps 需要先转换为 .docx
  • 公文字体(仿宋_GB2312、黑体等)macOS 不自带,建议提前安装对应字体以获得最佳效果。未安装时工具会自动回退到 macOS 系统字体。

国产系统用户(麒麟 / 统信 UOS / 深度 / 中标麒麟 等)

⚠️ 目前为测试版本,欢迎在 Issues 反馈问题(请注明系统名称和版本)

方式一:下载预编译版本(推荐)

第一步:查询当前架构,在终端运行:

uname -m
输出结果适用硬件下载链接
x86_64Intel / AMD / 兆芯 / 海光docformat_linux
aarch64飞腾 / 鲲鹏 / 树莓派docformat_linux_arm64

第二步:赋予执行权限并运行

chmod +x docformat_linux # ARM64 用户替换为 docformat_linux_arm64 ./docformat_linux

如果双击无反应,请在文件管理器中右键 → 属性 → 勾选"允许作为程序执行"

方式二:源码运行(binary 报错时的备选)

适合 binary 无法运行的情况(如 GLIBC 版本不匹配、龙芯等其他架构):

# 1. 下载源码(或从 Releases 下载源码压缩包) git clone https://github.com/KaguraNanaga/docformat-gui.git cd docformat-gui # 2. 运行安装助手(自动检测环境、安装依赖、启动程序) bash install.sh

注意

  • Linux 版本仅支持 .docx 文件;.doc/.wps 请先在 Windows 上另存为 .docx
  • 龙芯(LoongArch)用户请使用方式二

使用方法

第一步:选择文件

点击界面上方的「输入」栏,选择你需要处理的 Word 文档。

第二步:选择模式

界面提供了三种处理模式,满足不同需求:

模式适用场景
🪄 智能一键处理(推荐) 全自动模式。同时进行标点修复、排版规范和样式清洗,一步到位。
🩺 格式诊断只想看看文档有哪些问题,但暂时不想修改文件。
🩹 标点修复仅修复中英文标点混用的情况,保留原文档的字体和段落格式。

第三步:开始处理

点击中间醒目的 「开始处理」 按钮。

  • 处理完成后,工具会自动在原文件旁边生成一个新的文件(文件名后缀为 _processed)。
  • 你的原文件永远不会被覆盖或修改,请放心使用。

常见问题

Q:处理后的文档打开是乱码或字体不对? A:公文格式依赖特定的字体。请确保你的电脑安装了以下字体(Windows 通常自带):

  • 仿宋_GB2312
  • 黑体
  • 楷体_GB2312

Q:macOS 上提示"已损坏,无法打开"怎么办? A:在终端中执行以下命令移除隔离属性,然后重新打开:

xattr -cr /Applications/docformat_macos.app

Q:Windows 7 上运行闪退或报错怎么办? A:请确保:

  1. 已安装 Windows 7 SP1
  2. 已安装 Visual C++ Redistributable 2015-2022
  3. 下载的是 Win7 专用版本(文件名含 _win7

Q:Linux 上提示 “Exec format error” 或无法执行? A:通常是架构不匹配。请先运行 uname -m,然后下载对应的 x86_64 或 ARM64 版本。

Q:Linux 上提示 “GLIBC_2.xx not found” 或启动失败? A:系统的 glibc 版本过低或不兼容。建议改用源码方式运行:bash install.sh

Q:Linux 上提示缺少 tkinter 或无法创建窗口? A:请先安装系统依赖(例如 sudo apt-get install -y python3-tk),然后再运行 bash install.sh

Q:为什么提示「文件不存在」? A:请检查文件名或文件夹路径中是否包含极其生僻的特殊字符。建议将文件放在桌面或纯英文路径下尝试。

Q:可以批量处理多个文件吗? A:支持。点击输入框时可多选文件(按住 Ctrl 或 Shift),选择多个文件后输出框会自动切换为目录选择模式,处理完成后所有文件统一保存到指定目录,文件名自动添加 _processed 后缀。

Q:龙芯(LoongArch)能用吗? A:目前没有 LoongArch 预编译版本。请使用源码方式运行:bash install.sh


反馈与建议

如果这个工具帮到了你,或者你发现了 Bug,欢迎联系我:


数据安全

🔒 本工具所有操作均在本地完成,不会上传任何文档内容到服务器或云端。无网络通信、无数据收集、无遥测追踪。源代码完全开放,欢迎审查。

详见 数据安全与免责声明


开源许可

本项目基于 MIT 许可证 开源,欢迎开发者共同完善。

第三方依赖许可证信息详见 THIRD_PARTY_LICENSES.md

Made with ❤️ by KaguraNanaga

关于 About

公文格式自动处理工具(可本地运行)
chinese-documentchinese-documentationclaude-codeclaudecodedocformatterdocumentation-tooldocumentformat

语言 Languages

Python99.8%
Shell0.2%

提交活跃度 Commit Activity

代码提交热力图
过去 52 周的开发活跃度
37
Total Commits
峰值: 17次/周
Less
More

核心贡献者 Contributors