Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

KaguraNanaga/docformat-gui

Repository files navigation

Document Format GUI (公文格式处理工具)

软件截图

一键修复 Word 文档格式,让排版不再头疼。

立即下载 · 核心能力 · 使用方法 · 常见问题 · English

Platform License Language


项目简介

这是一个专为解决 Word 文档格式混乱问题而设计的极简工具。它采用了现代化的纸质感 UI 设计,能够智能识别文档中的标点、排版和字体问题,并可以根据国家标准(GB/T 9704-2012)进行一键自动化修复。

特点:

  • 🎯 极简操作 — 即使是电脑小白也能上手即用
  • 🔒 安全离线 — 纯本地运行,数据不联网,保障公文安全
  • 📋 标准规范 — 严格遵循党政机关公文格式标准

v1.8.4 更新:

  • 🐛 自定义格式生效修复 — 修复源码运行和打包运行读取自定义配置路径不一致,导致保存后的自定义格式没有真正应用的问题
  • 🪟 主窗口尺寸优化 — 默认窗口宽度加大,文件输入与操作区域显示更舒展
  • 🧩 自定义预设兼容增强 — 自动修复旧配置缺失 active_preset_id 的情况,避免保存后回落到错误预设

v1.8.2 更新:

  • 🧯 稳定热修版 — 优先保障 Windows 7/8 兼容版的启动、格式化、标点修复和诊断稳定性
  • 🧪 AI 功能暂缓公开 — AI 逻辑检查仍为实验功能,v1.8.2 稳定版默认隐藏 AI 入口,避免影响 Win7 热修版稳定性
  • 🛠️ AI 内测开关 — 开发/内测可通过 DOCFORMAT_ENABLE_EXPERIMENTAL_AI=1 临时启用 AI 入口,正式用户无需配置 API Key

v1.8.1 更新:

  • 📋 AI 粘贴生成 docx — 支持直接粘贴 AI 生成的纯文本或 Markdown 内容,自动生成 Word 文档并进入公文格式处理流程
  • 📝 Markdown 解析增强 — 支持 # / ## / ### 标题、**加粗**、列表、引用和代码块,兼容 ##标题 这种省略空格的中文 Markdown 写法
  • ⚙️ 多预设管理 — 自定义格式升级为多条命名预设,支持新建、切换、重命名、删除
  • 📤 配置导入导出 — 自定义预设可导出为 JSON 备份或分享,也可导入旧版配置文件
  • 📁 文件夹批量导入 — 支持选择文件夹后递归读取 .doc/.docx/.wps 文档批量处理
  • 🧹 强力清洗模式 — 可在排版前清除 AI 粘贴或复制来源带来的脏格式,再统一套用公文格式
  • 🐛 附件列表修复 — 修复落款后附件 2.xxx / 3.xxx 被误识别为正文或三级标题的问题,并按规范应用附件悬挂缩进
  • 🐛 粘贴标题修复 — 修复短标题或无公文关键字标题在 AI 粘贴流程中被误识别为正文的问题
  • 🪟 弹窗体验优化 — 自定义设置与粘贴文本弹窗会按屏幕自动放大,并补齐滚动体验

v1.7.2 更新:

  • 🐛 标题段间距修复 — 修复使用 Word 内置 Heading 样式的文档处理后,各级标题段前段后无法清零的问题(根因是样式表里的 Autospacing 强制覆盖直接属性)
  • 🐛 落款日期修复 — 修复 2026年04月20日 等点分日期被误识别为三级标题并加粗的问题
  • 🐛 联合发文落款修复 — 落款单位长度上限从 30 字提至 60 字,覆盖联合发文场景
  • 🐛 落款单位后缀扩展 — 新增"指挥部 / 领导小组 / 管委会"等单位后缀的识别
  • 🐛 结构性空段修复 — 修复标题→正文、正文→落款之间的可见空行被错误压缩到 1pt 高的问题(根因是 Python 对象 id 在段落修改后失效)
  • 🖱️ 拖拽功能就位tkinterdnd2 加入默认依赖,输入框 placeholder 文案根据可用性动态切换

v1.7.1 更新:

  • 🐛 多行标题修复 — 修复文档前面有空段或文号时,多行标题第一行被误识别为正文(仿宋)的问题
  • 🐛 段落拆分修复 — 修复"1. 第一阶段:完成xxx"等行内段落被错误拆分为"标题段+正文段"的问题(默认禁用,需要的用户可在 preset 里设 split_heading_at_punct=true)
  • 🐛 内部参数修复 — 修复 bold_serial 入参被内部代码覆盖的逻辑
  • 🧹 清理仓库脏数据 — 重置被误提交的 custom_settings.json 默认值,新用户首次启动不会再得到异常配置
  • ✅ 加入回归测试 — 引入 pytest,新增 8 个 detect_para_type / split_heading 测试用例

v1.7.0 更新:

  • 🐛 表格对齐修复 — 修复处理后表格单元格对齐被覆盖的问题;默认保留原始对齐格式,自定义设置中可开启智能对齐规则
  • 🐛 页码重复修复 — 修复对已有页码的文档处理后出现两套页码并存的问题
  • 🐛 标题识别修复 — 修复机关名称作为标题第一行时被误识别为主送机关的问题
  • 🐛 自定义加粗丢失修复 — 修复处理不含三级标题的文档后,三级标题加粗设置丢失的问题
  • 📐 首行缩进单位 — 处理后文档在 Word 中显示首行缩进为"字符"单位而非厘米
  • ↕️ 段前段后间距 — 自定义设置中可统一调整全文段前、段后间距
  • 📏 页码位置可调 — 自定义设置中可调整页码距页面底边的距离
  • 🖱️ 文件拖拽支持 — 可直接将文件拖入输入框(需安装 tkinterdnd2)
  • ▶️ 处理后自动打开 — 新增可选开关,处理完成后自动在 Word 中打开输出文件
  • 🔡 序列词加粗开关 — 自定义设置中可控制「一是/一要/第一条」等序列词是否自动加粗

v1.6.0 更新:

  • 📂 批量处理 — 支持同时选择多个文件一并处理,自动输出到指定目录
  • 🔤 系统字体读取 — 字体下拉框从电脑实际安装的字体库动态读取,公文常用字体置顶显示
  • 🧠 标题识别优化 — 修复过长标题因换行导致第二行被误识别为正文或主送机关的问题
  • 📝 输出修订标记 — 新增可选模式,处理后的文档在 Word 中可逐条接受或拒绝格式更改
  • ␣ 空格规范处理 — 默认删除文档内多余空格;自定义模式支持规范英文/数字前后恰好保留一个空格
  • 🐧 Linux ARM64 支持 — 新增飞腾、鲲鹏等 ARM64 架构的国产系统预编译版本

更早版本:

  • v1.5.0:新增 Windows 7/8 兼容版本(Python 3.8 构建)
  • v1.4.0:新增 macOS 支持(.dmg 安装包,Intel 和 Apple Silicon);修复自定义配置回显问题;增强加粗控制
  • v1.3.0:新增 .doc / .wps 格式支持;表格自动调整;自定义格式配置;开箱即用打包

核心能力

本工具不仅仅是简单的格式刷,它能深度识别并修复以下常见痛点:

  1. 🔣 符号标准化:自动检测并修复括号、引号、逗号、句号、分号等全角半角混用问题,一律调整为中文规范符号。
  2. 📏 页边距校准:强制统一页边距设置,符合公文版心要求。
  3. 🔤 字体智能适配:智能识别小标题与正文层级,自动匹配对应的字体(如黑体、仿宋)和字号。
  4. 📝 缩进自动补全:扫描全文,为缺失首行缩进的段落自动添加标准的 2 字符缩进。
  5. 📐 行距统一规范:识别文档中不统一的行距设置,一键调整为标准行距(如 28 磅)。
  6. 1️⃣ 序号风格修正:自动清洗混乱的序号格式,统一风格(例如将混用的"1、"和"1."统一规范化)。
  7. 🎨 视觉背景调整:支持调整页面背景颜色,提供更舒适的编辑阅读体验。
  8. 🧹 字体样式清洗:深度清理文档中不规范的字体颜色、粗细、下划线及斜体,还原清爽版面。
  9. 📂 .DOC / .WPS 兼容:完整支持 .doc.wps 格式的输入与输出,无需手动转换,兼容 WPS 及 Microsoft Office 生态。
  10. 📊 表格自动调整:智能识别文档中的表格,自动调整列宽、行高及单元格格式。默认保留原始对齐方式,自定义模式下可开启按内容类型智能对齐(数字靠右、短文本居中等)。
  11. ⚙️ 自定义格式配置:支持用户自定义页边距、行距、字体字号等格式参数,满足不同排版需求。
  12. 🅱️ 灵活加粗控制:标题、各级标题、正文等均可独立设置加粗,高级设置中可逐元素精细控制。
  13. 📦 开箱即用:内置 pywin32 组件,无需额外安装 Python 环境,下载即用,真正的绿色免配置。

下载安装

Windows 10/11 用户

  1. 点击下载:Document_Format_GUI.exe
  2. 下载后双击即可运行,无需安装 Python,绿色纯净。

注意:

  • 支持 .docx.doc.wps 格式文档。

Windows 7/8 用户

  1. 点击下载:Document_Format_GUI_Win7.exe
  2. 下载后双击即可运行,无需安装 Python。

注意:

  • 需要 Windows 7 SP1 或更高版本
  • 需要安装 Microsoft Office 或 WPS Office 才能处理 .doc / .wps 格式
  • 推荐使用 .docx 格式以获得最佳兼容性
  • 如果双击后闪退,请安装 Visual C++ Redistributable 2015-2022

macOS 用户

  1. 按芯片下载对应版本:

  2. 安装步骤:

    1. 双击下载的 .dmg 文件,弹出安装窗口
    2. 将应用图标拖拽到 Applications(应用程序) 文件夹中
    3. 关闭安装窗口,弹出(推出)DMG 磁盘映像
  3. 打开应用:

    正式发布版已经过 Apple 公证签名,直接双击即可打开,不会再出现"无法验证开发者"或"已损坏"的拦截。

    如果你用的是未公证的测试版 / 自行打包版,首次打开被拦截怎么办
    1. 双击应用,在弹出的提示框点 「完成」
    2. 打开 系统设置隐私与安全性
    3. 向下滚动,在「安全性」区域找到"已阻止 XXX 以保护你的 Mac"的提示
    4. 点击 「仍要打开」,输入系统密码确认即可
    5. 之后再次使用直接双击,无需重复

    注意:macOS Sequoia(15) 起已取消"右键→打开"的绕过方式,只能走上面系统设置里的「仍要打开」。

注意:

  • macOS 版本仅支持 .docx 文件;.doc/.wps 需要先转换为 .docx
  • 公文字体(仿宋_GB2312、黑体等)macOS 不自带,建议提前安装对应字体以获得最佳效果。未安装时工具会自动回退到 macOS 系统字体。
  • 当前 macOS 打包版默认关闭文件拖拽入口,优先保证 Intel / Apple Silicon 两个版本都能稳定打开。选择文件、批量文件夹、AI 粘贴生成 docx 等功能不受影响。

国产系统用户(麒麟 / 统信 UOS / 深度 / 中标麒麟 等)

⚠️ 目前为测试版本,欢迎在 Issues 反馈问题(请注明系统名称和版本)

方式一:下载预编译版本(推荐)

第一步:查询当前架构,在终端运行:

uname -m
输出结果 适用硬件 下载链接
x86_64 Intel / AMD / 兆芯 / 海光 docformat_linux
aarch64 飞腾 / 鲲鹏 / 树莓派 docformat_linux_arm64

第二步:赋予执行权限并运行

chmod +x docformat_linux # ARM64 用户替换为 docformat_linux_arm64
./docformat_linux

如果双击无反应,请在文件管理器中右键 → 属性 → 勾选"允许作为程序执行"

方式二:源码运行(binary 报错时的备选)

适合 binary 无法运行的情况(如 GLIBC 版本不匹配、龙芯等其他架构):

# 1. 下载源码(或从 Releases 下载源码压缩包)
git clone https://github.com/KaguraNanaga/docformat-gui.git
cd docformat-gui
# 2. 运行安装助手(自动检测环境、安装依赖、启动程序)
bash install.sh

注意:

  • Linux 版本仅支持 .docx 文件;.doc/.wps 请先在 Windows 上另存为 .docx
  • 龙芯(LoongArch)用户请使用方式二

使用方法

第一步:选择文件

点击界面上方的「输入」栏,选择你需要处理的 Word 文档。

第二步:选择模式

界面提供了三种处理模式,满足不同需求:

模式 适用场景
🪄 智能一键处理 (推荐) 全自动模式。同时进行标点修复、排版规范和样式清洗,一步到位。
🩺 格式诊断 只想看看文档有哪些问题,但暂时不想修改文件。
🩹 标点修复 仅修复中英文标点混用的情况,保留原文档的字体和段落格式。

第三步:开始处理

点击中间醒目的 「开始处理」 按钮。

  • 处理完成后,工具会自动在原文件旁边生成一个新的文件(文件名后缀为 _processed)。
  • 你的原文件永远不会被覆盖或修改,请放心使用。

常见问题

Q:处理后的文档打开是乱码或字体不对? A:公文格式依赖特定的字体。请确保你的电脑安装了以下字体(Windows 通常自带):

  • 仿宋_GB2312
  • 黑体
  • 楷体_GB2312

Q:macOS 上提示"已损坏,无法打开"怎么办? A:在终端中执行以下命令移除隔离属性,然后重新打开(按你下载的版本二选一):

# Intel 芯片
xattr -cr /Applications/docformat_macos_intel.app
# Apple Silicon(M 系列)
xattr -cr /Applications/docformat_macos_apple_silicon.app

Q:Windows 7 上运行闪退或报错怎么办? A:请确保:

  1. 已安装 Windows 7 SP1
  2. 已安装 Visual C++ Redistributable 2015-2022
  3. 下载的是 Win7 专用版本(文件名含 _win7)

Q:Linux 上提示 "Exec format error" 或无法执行? A:通常是架构不匹配。请先运行 uname -m,然后下载对应的 x86_64 或 ARM64 版本。

Q:Linux 上提示 "GLIBC_2.xx not found" 或启动失败? A:系统的 glibc 版本过低或不兼容。建议改用源码方式运行:bash install.sh

Q:Linux 上提示缺少 tkinter 或无法创建窗口? A:请先安装系统依赖(例如 sudo apt-get install -y python3-tk),然后再运行 bash install.sh

Q:为什么提示「文件不存在」? A:请检查文件名或文件夹路径中是否包含极其生僻的特殊字符。建议将文件放在桌面或纯英文路径下尝试。

Q:可以批量处理多个文件吗? A:支持。点击输入框时可多选文件(按住 Ctrl 或 Shift),选择多个文件后输出框会自动切换为目录选择模式,处理完成后所有文件统一保存到指定目录,文件名自动添加 _processed 后缀。

Q:龙芯(LoongArch)能用吗? A:目前没有 LoongArch 预编译版本。请使用源码方式运行:bash install.sh


AI 检查配置(实验功能)

AI 逻辑检查目前仍为实验功能,v1.8.2 稳定版默认隐藏入口。开发/内测时可设置 DOCFORMAT_ENABLE_EXPERIMENTAL_AI=1 后再配置 ai_settings.json。如需减少本单位简称、惯用语、单位情况造成的误报,可复制 ai_glossary.example.txtai_glossary.txt 后填写术语表;文件位置也可通过 scripts.ai_config.get_glossary_path() 查看。注意:ai_glossary.txt 会随每次 AI 检查请求一起发送给 AI 服务商,请不要写个人信息、内部人事、涉密内容或其他不应外发的信息。


反馈与建议

如果这个工具帮到了你,或者你发现了 Bug,欢迎联系我:


数据安全

🔒 本工具所有操作均在本地完成,不会上传任何文档内容到服务器或云端。无网络通信、无数据收集、无遥测追踪。源代码完全开放,欢迎审查。

详见 数据安全与免责声明


开源许可

本项目基于 MIT 许可证 开源,欢迎开发者共同完善。

第三方依赖许可证信息详见 THIRD_PARTY_LICENSES.md

Made with ❤️ by KaguraNanaga

AltStyle によって変換されたページ (->オリジナル) /