开源工具CommonForms,将静态 PDF 表单制作成可直接填写的交互式表。

开源工具CommonForms,将静态 PDF 表单制作成可直接填写的交互式表。

开始使用 软件下载

开源工具CommonForms,将静态 PDF 表单制作成可直接填写的交互式表。

当需要将静态 PDF 表单,制作成可直接填写的交互式表单,以往都是手动添加输入框,效率低且容易出错。

现在可以使用 CommonForms 开源工具,自动识别 PDF 中的表单区域,并转换为可填写的交互式表单。

基于深度学习模型 FFDNet,支持检测文档中的各种表单字段类型,包括文本框、复选框、签名区域等等。

GitHub:http://github.com/jbarrow/commonforms

主要特性:

– 自动检测 PDF 中的表单字段并转换为可填写控件;

– 支持多种字段类型识别,包括文本、复选框、签名等;

– 提供命令行工具和 Python API 两种使用方式;

– 内置 FFDNet-L 和 FFDNet-S 两个预训练模型;

– 可自定义检测置信度和图像处理参数;

– 支持保留原有表单字段或完全重新生成。

此存储库包含三项内容:

pip-installable 包,其中包含用于将 PDF 转换为可填写表单的 CLI 和 APIcommonforms

论文 CommonForms: A Large, Diverse Dataset for Form Field Detection 中的 FFDNet-S 和 FFDNet-L 模型

托管在 HuggingFace 上的 CommonForms 数据集的预处理代码:https://huggingface.co/datasets/jbarrow/CommonForms

安装

CommonForms 可以与 或 一起安装,请随意选择您的包管理器风格:uvpip

uv pip install commonforms

安装后,您应该能够在 ~any PDF 上运行 CLI 命令。

CommonForms CLI

最简单的用法将使用默认建议的设置在 CPU 上运行推理:

commonforms <input.pdf> <output.pdf>

关注公众号:

发表回复