开源工具CommonForms,将静态 PDF 表单制作成可直接填写的交互式表。
开源工具CommonForms,将静态 PDF 表单制作成可直接填写的交互式表。
当需要将静态 PDF 表单,制作成可直接填写的交互式表单,以往都是手动添加输入框,效率低且容易出错。
现在可以使用 CommonForms 开源工具,自动识别 PDF 中的表单区域,并转换为可填写的交互式表单。
基于深度学习模型 FFDNet,支持检测文档中的各种表单字段类型,包括文本框、复选框、签名区域等等。
GitHub:http://github.com/jbarrow/commonforms

主要特性:
– 自动检测 PDF 中的表单字段并转换为可填写控件;
– 支持多种字段类型识别,包括文本、复选框、签名等;
– 提供命令行工具和 Python API 两种使用方式;
– 内置 FFDNet-L 和 FFDNet-S 两个预训练模型;
– 可自定义检测置信度和图像处理参数;
– 支持保留原有表单字段或完全重新生成。
此存储库包含三项内容:
pip-installable 包,其中包含用于将 PDF 转换为可填写表单的 CLI 和 APIcommonforms
论文 CommonForms: A Large, Diverse Dataset for Form Field Detection 中的 FFDNet-S 和 FFDNet-L 模型
托管在 HuggingFace 上的 CommonForms 数据集的预处理代码:https://huggingface.co/datasets/jbarrow/CommonForms
安装
CommonForms 可以与 或 一起安装,请随意选择您的包管理器风格:uvpip
uv pip install commonforms
安装后,您应该能够在 ~any PDF 上运行 CLI 命令。
CommonForms CLI
最简单的用法将使用默认建议的设置在 CPU 上运行推理:
commonforms <input.pdf> <output.pdf>
版权声明:本站所有文章版权均归AiNeuOS所有,任何个人、媒体、网站、团体等注明来源后均可以转载。但是不得在非我站的服务器上建立镜像,否则,我站将依法保留追究相关法律责任的权利。
关注公众号:
