PDF文档分析工具 自动识别布局
介绍
这是一款开源的 PDF 文档分析工具,能够自动识别页面中的文本、标题、图片、表格等元素,并确定正确的阅读顺序。提供用户友好的 Gradio 网页界面,支持高级布局分析(VGT 高精度模型或 LightGBM 快速模型),多格式输出(JSON、Markdown、HTML),内置 Ollama 自动翻译及 Tesseract OCR(150+语言)。同时支持表格(HTML)与公式(LaTeX)提取,提供 RESTful API 和 Docker 部署。适合开发者学习文档解析、机器学习模型应用及文档处理流水线设计。
使用说明
阅读压缩包内的README.md文件。
图片演示



