pdf-extract-api：高精度文档解析和提取API开源项目-盘学网

pdf-extract-api：高精度文档解析和提取API开源项目

编程开发盘天下 | 网盘资源分享 2024-11-22 1247 0

篱落主机 - 香港免备案老薛主机 - 优惠码：0813 推荐VPN-Clash 29元/月,80G大流量卡篱落主机 - 香港免备案老薛主机 - 优惠码：0813 推荐VPN-Clash 29元/月,80G大流量卡

pdf-extract-api：高精度文档解析和提取 API 开源项目

一个文档解析和提取 API，支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。

它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。

支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。

开源地址：https:// github .com/CatchTheTornado/pdf-extract-api

夸克资源精选合集

「电影」 「电视剧」 「大尺度」 「动漫」 「付费短剧」 「广播剧」 「纪录片」 「软件工具」 「音乐」 「教程」 「网赚」 「书库1」 「书库2」 「小说」 「综艺」

#pdfextractapi #设计资源 #开源项目

(0)

1. 本站所有资源来源于网络，如有侵权请邮件联系站长！hygd0813@qq.com
2. 分享目的仅供大家学习和交流，您必须在下载后24小时内删除！
3. 不得使用于非法商业用途，不得违反国家法律。否则后果自负！
4. 本站提供的资源，都不包含版权，请大家谅解！
5. 如有链接无法下载、失效或广告，请联系管理员处理！
6. 转载请注明出处，本文链接：https://www.panlearn.cn/design/13827.html

上一篇IC-Light：一款开源AI智能打光工具

下一篇Python分布式爬虫与逆向进阶实战