V2EX 最热主题
01:19 · Mar 22, 2025 · Sat
V2EX-最热主题
[开源] 扫描件 PDF 转 Markdown / EPUB,自动修复 OCR 错误
#v2ex
Telegraph
|
source
Telegraph
[开源] 扫描件 PDF 转 Markdown / EPUB,自动修复 OCR 错误
BlackHole1: 最近我们开源了一个 PDF 处理工具 - pdf-craft,专注于解决扫描书籍 PDF 转换的痛点,让书籍数字化更智能。pdf-craft 支持将 PDF 转为 Markdown 和 EPUB ,智能处理文本、图表、公式等内容,适用于技术文档、书籍数字化、论文研究等场景。 痛点与解决方案 PDF 不便于移动设备阅读:将 PDF 转为 EPUB ,适配各种屏幕大小 书籍结构混乱:智能分析章节、目录,重建结构化内容 注释和引用难以追踪:使用 LLM 智能处理注释和引用 OCR 识别错误多:结合…
Home
Powered by
BroadcastChannel
&
Sepia