Doc2X 常见问题 - FAQ
Doc2X 是一个强大的文档解析和翻译工具,支持多种格式的文档识别、转换和翻译。本指南将帮助您快速了解和使用 Doc2X 的各项功能。
快速链接
- 网站:doc2x.noedgeai.com
- API 接入:open.noedgeai.com(与网页额度不互通)
- API v2 文档:Doc2x API v2 接口文档
- Zotero 插件教程:Doc2X Zotero 插件使用指南
- 功能介绍:https://noedgeai.com
翻译-积分规则
Doc2X 已更新网页与客户端的翻译积分规则,详情请参考 Doc2X 积分规则。
目前支持的功能
核心识别功能
- ✅ 多元素识别:支持文字、公式、表格、图像的识别
- ✅ 多栏识别:支持多栏文档的识别,并还原正确的阅读顺序
- ✅ 多语言支持:支持中文(简体/繁体)、英文、西欧国家语言、日语、韩语等
- 更多语言正在支持中
高级功能(迭代中)
以下功能已支持,但效果仍在不断优化:
- 🔄 跨页表格合并(API)
- 🔄 手写识别
- 🔄 竖排文字
- 🔄 多级标题支持
当前限制
- ❌ 不支持超长图/超宽图:需要手动分割为正常页面大小
- ❌ 不支持空白边框过大的文档:需要手动裁剪空白边框
- ❌ 不支持旋转的 PDF:请手动转正 PDF 后再识别
处理速度与并发
处理速度
- 网页和 API:单个 PDF 平均速度约 10 页/秒
- 具体速度:取决于文档复杂程度
- API 加速:需要更快处理速度请联系我们
并发限制
- API 默认并发:5 个 PDF 同时处理
- 提升并发:需要更大并发请联系我们
大批量数据处理
企业级服务
- 大量处理:有大量 PDF 需要处理可联系获取折扣价格
- 已服务客户:多家知名大模型厂商、金融和教育机构
- 基础设施:自建数百卡算力池和多机房冗余,保障稳定性
- 处理能力:每天能处理数千万页文档,累计处理数十亿页
为什么选择 Doc2X
核心优势
- 公式识别领先:市面上同类产品在公式识别(特别是行内和复杂公式)方面表现不佳,Doc2X 处于领先水平
- 表格识别优秀:支持识别表格内图片和跨页表格合并等高级功能
- 多栏识别精准:多栏文档的阅读顺序还原效果优异
- 适配范围广泛:支持财研报、论文、教辅、专利等多种文档类型
数据安全
- 网页端存储:有效期为 30 天(包括图床)
- API 存储:过期时间为 24 小时
- 自动删除:过期后自动删除,请放心使用