Skip to content

Doc2X 常见问题 - FAQ

Doc2X 是一个强大的文档解析和翻译工具,支持多种格式的文档识别、转换和翻译。本指南将帮助您快速了解和使用 Doc2X 的各项功能。

翻译-积分规则

Doc2X 已更新网页与客户端的翻译积分规则,详情请参考 Doc2X 积分规则

目前支持的功能

核心识别功能

  • 多元素识别:支持文字、公式、表格、图像的识别
  • 多栏识别:支持多栏文档的识别,并还原正确的阅读顺序
  • 多语言支持:支持中文(简体/繁体)、英文、西欧国家语言、日语、韩语等
    • 更多语言正在支持中

高级功能(迭代中)

以下功能已支持,但效果仍在不断优化:

当前限制

  • 不支持超长图/超宽图:需要手动分割为正常页面大小
  • 不支持空白边框过大的文档:需要手动裁剪空白边框
  • 不支持旋转的 PDF:请手动转正 PDF 后再识别

处理速度与并发

处理速度

  • 网页和 API:单个 PDF 平均速度约 10 页/秒
  • 具体速度:取决于文档复杂程度
  • API 加速:需要更快处理速度请联系我们

并发限制

  • API 默认并发:5 个 PDF 同时处理
  • 提升并发:需要更大并发请联系我们

大批量数据处理

企业级服务

  • 大量处理:有大量 PDF 需要处理可联系获取折扣价格
  • 已服务客户:多家知名大模型厂商、金融和教育机构
  • 基础设施:自建数百卡算力池和多机房冗余,保障稳定性
  • 处理能力:每天能处理数千万页文档,累计处理数十亿

为什么选择 Doc2X

核心优势

  1. 公式识别领先:市面上同类产品在公式识别(特别是行内和复杂公式)方面表现不佳,Doc2X 处于领先水平
  2. 表格识别优秀:支持识别表格内图片和跨页表格合并等高级功能
  3. 多栏识别精准:多栏文档的阅读顺序还原效果优异
  4. 适配范围广泛:支持财研报、论文、教辅、专利等多种文档类型

数据安全

  • 网页端存储:有效期为 30 天(包括图床)
  • API 存储:过期时间为 24 小时
  • 自动删除:过期后自动删除,请放心使用