---
title: "42md 知识获取功能规格说明（合成）"
source: "document"
source_file: "demo-samples/docx/42md-spec/input.docx"
created: "2026-05-08T07:34:05Z"
---


# 42md 知识获取功能规格说明

版本 v1.2 · 2026-05

# 一、概述

本规格说明 42md 知识获取模块的目标、能力边界与质量基线。该模块负责把多种来源的内容（文档、网页、音频、扫描件）转换为干净的 Markdown，作为后续编译/策展的统一输入。

# 二、核心能力

## 2.1 文档格式转换

支持 PDF、Office（DOCX/XLSX/PPTX）、Apple iWork（Pages/Numbers/Keynote）、OFD、EPUB、MOBI、字幕（SRT/ASS/VTT）等 42+ 种输入格式。纯结构转换，无需 AI 配额。

## 2.2 网页抓取

单篇 URL 直接转 Markdown；整站抓取通过 RSS / Sitemap 自动发现页面；资源批量抓取覆盖站点上的 PDF、图片、电子书等附件。

## 2.3 AI 识别与转录

扫描件 PDF 与图片通过 VLM 模型识别（按千字计费）；音频文件支持 ASR 转录，4 小时讲座几分钟出稿。

# 三、质量基线

| 维度 | 指标 | 基线 |
| --- | --- | --- |
| 速度 | 单文件首屏耗时 | ≤ 2 秒（不含 AI）|
| 保真 | 表格还原准确率 | ≥ 95% |
| 保真 | 图片引用完整性 | 100% |
| 成本 | 纯结构转换 AI 消耗 | 0 千字/份 |


# 四、配额规则

纯结构转换永久免费；AI 识别（OCR / ASR / 翻译）按「千字编译配额」计费，调用前 Dialog 显式提示预估消耗 + 二次确认，失败不扣费。

# 五、责任方

产品：活水 AI 实验室 技术：42md 核心团队 联系：feedback@42md. cc