微软开源神器 MarkItDown:10 万 Star,一个命令把所有文件变成 Markdown
微软 AutoGen 团队开源了一款轻量级 Python 工具 MarkItDown,核心功能就一句话:把各种文件格式转换成 Markdown。PDF、Word、Excel、PowerPoint、图片(OCR)、音频(语音转录)、HTML、CSV、JSON、XML、EPub、YouTube 链接、ZIP 压缩包……全支持。

为什么这东西火了?
三个原因:
1. AI 时代,Markdown 是最优输入格式
GPT-4o、Claude、Gemini 这些主流大模型,原生就"说"Markdown。它们在训练中见过海量 Markdown 文本,理解得最好,token 消耗也最少。把任何文档先转成 Markdown 再喂给 LLM,效果就是更好。
2. 一个命令搞定,零配置
pip install 'markitdown[all]'
markitdown report.pdf -o report.md
两行命令,PDF 变 Markdown。不需要 LibreOffice,不需要 OCR 服务,不需要云 API。
3. 微软背书 + 10 万 Star
这是微软 AutoGen 团队维护的项目,代码质量有保障。GitHub 上 10 万+ Star,社区活跃,问题有人修,功能有人加。

实战:5 分钟上手
安装
pip install 'markitdown[all]'
如果只想支持部分格式,可以按需安装:
pip install 'markitdown[pdf, docx, pptx]'
可选依赖包括:pdf、docx、xlsx、pptx、outlook、audio-transcription、youtube-transcription、az-doc-intel 等。

命令行使用
转换单个文件:
markitdown annual-report.pdf > annual-report.md
指定输出文件:
markitdown presentation.pptx -o slides.md
管道操作也支持:
cat data.xlsx | markitdown > data.md
Python API 使用
from markitdown import MarkItDown
md = MarkItDown()
# 转换 PDF
result = md.convert("report.pdf")
print(result.text_content)
# 转换 Excel
result = md.convert("data.xlsx")
print(result.text_content)
# 转换 Word
result = md.convert("document.docx")
print(result.text_content)
用 LLM 描述图片内容
MarkItDown 支持用大模型对图片生成描述:
from markitdown import MarkItDown
from openai import OpenAI
md = MarkItDown(
llm_client=OpenAI(),
llm_model="gpt-4o",
)
result = md.convert("chart.png")
print(result.text_content)
这个特性对处理含图表的 PPT 和图片特别有用。
OCR 插件:从图片中提取文字
安装 OCR 插件后,可以从 PDF、Word、PPT、Excel 中嵌入的图片提取文字:
pip install markitdown-ocr
pip install openai
md = MarkItDown(
enable_plugins=True,
llm_client=OpenAI(),
llm_model="gpt-4o",
)
result = md.convert("scanned_document.pdf")
print(result.text_content)
MCP Server 集成
MarkItDown 还提供了 MCP Server,可以直接接入 Claude Desktop 等 LLM 应用:
# 安装
pip install 'markitdown-mcp[all]'
# 配置到 Claude Desktop 的 claude_desktop_config.json
这意味着 Claude 可以直接读取和转换你的本地文件,不需要手动复制粘贴。

实际应用场景
1. 让 AI 读懂你的文档
把合同 PDF、财务报表 Excel、产品文档 Word 统一转成 Markdown,再喂给 LLM 做分析、总结、问答。
2. 知识库构建
把公司内部各种格式的文档批量转为 Markdown,导入 RAG 系统,搭建智能知识库。
3. 音视频转文字
YouTube 视频链接、本地音频文件,直接转成文字记录,配合 LLM 做内容分析。
4. 数据提取
Excel、CSV 里的表格数据,转为 Markdown 表格格式,结构化程度更高,LLM 处理更准确。

小结
MarkItDown 的核心价值在于:
- 格式统一:所有文档转为 Markdown,AI 处理更高效
- 开箱即用:一个命令搞定,零配置
- 微软背书:AutoGen 团队维护,质量有保障
- 生态完善:10 万+ Star,社区活跃,支持 MCP 集成
在 AI 时代,文档处理是刚需。MarkItDown 这把"瑞士军刀",值得收藏。