#AI数据处理
MarkItDown:微软开源文档转Markdown工具,14万Star助力AI数据处理
把 PDF、Word、PPT、Excel 喂给大模型,结果不是乱码就是表格崩了,要么整个结构完全丢失。为每种格式写一套转换脚本——PDF 用 PyPDF2,Word 用 python-docx,PPT 用 pytho…