大家好,我是 Ai 學習的老章
推薦一個實用的項目,最近更新了 MCP 服務,我在本地 Cherry Studio 試了一下,效果還行。
MarkItDown
MarkItDown
是一個輕量級的 Python 工具,用于將各種文件轉換為 Markdown,以便與 LLMs 和相關的文本分析管道一起使用,將重要的文檔結構和內容作為 Markdown 保留(包括:標題、列表、表格、鏈接等)。
項目地址:https://github.com/microsoft/markitdown
目前,MarkItDown
支持:
PDF
PowerPoint
Word
Excel
圖像(EXIF 元數據和 OCR)
音頻(EXIF 元數據和語音轉錄)
HTML
基于文本的格式(CSV,JSON,XML)
ZIP 文件(遍歷內容)
Youtube 鏈接
EPubs
直接使用 pip:
pip install 'markitdown[all]'
或從源安裝:
git clone git@github.com:microsoft/markitdown.git cd markitdown pip install -e 'packages/markitdown[all]'
使用命令行:
markitdown path-to-file.pdf > document.md
或使用-o
指定輸出文件:
markitdown path-to-file.pdf -o document.md
通過管道傳輸內容:
cat path-to-file.pdf | markitdown
Python 接口Python 中的基本用法:
from markitdown import MarkItDown md = MarkItDown(enable_plugins=False) # Set to True to enable plugins result = md.convert("test.xlsx") print(result.text_content)
Python 中的 Document Intelligence 轉換:
from markitdown import MarkItDown md = MarkItDown(docintel_endpoint=" " ) result = md.convert("test.pdf") print(result.text_content)
若要將大型語言模型用于圖像描述,請提供llm_client
和llm_model
:
from markitdown import MarkItDown from openai import OpenAI client = OpenAI() md = MarkItDown(llm_client=client, llm_model="gpt-4o") result = md.convert("example.jpg") print(result.text_content)
以上都是基礎功能
今天我們重點看看 MarkItDown 剛剛新增的 MCP(模型上下文協議)服務器,用于與 LLM Claude Desktop 等應用程序集成。
安裝
使用 pip:
pip install markitdown-mcp
用法要運行 MCP 服務器,請使用 STDIO(默認),使用以下命令:
markitdown-mcp
要使用 SSE 運行 MCP 服務器,請使用以下命令:
markitdown-mcp --sse --host 127.0.0.1 --port 3001
Cherry Studio的配置如下,更詳細介紹可以看看我之前的文章
命令那里如果直接填寫 markitdown-mcp 報錯的話,可以用 whereis 看一下自己的 markitdown-mcp 安裝位置
whereis markitdown-mcp /Users/zhangbeihai/miniconda/envs/morta/bin/markitdown-mcp
使用時,在對話框下面選中該 MCP 即可
結果:
制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.