首页 - 互联网

如何实现本地大模型与MCP集成

作者: 五速梦信息网
时间: 2026年06月19日 04:49

1.概述

本文将围绕构建兼具本地运行大型语言模型（LLM）与MCP 集成能力的 AI 驱动工具展开，为读者提供从原理到实践的全流程指南。通过深度整合本地大模型的隐私性、可控性优势与 MCP 工具的自动化执行能力，帮助用户以低门槛、高效率的方式，打造个性化 AI 助手，实现任务自动化 —— 无论是文档处理、数据分析，还是流程调度等场景，均可通过这一集成方案，借助大模型的语义理解与推理能力，结合 MCP 工具的标准化接口，构建端到端的智能工作流，让 AI 真正成为提升生产力的核心引擎。

2.内容

2.1 环境准备

ollama
python==3.13.2
uv 0.6.12
Linux / macOS 大模型服务部署
安装ollama服务框架
通过ollama部署所需的大语言模型开发环境配置
准备Python 3.13运行环境（推荐使用最新稳定版）
安装mcp服务开发所需的Python包开发工具推荐
使用uv工具链（新一代Python项目管理工具）
功能覆盖：
- Python版本管理
- 虚拟环境控制
- 依赖包管理
- 项目依赖维护
优势：提供全流程的Python开发环境管理方案

2.2 ollama安装

访问ollama地址：https://ollama.com/，然后根据自己的环境下载对应的安装包，如下图所示：安装好ollama后，启动服务后，可以执行命令来检查服务是否启动成功，如下图所示：然后，我们在ollama的模型页面选择我们需要下载的大模型，可以根据自身机器的性能来选择不同规模的模型，如图所示：安装完成对应的模型后，可以通过http://localhost:11434/api/tags访问查看安装在本地的模型信息，如图所示：

2.3 安装uv工具

安装 uv（通常指 Rust 编写的超快 Python 包安装工具 uv，由 Astral 团队开发）的常用方法如下： 1. 使用官方安装脚本（推荐） 运行以下命令一键安装（适合 Linux/macOS）：

curl -LsSf https://astral.sh/uv/install.sh | sh

安装后按提示将 uv 加入 PATH 环境变量，或直接重启终端。 2. 通过 pip 安装 如果已配置 Python 环境，可直接用 pip 安装：

pip install uv

3. 验证安装 运行以下命令检查是否成功：

uv --version

3.编写MCP服务

环境准备好之后，我们就可以开始编写MCP服务了，这里我们编写一个简单的MCP服务，用于读取本地文件，实现代码如下所示：

import os
import uvicorn
import logging
from dotenv import load_dotenv
from argparse import ArgumentParser
from mcp.server.fastmcp import FastMCP
from starlette.applications import Starlette
from starlette.requests import Request
from starlette.routing import Route, Mount
from mcp.server import Server
from mcp.server.sse import SseServerTransport
# 配置日志
logging.basicConfig(
    level=logging.INFO,
    format=&#39;%(asctime)s - %(name)s - %(levelname)s - %(message)s&#39;
)
logger = logging.getLogger(__name__)
# 加载环境变量
load_dotenv()
class Config:
    &#34;&#34;&#34;应用配置类&#34;&#34;&#34;
    HOST = os.getenv(&#39;HOST&#39;, &#39;0.0.0.0&#39;)
    PORT = int(os.getenv(&#39;PORT&#39;, 8020))
    DEBUG = os.getenv(&#39;DEBUG&#39;, &#39;False&#39;).lower() == &#39;true&#39;
    FILE_PATH = os.getenv(
        &#39;FILE_PATH&#39;,
        &#39;/Users/smartloli/workspace/vscode/1/data.txt&#39;
    )
# 初始化MCP
mcp = FastMCP(&#34;file_reader&#34;)
@mcp.tool()
async def read_file():
    &#34;&#34;&#34;
    读取配置文件中的数据
Returns:
        文件内容或错误信息
    &#34;&#34;&#34;
    file_path = Config.FILE_PATH
    try:
        logger.info(f&#34;Reading file: {file_path}&#34;)
        with open(file_path, &#39;r&#39;, encoding=&#39;utf-8&#39;) as file:
            return file.read()
    except FileNotFoundError as e:
        logger.error(f&#34;File not found: {file_path}&#34;)
        return {&#34;error&#34;: &#34;File not found&#34;, &#34;details&#34;: str(e)}
    except Exception as e:
        logger.exception(f&#34;Error reading file: {file_path}&#34;)
        return {&#34;error&#34;: &#34;Unexpected error&#34;, &#34;details&#34;: str(e)}
def create_starlette_app(mcp_server: Server) -&gt; Starlette:
    &#34;&#34;&#34;创建基于Starlette的MCP服务器应用
Args:
        mcp_server: MCP服务器实例
Returns:
        Starlette应用实例
    &#34;&#34;&#34;
    sse = SseServerTransport(&#34;/messages/&#34;)
async def handle_sse(request: Request) -&gt; None:
        async with sse.connect_sse(
            request.scope,
            request.receive,
            request._send
        ) as (read_stream, write_stream):
            await mcp_server.run(
                read_stream,
                write_stream,
                mcp_server.create_initialization_options(),
            )
return Starlette(
        debug=Config.DEBUG,
        routes=[
            Route(&#34;/sse&#34;, endpoint=handle_sse),
            Mount(&#34;/messages/&#34;, app=sse.handle_post_message),
        ],
        on_startup=[lambda: logger.info(&#34;Server starting...&#34;)],
        on_shutdown=[lambda: logger.info(&#34;Server shutting down...&#34;)]
    )
def parse_arguments():
    &#34;&#34;&#34;解析命令行参数&#34;&#34;&#34;
    parser = ArgumentParser(description=&#39;Run MCP SSE-based server&#39;)
    parser.add_argument(&#39;--host&#39;, default=Config.HOST, help=&#39;Host to bind to&#39;)
    parser.add_argument(&#39;--port&#39;, type=int,
                        default=Config.PORT, help=&#39;Port to listen on&#39;)
    parser.add_argument(&#39;--debug&#39;, action=&#39;store_true&#39;,
                        help=&#39;Enable debug mode&#39;)
    return parser.parse_args()
if __name__ == &#34;__main__&#34;:
    args = parse_arguments()
# 更新配置
    Config.HOST = args.host
    Config.PORT = args.port
    Config.DEBUG = args.debug
# 启动服务器
    mcp_server = mcp._mcp_server
    starlette_app = create_starlette_app(mcp_server)
logger.info(f&#34;Starting server on {Config.HOST}:{Config.PORT}&#34;)
    uvicorn.run(
        starlette_app,
        host=Config.HOST,
        port=Config.PORT,
        log_level=&#34;info&#34; if not Config.DEBUG else &#34;debug&#34;
    )

然后，我们使用uv来启动MCP服务，执行命令如下：

uv run file_list.py --host 0.0.0.0 --port 8020

启动成功后，显示如下图所示信息：

4.集成LLM 和 MCP

准备好LLM服务和MCP服务之后，我们在Cherry Studio客户端上集成我们本地部署的LLM 和 MCP 服务，如下图所示： 1.配置本地文件搜索MCP服务 2.集成本地LLM 然后，在设置里面勾选“工具”就可以使用MCP服务了，如图所示： 3.测试本地LLM回答 4.测试本地LLM & MCP调用 当我们开启MCP服务后，输入的搜索词中LLM会自行判断是否需要调用本地的MCP服务，这里我们通过搜索词触发LLM通过function去调用本地MCP服务。

5.总结

本文围绕本地大模型与模型上下文协议（MCP）的集成展开探索，重点揭示了通过 MCP 构建自定义 AI 工具的路径。通过适配不同开发环境与实际用例，MCP 为 AI 功能的跨场景整合提供了灵活框架，其核心优势体现在定制化能力上 —— 从模型选型到集成策略的全流程可调节性，使开发者能够基于具体需求打造精准适配的 AI 解决方案，展现了 MCP 在整合本地大模型时的多功能性与实践价值。