模型上下文协议 (Model Context Protocol, MCP) 是一项由 Anthropic 于 2024 年底开源的新标准 。其主要目标在于标准化人工智能 (AI) 助手与实际存储数据的系统(包括内容存储库、业务工具和开发环境)之间的连接方式 。
该协议旨在解决 AI 集成的复杂性,使 AI 应用能够更便捷地访问外部信息和功能,从而实现更具上下文感知和实用性的 AI 应用 。

图片

本报告将深入探讨 MCP 的定义、核心内容、接口、数据结构、适用性、生态系统、市场发展以及其在企业集成(包括与 CIM/ERP 系统的潜在连接)方面的应用前景 。

一、标准化 AI 集成的必要性

随着 AI 大模型的日益普及,将其与现有的企业基础设施进行有效集成变得至关重要 。尽管 AI 模型在推理和质量方面取得了显著进步 ,但它们通常受限于无法直接访问外部数据,这阻碍了其在实际应用中的潜力 。目前,每当需要将一个新的 AI 模型与一个企业工具集成时,通常需要构建定制化的连接器和提示工程,这导致了所谓的

“MxN 集成问题”,其中 M 代表模型数量,N 代表企业工具数量 。

这种模式不仅复杂,而且难以扩展,增加了开发和维护的成本。

模型上下文协议 (MCP) 的出现正是为了解决这一难题 。通过标准化大型语言模型 (LLM) 与外部信息源的连接方式,MCP 将集成复杂度从 MxN 降低到 M+N 。这种标准化带来的一个主要好处是,开发者不再需要为每个数据源维护不同的连接器 ,从而简化了 AI 系统的构建和维护过程。

二、MCP 的优势

统一性:

MCP 提供了一个统一的接口,使得不同的 LLM 和工具可以无缝对接,无需为每对模型和工具编写特定的代码。

灵活性:

通过 MCP,开发人员可以快速将新的模型或工具集成到现有系统中,提高了开发效率和系统的可扩展性。

互操作性:

MCP 确保了不同模型和工具之间的互操作性,使得它们可以协同工作,共同完成复杂的任务。

图片

三、 什么是模型上下文协议 (MCP)?

定义和核心原则

模型上下文协议 (MCP) 是一项开放标准,旨在将 AI 助手与实际存储数据的各种系统连接起来,这些系统包括内容存储库、业务工具以及开发环境 。本质上,MCP 为大型语言模型 (LLM) 应用和外部数据或功能之间创建了一个通用的接口 。作为一项开放标准,MCP 的设计理念是促进社区驱动的开发和广泛采用,避免单一供应商的锁定。其核心原则包括开放标准、跨平台兼容性以及对开发者体验的高度重视。MCP 的目标是为将 AI 助手连接到各种数据源提供一个统一的解决方案,并且只需要进行一次连接。

图片

解决 MxN 集成问题

MCP 的主要优势在于其能够标准化 AI 模型与外部系统之间的交互方式,从而显著减少对定制化集成的需求。通过要求模型和工具都遵循一个共同的接口,MCP 简化了整个生态系统 。这种标准化意味着开发者只需要实现一次 MCP 协议,他们的 AI 应用就可以与任何兼容的 MCP 服务器进行通信,而无需为每个新的数据源或工具编写特定的集成代码。

AI 的 USB-C 类比

许多文献将 MCP 比作 AI 领域的“USB-C”接口 。就像 USB-C 标准化了各种设备与计算机的连接方式一样,MCP 定义了一套通用的规则,使得任何兼容的 LLM 客户端都可以与任何兼容的 MCP 服务器进行通信 。这种类比强调了 MCP 的即插即用特性和互操作性优势。通过提供一个标准化的接口,MCP 使得 AI 应用能够轻松地与各种工具和数据源进行交互,而无需复杂的定制化开发。

四、 MCP 的核心架构和组件

MCP 主机、客户端和服务器:角色与职责

MCP 架构基于客户端-服务器模型,包含以下关键组件:

MCP 主机(AI 应用):

这些是需要外部信息的 AI 或 LLM 驱动的应用,例如聊天机器人、集成开发环境 (IDE) 等 。主机负责协调 LLM 的操作,管理多个连接,并将 AI 的输出与检索到的上下文信息进行整合。这意味着 AI 应用本身负责决定何时以及如何利用通过 MCP 访问的外部数据和工具。

MCP 客户端:

客户端是驻留在主机应用中的组件,负责管理与 MCP 服务器的一对一连接 。每个数据源或工具都有其自己的客户端实例。客户端处理与服务器的所有消息交换,路由请求和响应,并跟踪服务器的功能。这种专用的一对一连接设计可能侧重于安全性和隔离,确保每个连接都被独立管理。

MCP 服务器:

服务器是轻量级的程序或服务,通过 MCP 接口暴露特定的数据或功能 。服务器可以封装本地资源(如文件系统或数据库)或远程服务(如 Slack、Gmail、GitHub 等)。每个服务器以标准化的方式提供一个或多个功能,以便任何 MCP 客户端都可以查询或调用它们。服务器以标准化方式提供功能对于实现互操作性至关重要,允许任何兼容的客户端与服务器交互。

图片

关键原语定义

MCP 协议定义了一组关键的通信原语:

服务器端原语:

工具 (Tools):

模型可以调用的可执行函数或操作,例如数据库查询、网页搜索或发布 Slack 消息。工具使 AI 模型能够执行实际操作,而不仅仅是检索信息,这对于构建真正的智能代理系统至关重要。

资源 (Resources):

服务器可以发送以丰富模型上下文的结构化数据,例如文档片段或代码片段。资源通常通过类似 URI 的标识符引用。这种机制为 AI 模型提供了及时获取相关信息的途径,克服了其训练数据的局限性。

提示 (Prompts):

用于指导模型的预定义指令或模板。提示允许服务器提供特定的指导或模板,以控制 AI 模型与暴露的工具和资源之间的交互,确保更可控和可预测的行为。

图片

客户端原语

根 (Roots):

主机文件系统或环境中服务器可以访问的入口点,需要经过授权。根定义了服务器可以操作的边界 。根对于安全性和访问控制至关重要,允许用户定义 AI 模型可以交互的系统的特定部分。

采样 (Sampling):

一种允许服务器向主机 AI 请求补全的机制,使主机能够控制模型选择和隐私 。采样需要人工批准。这是一个创新功能,颠倒了传统的客户端-服务器 LLM 推理交互,为隐私、成本管理和模型选择提供了优势。

通信流程和交互模式

MCP 的通信流程通常遵循以下步骤:

MCP 客户端首先向服务器查询其提供的功能,即获取服务器可以提供的可用工具、资源或提示模板列表。AI 模型(通过其主机应用)会获知这些功能。

用户的查询(以及其他上下文)与服务器的工具/资源描述一起发送给 AI 模型。实际上,模型现在“知道”它可以借助服务器做什么。例如,如果用户询问“明天的天气如何?”,发送给模型的提示将包含一个“天气 API 工具”的描述,该工具由服务器暴露。

AI 模型分析查询和可用的 MCP 工具/资源,并决定是否需要使用其中一个。如果需要,它会以结构化的方式(根据 MCP 规范)响应,表明它想要使用哪个工具或资源。在天气示例中,模型可能会决定调用服务器提供的“天气 API”工具来获取最新的信息。

MCP 客户端接收到模型的请求,并在 MCP 服务器上调用相应的操作(例如,通过服务器的代码执行天气 API 调用)。服务器执行该操作(例如,从数据库检索数据或调用外部 API),然后将结果返回给客户端。

来自服务器的结果(例如,天气预报数据)通过客户端返回给 AI 模型。模型现在可以将此数据融入其答案中。然后,它基于自身的知识和新获取的信息生成最终的回复给用户(例如,“明天的天气预报是 15°C,有小雨。”)。用户看到的答案是通过模型在对话过程中无缝地获取外部信息而丰富起来的。

与通常是无状态的问答调用的插件不同,MCP 支持丰富的双向交互。它支持双向通信,允许 AI 代理既可以检索信息,也可以触发操作 。

图片

技术规格:接口和数据结构

接口定义

MCP 使用 JSON-RPC 2.0 作为通信的消息格式。JSON-RPC 2.0 是一种广泛采用的远程过程调用标准,确保了互操作性和易于实现。MCP 还定义了一组用于常见任务的方法和消息类型,例如初始化连接、列出服务器功能以及调用工具 。此外,MCP 规范定义了核心消息类型,称为“原语”,包括提示、资源、工具、根和采样。

数据结构

请求、响应和通知的格式都遵循 JSON-RPC 2.0 标准 。服务器端原语(工具、资源、提示)具有定义的参数和返回类型结构。客户端原语(根、采样)也有定义的结构,用于它们的通信和管理 。资源通常通过类似 URI 的标识符引用 。MCP 还使用标准化的数据请求格式,如 JSON Schema 。

传输机制

MCP 允许通过不同的传输机制进行通信 。对于由主机启动的本地服务器,通常使用标准输入/输出流 (stdio)。对于远程服务器,则使用基于 HTTP 的服务器发送事件 (SSE) 。Java MCP SDK 支持多种传输机制,包括基于 Stdio 和 HTTP 的 SSE 。这种灵活性使得 MCP 能够适应不同的部署环境和通信需求。

图片

MCP 对 AI 大模型的适用性

开放标准和模型无关性

MCP 被设计为开源和通用的,不依赖于任何特定的 AI 提供商。其目标是实现模型无关性,允许任何兼容的 AI 客户端与任何 MCP 服务器通信。MCP 的设计灵感来源于语言服务器协议 (LSP),旨在克服 MxN 集成问题。

对各种 LLM 架构的益处

MCP 为 LLM 访问外部信息提供了一种标准化的方式,克服了知识截止日期的问题 。通过提供来自可靠来源的事实信息,MCP 减少了模型产生幻觉的可能性。它还通过允许访问用户特定的数据(在适当的权限下)来实现个性化 。MCP 使模型能够利用特定领域的知识库和工具 ,并支持对相关信息和外部工具的动态、实时访问。MCP 专为 LLM 构建,确保它们能够有效地接收必要的上下文信息。

特定模型集成的考虑因素

虽然 MCP 旨在实现模型无关性,但集成程度和具体功能可能因 LLM 理解和利用通过 MCP 提供的信息的能力而异。一些资料提到 MCP 最初主要面向 Anthropic 的 Claude 模型。然而,其开放性鼓励更广泛的采用 。

图片

不断增长的 MCP 生态系统:连接的工具和系统

现有 MCP 服务器示例

目前已有针对 Google Drive、Slack、GitHub、Git、Postgres、SQLite、Puppeteer 和网络浏览器等流行系统的预构建 MCP 服务器。

图片

与开发平台的集成

Zed、Replit、Codeium 和 Sourcegraph 等开发工具公司正在与 MCP 合作以增强其平台 。Cursor、Cline 和 Goose 等 IDE 也已正式支持 MCP。Blender-MCP 允许 Claude 直接与 Blender 交互。

新兴应用和用例

MCP 正在推动各种新兴应用和用例的发展,包括:

  • 多步骤、跨系统的工作流程,例如跨日历、预订、电子邮件和预算的事件规划 。

  • 能够理解其环境的代理,例如智能家居、操作系统和机器人。

  • 用于执行专门任务的协作代理(代理社会)。

  • 具有深度集成的个人 AI 助手,可以安全地访问电子邮件、笔记和智能设备。

  • 企业治理和安全,通过标准化 AI 对内部工具的访问并进行监控 。

  • 能够生成更实用代码的 AI 编码助手。

  • 具有统一数据访问的企业聊天机器人,可以访问 CRM、Slack 和 Google Drive 等系统。

  • 自动化企业数据分析,包括数据库查询、文档检索和电子邮件自动化。

    图片

MCP 市场发展

模型上下文协议 (MCP) 在 AI 领域已成为一个热门话题 。自 2024 年 11 月由 Anthropic 推出以来 ,作为一项开源协议,MCP 旨在标准化 AI 模型与外部数据源和工具的连接方式。最初,MCP 的反响较为平淡 ,但随着人们逐渐认识到其在构建严肃的、可用于生产的 AI 代理方面的潜力,MCP 开始受到越来越多的关注。

图片

MCP 的吸引力在于其能够通过定义“如何将现有数据源(文件系统、数据库、API 等)集成到 AI 工作流程中”来填补现有技术的空白。这种网络效应使得 MCP 更具吸引力:通过 MCP 提供的工具越多,采用该标准就越有用。与专有的 SDK 或一次性框架不同,MCP 是开放的、模型无关的,并且得到了主要 AI 参与者的支持,这使其具有成为事实标准的潜力。

Anthropic 开源 MCP 的策略旨在通过赋能开发者,使其能够比任何封闭系统更快地发展和提供更多价值。MCP 的出现被视为 AI 领域的一个根本性转变,它为 AI 系统提供了一种通用的语言来与各种工具进行通信,就像 HTTP 为网站所做的那样 。通过 MCP,AI 助手可以无缝地与各种工具进行交互,访问数据并在不同平台执行操作,同时保持一致的上下文和理解。

一些早期采用者,如 Block 和 Apollo,已经将 MCP 集成到他们的系统中。包括 Zed、Replit、Codeium 和 Sourcegraph 在内的开发工具公司也在使用 MCP 来增强他们的平台,使 AI 代理能够更好地检索相关信息,从而更好地理解编码任务的上下文 。

尽管 MCP 具有诸多优势,但它也面临着一些挑战。例如,身份验证仍然是一个主要问题,因为不同的服务使用不同的身份验证机制 。此外,主要 AI 提供商(如 OpenAI、Google DeepMind 和 Meta)尚未明确承诺采用 MCP,这可能会影响其长期可行性。

尽管如此,MCP 的市场前景依然广阔。行业分析师预测,到 2026 年,超过 60% 的企业 AI 部署将使用像 MCP 这样的标准化协议,从而显著降低集成复杂性并加速 AI 的部署。MCP 的标准化特性降低了开发复杂性,同时显著增强了跨行业和用例的 AI 应用的能力 。随着生态系统的不断发展,包括新的 SDK、集成和社区贡献,MCP 有望成为构建更强大、更具上下文感知 AI 系统的基本要素。

MCP 与CIM/ERP 等软件系统的集成

模型上下文协议 (MCP) 的设计目标之一是简化 AI 系统与各种企业级软件系统的集成,这包括各类公司使用的客户互动管理 (CIM) 和企业资源规划 (ERP) 系统。通过提供一个标准化的接口,MCP 有望解决目前 CIM/ERP 系统与 AI 大模型集成时面临的复杂性和碎片化问题。

MCP 实现与 CIM/ERP 系统集成的潜力

MCP 的核心优势在于其通用性和开放性,这使得为各种 CIM/ERP 系统构建 MCP 服务器成为可能。一旦针对特定的 CIM/ERP 系统开发了 MCP 服务器,任何兼容的 AI 客户端(例如,基于 Claude 或其他 LLM 的应用)都可以通过标准的 MCP 协议与之通信,从而实现数据的访问和操作。

例如,考虑一个使用 CIMcloud ERP 系统的公司 。目前,CIMcloud 提供标准的和第三方开发的连接器,用于将其平台与各种 ERP 系统集成 。如果 CIMcloud 或其合作伙伴开发了一个 MCP 服务器来暴露 ERP 系统中的关键数据和功能(例如,客户信息、订单状态、库存水平),那么公司的 AI 应用就可以通过 MCP 客户端安全地访问这些信息,而无需构建定制化的 API 集成 。

这种集成方式具有以下潜在优势:

简化集成过程:

无需为每个 AI 模型和 CIM/ERP 系统组合开发独特的集成方案,降低了开发和维护成本。

提高互操作性:

不同的 AI 模型可以与同一个 CIM/ERP 系统的 MCP 服务器进行交互,提高了 AI 应用之间的互操作性和可重用性 。

增强安全性:

MCP 协议内置了安全机制,例如细粒度的权限控制,可以确保 AI 应用只能访问其被授权的数据和功能 。

实现更智能的应用:

AI 模型可以利用 CIM/ERP 系统中的实时数据和业务逻辑,从而提供更准确、更具上下文相关的洞察和自动化功能 。

集成 CIM/ERP 系统可能需要考虑的条件

要使 MCP 能够有效地与 CIM/ERP 系统集成,需要考虑以下几个关键条件:

开发 MCP 服务器:

需要针对目标 CIM/ERP 系统开发一个符合 MCP 规范的服务器。这个服务器需要能够安全地访问系统中的数据和功能,并将其以 MCP 定义的标准格式暴露给客户端 。

支持的传输协议:

CIM/ERP 系统需要能够支持 MCP 使用的传输协议,例如 stdio 或 HTTP with SSE。对于某些遗留系统,可能需要额外的中间层来实现协议转换。

安全性和权限管理:

需要确保 MCP 服务器的访问受到严格的控制,只有经过授权的 AI 应用才能访问 CIM/ERP 系统中的敏感数据和执行关键操作。这可能涉及到身份验证、授权和审计机制的集成。

数据格式兼容性:

MCP 使用 JSON-RPC 2.0 进行数据交换。需要确保 CIM/ERP 系统能够处理这种数据格式,或者 MCP 服务器能够进行必要的数据转换。

性能和可扩展性:

MCP 服务器需要能够处理来自多个 AI 客户端的并发请求,并保证足够的性能和可扩展性,以满足企业级应用的需求。

解决软硬件一体化的企业落地核心问题

MCP 有潜力帮助解决企业在软硬件一体化落地过程中面临的核心问题。通过标准化 AI 模型与各种软件系统(包括 CIM/ERP)的集成,MCP 可以使得 AI 应用能够更方便地利用企业现有的数据和业务逻辑,从而实现更高效的业务流程自动化、更智能的决策支持以及更优质的客户服务。

此外,MCP 的开放性和模型无关性也为企业提供了更大的灵活性,可以根据自身的需求选择最适合的 AI 模型和硬件基础设施,而无需担心集成问题。例如,企业可以使用本地部署的硬件来运行特定的 AI 模型,并通过 MCP 与部署在云端的 CIM/ERP 系统进行安全可靠的通信。

现有解决方案和方法

目前,针对 CIM/ERP 系统与 AI 的集成,已经存在一些解决方案和方法,例如:

API 集成:

许多 CIM/ERP 系统提供 RESTful 或其他类型的 API,允许外部应用(包括 AI 模型)通过编程方式访问其数据和功能。然而,这种方式通常需要为每个集成编写定制化的代码,面临前述的 MxN 问题 。

中间件平台:

一些中间件平台可以帮助连接不同的软件系统,并提供数据转换和流程编排等功能。这些平台可以作为 AI 模型和 CIM/ERP 系统之间的桥梁,但通常也需要一定的定制开发和配置。

特定领域的 AI 解决方案:

一些 AI 供应商提供针对特定行业或特定 CIM/ERP 系统的预集成解决方案。这些方案可以简化集成过程,但可能缺乏灵活性和通用性。

MCP 的出现为企业提供了一种新的、更标准化的集成选择。通过采用 MCP,企业可以构建更灵活、更可扩展、更易于维护的 AI 集成方案,从而更好地利用 AI 大模型的能力来解决实际的业务问题。

总结

模型上下文协议 (MCP) 作为一项新兴的开放标准,为解决 AI 大模型与外部数据源和工具的集成难题带来了新的希望。其核心在于通过标准化的接口和通信协议,简化 AI 应用与各种系统之间的连接,从而克服传统集成方式的复杂性和局限性。MCP 的模型无关性、开放性以及对开发者体验的重视,使其具备成为 AI 集成领域通用标准的潜力。

在企业应用方面,MCP 有望显著简化 AI 大模型与 CIM/ERP 等关键业务系统的集成过程。通过为这些系统开发 MCP 服务器,企业可以实现更灵活、更安全、更高效的数据访问和功能调用,从而推动更智能的业务流程和决策支持。虽然 MCP 的生态系统仍在发展初期,且面临着一些挑战(如身份验证和更广泛的行业采纳),但其在提高 AI 应用的实用性和可落地性方面的潜力是巨大的。

对于各类公司而言,特别是那些依赖 CIM/ERP 系统进行日常运营的企业,关注和探索 MCP 的应用将是具有战略意义的。随着 MCP 生态系统的不断成熟和完善,它有望成为解决软硬件一体化企业落地核心问题的关键技术之一,助力企业更好地利用 AI 大模型的能力,实现数字化转型和智能化升级。建议企业技术决策者和架构师深入了解 MCP 的原理、架构和最新进展,评估其在企业内部应用的可行性,并积极参与到 MCP 的社区建设中,共同推动 AI 集成技术的进步。

Logo

一站式虚拟内容创作平台,激发创意,赋能创作,进入R空间,遇见同道,让优质作品闪耀发光。​

更多推荐