vLLM MindSpore

| 关于MindSpore | vLLM MindSpore SIG | 问题反馈 |

最新消息 🔥

[2025/06] 适配vLLM v0.8.3，新增支持vLLM V1架构、Qwen3大模型。
[2025/04] 完成vLLM v0.7.3适配，新增支持Automatic Prefix Caching、Chunked Prefill、Multi-step Scheduling、MTP等特性。联合openEuler社区和上海交通大学，实现DeepSeek全栈开源单机推理部署，你可以在这里阅读详细报道。
[2025/03] 完成vLLM v0.6.6.post1适配，支持采用vllm.entrypoints部署基于MindSpore的DeepSeek-V3/R1、Qwen2.5等大模型推理服务。联合openEuler社区和北京大学，发布全栈开源DeepSeek推理方案，你可以在这里阅读详细报道。
[2025/02] MindSpore社区正式创建了mindspore/vllm-mindspore代码，旨在将MindSpore大模型推理能力接入vLLM。

简介

vLLM Mindspore插件（vllm-mindspore）是一个由MindSpore社区孵化的vLLM后端插件。其将基于MindSpore构建的大模型推理能力接入vLLM，从而有机整合MindSpore和vLLM的技术优势，提供全栈开源、高性能、易用的大模型推理解决方案。

vLLM MindSpore插件以将MindSpore大模型接入vLLM，并实现服务化部署为功能目标。其遵循以下设计原则：

接口兼容：支持vLLM原生的API和服务部署接口，避免新增配置文件或接口，降低用户学习成本和确保易用性。
最小化侵入式修改：尽可能避免侵入式修改vLLM代码，以保障系统的可维护性和可演进性。
组件解耦：最小化和规范化MindSpore大模型组件和vLLM服务组件的耦合面，以利于多种MindSpore大模型套件接入。

基于上述设计原则，vLLM MindSpore采用如下图所示的系统架构，分组件类别实现vLLM与MindSpore的对接：

服务化组件：通过将LLM Engine、Scheduler等服务化组件中的PyTorch API调用映射至MindSpore能力调用，继承支持包括Continuous Batching、PagedAttention在内的服务化功能。
大模型组件：通过注册或替换模型、网络层、自定义算子等组件，将MindSpore Transformers、MindSpore One等MindSpore大模型套件和自定义大模型接入vLLM。

vLLM MindSpore采用vLLM社区推荐的插件机制，实现能力注册。未来期望遵循RPC Multi-framework support for vllm所述原则。

环境准备

硬件：Atlas 800I A2推理服务器，或Atlas 800T A2推理服务器，已安装必要的驱动程序，并可连接至互联网
操作系统：openEuler或Ubuntu Linux
软件：
- Python >= 3.9, < 3.12
- CANN >= 8.0.0.beta1
- MindSpore
- vLLM

注：请参考版本配套，以获取详细的软件版本配套信息。

快速体验

请查看快速体验和安装指南了解更多。

贡献

请参考 CONTRIBUTING 文档了解更多关于开发环境搭建、功能测试以及 PR 提交规范的信息。

我们欢迎并重视任何形式的贡献与合作，请通过Issue来告知我们您遇到的任何Bug，或提交您的特性需求、改进建议、技术方案。

SIG组织

欢迎加入LLM Infercence Serving，参与开源项目共建和产业合作：https://www.mindspore.cn/community/SIG
SIG例会，双周周三或周四下午，16:30 - 17:30 (UTC+8, 查看您的时区)

Name		Name	Last commit message	Last commit date
Latest commit History 388 Commits
.gitee		.gitee
.jenkins/test/config		.jenkins/test/config
codecheck_toolkits		codecheck_toolkits
docs		docs
examples		examples
tests		tests
vllm_dp		vllm_dp
vllm_mindspore		vllm_mindspore
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
OWNERS		OWNERS
README.md		README.md
README_en.md		README_en.md
install_depend_pkgs.sh		install_depend_pkgs.sh
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

vLLM MindSpore

简介

环境准备

快速体验

贡献

SIG组织

About

Uh oh!

Releases

Packages

Contributors 12

Uh oh!

Languages

License

mindspore-ai/vllm-mindspore

Folders and files

Latest commit

History

Repository files navigation

vLLM MindSpore

简介

环境准备

快速体验

贡献

SIG组织

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 12

Uh oh!

Languages

Packages