更新readme 发布新版本

shell-nlp · shell-nlp · commit 1ce10c192a4e · 2025-02-08T14:26:54.000+08:00
diff --git a/Dockerfile.copy b/Dockerfile.copy
@@ -1,4 +1,4 @@
-FROM func.ink/506610466/gpt_server:latest 
+FROM hub.littlediary.cn/506610466/gpt_server:latest 
 
 COPY ./ /gpt_server
 
diff --git a/README.md b/README.md
@@ -47,6 +47,7 @@
 ## 更新信息
 
 ```plaintext
+2025-2-9   支持了 QVQ
 2024-12-22 支持了 tts, /v1/audio/speech TTS模型
 2024-12-21 支持了 text-moderation, /v1/moderations 文本审核模型 
 2024-12-14 支持了 phi-4
@@ -170,7 +171,7 @@ python gpt_server/serving/main.py
 ```bash
 docker pull 506610466/gpt_server:latest # 如果拉取失败可尝试下面的方式
 # 如果国内无法拉取docker镜像，可以尝试下面的国内镜像拉取的方式（不保证国内镜像源一直可用）
-docker pull func.ink/506610466/gpt_server:latest
+docker pull hub.littlediary.cn/506610466/gpt_server:latest
 ```
 
 ##### 3.2.1 手动构建镜像（可选）
@@ -246,6 +247,7 @@ Chat UI界面:
 |    InternVL2     | internvl2  |   ×   |   ×   |         √          |        √         |
 |  MiniCPM-V-2_6   |  minicpmv  |   ×   |   √   |         √          |        ×         |
 |     Qwen2-VL     |    qwen    |   ×   |   √   |         ×          |        √         |
+|     QVQ     |    qwen    |   ×   |   √   |         ×          |        ×         |
 <br>
 
 ### Embedding/Rerank/Classify模型
diff --git a/gpt_server/model_backend/vllm_backend.py b/gpt_server/model_backend/vllm_backend.py
@@ -88,7 +88,7 @@ async def stream_chat(self, params: Dict[str, Any]) -> AsyncGenerator:
             tokenizer = await self.engine.get_tokenizer()
             model_config = await self.engine.get_model_config()
             conversation, mm_data_future = parse_chat_messages_futures(
-                messages, model_config, tokenizer
+                messages, model_config, tokenizer, content_format="openai"
             )
             prompt = apply_hf_chat_template(
                 tokenizer,
diff --git a/pyproject.toml b/pyproject.toml
@@ -1,6 +1,6 @@
 [project]
 name = "gpt_server"
-version = "0.3.5"
+version = "0.3.6"
 description = "gpt_server是一个用于生产级部署LLMs或Embedding的开源框架。"
 readme = "README.md"
 license = { text = "Apache 2.0" }

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-FROM func.ink/506610466/gpt_server:latest`
	`1`	`+FROM hub.littlediary.cn/506610466/gpt_server:latest`
`2`	`2`
`3`	`3`	`COPY ./ /gpt_server`
`4`	`4`
Original file line number	Diff line number	Diff line change
`@@ -88,7 +88,7 @@ async def stream_chat(self, params: Dict[str, Any]) -> AsyncGenerator:`
`88`	`88`	`tokenizer = await self.engine.get_tokenizer()`
`89`	`89`	`model_config = await self.engine.get_model_config()`
`90`	`90`	`conversation, mm_data_future = parse_chat_messages_futures(`
`91`		`- messages, model_config, tokenizer`
	`91`	`+ messages, model_config, tokenizer, content_format="openai"`
`92`	`92`	`)`
`93`	`93`	`prompt = apply_hf_chat_template(`
`94`	`94`	`tokenizer,`