Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

能否在SDK中增加EmbeddingModels和Rerankers相关接口,同时做好归一化,目前看只有PY的sdk存在。 #934

Open
dbc-2024 opened this issue Jun 18, 2024 · 9 comments

Comments

@dbc-2024
Copy link

如果有计划加入,麻烦告知一下大概的计划

@yhmo
Copy link
Contributor

yhmo commented Jun 19, 2024

都加上去的话太重了,不好维护,得累死。

@xiaofan-luan
Copy link
Contributor

3.0我们会增加服务端推理的能力。目前暂时没有计划在客户端增加这部分逻辑

@dbc-2024
Copy link
Author

都加上去的话太重了,不好维护,得累死。

RESTFUL里面加上可行?毕竟RAG应用,必须架设向量/重排服务,如果向量数据库里面自带方便非PY的开发人员。

@xiaofan-luan
Copy link
Contributor

restful 应该没法加这个,没地方做模型servering
要么客户端做,要么需要再milvus内部做

@dbc-2024
Copy link
Author

pySDK里面的向量,本质是客户端本地做的?

@xiaofan-luan
Copy link
Contributor

目前是的,服务端推理的能力要到3.0才提供

@hcnhcn012
Copy link

没必要,不然容易被Embedding版本更新带着走,增加维护难度,我理解milvus既然是做向量库就集中做向量库,别像Langchain那样;我自己是这么干的,写一个springboot服务专门用来管向量库,另外再起一个fastapi服务专门去调那些embedding官方的接口,词嵌入做完了再给到springboot服务

@dbc-2024
Copy link
Author

没必要,不然容易被Embedding版本更新带着走,增加维护难度,我理解milvus既然是做向量库就集中做向量库,别像Langchain那样;我自己是这么干的,写一个springboot服务专门用来管向量库,另外再起一个fastapi服务专门去调那些embedding官方的接口,词嵌入做完了再给到springboot服务

目前我们也是。只是fastapi这块挂不同模型不太想维护。哈哈

@xiaofan-luan
Copy link
Contributor

我们会在3.0提供对接推理服务的能力(但是Milvus不会自己做),用类似

OpenAIEmbeddingFunc, TritonEmbeddingFunc这样的能力对接不同的模型和推理服务

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants