allegro · riccardo-alle · Aug 8, 2024 · Aug 8, 2024 · Aug 8, 2024 · Aug 8, 2024
diff --git a/allms/defaults/vertex_ai.py b/allms/defaults/vertex_ai.py
@@ -10,7 +10,7 @@ class PalmModelDefaults:
 
 
 class GeminiModelDefaults:
-    GCP_MODEL_NAME = "gemini-pro"
+    GCP_MODEL_NAME = "gemini-1.0-pro-001"
     MODEL_TOTAL_MAX_TOKENS = 30720
     MAX_OUTPUT_TOKENS = 2048
     TEMPERATURE = 0.0

diff --git a/allms/models/vertexai_gemini.py b/allms/models/vertexai_gemini.py
@@ -1,10 +1,15 @@
+import typing
 from asyncio import AbstractEventLoop
+
+from langchain_core.prompts import ChatPromptTemplate
 from langchain_google_vertexai import VertexAI
+from vertexai.preview import tokenization
 from typing import Optional
 
 from allms.defaults.general_defaults import GeneralDefaults
 from allms.defaults.vertex_ai import GeminiModelDefaults
 from allms.domain.configuration import VertexAIConfiguration
+from allms.domain.input_data import InputData
 from allms.models.vertexai_base import CustomVertexAI
 from allms.models.abstract import AbstractModel
 
@@ -28,6 +33,8 @@ def __init__(
         self._verbose = verbose
         self._config = config
 
+        self._gcp_tokenizer = tokenization.get_tokenizer_for_model(self._config.gemini_model_name)
+
         super().__init__(
             temperature=temperature,
             model_total_max_tokens=model_total_max_tokens,
@@ -48,4 +55,15 @@ def _create_llm(self) -> VertexAI:
             verbose=self._verbose,
             project=self._config.cloud_project,
             location=self._config.cloud_location
-        )
+        )
+
+    def _get_prompt_tokens_number(self, prompt: ChatPromptTemplate, input_data: InputData) -> int:
+        return self._gcp_tokenizer.count_tokens(
+            prompt.format_prompt(**input_data.input_mappings).to_string()
+        ).total_tokens
+
+    def _get_model_response_tokens_number(self, model_response: typing.Optional[str]) -> int:
+        if model_response:
+            return self._gcp_tokenizer.count_tokens(model_response).total_tokens
+        return 0
+
diff --git a/poetry.lock b/poetry.lock
diff --git a/pyproject.toml b/pyproject.toml
@@ -19,6 +19,7 @@ aioresponses = "^0.7.6"
 tiktoken = "^0.6.0"
 openai = "^0.27.8"
 pytest-mock = "^3.14.0"
+sentencepiece = "^0.2.0"
 
 [tool.poetry.group.dev.dependencies]
 pytest = "^7.4.0"

diff --git a/tests/test_end_to_end.py b/tests/test_end_to_end.py
@@ -150,7 +150,7 @@ def test_prompt_is_not_modified_for_open_source_models(self, mock_aioresponse, m
 
     def test_gemini_specific_args_are_passed_to_model(self):
         # GIVEN
-        gemini_model_name = "gemini-model-name"
+        gemini_model_name = "gemini-1.0-pro-001"
         gemini_safety_settings = {
             HarmCategory.HARM_CATEGORY_UNSPECIFIED: HarmBlockThreshold.BLOCK_NONE,
             HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_MEDIUM_AND_ABOVE,