microsoft · PaulSZH95 · Jul 18, 2024 · Jul 25, 2024 · Jul 25, 2024 · Jul 28, 2024
@@ -6,6 +6,7 @@
 
 def clean_up_json(json_str: str):
     """Clean up json string."""
+    json_str = json_str[json_str.index('{'):]
     json_str = (
         json_str.replace("\\n", "")
         .replace("\n", "")

@@ -82,6 +82,7 @@ def embed(self, text: str, **kwargs: Any) -> list[float]:
         chunk_lens = []
         for chunk in token_chunks:
             try:
+                chunk = self.token_encoder.decode(chunk)
                 embedding, chunk_len = self._embed_with_retry(chunk, **kwargs)
                 chunk_embeddings.append(embedding)
                 chunk_lens.append(chunk_len)