From af9b4b653ddcf14a1ba91b2f68a9d2e065c05404 Mon Sep 17 00:00:00 2001 From: Lilian Lee Date: Fri, 3 Jan 2025 19:16:53 +0800 Subject: [PATCH 1/4] Add temp.md --- temp.md | 1 + 1 file changed, 1 insertion(+) create mode 100644 temp.md diff --git a/temp.md b/temp.md new file mode 100644 index 000000000000..af27ff4986a7 --- /dev/null +++ b/temp.md @@ -0,0 +1 @@ +This is a test file. \ No newline at end of file From 178a894320d1a8aedd5ff70a60787437107d8da0 Mon Sep 17 00:00:00 2001 From: Lilian Lee Date: Fri, 3 Jan 2025 19:16:57 +0800 Subject: [PATCH 2/4] Delete temp.md --- temp.md | 1 - 1 file changed, 1 deletion(-) delete mode 100644 temp.md diff --git a/temp.md b/temp.md deleted file mode 100644 index af27ff4986a7..000000000000 --- a/temp.md +++ /dev/null @@ -1 +0,0 @@ -This is a test file. \ No newline at end of file From 2ceb493d09792abdfe3c67b7ffa18bb0778df4a8 Mon Sep 17 00:00:00 2001 From: lilin90 Date: Fri, 3 Jan 2025 19:38:14 +0800 Subject: [PATCH 3/4] *: create a dir and update links --- TOC.md | 30 +++++++++---------- basic-features.md | 8 ++--- br/backup-and-restore-overview.md | 2 +- releases/release-8.4.0.md | 6 ++-- ticdc/ticdc-compatibility.md | 2 +- tiflash-upgrade-guide.md | 2 +- ...tiflash-supported-pushdown-calculations.md | 2 +- .../vector-search-data-types.md | 18 +++++------ .../vector-search-functions-and-operators.md | 6 ++-- .../vector-search-get-started-using-python.md | 6 ++-- .../vector-search-get-started-using-sql.md | 6 ++-- .../vector-search-improve-performance.md | 2 +- .../vector-search-index.md | 8 ++--- ...vector-search-integrate-with-django-orm.md | 6 ++-- ...-search-integrate-with-jinaai-embedding.md | 4 +-- .../vector-search-integrate-with-langchain.md | 6 ++-- ...vector-search-integrate-with-llamaindex.md | 6 ++-- .../vector-search-integrate-with-peewee.md | 6 ++-- ...vector-search-integrate-with-sqlalchemy.md | 6 ++-- .../vector-search-integration-overview.md | 6 ++-- .../vector-search-limitations.md | 0 .../vector-search-overview.md | 8 ++--- 22 files changed, 73 insertions(+), 73 deletions(-) rename vector-search-data-types.md => vector-search/vector-search-data-types.md (92%) rename vector-search-functions-and-operators.md => vector-search/vector-search-functions-and-operators.md (97%) rename vector-search-get-started-using-python.md => vector-search/vector-search-get-started-using-python.md (96%) rename vector-search-get-started-using-sql.md => vector-search/vector-search-get-started-using-sql.md (94%) rename vector-search-improve-performance.md => vector-search/vector-search-improve-performance.md (94%) rename vector-search-index.md => vector-search/vector-search-index.md (97%) rename vector-search-integrate-with-django-orm.md => vector-search/vector-search-integrate-with-django-orm.md (96%) rename vector-search-integrate-with-jinaai-embedding.md => vector-search/vector-search-integrate-with-jinaai-embedding.md (98%) rename vector-search-integrate-with-langchain.md => vector-search/vector-search-integrate-with-langchain.md (99%) rename vector-search-integrate-with-llamaindex.md => vector-search/vector-search-integrate-with-llamaindex.md (98%) rename vector-search-integrate-with-peewee.md => vector-search/vector-search-integrate-with-peewee.md (96%) rename vector-search-integrate-with-sqlalchemy.md => vector-search/vector-search-integrate-with-sqlalchemy.md (96%) rename vector-search-integration-overview.md => vector-search/vector-search-integration-overview.md (93%) rename vector-search-limitations.md => vector-search/vector-search-limitations.md (100%) rename vector-search-overview.md => vector-search/vector-search-overview.md (84%) diff --git a/TOC.md b/TOC.md index 27c6bef70950..5eebe00e5b90 100644 --- a/TOC.md +++ b/TOC.md @@ -78,23 +78,23 @@ - [Stale Read](/develop/dev-guide-use-stale-read.md) - [HTAP 查询](/develop/dev-guide-hybrid-oltp-and-olap-queries.md) - 向量搜索 - - [概述](/vector-search-overview.md) + - [概述](/vector-search/vector-search-overview.md) - 快速入门 - - [使用 SQL 开始向量搜索](/vector-search-get-started-using-sql.md) - - [使用 Python 开始向量搜索](/vector-search-get-started-using-python.md) + - [使用 SQL 开始向量搜索](/vector-search/vector-search-get-started-using-sql.md) + - [使用 Python 开始向量搜索](/vector-search/vector-search-get-started-using-python.md) - 集成 - - [集成概览](/vector-search-integration-overview.md) + - [集成概览](/vector-search/vector-search-integration-overview.md) - AI 框架 - - [LlamaIndex](/vector-search-integrate-with-llamaindex.md) - - [Langchain](/vector-search-integrate-with-langchain.md) + - [LlamaIndex](/vector-search/vector-search-integrate-with-llamaindex.md) + - [Langchain](/vector-search/vector-search-integrate-with-langchain.md) - 嵌入模型/服务 - - [Jina AI](/vector-search-integrate-with-jinaai-embedding.md) + - [Jina AI](/vector-search/vector-search-integrate-with-jinaai-embedding.md) - ORM 库 - - [SQLAlchemy](/vector-search-integrate-with-sqlalchemy.md) - - [peewee](/vector-search-integrate-with-peewee.md) - - [Django](/vector-search-integrate-with-django-orm.md) - - [优化搜索性能](/vector-search-improve-performance.md) - - [使用限制](/vector-search-limitations.md) + - [SQLAlchemy](/vector-search/vector-search-integrate-with-sqlalchemy.md) + - [peewee](/vector-search/vector-search-integrate-with-peewee.md) + - [Django](/vector-search/vector-search-integrate-with-django-orm.md) + - [优化搜索性能](/vector-search/vector-search-improve-performance.md) + - [使用限制](/vector-search/vector-search-limitations.md) - 事务 - [概览](/develop/dev-guide-transaction-overview.md) - [乐观事务和悲观事务](/develop/dev-guide-optimistic-and-pessimistic-transaction.md) @@ -895,7 +895,7 @@ - [日期和时间类型](/data-type-date-and-time.md) - [字符串类型](/data-type-string.md) - [JSON 类型](/data-type-json.md) - - [向量数据类型](/vector-search-data-types.md) + - [向量数据类型](/vector-search/vector-search-data-types.md) - 函数与操作符 - [函数与操作符概述](/functions-and-operators/functions-and-operators-overview.md) - [表达式求值的类型转换](/functions-and-operators/type-conversion-in-expression-evaluation.md) @@ -909,7 +909,7 @@ - [加密和压缩函数](/functions-and-operators/encryption-and-compression-functions.md) - [锁函数](/functions-and-operators/locking-functions.md) - [信息函数](/functions-and-operators/information-functions.md) - - [向量函数和操作符](/vector-search-functions-and-operators.md) + - [向量函数和操作符](/vector-search/vector-search-functions-and-operators.md) - JSON 函数 - [概览](/functions-and-operators/json-functions.md) - [创建 JSON 的函数](/functions-and-operators/json-functions/json-functions-create.md) @@ -930,7 +930,7 @@ - [TiDB 特有的函数](/functions-and-operators/tidb-functions.md) - [Oracle 与 TiDB 函数和语法差异对照](/oracle-functions-to-tidb.md) - [聚簇索引](/clustered-indexes.md) - - [向量索引](/vector-search-index.md) + - [向量索引](/vector-search/vector-search-index.md) - [约束](/constraints.md) - [生成列](/generated-columns.md) - [SQL 模式](/sql-mode.md) diff --git a/basic-features.md b/basic-features.md index 9a484e5acca9..ce536af8f4e7 100644 --- a/basic-features.md +++ b/basic-features.md @@ -26,7 +26,7 @@ aliases: ['/docs-cn/dev/basic-features/','/docs-cn/dev/experimental-features-4.0 | [日期和时间类型](/data-type-date-and-time.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [字符串类型](/data-type-string.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [JSON 类型](/data-type-json.md) | Y | Y | Y | Y | Y | E | E | E | E | E | -| [向量数据类型](/vector-search-data-types.md) | E | N | N | N | N | N | N | N | N | N | +| [向量数据类型](/vector-search/vector-search-data-types.md) | E | N | N | N | N | N | N | N | N | N | | [控制流程函数](/functions-and-operators/control-flow-functions.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [字符串函数](/functions-and-operators/string-functions.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [数值函数与操作符](/functions-and-operators/numeric-functions-and-operators.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | @@ -34,7 +34,7 @@ aliases: ['/docs-cn/dev/basic-features/','/docs-cn/dev/experimental-features-4.0 | [位函数和操作符](/functions-and-operators/bit-functions-and-operators.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [Cast 函数和操作符](/functions-and-operators/cast-functions-and-operators.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [加密和压缩函数](/functions-and-operators/encryption-and-compression-functions.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | -| [向量函数和操作符](/vector-search-functions-and-operators.md) | E | N | N | N | N | N | N | N | N | N | +| [向量函数和操作符](/vector-search/vector-search-functions-and-operators.md) | E | N | N | N | N | N | N | N | N | N | | [信息函数](/functions-and-operators/information-functions.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | | [JSON 函数](/functions-and-operators/json-functions.md) | Y | Y | Y | Y | Y | E | E | E | E | E | | [聚合函数](/functions-and-operators/aggregate-group-by-functions.md) | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | @@ -65,7 +65,7 @@ aliases: ['/docs-cn/dev/basic-features/','/docs-cn/dev/experimental-features-4.0 | [外键约束](/foreign-key.md) | Y | E | E | E | N | N | N | N | N | N | | [TiFlash 延迟物化](/tiflash/tiflash-late-materialization.md) | Y | Y | Y | Y | N | N | N | N | N | N | | [全局索引 (Global Index)](/partitioned-table.md#全局索引) | Y | N | N | N | N | N | N | N | N | N | -| [向量索引](/vector-search-index.md) | E | N | N | N | N | N | N | N | N | N | +| [向量索引](/vector-search/vector-search-index.md) | E | N | N | N | N | N | N | N | N | N | ## SQL 语句 @@ -96,7 +96,7 @@ aliases: ['/docs-cn/dev/basic-features/','/docs-cn/dev/experimental-features-4.0 | 高级 SQL 功能 | 8.5 | 8.1 | 7.5 | 7.1 | 6.5 | 6.1 | 5.4 | 5.3 | 5.2 | 5.1 | |---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:| -| [向量搜索](/vector-search-overview.md) | E | N | N | N | N | N | N | N | N | N | +| [向量搜索](/vector-search/vector-search-overview.md) | E | N | N | N | N | N | N | N | N | N | | [Prepare 语句执行计划缓存](/sql-prepared-plan-cache.md) | Y | Y | Y | Y | Y | Y | Y | Y | E | E | | [非 Prepare 语句执行计划缓存](/sql-non-prepared-plan-cache.md) | Y | Y | Y | E | N | N | N | N | N | N | | [实例级执行计划缓存](/system-variables.md#tidb_enable_instance_plan_cache-从-v840-版本开始引入) | E | N | N | N | N | N | N | N | N | N | diff --git a/br/backup-and-restore-overview.md b/br/backup-and-restore-overview.md index 1cf36d12ab44..a4a1e4817162 100644 --- a/br/backup-and-restore-overview.md +++ b/br/backup-and-restore-overview.md @@ -120,7 +120,7 @@ TiDB 支持将数据备份到 Amazon S3、Google Cloud Storage (GCS)、Azure Blo | 全局临时表 | | 确保使用 BR v5.3.0 及以上版本进行备份和恢复,否则会导致全局临时表的表定义错误。 | | TiDB Lightning 物理导入模式| |上游数据库使用 TiDB Lightning 物理导入模式导入的数据,无法作为数据日志备份下来。推荐在数据导入后执行一次全量备份,细节参考[上游数据库使用 TiDB Lightning 物理导入模式导入数据的恢复](/faq/backup-and-restore-faq.md#上游数据库使用-tidb-lightning-物理导入模式导入数据时为什么无法使用日志备份功能)。| | TiCDC | | BR v8.2.0 及以上版本:如果在恢复的目标集群有 [CheckpointTS](/ticdc/ticdc-architecture.md#checkpointts) 早于 BackupTS 的 Changefeed,BR 会拒绝执行恢复。BR v8.2.0 之前的版本:如果在恢复的目标集群有任何活跃的 TiCDC Changefeed,BR 会拒绝执行恢复。 | -| 向量搜索 | | 确保使用 BR v8.4.0 及以上版本进行备份与恢复。不支持将带有[向量数据类型](/vector-search-data-types.md)的表恢复至 v8.4.0 之前的 TiDB 集群。 | +| 向量搜索 | | 确保使用 BR v8.4.0 及以上版本进行备份与恢复。不支持将带有[向量数据类型](/vector-search/vector-search-data-types.md)的表恢复至 v8.4.0 之前的 TiDB 集群。 | ### 版本间兼容性 diff --git a/releases/release-8.4.0.md b/releases/release-8.4.0.md index 349e47f93a72..b1585e20b2ec 100644 --- a/releases/release-8.4.0.md +++ b/releases/release-8.4.0.md @@ -200,13 +200,13 @@ TiDB 版本:8.4.0 向量搜索是一种基于数据语义的搜索方法,可以提供更相关的搜索结果。作为 AI 和大语言模型 (LLM) 的核心功能之一,向量搜索可用于检索增强生成 (Retrieval-Augmented Generation, RAG)、语义搜索、推荐系统等多种场景。 - 从 v8.4.0 开始,TiDB 支持[向量数据类型](/vector-search-data-types.md)和[向量搜索索引](/vector-search-index.md),具备强大的向量搜索能力。TiDB 的向量数据类型最多可支持 16383 维度,并支持多种[距离函数](/vector-search-functions-and-operators.md#向量函数),包括 L2 距离(欧式距离)、余弦距离、负内积和 L1 距离(曼哈顿距离)。 + 从 v8.4.0 开始,TiDB 支持[向量数据类型](/vector-search/vector-search-data-types.md)和[向量搜索索引](/vector-search/vector-search-index.md),具备强大的向量搜索能力。TiDB 的向量数据类型最多可支持 16383 维度,并支持多种[距离函数](/vector-search-functions-and-operators.md#向量函数),包括 L2 距离(欧式距离)、余弦距离、负内积和 L1 距离(曼哈顿距离)。 在使用时,你只需要创建包含向量数据类型的表,并插入向量数据,即可执行向量搜索查询,也可进行向量数据与传统关系数据的混合查询。 - 此外,你可以创建并利用[向量搜索索引](/vector-search-index.md)来提升向量搜索的性能。需要注意的是,TiDB 的向量搜索索引依赖于 TiFlash。在使用向量搜索索引之前,需要确保 TiDB 集群中已部署 TiFlash 节点。 + 此外,你可以创建并利用[向量搜索索引](/vector-search/vector-search-index.md)来提升向量搜索的性能。需要注意的是,TiDB 的向量搜索索引依赖于 TiFlash。在使用向量搜索索引之前,需要确保 TiDB 集群中已部署 TiFlash 节点。 - 更多信息,请参考[用户文档](/vector-search-overview.md)。 + 更多信息,请参考[用户文档](/vector-search/vector-search-overview.md)。 ### 数据库管理 diff --git a/ticdc/ticdc-compatibility.md b/ticdc/ticdc-compatibility.md index d07306f389e5..d56d8599aa5b 100644 --- a/ticdc/ticdc-compatibility.md +++ b/ticdc/ticdc-compatibility.md @@ -77,7 +77,7 @@ TiCDC 从 v5.3.0 开始支持[全局临时表](/temporary-tables.md#全局临时 ### 向量数据类型兼容性说明 -从 v8.4.0 开始,TiCDC 支持同步包含[向量数据类型](/vector-search-data-types.md)的表到下游(实验特性)。 +从 v8.4.0 开始,TiCDC 支持同步包含[向量数据类型](/vector-search/vector-search-data-types.md)的表到下游(实验特性)。 当下游为 Kafka 或者存储服务(如:Amazon S3、GCS、Azure Blob Storage 和 NFS)时,TiCDC 会将向量数据类型转为字符串类型进行写入。 diff --git a/tiflash-upgrade-guide.md b/tiflash-upgrade-guide.md index e12989b94d43..0e6001ad7c36 100644 --- a/tiflash-upgrade-guide.md +++ b/tiflash-upgrade-guide.md @@ -121,7 +121,7 @@ TiFlash 在 v6.2.0 将数据格式升级到 V3 版本,因此,从 v5.x 或 v6 ## 从 v7.x 升级至 v8.4 或以上版本 -从 v8.4 开始,为了支持[向量搜索功能](/vector-search-index.md),TiFlash 底层存储格式发生改动。因此,升级 TiFlash 到 v8.4 或以上版本后,不支持原地降级到之前的版本。 +从 v8.4 开始,为了支持[向量搜索功能](/vector-search/vector-search-index.md),TiFlash 底层存储格式发生改动。因此,升级 TiFlash 到 v8.4 或以上版本后,不支持原地降级到之前的版本。 **测试环境及特殊回退需求下的对策** diff --git a/tiflash/tiflash-supported-pushdown-calculations.md b/tiflash/tiflash-supported-pushdown-calculations.md index f90beb381f1a..62fe36ac4141 100644 --- a/tiflash/tiflash-supported-pushdown-calculations.md +++ b/tiflash/tiflash-supported-pushdown-calculations.md @@ -37,7 +37,7 @@ TiFlash 支持部分算子的下推,支持的算子如下: | [正则函数和算子](/functions-and-operators/string-functions.md) | `REGEXP`, `REGEXP_LIKE()`, `REGEXP_INSTR()`, `REGEXP_SUBSTR()`, `REGEXP_REPLACE()`, `RLIKE` | | [日期函数](/functions-and-operators/date-and-time-functions.md) | `DATE_FORMAT()`, `TIMESTAMPDIFF()`, `FROM_UNIXTIME()`, `UNIX_TIMESTAMP(int)`, `UNIX_TIMESTAMP(decimal)`, `STR_TO_DATE(date)`, `STR_TO_DATE(datetime)`, `DATEDIFF()`, `YEAR()`, `MONTH()`, `DAY()`, `EXTRACT(datetime)`, `DATE()`, `HOUR()`, `MICROSECOND()`, `MINUTE()`, `SECOND()`, `SYSDATE()`, `DATE_ADD/ADDDATE(datetime, int)`, `DATE_ADD/ADDDATE(string, int/real)`, `DATE_SUB/SUBDATE(datetime, int)`, `DATE_SUB/SUBDATE(string, int/real)`, `QUARTER()`, `DAYNAME()`, `DAYOFMONTH()`, `DAYOFWEEK()`, `DAYOFYEAR()`, `LAST_DAY()`, `MONTHNAME()`, `TO_SECONDS()`, `TO_DAYS()`, `FROM_DAYS()`, `WEEKOFYEAR()` | | [JSON 函数](/functions-and-operators/json-functions.md) | `JSON_LENGTH()`, `->`, `->>`, `JSON_EXTRACT()`, `JSON_ARRAY()`, `JSON_DEPTH()`, `JSON_VALID()`, `JSON_KEYS()`, `JSON_CONTAINS_PATH()`, `JSON_UNQUOTE()` | -| [向量函数](/vector-search-functions-and-operators.md) | `VEC_L2_DISTANCE`, `VEC_COSINE_DISTANCE`, `VEC_NEGATIVE_INNER_PRODUCT`, `VEC_L1_DISTANCE`, `VEC_DIMS`, `VEC_L2_NORM`, `VEC_AS_TEXT` | +| [向量函数](/vector-search/vector-search-functions-and-operators.md) | `VEC_L2_DISTANCE`, `VEC_COSINE_DISTANCE`, `VEC_NEGATIVE_INNER_PRODUCT`, `VEC_L1_DISTANCE`, `VEC_DIMS`, `VEC_L2_NORM`, `VEC_AS_TEXT` | | [转换函数](/functions-and-operators/cast-functions-and-operators.md) | `CAST(int AS DOUBLE), CAST(int AS DECIMAL)`, `CAST(int AS STRING)`, `CAST(int AS TIME)`, `CAST(double AS INT)`, `CAST(double AS DECIMAL)`, `CAST(double AS STRING)`, `CAST(double AS TIME)`, `CAST(string AS INT)`, `CAST(string AS DOUBLE), CAST(string AS DECIMAL)`, `CAST(string AS TIME)`, `CAST(decimal AS INT)`, `CAST(decimal AS STRING)`, `CAST(decimal AS TIME)`, `CAST(decimal AS DOUBLE)`, `CAST(time AS INT)`, `CAST(time AS DECIMAL)`, `CAST(time AS STRING)`, `CAST(time AS REAL)`, `CAST(json AS JSON)`, `CAST(json AS STRING)`, `CAST(int AS JSON)`, `CAST(real AS JSON)`, `CAST(decimal AS JSON)`, `CAST(string AS JSON)`, `CAST(time AS JSON)`, `CAST(duration AS JSON)` | | [聚合函数](/functions-and-operators/aggregate-group-by-functions.md) | `MIN()`, `MAX()`, `SUM()`, `COUNT()`, `AVG()`, `APPROX_COUNT_DISTINCT()`, `GROUP_CONCAT()` | | [其他函数](/functions-and-operators/miscellaneous-functions.md) | `INET_NTOA()`, `INET_ATON()`, `INET6_NTOA()`, `INET6_ATON()` | diff --git a/vector-search-data-types.md b/vector-search/vector-search-data-types.md similarity index 92% rename from vector-search-data-types.md rename to vector-search/vector-search-data-types.md index d5fe04584d9b..7d847d25224c 100644 --- a/vector-search-data-types.md +++ b/vector-search/vector-search-data-types.md @@ -18,7 +18,7 @@ summary: 本文介绍 TiDB 的向量数据类型。 与使用 [`JSON`](/data-type-json.md) 类型相比,使用向量类型具有以下优势: -- 支持向量索引。可以通过构建[向量搜索索引](/vector-search-index.md)加速查询。 +- 支持向量索引。可以通过构建[向量搜索索引](/vector-search/vector-search-index.md)加速查询。 - 可指定维度。指定一个固定维度后,不符合维度的数据将被阻止写入到表中。 - 存储格式更优。向量数据类型针对向量数据进行了特别优化,在空间利用和性能效率上都优于 `JSON` 类型。 @@ -57,9 +57,9 @@ ERROR 1105 (HY000): Invalid vector text: [5, ] ERROR 1105 (HY000): vector has 2 dimensions, does not fit VECTOR(3) ``` -关于向量数据类型支持的所有函数和操作符,可参阅[向量函数与操作符](/vector-search-functions-and-operators.md)。 +关于向量数据类型支持的所有函数和操作符,可参阅[向量函数与操作符](/vector-search/vector-search-functions-and-operators.md)。 -关于向量搜索索引的更多信息,可参阅[向量搜索索引](/vector-search-index.md)。 +关于向量搜索索引的更多信息,可参阅[向量搜索索引](/vector-search/vector-search-index.md)。 ## 混合存储不同维度的向量 @@ -75,11 +75,11 @@ INSERT INTO vector_table VALUES (1, '[0.3, 0.5, -0.1]'); -- 插入一个 3 维 INSERT INTO vector_table VALUES (2, '[0.3, 0.5]'); -- 插入一个 2 维向量 ``` -需要注意的是,存储了不同维度向量的列不支持构建[向量搜索索引](/vector-search-index.md),因为只有维度相同的向量之间才能计算向量距离。 +需要注意的是,存储了不同维度向量的列不支持构建[向量搜索索引](/vector-search/vector-search-index.md),因为只有维度相同的向量之间才能计算向量距离。 ## 比较 -向量数据支持[比较运算符](/vector-search-functions-and-operators.md#扩展的内置函数和运算符),例如 `=`、`!=`、`<`、`>`、`<=` 和 `>=` 等。关于向量数据类型支持的所有函数和操作符,可参阅[向量函数与操作符](/vector-search-functions-and-operators.md)。 +向量数据支持[比较运算符](/vector-search-functions-and-operators.md#扩展的内置函数和运算符),例如 `=`、`!=`、`<`、`>`、`<=` 和 `>=` 等。关于向量数据类型支持的所有函数和操作符,可参阅[向量函数与操作符](/vector-search/vector-search-functions-and-operators.md)。 比较向量数据类型时,TiDB 会以向量中的各个元素为单位进行依次比较,如: @@ -223,7 +223,7 @@ ERROR 1105 (HY000): vectors have different dimensions: 1 and 3 1 row in set (0.01 sec) ``` -如需了解其他转换函数,请参阅[向量函数和操作符](/vector-search-functions-and-operators.md)。 +如需了解其他转换函数,请参阅[向量函数和操作符](/vector-search/vector-search-functions-and-operators.md)。 ### 向量与其他数据类型之间的转换 @@ -233,7 +233,7 @@ ERROR 1105 (HY000): vectors have different dimensions: 1 and 3 ## 使用限制 -有关向量类型的限制,请参阅[向量搜索限制](/vector-search-limitations.md)以及[向量搜索索引的使用限制](/vector-search-index.md#使用限制)。 +有关向量类型的限制,请参阅[向量搜索限制](/vector-search/vector-search-limitations.md)以及[向量搜索索引的使用限制](/vector-search-index.md#使用限制)。 ## MySQL 兼容性 @@ -241,5 +241,5 @@ ERROR 1105 (HY000): vectors have different dimensions: 1 and 3 ## 另请参阅 -- [向量函数和操作符](/vector-search-functions-and-operators.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量函数和操作符](/vector-search/vector-search-functions-and-operators.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-functions-and-operators.md b/vector-search/vector-search-functions-and-operators.md similarity index 97% rename from vector-search-functions-and-operators.md rename to vector-search/vector-search-functions-and-operators.md index 9b5995f63338..c194ba9baf2b 100644 --- a/vector-search-functions-and-operators.md +++ b/vector-search/vector-search-functions-and-operators.md @@ -13,7 +13,7 @@ summary: 本文介绍 TiDB 的向量相关函数和操作。 ## 向量函数 -TiDB 为[向量数据类型](/vector-search-data-types.md)引入了以下向量函数: +TiDB 为[向量数据类型](/vector-search/vector-search-data-types.md)引入了以下向量函数: **向量距离函数:** @@ -35,7 +35,7 @@ TiDB 为[向量数据类型](/vector-search-data-types.md)引入了以下向量 ## 扩展的内置函数和运算符 -TiDB 扩展了以下内置函数和运算符的功能,使其额外支持了[向量数据类型](/vector-search-data-types.md)。 +TiDB 扩展了以下内置函数和运算符的功能,使其额外支持了[向量数据类型](/vector-search/vector-search-data-types.md)。 **算术运算符:** @@ -281,4 +281,4 @@ VEC_AS_TEXT(vector) ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) \ No newline at end of file diff --git a/vector-search-get-started-using-python.md b/vector-search/vector-search-get-started-using-python.md similarity index 96% rename from vector-search-get-started-using-python.md rename to vector-search/vector-search-get-started-using-python.md index a29a0f2c8c02..b8f8427c225f 100644 --- a/vector-search-get-started-using-python.md +++ b/vector-search/vector-search-get-started-using-python.md @@ -7,7 +7,7 @@ summary: 了解如何使用 Python 和 TiDB 向量搜索快速开发可执行语 本文将展示如何开发一个简单的 AI 应用,这个 AI 应用实现了简单的**语义搜索**功能。不同于传统的关键字搜索,语义搜索可以智能地理解你的输入,返回更相关的结果。例如,在“狗”、“鱼”和“树”这三条内容中搜索“一种会游泳的动物”时,语义搜索会将“鱼”作为最相关的结果返回。 -在本文中,你将使用 [TiDB 向量搜索](/vector-search-overview.md)、Python、[TiDB Vector Python SDK](https://github.com/pingcap/tidb-vector-python) 和 AI 大模型完成这个 AI 应用的开发。 +在本文中,你将使用 [TiDB 向量搜索](/vector-search/vector-search-overview.md)、Python、[TiDB Vector Python SDK](https://github.com/pingcap/tidb-vector-python) 和 AI 大模型完成这个 AI 应用的开发。 > **警告:** > @@ -229,5 +229,5 @@ Search result ("a swimming animal"): ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-get-started-using-sql.md b/vector-search/vector-search-get-started-using-sql.md similarity index 94% rename from vector-search-get-started-using-sql.md rename to vector-search/vector-search-get-started-using-sql.md index d79a5d7e32ad..0ddea0515e50 100644 --- a/vector-search-get-started-using-sql.md +++ b/vector-search/vector-search-get-started-using-sql.md @@ -5,7 +5,7 @@ summary: 了解如何在 TiDB 中使用 SQL 语句快速开始向量搜索,从 # 使用 SQL 开始向量搜索 -TiDB 扩展了 MySQL 语法以支持[向量搜索](/vector-search-overview.md),并引入了[向量数据类型](/vector-search-data-types.md)和多个[向量函数](/vector-search-functions-and-operators.md)。 +TiDB 扩展了 MySQL 语法以支持[向量搜索](/vector-search/vector-search-overview.md),并引入了[向量数据类型](/vector-search/vector-search-data-types.md)和多个[向量函数](/vector-search/vector-search-functions-and-operators.md)。 本文将展示如何使用 SQL 语句在 TiDB 中进行向量搜索。在本文中,你将使用 [MySQL 命令行客户端](https://dev.mysql.com/doc/refman/8.4/en/mysql.html)完成以下任务: @@ -175,5 +175,5 @@ LIMIT 3; ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-improve-performance.md b/vector-search/vector-search-improve-performance.md similarity index 94% rename from vector-search-improve-performance.md rename to vector-search/vector-search-improve-performance.md index 5ff595f561ce..1c5f4c5fe0df 100644 --- a/vector-search-improve-performance.md +++ b/vector-search/vector-search-improve-performance.md @@ -13,7 +13,7 @@ summary: 了解优化 TiDB 向量搜索性能的最佳实践。 ## 为向量列添加向量搜索索引 -[向量搜索索引](/vector-search-index.md)可显著提高向量搜索查询的性能,通常能提高 10 倍或更多,而召回率仅略有下降。 +[向量搜索索引](/vector-search/vector-search-index.md)可显著提高向量搜索查询的性能,通常能提高 10 倍或更多,而召回率仅略有下降。 ## 确保向量索引已完全构建 diff --git a/vector-search-index.md b/vector-search/vector-search-index.md similarity index 97% rename from vector-search-index.md rename to vector-search/vector-search-index.md index b1fc54e48a6b..7ed8953b8b66 100644 --- a/vector-search-index.md +++ b/vector-search/vector-search-index.md @@ -7,7 +7,7 @@ summary: 了解如何在 TiDB 中构建并使用向量搜索索引加速 K 近 K 近邻(K-Nearest Neighbors,简称 KNN)搜索是一种在向量空间中找到距离给定向量最近的 K 个向量的查询。实现 K 近邻搜索最直接的方法是暴力搜索(即计算向量空间中所有点与给定向量之间的距离),这种方法可以达到最高的精确度,但在实际应用中其搜索速度往往过于缓慢。因此,K 近邻搜索通常会采用近似算法来提高搜索效率。 -在 TiDB 中,你可以创建并利用向量搜索索引来对[向量数据类型](/vector-search-data-types.md)的列进行近似近邻(Approximate Nearest Neighbor,简称 ANN)搜索。通过使用向量搜索索引,整个查询可在几毫秒内完成。 +在 TiDB 中,你可以创建并利用向量搜索索引来对[向量数据类型](/vector-search/vector-search-data-types.md)的列进行近似近邻(Approximate Nearest Neighbor,简称 ANN)搜索。通过使用向量搜索索引,整个查询可在几毫秒内完成。 > **警告:** > @@ -31,7 +31,7 @@ TiDB 目前支持 [HNSW (Hierarchical Navigable Small World)](https://en.wikiped [HNSW](https://en.wikipedia.org/wiki/Hierarchical_navigable_small_world) 是当前最流行的向量搜索索引算法之一。它性能良好,而且准确率相对较高,特定情况下可达 98%。 -在 TiDB 中,你可以通过以下任一种方式为[向量数据类型](/vector-search-data-types.md)的列创建 HNSW 索引。 +在 TiDB 中,你可以通过以下任一种方式为[向量数据类型](/vector-search/vector-search-data-types.md)的列创建 HNSW 索引。 - 在建表时,使用以下语法来指定为哪一个向量列创建 HNSW 索引: @@ -251,5 +251,5 @@ LIMIT 10; ## 另请参阅 -- [优化向量搜索性能](/vector-search-improve-performance.md) -- [向量数据类型](/vector-search-data-types.md) \ No newline at end of file +- [优化向量搜索性能](/vector-search/vector-search-improve-performance.md) +- [向量数据类型](/vector-search/vector-search-data-types.md) \ No newline at end of file diff --git a/vector-search-integrate-with-django-orm.md b/vector-search/vector-search-integrate-with-django-orm.md similarity index 96% rename from vector-search-integrate-with-django-orm.md rename to vector-search/vector-search-integrate-with-django-orm.md index 6f6d262a43f9..622e886eb822 100644 --- a/vector-search-integrate-with-django-orm.md +++ b/vector-search/vector-search-integrate-with-django-orm.md @@ -5,7 +5,7 @@ summary: 了解如何在 Django ORM 中通过 TiDB 向量搜索功能存储向 # 在 Django ORM 中使用 TiDB 向量搜索 -本文档将展示如何使用 [Django](https://www.djangoproject.com/) ORM 与 [TiDB 向量搜索](/vector-search-overview.md)进行交互,以及如何存储向量和执行向量搜索查询。 +本文档将展示如何使用 [Django](https://www.djangoproject.com/) ORM 与 [TiDB 向量搜索](/vector-search/vector-search-overview.md)进行交互,以及如何存储向量和执行向量搜索查询。 > **警告:** > @@ -258,5 +258,5 @@ results = Document.objects.annotate( ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-integrate-with-jinaai-embedding.md b/vector-search/vector-search-integrate-with-jinaai-embedding.md similarity index 98% rename from vector-search-integrate-with-jinaai-embedding.md rename to vector-search/vector-search-integrate-with-jinaai-embedding.md index ddc26e79bcf7..f817863cd3ed 100644 --- a/vector-search-integrate-with-jinaai-embedding.md +++ b/vector-search/vector-search-integrate-with-jinaai-embedding.md @@ -272,5 +272,5 @@ with Session(engine) as session: ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-integrate-with-langchain.md b/vector-search/vector-search-integrate-with-langchain.md similarity index 99% rename from vector-search-integrate-with-langchain.md rename to vector-search/vector-search-integrate-with-langchain.md index b91a7591935d..a7891ce87b2e 100644 --- a/vector-search-integrate-with-langchain.md +++ b/vector-search/vector-search-integrate-with-langchain.md @@ -5,7 +5,7 @@ summary: 展示如何在 LangChain 中使用 TiDB 向量搜索 # 在 LangChain 中使用 TiDB 向量搜索 -本文档将展示如何在 [LangChain](https://python.langchain.com/) 中使用 [TiDB 向量搜索](/vector-search-overview.md)。 +本文档将展示如何在 [LangChain](https://python.langchain.com/) 中使用 [TiDB 向量搜索](/vector-search/vector-search-overview.md)。 > **警告:** > @@ -632,5 +632,5 @@ vector_store.tidb_vector_client.execute("DROP TABLE airplan_routes") ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-integrate-with-llamaindex.md b/vector-search/vector-search-integrate-with-llamaindex.md similarity index 98% rename from vector-search-integrate-with-llamaindex.md rename to vector-search/vector-search-integrate-with-llamaindex.md index d3408d396d4e..23271e3fb55b 100644 --- a/vector-search-integrate-with-llamaindex.md +++ b/vector-search/vector-search-integrate-with-llamaindex.md @@ -5,7 +5,7 @@ summary: 了解如何在 LlamaIndex 中使用 TiDB 向量搜索。 # 在 LlamaIndex 中使用 TiDB 向量搜索 -本文档将展示如何在 [LlamaIndex](https://www.llamaindex.ai) 中使用 [TiDB 向量搜索](/vector-search-overview.md)。 +本文档将展示如何在 [LlamaIndex](https://www.llamaindex.ai) 中使用 [TiDB 向量搜索](/vector-search/vector-search-overview.md)。 > **警告:** > @@ -312,5 +312,5 @@ Empty Response ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-integrate-with-peewee.md b/vector-search/vector-search-integrate-with-peewee.md similarity index 96% rename from vector-search-integrate-with-peewee.md rename to vector-search/vector-search-integrate-with-peewee.md index 064d951dd222..18609efe77b9 100644 --- a/vector-search-integrate-with-peewee.md +++ b/vector-search/vector-search-integrate-with-peewee.md @@ -5,7 +5,7 @@ summary: 了解如何在 peewee 中通过 TiDB 向量搜索功能存储向量并 # 在 peewee 中使用 TiDB 向量搜索 -本文档将展示如何使用 [peewee](https://docs.peewee-orm.com/) 与 [TiDB 向量搜索](/vector-search-overview.md)进行交互,以及如何存储向量和执行向量搜索查询。 +本文档将展示如何使用 [peewee](https://docs.peewee-orm.com/) 与 [TiDB 向量搜索](/vector-search/vector-search-overview.md)进行交互,以及如何存储向量和执行向量搜索查询。 > **警告:** > @@ -250,5 +250,5 @@ results = Document.select(Document, distance).where(distance_expression < 0.2).o ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-integrate-with-sqlalchemy.md b/vector-search/vector-search-integrate-with-sqlalchemy.md similarity index 96% rename from vector-search-integrate-with-sqlalchemy.md rename to vector-search/vector-search-integrate-with-sqlalchemy.md index 6f25678c9c98..4a8572e92250 100644 --- a/vector-search-integrate-with-sqlalchemy.md +++ b/vector-search/vector-search-integrate-with-sqlalchemy.md @@ -5,7 +5,7 @@ summary: 了解如何在 SQLAlchemy 中通过 TiDB 向量搜索功能存储向 # 在 SQLAlchemy 中使用 TiDB 向量搜索 -本文档将展示如何使用 [SQLAlchemy](https://www.sqlalchemy.org/) 与 [TiDB 向量搜索](/vector-search-overview.md)进行交互,以及如何存储向量和执行向量搜索查询。 +本文档将展示如何使用 [SQLAlchemy](https://www.sqlalchemy.org/) 与 [TiDB 向量搜索](/vector-search/vector-search-overview.md)进行交互,以及如何存储向量和执行向量搜索查询。 > **警告:** > @@ -218,5 +218,5 @@ with Session(engine) as session: ## 另请参阅 -- [向量数据类型](/vector-search-data-types.md) -- [向量搜索索引](/vector-search-index.md) \ No newline at end of file +- [向量数据类型](/vector-search/vector-search-data-types.md) +- [向量搜索索引](/vector-search/vector-search-index.md) \ No newline at end of file diff --git a/vector-search-integration-overview.md b/vector-search/vector-search-integration-overview.md similarity index 93% rename from vector-search-integration-overview.md rename to vector-search/vector-search-integration-overview.md index 08145f67568c..b7d15a018486 100644 --- a/vector-search-integration-overview.md +++ b/vector-search/vector-search-integration-overview.md @@ -17,8 +17,8 @@ TiDB 目前支持以下 AI 框架。基于这些 AI 框架,你可以使用 TiD | AI 框架 | 教程 | |---------------|---------------------------------------------------------------------------------------------------| -| Langchain | [在 LangChain 中使用 TiDB 向量搜索](/vector-search-integrate-with-langchain.md) | -| LlamaIndex | [在 LlamaIndex 中使用 TiDB 向量搜索](/vector-search-integrate-with-llamaindex.md) | +| Langchain | [在 LangChain 中使用 TiDB 向量搜索](/vector-search/vector-search-integrate-with-langchain.md) | +| LlamaIndex | [在 LlamaIndex 中使用 TiDB 向量搜索](/vector-search/vector-search-integrate-with-llamaindex.md) | 此外,你还可以使用 TiDB 完成多种其它需求,例如将 TiDB 用于 AI 应用程序的文档存储和知识图谱存储等。 @@ -32,7 +32,7 @@ TiDB 向量搜索支持存储高达 16383 维的向量,可适应大多数嵌 | 嵌入模型服务提供商 | 教程 | |-----------------------------|---------------------------------------------------------------------------------------------------------------------| -| Jina AI | [结合 Jina AI 嵌入模型 API 使用 TiDB 向量搜索](/vector-search-integrate-with-jinaai-embedding.md) | +| Jina AI | [结合 Jina AI 嵌入模型 API 使用 TiDB 向量搜索](/vector-search/vector-search-integrate-with-jinaai-embedding.md) | ## 对象关系映射 (ORM) 库 diff --git a/vector-search-limitations.md b/vector-search/vector-search-limitations.md similarity index 100% rename from vector-search-limitations.md rename to vector-search/vector-search-limitations.md diff --git a/vector-search-overview.md b/vector-search/vector-search-overview.md similarity index 84% rename from vector-search-overview.md rename to vector-search/vector-search-overview.md index 8755010f6a2f..3c26cac93c25 100644 --- a/vector-search-overview.md +++ b/vector-search/vector-search-overview.md @@ -27,7 +27,7 @@ TiDB 向量搜索提供了一种高级的语义搜索功能,可以在文档、 向量嵌入在机器学习中至关重要,是语义相似性搜索的基础。 -TiDB 专门引入了[向量数据类型](/vector-search-data-types.md)以及[向量搜索索引](/vector-search-index.md),用于优化向量嵌入的存储和检索,增强其在人工智能领域的应用。你可以使用向量类型在 TiDB 中存储向量嵌入,并执行向量搜索查询,找到语义上最相关的数据。 +TiDB 专门引入了[向量数据类型](/vector-search/vector-search-data-types.md)以及[向量搜索索引](/vector-search/vector-search-index.md),用于优化向量嵌入的存储和检索,增强其在人工智能领域的应用。你可以使用向量类型在 TiDB 中存储向量嵌入,并执行向量搜索查询,找到语义上最相关的数据。 ### 嵌入模型 @@ -41,7 +41,7 @@ TiDB 专门引入了[向量数据类型](/vector-search-data-types.md)以及[向 在你将原始数据转换为向量并存储在 TiDB 中后,你的应用程序就可以开始利用这些向量来执行向量搜索查询,找到与用户查询语义或上下文最相关的数据。 -TiDB 向量搜索 (Vector Search) 通过使用[距离函数](/vector-search-functions-and-operators.md)来计算给定向量与数据库中存储的向量之间的距离,从而识别前 k 个近邻(KNN)向量。其中,与给定向量距离最小的向量即代表最相似的数据。 +TiDB 向量搜索 (Vector Search) 通过使用[距离函数](/vector-search/vector-search-functions-and-operators.md)来计算给定向量与数据库中存储的向量之间的距离,从而识别前 k 个近邻(KNN)向量。其中,与给定向量距离最小的向量即代表最相似的数据。 ![The Schematic TiDB Vector Search](/media/vector-search/embedding-search.png) @@ -68,5 +68,5 @@ TiDB 作为一款关系型数据库,在引入了向量搜索功能后,支持 要开始使用 TiDB 向量搜索,请参阅以下文档: -- [使用 Python 开始向量搜索](/vector-search-get-started-using-python.md) -- [使用 SQL 开始向量搜索](/vector-search-get-started-using-sql.md) \ No newline at end of file +- [使用 Python 开始向量搜索](/vector-search/vector-search-get-started-using-python.md) +- [使用 SQL 开始向量搜索](/vector-search/vector-search-get-started-using-sql.md) \ No newline at end of file From fb8e04fd04536288dfb289b59a999bb2a0d3cf0d Mon Sep 17 00:00:00 2001 From: lilin90 Date: Fri, 3 Jan 2025 19:48:52 +0800 Subject: [PATCH 4/4] Update more links --- releases/release-8.4.0.md | 2 +- vector-search/vector-search-data-types.md | 4 ++-- vector-search/vector-search-functions-and-operators.md | 6 +++--- vector-search/vector-search-get-started-using-python.md | 4 ++-- vector-search/vector-search-get-started-using-sql.md | 8 ++++---- vector-search/vector-search-improve-performance.md | 2 +- vector-search/vector-search-limitations.md | 2 +- 7 files changed, 14 insertions(+), 14 deletions(-) diff --git a/releases/release-8.4.0.md b/releases/release-8.4.0.md index b1585e20b2ec..076380ada067 100644 --- a/releases/release-8.4.0.md +++ b/releases/release-8.4.0.md @@ -200,7 +200,7 @@ TiDB 版本:8.4.0 向量搜索是一种基于数据语义的搜索方法,可以提供更相关的搜索结果。作为 AI 和大语言模型 (LLM) 的核心功能之一,向量搜索可用于检索增强生成 (Retrieval-Augmented Generation, RAG)、语义搜索、推荐系统等多种场景。 - 从 v8.4.0 开始,TiDB 支持[向量数据类型](/vector-search/vector-search-data-types.md)和[向量搜索索引](/vector-search/vector-search-index.md),具备强大的向量搜索能力。TiDB 的向量数据类型最多可支持 16383 维度,并支持多种[距离函数](/vector-search-functions-and-operators.md#向量函数),包括 L2 距离(欧式距离)、余弦距离、负内积和 L1 距离(曼哈顿距离)。 + 从 v8.4.0 开始,TiDB 支持[向量数据类型](/vector-search/vector-search-data-types.md)和[向量搜索索引](/vector-search/vector-search-index.md),具备强大的向量搜索能力。TiDB 的向量数据类型最多可支持 16383 维度,并支持多种[距离函数](/vector-search/vector-search-functions-and-operators.md#向量函数),包括 L2 距离(欧式距离)、余弦距离、负内积和 L1 距离(曼哈顿距离)。 在使用时,你只需要创建包含向量数据类型的表,并插入向量数据,即可执行向量搜索查询,也可进行向量数据与传统关系数据的混合查询。 diff --git a/vector-search/vector-search-data-types.md b/vector-search/vector-search-data-types.md index 7d847d25224c..bc7c144d7395 100644 --- a/vector-search/vector-search-data-types.md +++ b/vector-search/vector-search-data-types.md @@ -79,7 +79,7 @@ INSERT INTO vector_table VALUES (2, '[0.3, 0.5]'); -- 插入一个 2 维 ## 比较 -向量数据支持[比较运算符](/vector-search-functions-and-operators.md#扩展的内置函数和运算符),例如 `=`、`!=`、`<`、`>`、`<=` 和 `>=` 等。关于向量数据类型支持的所有函数和操作符,可参阅[向量函数与操作符](/vector-search/vector-search-functions-and-operators.md)。 +向量数据支持[比较运算符](/vector-search/vector-search-functions-and-operators.md#扩展的内置函数和运算符),例如 `=`、`!=`、`<`、`>`、`<=` 和 `>=` 等。关于向量数据类型支持的所有函数和操作符,可参阅[向量函数与操作符](/vector-search/vector-search-functions-and-operators.md)。 比较向量数据类型时,TiDB 会以向量中的各个元素为单位进行依次比较,如: @@ -233,7 +233,7 @@ ERROR 1105 (HY000): vectors have different dimensions: 1 and 3 ## 使用限制 -有关向量类型的限制,请参阅[向量搜索限制](/vector-search/vector-search-limitations.md)以及[向量搜索索引的使用限制](/vector-search-index.md#使用限制)。 +有关向量类型的限制,请参阅[向量搜索限制](/vector-search/vector-search-limitations.md)以及[向量搜索索引的使用限制](/vector-search/vector-search-index.md#使用限制)。 ## MySQL 兼容性 diff --git a/vector-search/vector-search-functions-and-operators.md b/vector-search/vector-search-functions-and-operators.md index c194ba9baf2b..2641f9477d6a 100644 --- a/vector-search/vector-search-functions-and-operators.md +++ b/vector-search/vector-search-functions-and-operators.md @@ -44,7 +44,7 @@ TiDB 扩展了以下内置函数和运算符的功能,使其额外支持了[ | [`+`](https://dev.mysql.com/doc/refman/8.0/en/arithmetic-functions.html#operator_plus) | 向量以元素为单位进行加法运算符 | | [`-`](https://dev.mysql.com/doc/refman/8.0/en/arithmetic-functions.html#operator_minus) | 向量以元素为单位进行减法运算符 | -关于向量运算工作原理的更多信息,请参阅[向量数据类型的运算](/vector-search-data-types.md#运算)。 +关于向量运算工作原理的更多信息,请参阅[向量数据类型的运算](/vector-search/vector-search-data-types.md#运算)。 **聚合函数 (GROUP BY):** @@ -76,7 +76,7 @@ TiDB 扩展了以下内置函数和运算符的功能,使其额外支持了[ | [`!=`, `<>`](https://dev.mysql.com/doc/refman/8.0/en/comparison-operators.html#operator_not-equal) | 不等运算符 | | [`NOT IN()`](https://dev.mysql.com/doc/refman/8.0/en/comparison-operators.html#operator_not-in) | 检查值是否不在一组数值之内 | -关于如何比较向量的更多信息,请参阅[向量数据类型的比较](/vector-search-data-types.md#比较)。 +关于如何比较向量的更多信息,请参阅[向量数据类型的比较](/vector-search/vector-search-data-types.md#比较)。 **控制流程函数:** @@ -94,7 +94,7 @@ TiDB 扩展了以下内置函数和运算符的功能,使其额外支持了[ | [`CAST()`](https://dev.mysql.com/doc/refman/8.0/en/cast-functions.html#function_cast) | 将值转换为字符串或向量类型 | | [`CONVERT()`](https://dev.mysql.com/doc/refman/8.0/en/cast-functions.html#function_convert) | 将值转换为字符串类型 | -关于如何使用 `CAST()` 的更多信息,请参阅[向量数据类型的转换](/vector-search-data-types.md#类型转换-cast)。 +关于如何使用 `CAST()` 的更多信息,请参阅[向量数据类型的转换](/vector-search/vector-search-data-types.md#类型转换-cast)。 ## 使用示例 diff --git a/vector-search/vector-search-get-started-using-python.md b/vector-search/vector-search-get-started-using-python.md index b8f8427c225f..5abd78c62f2a 100644 --- a/vector-search/vector-search-get-started-using-python.md +++ b/vector-search/vector-search-get-started-using-python.md @@ -49,7 +49,7 @@ pip install sqlalchemy pymysql sentence-transformers tidb-vector python-dotenv ``` - `tidb-vector`:用于与 TiDB 向量搜索交互的 Python 客户端。 -- [`sentence-transformers`](https://sbert.net):提供预训练模型的 Python 库,用于从文本生成[向量嵌入](/vector-search-overview.md#向量嵌入)。 +- [`sentence-transformers`](https://sbert.net):提供预训练模型的 Python 库,用于从文本生成[向量嵌入](/vector-search/vector-search-overview.md#向量嵌入)。 ### 第 3 步:配置 TiDB 集群的连接字符串 @@ -117,7 +117,7 @@ TIDB_DATABASE_URL="mysql+pymysql://:@:/" ### 第 4 步:初始化嵌入模型 -[嵌入模型](/vector-search-overview.md#嵌入模型)用于将数据转换为[向量嵌入](/vector-search-overview.md#向量嵌入)。本示例将使用预训练模型 [**msmarco-MiniLM-L12-cos-v5**](https://huggingface.co/sentence-transformers/msmarco-MiniLM-L12-cos-v5) 将文本数据转换为向量嵌入。该模型为一个轻量级模型,由 `sentence-transformers` 库提供,可将文本数据转换为 384 维的向量嵌入。 +[嵌入模型](/vector-search/vector-search-overview.md#嵌入模型)用于将数据转换为[向量嵌入](/vector-search/vector-search-overview.md#向量嵌入)。本示例将使用预训练模型 [**msmarco-MiniLM-L12-cos-v5**](https://huggingface.co/sentence-transformers/msmarco-MiniLM-L12-cos-v5) 将文本数据转换为向量嵌入。该模型为一个轻量级模型,由 `sentence-transformers` 库提供,可将文本数据转换为 384 维的向量嵌入。 将以下代码复制到 `example.py` 文件中,完成模型的设置。这段代码初始化了一个 `SentenceTransformer` 实例,并定义了一个 `text_too_embedding()` 函数用于将文本数据转换为向量数据。 diff --git a/vector-search/vector-search-get-started-using-sql.md b/vector-search/vector-search-get-started-using-sql.md index 0ddea0515e50..7c1feb7a0c8b 100644 --- a/vector-search/vector-search-get-started-using-sql.md +++ b/vector-search/vector-search-get-started-using-sql.md @@ -74,7 +74,7 @@ mysql --comments --host 127.0.0.1 --port 4000 -u root ### 第 2 步:创建向量表 -创建表时,你可以使用 `VECTOR` 数据类型声明指定列为[向量](/vector-search-overview.md#向量嵌入)列。 +创建表时,你可以使用 `VECTOR` 数据类型声明指定列为[向量](/vector-search/vector-search-overview.md#向量嵌入)列。 例如,要创建一个带有三维 `VECTOR` 列的 `embedded_documents` 表,可以使用 MySQL CLI 执行以下 SQL 语句: @@ -97,7 +97,7 @@ Query OK, 0 rows affected (0.27 sec) ### 第 3 步:向表中插入向量 -向 `embedded_documents` 表中插入三行,每一行包含数据和数据的[向量嵌入](/vector-search-overview.md#向量嵌入): +向 `embedded_documents` 表中插入三行,每一行包含数据和数据的[向量嵌入](/vector-search/vector-search-overview.md#向量嵌入): ```sql INSERT INTO embedded_documents @@ -118,7 +118,7 @@ Records: 3 Duplicates: 0 Warnings: 0 > > 为了方便展示,本示例简化了向量的维数,仅使用三维向量。 > -> 在实际应用中,[嵌入模型](/vector-search-overview.md#嵌入模型)通常会生成数百或数千维的向量。 +> 在实际应用中,[嵌入模型](/vector-search/vector-search-overview.md#嵌入模型)通常会生成数百或数千维的向量。 ### 第 4 步:查询向量表 @@ -145,7 +145,7 @@ SELECT * FROM embedded_documents; 与全文搜索类似,在使用向量搜索时,你需要提供搜索词。 -在本例中,搜索词是“一种会游泳的动物”,假设其对应的向量是 `[1,2,3]`。在实际应用中,你需要使用[嵌入模型](/vector-search-overview.md#嵌入模型)将用户的搜索词转换为向量。 +在本例中,搜索词是“一种会游泳的动物”,假设其对应的向量是 `[1,2,3]`。在实际应用中,你需要使用[嵌入模型](/vector-search/vector-search-overview.md#嵌入模型)将用户的搜索词转换为向量。 执行以下 SQL 语句后,TiDB 会计算 `[1,2,3]` 与表中各向量之间的余弦距离 (`vec_cosine_distance`),然后对这些距离进行排序并输出表中最接近搜索向量(余弦距离最小)的前三个文档。 diff --git a/vector-search/vector-search-improve-performance.md b/vector-search/vector-search-improve-performance.md index 1c5f4c5fe0df..58921085d24c 100644 --- a/vector-search/vector-search-improve-performance.md +++ b/vector-search/vector-search-improve-performance.md @@ -17,7 +17,7 @@ summary: 了解优化 TiDB 向量搜索性能的最佳实践。 ## 确保向量索引已完全构建 -当插入大批量向量数据时,可能会有部分数据处于 Delta 层等待后续的持久化,这一部分的数据会在持久化后才会开始构建向量索引。在向量搜索索引完全构建好后,向量搜索性能才能达到最佳水平。要查看索引构建进度,可参阅[查看索引构建进度](/vector-search-index.md#查看索引构建进度)。 +当插入大批量向量数据时,可能会有部分数据处于 Delta 层等待后续的持久化,这一部分的数据会在持久化后才会开始构建向量索引。在向量搜索索引完全构建好后,向量搜索性能才能达到最佳水平。要查看索引构建进度,可参阅[查看索引构建进度](/vector-search/vector-search-index.md#查看索引构建进度)。 ## 减少向量维数或缩短嵌入时间 diff --git a/vector-search/vector-search-limitations.md b/vector-search/vector-search-limitations.md index d081c0069be5..400f1b62ed7e 100644 --- a/vector-search/vector-search-limitations.md +++ b/vector-search/vector-search-limitations.md @@ -23,7 +23,7 @@ summary: 了解 TiDB 向量搜索功能的限制。 ## 向量搜索索引限制 -参考[向量搜索索引 - 使用限制](/vector-search-index.md#使用限制)。 +参考[向量搜索索引 - 使用限制](/vector-search/vector-search-index.md#使用限制)。 ## 工具兼容性