向量数据库知识体系概览

问题

什么是向量数据库？为什么需要专门的向量数据库？

向量数据库是专门用于存储、索引和检索高维向量的数据库。向量（Embedding）是用一组浮点数组成的数组来表示非结构化数据（文本、图片、音频等）的语义信息。

"人工智能改变世界" → [0.23, -0.15, 0.87, ..., 0.42]  // 768维或1536维

传统数据库擅长精确匹配（WHERE id = 1），但无法进行语义相似度搜索：

搜索类型	传统数据库	向量数据库
`SELECT * WHERE name = '苹果'`	✅ 精确匹配	不擅长
"找和苹果语义相似的词"	❌ 无法完成	✅ 返回"水果"、"梨"