向量資料庫 (Vector database)

專門儲存高維向量（embedding）並能快速找到最相近向量的資料庫。

向量資料庫專門儲存 embedding 向量，並支援 approximate nearest neighbor（ANN）查詢——「給我跟這個向量最像的前 10 個」。實際的 ANN 引擎（HNSW、IVF、ScaNN）犧牲一點點 recall 換取大幅速度提升，讓你能在毫秒內查上百萬筆向量。它重要的原因是：傳統關聯式資料庫不是為這個設計的。對 100 萬筆 1536 維向量做暴力 cosine similarity 慢得不像話，向量資料庫讓這件事變便宜。每個 RAG 系統都需要——沒有高效檢索，就沒辦法把 LLM 回答綁在你的資料上。典型用法：把文件每個段落 embed，存 (段落文字、embedding、metadata) 進向量資料庫；查詢時把使用者問題 embed，查 top-k 最相似向量，把對應段落塞進 prompt 給 LLM 當 context。整條 pipeline 100-300ms 跑完。常見選擇：Pinecone（managed）、Weaviate、Qdrant、Milvus、Chroma（open-source）；pgvector 把 Postgres 變成堪用的向量資料庫，已是 Supabase + Neon 的預設選項。小專案 pgvector 或 Chroma 通常夠用；大規模（>5000 萬筆、跨區域）需要 Pinecone 或 Milvus。延伸閱讀：embedding、RAG、HNSW、hybrid search。