跳到內容

技術

向量資料庫 (Vector database)

Vector database

專門儲存高維向量(embedding)並能快速找到最相近向量的資料庫。

登入以收藏
向量資料庫專門儲存 embedding 向量,並支援 approximate nearest neighbor(ANN)查詢——「給我跟這個向量最像的前 10 個」。實際的 ANN 引擎(HNSW、IVF、ScaNN)犧牲一點點 recall 換取大幅速度提升,讓你能在毫秒內查上百萬筆向量。 它重要的原因是:傳統關聯式資料庫不是為這個設計的。對 100 萬筆 1536 維向量做暴力 cosine similarity 慢得不像話,向量資料庫讓這件事變便宜。每個 RAG 系統都需要——沒有高效檢索,就沒辦法把 LLM 回答綁在你的資料上。 典型用法:把文件每個段落 embed,存 (段落文字、embedding、metadata) 進向量資料庫;查詢時把使用者問題 embed,查 top-k 最相似向量,把對應段落塞進 prompt 給 LLM 當 context。整條 pipeline 100-300ms 跑完。 常見選擇:Pinecone(managed)、Weaviate、Qdrant、Milvus、Chroma(open-source);pgvector 把 Postgres 變成堪用的向量資料庫,已是 Supabase + Neon 的預設選項。小專案 pgvector 或 Chroma 通常夠用;大規模(>5000 萬筆、跨區域)需要 Pinecone 或 Milvus。延伸閱讀:embedding、RAG、HNSW、hybrid search。

最後更新: 2026-04-29

We use cookies

Anonymous analytics help us improve the site. You can opt out anytime. Learn more