AI 學習區

Debug 一個行為怪怪的多步驟 agent

第 4 步歪掉但你不知道為什麼。這是系統化 playbook。

RAG 系統用 hybrid search(BM25 + 向量)

純向量搜尋抓不到關鍵字,純關鍵字搜尋抓不到語意。結合起來,這是食譜。

進階★★★★★9 分鐘

從 LLM 拿結構化輸出:tool use、JSON mode、schema

讓模型吐有效 JSON 的三條路、各自什麼時候贏,以及 production 上會嚇到你的失敗模式。

Speculative decoding:讓推論快 2-3 倍

小模型提議 token,大模型平行驗證。輸出一樣,延遲大幅降低。

進階★★★★★9 分鐘

LLM routing:把簡單 query 送到便宜模型

大部分 query 用不到 Opus。簡單 router 把成本砍 60-80%,品質損失極小 —— 前提是你蓋對。

怎麼大規模評測 LLM 輸出品質

三種真的能規模化的 eval —— golden dataset、LLM-as-judge、線上指標,以及什麼時候該用哪個。

Agent 記憶策略:從 session 到長期

四層記憶、各自什麼時候重要,以及花俏框架跟 50 行自己寫的取捨。

進階★★★★★9 分鐘

什麼時候微調贏 prompt 工程,什麼時候不贏

大部分團隊太早跳到微調。決策樹、實際數字,以及該按什麼順序試。

什麼是 RAG？檢索增強生成的實用指南

RAG 讓 LLM 用你的私有文件回答問題,而不是憑空亂猜。本文解釋它的運作原理、何時值得導入,以及什麼時候 fine-tuning 或長 context 更划算。

2026 年的 AI 到底是什麼?5 分鐘看懂現況

2026 年的 AI 不是一個東西,而是一整個生態系。本文用 5 分鐘幫你把名詞、產品、和真正能用的場景理清楚。

什麼是大型語言模型(LLM)?用人話解釋

LLM 不會「思考」,它在預測下一個字。理解這一點,你就同時懂了它為何驚艷、又為何會一本正經胡說八道。

什麼是 prompt?為什麼 prompt 品質決定一切

Prompt 就是你丟給 LLM 的那段文字。但模糊跟精確的 prompt,差別就是「答案沒用」跟「答案很神」。

什麼是 context window?每個 LLM 都有的隱形天花板

Context window 是模型一次看得到多少文字。視窗變大開啟了長文件時代,但它沒有解決所有問題 — 而且它真的會花錢。

LLM 講的 token 是什麼?跟你的帳單為什麼有關

Token 是 LLM 真正看到的單位。它不是字、不是字元 — 而是每個 API 計費的依據。

什麼是 AI agent?跟 chatbot 差在哪?

Agent 就是會行動的 LLM:點連結、跑程式、查 API,還會檢查自己有沒有做對、不對就重來。「重來」這件事讓它強大,也讓它脆弱。

什麼是 fine-tuning?什麼時候你才真的需要?

Fine-tuning 是用你的資料再訓練模型。聽起來像所有「客製 AI」需求的萬能解 — 但 2026 年它幾乎不該是你的第一步。

什麼是 vibe coding?怎麼做才不會做出垃圾

Vibe coding 就是讓 AI 寫 code、你掌方向。Cursor、Lovable、v0 把它變成真實工作流 — 但只有把 AI 當 junior 而不是神燈,才做得出能用的東西。

什麼是 MCP(Model Context Protocol)?AI 界的 USB-C

MCP 是一個開放協議,讓任何 AI 助理可以透過同一個介面接到任何工具 — 你的檔案系統、GitHub、Notion、你自家資料庫 — 不必每組配對都自己寫整合。

什麼是 API key?怎麼用才不會外洩

API key 就是你連 OpenAI、Anthropic 這類付費服務的密碼。外洩等於陌生人花你的錢 — 而且幾乎每個人都至少漏過一次。

什麼是 embedding?把語意變成數字

Embedding 是一串代表文字「意思」的數字。意思相近 = 數字相近。它是語意搜尋、RAG、推薦系統背後的數學。

什麼是 vector database?你真的需要嗎?

Vector database 用來存 embedding、快速找相似的。大多數剛起步的 RAG app,既有的 Postgres 裝個 pgvector 就夠了,專門的向量 DB 可能 over-engineer。

什麼是多模態(multimodal)模型?AI 能同時看、聽、讀

多模態的意思是同一個模型能處理文字、圖片、音訊、影片。新版 Claude、GPT-5、Gemini 看你的截圖跟看文字一樣,這改變了能做什麼。

什麼是 reasoning model?o3、DeepSeek R1 跟「先想再答」的轉變

Reasoning model 回答前會「想一下」 — 有時想好幾分鐘。它們在數學跟 code 上更強、閒聊不適合、價格也更貴。重要場合才用。