LEARN · 學習區
AI 學習區
從零開始學 AI:什麼是 RAG / agent / prompt / fine-tuning / 對齊 / context window;怎麼選工具;實用情境;進階技術。
Debug 一個行為怪怪的多步驟 agent
第 4 步歪掉但你不知道為什麼。這是系統化 playbook。
RAG 系統用 hybrid search(BM25 + 向量)
純向量搜尋抓不到關鍵字,純關鍵字搜尋抓不到語意。結合起來,這是食譜。
從 LLM 拿結構化輸出:tool use、JSON mode、schema
讓模型吐有效 JSON 的三條路、各自什麼時候贏,以及 production 上會嚇到你的失敗模式。
Speculative decoding:讓推論快 2-3 倍
小模型提議 token,大模型平行驗證。輸出一樣,延遲大幅降低。
LLM routing:把簡單 query 送到便宜模型
大部分 query 用不到 Opus。簡單 router 把成本砍 60-80%,品質損失極小 —— 前提是你蓋對。
怎麼大規模評測 LLM 輸出品質
三種真的能規模化的 eval —— golden dataset、LLM-as-judge、線上指標,以及什麼時候該用哪個。
Agent 記憶策略:從 session 到長期
四層記憶、各自什麼時候重要,以及花俏框架跟 50 行自己寫的取捨。
什麼時候微調贏 prompt 工程,什麼時候不贏
大部分團隊太早跳到微調。決策樹、實際數字,以及該按什麼順序試。
什麼是 RAG?檢索增強生成的實用指南
RAG 讓 LLM 用你的私有文件回答問題,而不是憑空亂猜。本文解釋它的運作原理、何時值得導入,以及什麼時候 fine-tuning 或長 context 更划算。
2026 年的 AI 到底是什麼?5 分鐘看懂現況
2026 年的 AI 不是一個東西,而是一整個生態系。本文用 5 分鐘幫你把名詞、產品、和真正能用的場景理清楚。
什麼是大型語言模型(LLM)?用人話解釋
LLM 不會「思考」,它在預測下一個字。理解這一點,你就同時懂了它為何驚艷、又為何會一本正經胡說八道。
什麼是 prompt?為什麼 prompt 品質決定一切
Prompt 就是你丟給 LLM 的那段文字。但模糊跟精確的 prompt,差別就是「答案沒用」跟「答案很神」。
什麼是 context window?每個 LLM 都有的隱形天花板
Context window 是模型一次看得到多少文字。視窗變大開啟了長文件時代,但它沒有解決所有問題 — 而且它真的會花錢。
LLM 講的 token 是什麼?跟你的帳單為什麼有關
Token 是 LLM 真正看到的單位。它不是字、不是字元 — 而是每個 API 計費的依據。
什麼是 AI agent?跟 chatbot 差在哪?
Agent 就是會行動的 LLM:點連結、跑程式、查 API,還會檢查自己有沒有做對、不對就重來。「重來」這件事讓它強大,也讓它脆弱。
什麼是 fine-tuning?什麼時候你才真的需要?
Fine-tuning 是用你的資料再訓練模型。聽起來像所有「客製 AI」需求的萬能解 — 但 2026 年它幾乎不該是你的第一步。
什麼是 vibe coding?怎麼做才不會做出垃圾
Vibe coding 就是讓 AI 寫 code、你掌方向。Cursor、Lovable、v0 把它變成真實工作流 — 但只有把 AI 當 junior 而不是神燈,才做得出能用的東西。
什麼是 MCP(Model Context Protocol)?AI 界的 USB-C
MCP 是一個開放協議,讓任何 AI 助理可以透過同一個介面接到任何工具 — 你的檔案系統、GitHub、Notion、你自家資料庫 — 不必每組配對都自己寫整合。
什麼是 API key?怎麼用才不會外洩
API key 就是你連 OpenAI、Anthropic 這類付費服務的密碼。外洩等於陌生人花你的錢 — 而且幾乎每個人都至少漏過一次。
什麼是 embedding?把語意變成數字
Embedding 是一串代表文字「意思」的數字。意思相近 = 數字相近。它是語意搜尋、RAG、推薦系統背後的數學。
什麼是 vector database?你真的需要嗎?
Vector database 用來存 embedding、快速找相似的。大多數剛起步的 RAG app,既有的 Postgres 裝個 pgvector 就夠了,專門的向量 DB 可能 over-engineer。
什麼是多模態(multimodal)模型?AI 能同時看、聽、讀
多模態的意思是同一個模型能處理文字、圖片、音訊、影片。新版 Claude、GPT-5、Gemini 看你的截圖跟看文字一樣,這改變了能做什麼。
什麼是 reasoning model?o3、DeepSeek R1 跟「先想再答」的轉變
Reasoning model 回答前會「想一下」 — 有時想好幾分鐘。它們在數學跟 code 上更強、閒聊不適合、價格也更貴。重要場合才用。
什麼是 tool use(function calling)?LLM 怎麼伸出手做事
Tool use 讓 LLM 呼叫你提供的函式 — 搜網、查 DB、寄信。它是從聊天通往行動的橋,也是現代 AI agent 的基礎。