2026 年 AI 入門必懂的 30 個名詞

你只要在 AI 圈待過一段時間,一定聽過一堆縮寫和怪詞。這份就是速查單 — 30 個詞,每個一兩句、不繞學術。書籤起來,下次開會聽到忘記是什麼直接翻。

模型與架構

LLM(Large Language Model) — 用海量文字訓練、預測下一個 token 的統計模型。ChatGPT、Claude、Gemini 都是 LLM。輸出就是一個 token 接一個 token 的高速 autocomplete。
Token — LLM 真正看到的單位。英文約 0.75 字一個 token,中文 1-2 個 token 一個字。計價跟 context 的單位。
Context window — 每次請求模型能處理的最大 token 數。Claude 200K、Gemini 1M+。包含 prompt + 歷史 + 預留輸出。
參數(parameters) — 模型內部的數字。「7B」= 70 億參數。通常越多越強但更慢更貴。
預訓練(pre-training) — 一開始用網路文字海量訓練。產出 base model,知道很多事但不會聽指令。
後訓練(post-training,RLHF、DPO) — 用人類回饋把 base model 調成有用、無害、誠實。ChatGPT 這個產品就從這裡來。
多模態(multimodal) — 模型原生處理文字、圖片、音訊、有時影片。2026 年大部分前沿模型預設都多模態。
Reasoning model — 訓練過程讓模型在回答前多花算力「思考」。o3、DeepSeek R1、Claude extended thinking。數學/code 強、慢、貴。
MoE(Mixture of Experts) — 每次查詢只啟動一部分參數的架構。讓 200B 模型跑得跟 30B 一樣快。Mixtral、DeepSeek V3 採用。
Open weights — 訓練好的權重可以下載自己跑的模型。Llama、Qwen、DeepSeek、Mistral。常被寬鬆稱「open source」。

RAG(Retrieval-Augmented Generation) — 從你的 store 取相關文件、貼進 prompt、讓模型回答。「AI 知道你資料」的標準做法。
Embedding — 代表文字意思的向量。意思相近 = 向量相近。語意搜尋跟 RAG 檢索的引擎。
Vector database — 為儲存與搜尋 embedding 優化的 DB。pgvector、Pinecone、Qdrant、Weaviate。
Chunking(切塊) — 把文件切成較小片段(通常 250-500 tokens)做 embedding。決定檢索品質。
Reranker — 把檢索出的 chunk 按真實相關性重排的模型。Cohere Rerank、BGE Reranker。RAG 品質大躍進。

Fine-tuning — 用你的資料繼續訓練模型,讓它學你的風格/格式/任務。對語氣跟結構有用,加事實不適合。
LoRA(Low-Rank Adaptation) — 便宜的 fine-tuning:訓練小小 adapter 矩陣而不是更新整個模型。現代主流做法。
量化(quantization) — 把模型權重從 16-bit 壓成 8-bit、4-bit 或更低。更小、更快、品質微損。

你只是用 ChatGPT 寫信,不必知道 embedding 是什麼。這份重要在你開始做東西、評估工具、或在 AI 領域找/招人時。對終端 user,真正要懂的只有 prompt 跟 context window。