Token 是什麼?為什麼 AI 工具一直提到它?2026 完整解析 + 省用技巧
Token 是 AI 處理文字的最小單位,你可以把它想成 AI 世界的「計次貨幣」—它決定你一次能輸入多少、訊息額度何時用完、API 帳單多少錢。
1 個英文字 ≈ 1.3 個 token,1 個中文字 ≈ 0.6 個 token。對一般使用者最實用的三個觀念是:
1.對話越長越「貴」(吃 token)
2.上傳大檔案會大量消耗 token
3.當你撞到「訊息額度用完」或「上下文已滿」,基本上就是在向你討 token。
學會這篇的 8 個省用技巧,可讓免費版的使用體驗接近 Pro。
1. Token 是什麼?用 3 個比喻一次懂
Token是 AI 模型處理文字的最小單位。它不一定等於一個字—可能是半個字、一個詞,甚至一個標點符號。每當你輸入一段話,AI 會先把它「切成 token」(這個動作叫 tokenization),才開始理解與回答。
原始切塊範例
例如英文句子 Tokens are units of language,在 GPT 的 tokenizer 看來會變成:
中文的「請幫我寫一篇文章」可能被切成:
用 3 個比喻幫你記住
比喻一:積木
AI 是用 token 這塊積木一塊一塊「砌出」回應的。輸入越多、輸出越長,需要的積木就越多。
比喻二:計程車里程
用 AI 像搭計程車——對話越長,跳表跳得越久。你的訂閱方案就像月票,有額度上限。
比喻三:會議室容量
每個模型都有腦容量(上下文視窗),裝不下時就要開始把舊內容請出去,所以 AI 會忘記很早之前說過的話。
三個比喻共通的重點是:token 是 AI 工具的計量單位,你的所有體驗—速度、品質、成本、字數限制——都圍繞它打轉。
2. 中文 vs 英文的 token 換算
同一段話,用不同語言寫消耗的 token 數差很多。這個差距會直接影響你的「使用配額」與「費用」。
| 語言 | 1 個字 ≈ 多少 token | 1 千字 ≈ 多少 token | 備註 |
|---|---|---|---|
| 英文 | 0.3(平均 4 字母 = 1 token) | ~750 token | 最省 token 的語言 |
| 繁體中文 | 1.5–2 個中文字 = 1 token | ~600 token | 意外比英文還省 |
| 簡體中文 | 1.5–2 個中文字 = 1 token | ~600 token | 與繁中接近 |
| 日文 | 1 個字 = 1–1.5 token | ~1,200 token | 較耗 token |
| 韓文 | 1 個字 = 1.5–2 token | ~1,500 token | 最耗 token |
| 表情符號 / Emoji | 每個 ≈ 2–3 token | — | 意外貴 |
實用換算口訣
對 80% 的使用情境,你只要記住這個粗略口訣就夠用:
一個有趣的反直覺:用中文跟 AI 對話,常常比用英文「省」token。但這不代表 AI 中文能力一定比英文好——只是切塊邏輯不同。
3. 為什麼 AI 工具一直提到 token?三個關鍵場景
如果你只是用網頁版聊天,token 確實在背後悄悄運作,你不需要每次都看到它。但下面這三個情境一定會把你「拉到 token 面前」:
場景一:訊息額度用完
「You've reached your message limit, try again at 3:45 PM」——背後的真相是你已經消耗到當期上限的 token 了。免費版限制最緊,Pro 寬鬆但仍有上限,Enterprise 才幾乎無限。當你一次塞了 50 頁 PDF 進去,額度可能 5 分鐘就燒完。
場景二:上下文視窗已滿
長對話進行到一半,AI 突然「忘記」之前的設定;或上傳大檔案時被擋下——這是模型的 context window 已滿的徵兆。它沒有真的「失憶」,而是被迫把最早的訊息「請出去」以容納新的輸入。
場景三:API 帳單
如果你用 OpenAI 或 Anthropic 的 API 開發,費用是按 token 計算。輸入 token 與輸出 token 通常分開計價,輸出貴 3–5 倍。一段不留意的長 prompt 或長回應,就可能讓你的月費差了好幾倍。
4. Context Window:你的 AI 一次能「記住」多少
Context window(上下文視窗)是 AI 模型的短期記憶上限,決定它在單次對話中能同時看到多少內容。對話歷史 + 上傳檔案 + 系統提示詞 + AI 即將輸出的回答,這些全部加起來不能超過上限。
| 模型 | Context Window | 約等於 |
|---|---|---|
| GPT-4o / GPT-5 | 128,000 token | ~9 萬中文字 / ~300 頁 A4 |
| Claude Sonnet 4.6 / Opus 4.6 | 200,000 token | ~15 萬中文字 / ~500 頁 A4 |
| Gemini 2.5 Pro | 1,000,000–2,000,000 token | ~75 萬–150 萬中文字 |
| NotebookLM(底層 Gemini) | 有效處理 100 萬 token+ | 整本長篇小說 + 多篇論文 |
這個數字越大,代表你能一次處理的資料越多。但要注意:「能裝多少」不等於「真的記得多好」。當對話塞到 8 成滿時,模型對最早內容的關注度通常下降,這現象叫lost in the middle(中間迷失效應)。
實務判斷:多大才算「夠用」
- 日常聊天、寫信、查資料:8K–32K 就夠了。
- 讀一本書 / 一份白皮書 / 30 頁 PDF:128K–200K 才舒服。
- 跨多本書、多份論文做比較:1M+ 才能裝得下。
6. 省 token 的 8 個實用技巧
下面這些技巧不需要改你的提問風格,只是順手做對就能讓你的免費版額度撐更久,Pro 用起來也更划算。
1.把長對話「適時砍掉重練」
當主題已換或對話超過 30 輪,開新對話比繼續累積划算。舊對話累積的 token 會被重複付費——每一次新提問,AI 都要重讀一遍整段歷史。
2.需要記憶長期內容,改用 Projects
ChatGPT 與 Claude 都有 Projects 功能。把長期參考資料放進去後,AI 在每次對話會動態取用而非整批塞進上下文,大幅節省 token。
3.檔案先摘要再對話
上傳 100 頁 PDF 直接問問題,等於把所有頁全部塞進每一次回答的上下文。更聰明的做法:第一輪請 AI 做「結構化摘要 + 關鍵段落」,後續對話以摘要為基礎,需要原文時再請它「回到第幾頁」。
4.圖片只上必要的
每張圖片約消耗 500–1,500 token(視解析度)。若只需要文字內容,改用截圖工具的 OCR 轉成文字再貼上,通常省下 80% token。
5.明確指定回答長度
「請用 200 字回答」比「請回答」省 5–10 倍 token,而且通常品質還更高。AI 預設會寫到飽,你不主動要求精簡,它就會吃你的額度。
6.避免把整段格式化資料塞給 AI
JSON、HTML、表格符號(尤其是大量空白與縮排)會吃掉大量 token。把它們轉成簡潔的條列或精簡 CSV 再丟給 AI,可省下 30–50%。
7.用 Haiku、GPT-4o-mini、Gemini Flash 做簡單任務
翻譯、改寫、摘要這類任務,輕量模型就夠了,還更快。把 Opus、GPT-5 這種大型模型留給真正需要深度推理的場合。
8.關掉不必要的思考模式
Claude 的 Extended Thinking、ChatGPT 的 o3 推理模式雖然回答更深,但會額外消耗 5–20 倍 token。簡單問題用一般模式就好,別為了保險起見一律開最強。
7. 實戰對照:常見任務各消耗多少 token
抽象的數字看再多,不如看實際情境。下表整理常見任務的 token 消耗區間,幫你直觀理解什麼是重度使用,什麼又算輕度。
| 使用情境 | 輸入 token | 輸出 token | 單次合計 |
|---|---|---|---|
| 翻譯 1 段落短文 | ~200 | ~300 | ~500 |
| 寫一封 300 字商務 Email | ~500 | ~400 | ~900 |
| 把 1 小時會議錄音轉摘要 | ~12,000 | ~1,500 | ~13,500 |
| 分析 30 頁 PDF 財報 | ~25,000 | ~2,000 | ~27,000 |
| 讀完一本 200 頁電子書 | ~150,000 | ~3,000 | ~153,000 |
| 寫一篇 2,000 字部落格(含對話迭代) | ~3,000 | ~3,500 | ~6,500 |
| 連續 50 輪程式碼除錯對話 | ~80,000+ | ~30,000 | ~110,000+ |
| 啟用 Extended Thinking 解一道難題 | ~1,000 | ~15,000(內部推理) | ~16,000 |
從對照表看出的三個重點
- 讀檔案是 token 大殺器:讀一本書比寫 100 封 Email 還燒 token,所以讀整本書 + 對話很容易在免費版幾分鐘就撞上限。
- 長對話的累積效應:50 輪除錯對話消耗的 token 比讀 30 頁 PDF 還多——因為每一輪都會重複讀整段對話歷史。
- 輸出比輸入更貴:無論訂閱或 API 計費,模型「寫」的 token 通常比「讀」的貴 3–5 倍。所以「請盡量精簡」這句指令永遠值得加。
最划算的使用方式是:把讀檔案的工作集中在 1–2 次,從中萃取結構化摘要,後續的對話以摘要為基礎—這個策略可以讓你的 token 消耗下降 70% 以上。
8. 怎麼判斷你該升級 Pro?
升級 Pro 不是越多越好,而是「用量配得上價格」才划算。下面是三個判斷訊號:
訊號一:每週至少 3 次撞到「訊息額度用完」
如果你每週都會碰到「今天就到這裡」的提示 3 次以上,意味著你已經是中重度使用者,Pro 月費(NT$ 600–700)分攤下來每天約 NT$ 20,比一杯咖啡還便宜,但解鎖的時間價值遠高於此。
訊號二:常需要處理長篇文件
如果你經常上傳超過 30 頁的 PDF、或同時處理多份檔案,免費版的上下文常常不夠用。Pro 才能完整使用 Claude 的 200K 上下文或 Gemini 的 1M+ 上下文。
訊號三:你想用最新最強的模型做深度推理
Claude Opus、GPT-5、Gemini 2.5 Pro 這類「旗艦模型」的回答品質,在複雜任務上明顯優於免費版的標準模型。如果你的工作對品質敏感(寫作、策略、程式架構),升級的差異有感。
不需要升級的訊號
每週使用低於 5 次、只做簡單問答(查資料、翻譯、改錯字)、或只在特定週期忙碌——這幾種情境免費版完全足夠。試用一個月再評估,不需要急著訂閱。進階策略:多家輪流用
許多熟練使用者會「同時用 ChatGPT + Claude + Gemini 免費版」,撞到 A 的上限就切到 B,3 家輪著用幾乎不會碰到限制——只是你需要自己決定誰擅長什麼任務。
結語:會看 token,你就比 90% 的使用者厲害
Token 不是工程師的玩具,而是 AI 工具最底層的「物理單位」。你不需要學會自己算 token——但你需要建立直覺:對話越長越貴、上傳越大越貴、開越強越貴。
把這篇的 8 個省用技巧內化成習慣,你會發現自己的免費版用起來像 Pro;真的升級 Pro 之後,也不會被無腦堆內容拖垮。AI 工具的競爭力,有一半在模型強不強,另一半在使用者懂不懂得用—而 token 就是那個分水嶺。
Token 是 AI 處理文字的最小單位,可以是一個字、半個字、一個詞或一個標點符號。英文平均約 4 個字母 = 1 token,中文約 1.5–2 個字 = 1 token。AI 計費、字數限制、上下文視窗都以 token 為基準,而非你直觀看到的字數。
粗略換算:1 萬個中文字大約 5,000–7,000 token。繁體中文夾雜英文與數字時,通常落在 6,000–8,000 token 之間。
每個模型都有上下文視窗上限,例如 Claude 約 20 萬 token、GPT-4o 約 12.8 萬 token、Gemini 1.5 Pro 約 100 萬 token。當對話累積內容(問題 + 回答 + 上傳檔案)超過上限,系統會開始遺忘最早的內容或拒絕新輸入。
ChatGPT 免費版每 5 小時約 10–20 則 GPT-4o;Claude 免費版每 5 小時約 30–45 則 Sonnet;Gemini 免費版限制最寬鬆,但 Deep Research、Veo 影片生成等功能僅 Pro 可用。實際上限會依使用人數動態調整。
三個訊號表示該升級:每週至少 3 次撞到訊息上限、需要處理長篇文件、想用最新模型做深度推理。若每週使用低於 5 次或只做簡單問答,免費版足夠。
訂閱版(ChatGPT Plus / Claude Pro)是按月固定費用,有訊息額度上限;API 是按實際 token 計費,輸入與輸出分開計價,輸出通常貴 3–5 倍。個人輕度使用適合訂閱,有開發需求或大量批次處理才適合 API。
OpenAI 提供 tiktoken 開源工具與線上計算器(platform.openai.com/tokenizer);Anthropic 有 Token Counter API;Google AI Studio 也內建 token 顯示。免費可用,把文字貼進去就能看到實際 token 數。
會,而且差距很大。一般回答可能用 500 token,啟用思考模式後可能消耗 5,000–20,000 token,因為模型會在內部進行多輪推理(這部分 token 不顯示給你但仍計費)。簡單任務不要一律開最強。