Token 是什麼?為什麼 AI 工具一直提到它?2026 完整解析 + 省用技巧

Token 是什麼?為什麼 AI 工具一直提到它?2026 完整解析 + 省用技巧

本文重點:

Token 是 AI 處理文字的最小單位,你可以把它想成 AI 世界的「計次貨幣」—它決定你一次能輸入多少、訊息額度何時用完、API 帳單多少錢。
1 個英文字 ≈ 1.3 個 token,1 個中文字 ≈ 0.6 個 token。對一般使用者最實用的三個觀念是:
1.對話越長越「貴」(吃 token)
2.上傳大檔案會大量消耗 token
3.當你撞到「訊息額度用完」或「上下文已滿」,基本上就是在向你討 token。
學會這篇的 8 個省用技巧,可讓免費版的使用體驗接近 Pro。

1. Token 是什麼?用 3 個比喻一次懂

Token是 AI 模型處理文字的最小單位。它不一定等於一個字—可能是半個字、一個詞,甚至一個標點符號。每當你輸入一段話,AI 會先把它「切成 token」(這個動作叫 tokenization),才開始理解與回答。

原始切塊範例

例如英文句子 Tokens are units of language,在 GPT 的 tokenizer 看來會變成:

Tokens are units of language 共 5 個 token,而非 5 個字

 

中文的「請幫我寫一篇文章」可能被切成:

一篇 文章 共 6 個 token(實際切法依模型而異)。

用 3 個比喻幫你記住

比喻一:積木

AI 是用 token 這塊積木一塊一塊「砌出」回應的。輸入越多、輸出越長,需要的積木就越多。

比喻二:計程車里程

用 AI 像搭計程車——對話越長,跳表跳得越久。你的訂閱方案就像月票,有額度上限。

比喻三:會議室容量

每個模型都有腦容量(上下文視窗),裝不下時就要開始把舊內容請出去,所以 AI 會忘記很早之前說過的話。

三個比喻共通的重點是:token 是 AI 工具的計量單位,你的所有體驗—速度、品質、成本、字數限制——都圍繞它打轉。

2. 中文 vs 英文的 token 換算

同一段話,用不同語言寫消耗的 token 數差很多。這個差距會直接影響你的「使用配額」與「費用」。

語言 1 個字 ≈ 多少 token 1 千字 ≈ 多少 token 備註
英文 0.3(平均 4 字母 = 1 token) ~750 token 最省 token 的語言
繁體中文 1.5–2 個中文字 = 1 token ~600 token 意外比英文還省
簡體中文 1.5–2 個中文字 = 1 token ~600 token 與繁中接近
日文 1 個字 = 1–1.5 token ~1,200 token 較耗 token
韓文 1 個字 = 1.5–2 token ~1,500 token 最耗 token
表情符號 / Emoji 每個 ≈ 2–3 token 意外貴

實用換算口訣

對 80% 的使用情境,你只要記住這個粗略口訣就夠用:

1,000 中文字≈ 600–700 token
1,000 英文字≈ 1,300 token
一頁 A4 文件≈ 500–800 token
一個有趣的反直覺:用中文跟 AI 對話,常常比用英文「省」token。但這不代表 AI 中文能力一定比英文好——只是切塊邏輯不同。

3. 為什麼 AI 工具一直提到 token?三個關鍵場景

如果你只是用網頁版聊天,token 確實在背後悄悄運作,你不需要每次都看到它。但下面這三個情境一定會把你「拉到 token 面前」:

場景一:訊息額度用完

「You've reached your message limit, try again at 3:45 PM」——背後的真相是你已經消耗到當期上限的 token 了。免費版限制最緊,Pro 寬鬆但仍有上限,Enterprise 才幾乎無限。當你一次塞了 50 頁 PDF 進去,額度可能 5 分鐘就燒完。

場景二:上下文視窗已滿

長對話進行到一半,AI 突然「忘記」之前的設定;或上傳大檔案時被擋下——這是模型的 context window 已滿的徵兆。它沒有真的「失憶」,而是被迫把最早的訊息「請出去」以容納新的輸入。

場景三:API 帳單

如果你用 OpenAI 或 Anthropic 的 API 開發,費用是按 token 計算。輸入 token 與輸出 token 通常分開計價,輸出貴 3–5 倍。一段不留意的長 prompt 或長回應,就可能讓你的月費差了好幾倍。

關鍵領悟
AI 工具不主動跟你討論 token,但每一次「失敗體驗」(額度用完、回答變短、上下文丟失、帳單暴衝)都是 token 在說話。學會看懂它,就等於學會看懂 AI 工具的身體語言。

4. Context Window:你的 AI 一次能「記住」多少

Context window(上下文視窗)是 AI 模型的短期記憶上限,決定它在單次對話中能同時看到多少內容。對話歷史 + 上傳檔案 + 系統提示詞 + AI 即將輸出的回答,這些全部加起來不能超過上限。

模型 Context Window 約等於
GPT-4o / GPT-5 128,000 token ~9 萬中文字 / ~300 頁 A4
Claude Sonnet 4.6 / Opus 4.6 200,000 token ~15 萬中文字 / ~500 頁 A4
Gemini 2.5 Pro 1,000,000–2,000,000 token ~75 萬–150 萬中文字
NotebookLM(底層 Gemini) 有效處理 100 萬 token+ 整本長篇小說 + 多篇論文

這個數字越大,代表你能一次處理的資料越多。但要注意:「能裝多少」不等於「真的記得多好」。當對話塞到 8 成滿時,模型對最早內容的關注度通常下降,這現象叫lost in the middle(中間迷失效應)。

實務判斷:多大才算「夠用」

  • 日常聊天、寫信、查資料:8K–32K 就夠了。
  • 讀一本書 / 一份白皮書 / 30 頁 PDF:128K–200K 才舒服。
  • 跨多本書、多份論文做比較:1M+ 才能裝得下。

5. 主流工具的 token 隱藏設計大揭秘

各家 AI 工具其實都藏了一些跟 token 有關的政策,理解它們可以避免你誤踩雷。

ChatGPT(OpenAI)

  • 免費版:每 5 小時約 10–20 則 GPT-4o 訊息,額度動態調整。超過後會自動降級到 GPT-4o mini。
  • Plus(USD $20/月):GPT-4o 與 GPT-5 訊息上限大幅提高,但仍有「重度使用」上限(約每 3 小時 80 則)。
  • Pro(USD $200/月):近乎無限的訊息與最強模型(o3、o3-pro 推理模型)。
  • 隱藏點:上傳的圖片、檔案會額外消耗 token,長對話會降速。

Claude(Anthropic)

  • 免費版:每 5 小時約 30–45 則訊息,但長對話會更快用完。
  • Pro(USD $20/月):額度約 5 倍,可使用 Opus 模型,並開放 Projects 與長對話延伸。
  • Max(USD $100–200/月):額度提升 5–20 倍,適合重度使用者。
  • 隱藏點:Claude 對長文最友善(20 萬 token 上下文),但啟用 Extended Thinking 會額外消耗 token。

Gemini(Google)

  • 免費版:訊息額度最寬鬆,但 Deep Research、Veo 影片生成、最新 2.5 Pro 模型限制較多。
  • Google AI Pro(USD $19.99/月):解鎖 2.5 Pro、NotebookLM Plus、2TB 雲端空間。
  • Google AI Ultra:Veo 3 影片、最高優先權、進階研究工具。
  • 隱藏點:1M+ token 上下文聽起來很大,但檔案上傳超過 50MB 會被壓縮處理。

NotebookLM

  • 免費版:100 個 Notebook、每本 50 個來源、每天 3 次 Audio Overview。
  • Plus 版:500 個 Notebook、每本 300 個來源、每天 20 次 Audio。
  • 隱藏點:每個來源上限 50 萬字,但實際處理 token 由 Google 後端管理,使用者看不到具體消耗。

6. 省 token 的 8 個實用技巧

下面這些技巧不需要改你的提問風格,只是順手做對就能讓你的免費版額度撐更久,Pro 用起來也更划算。

1.把長對話「適時砍掉重練」

當主題已換或對話超過 30 輪,開新對話比繼續累積划算。舊對話累積的 token 會被重複付費——每一次新提問,AI 都要重讀一遍整段歷史。

2.需要記憶長期內容,改用 Projects

ChatGPT 與 Claude 都有 Projects 功能。把長期參考資料放進去後,AI 在每次對話會動態取用而非整批塞進上下文,大幅節省 token。

3.檔案先摘要再對話

上傳 100 頁 PDF 直接問問題,等於把所有頁全部塞進每一次回答的上下文。更聰明的做法:第一輪請 AI 做「結構化摘要 + 關鍵段落」,後續對話以摘要為基礎,需要原文時再請它「回到第幾頁」。

4.圖片只上必要的

每張圖片約消耗 500–1,500 token(視解析度)。若只需要文字內容,改用截圖工具的 OCR 轉成文字再貼上,通常省下 80% token。

5.明確指定回答長度

「請用 200 字回答」比「請回答」省 5–10 倍 token,而且通常品質還更高。AI 預設會寫到飽,你不主動要求精簡,它就會吃你的額度。

6.避免把整段格式化資料塞給 AI

JSON、HTML、表格符號(尤其是大量空白與縮排)會吃掉大量 token。把它們轉成簡潔的條列或精簡 CSV 再丟給 AI,可省下 30–50%。

7.用 Haiku、GPT-4o-mini、Gemini Flash 做簡單任務

翻譯、改寫、摘要這類任務,輕量模型就夠了,還更快。把 Opus、GPT-5 這種大型模型留給真正需要深度推理的場合。

8.關掉不必要的思考模式

Claude 的 Extended Thinking、ChatGPT 的 o3 推理模式雖然回答更深,但會額外消耗 5–20 倍 token。簡單問題用一般模式就好,別為了保險起見一律開最強。

7. 實戰對照:常見任務各消耗多少 token

抽象的數字看再多,不如看實際情境。下表整理常見任務的 token 消耗區間,幫你直觀理解什麼是重度使用,什麼又算輕度。

使用情境 輸入 token 輸出 token 單次合計
翻譯 1 段落短文 ~200 ~300 ~500
寫一封 300 字商務 Email ~500 ~400 ~900
把 1 小時會議錄音轉摘要 ~12,000 ~1,500 ~13,500
分析 30 頁 PDF 財報 ~25,000 ~2,000 ~27,000
讀完一本 200 頁電子書 ~150,000 ~3,000 ~153,000
寫一篇 2,000 字部落格(含對話迭代) ~3,000 ~3,500 ~6,500
連續 50 輪程式碼除錯對話 ~80,000+ ~30,000 ~110,000+
啟用 Extended Thinking 解一道難題 ~1,000 ~15,000(內部推理) ~16,000

從對照表看出的三個重點

  • 讀檔案是 token 大殺器:讀一本書比寫 100 封 Email 還燒 token,所以讀整本書 + 對話很容易在免費版幾分鐘就撞上限。
  • 長對話的累積效應:50 輪除錯對話消耗的 token 比讀 30 頁 PDF 還多——因為每一輪都會重複讀整段對話歷史。
  • 輸出比輸入更貴:無論訂閱或 API 計費,模型「寫」的 token 通常比「讀」的貴 3–5 倍。所以「請盡量精簡」這句指令永遠值得加。
最划算的使用方式是:把讀檔案的工作集中在 1–2 次,從中萃取結構化摘要,後續的對話以摘要為基礎—這個策略可以讓你的 token 消耗下降 70% 以上。

8. 怎麼判斷你該升級 Pro?

升級 Pro 不是越多越好,而是「用量配得上價格」才划算。下面是三個判斷訊號:

訊號一:每週至少 3 次撞到「訊息額度用完」

如果你每週都會碰到「今天就到這裡」的提示 3 次以上,意味著你已經是中重度使用者,Pro 月費(NT$ 600–700)分攤下來每天約 NT$ 20,比一杯咖啡還便宜,但解鎖的時間價值遠高於此。

訊號二:常需要處理長篇文件

如果你經常上傳超過 30 頁的 PDF、或同時處理多份檔案,免費版的上下文常常不夠用。Pro 才能完整使用 Claude 的 200K 上下文或 Gemini 的 1M+ 上下文。

訊號三:你想用最新最強的模型做深度推理

Claude Opus、GPT-5、Gemini 2.5 Pro 這類「旗艦模型」的回答品質,在複雜任務上明顯優於免費版的標準模型。如果你的工作對品質敏感(寫作、策略、程式架構),升級的差異有感。

不需要升級的訊號

每週使用低於 5 次、只做簡單問答(查資料、翻譯、改錯字)、或只在特定週期忙碌——這幾種情境免費版完全足夠。試用一個月再評估,不需要急著訂閱。

進階策略:多家輪流用

許多熟練使用者會「同時用 ChatGPT + Claude + Gemini 免費版」,撞到 A 的上限就切到 B,3 家輪著用幾乎不會碰到限制——只是你需要自己決定誰擅長什麼任務。

結語:會看 token,你就比 90% 的使用者厲害

Token 不是工程師的玩具,而是 AI 工具最底層的「物理單位」。你不需要學會自己算 token——但你需要建立直覺:對話越長越貴、上傳越大越貴、開越強越貴。

把這篇的 8 個省用技巧內化成習慣,你會發現自己的免費版用起來像 Pro;真的升級 Pro 之後,也不會被無腦堆內容拖垮。AI 工具的競爭力,有一半在模型強不強,另一半在使用者懂不懂得用—而 token 就是那個分水嶺。

本文為資訊基於 2026 年 5 月主流 AI 工具的公開資料整理。各產品方案、token 限制可能隨時間調整,實際以官方公告為準。

01 Token 是什麼?和「字」有什麼不同?
A

Token 是 AI 處理文字的最小單位,可以是一個字、半個字、一個詞或一個標點符號。英文平均約 4 個字母 = 1 token,中文約 1.5–2 個字 = 1 token。AI 計費、字數限制、上下文視窗都以 token 為基準,而非你直觀看到的字數。

02 1 萬個中文字大約是多少 token?
A

粗略換算:1 萬個中文字大約 5,000–7,000 token。繁體中文夾雜英文與數字時,通常落在 6,000–8,000 token 之間。

03 為什麼 AI 工具會說「上下文用完了」?
A

每個模型都有上下文視窗上限,例如 Claude 約 20 萬 token、GPT-4o 約 12.8 萬 token、Gemini 1.5 Pro 約 100 萬 token。當對話累積內容(問題 + 回答 + 上傳檔案)超過上限,系統會開始遺忘最早的內容或拒絕新輸入。

04 ChatGPT、Claude、Gemini 的免費版各能用多少?
A

ChatGPT 免費版每 5 小時約 10–20 則 GPT-4o;Claude 免費版每 5 小時約 30–45 則 Sonnet;Gemini 免費版限制最寬鬆,但 Deep Research、Veo 影片生成等功能僅 Pro 可用。實際上限會依使用人數動態調整。

05 怎麼判斷自己該升級 Pro?
A

三個訊號表示該升級:每週至少 3 次撞到訊息上限、需要處理長篇文件、想用最新模型做深度推理。若每週使用低於 5 次或只做簡單問答,免費版足夠。

06 API 計費跟訂閱版有什麼不同?
A

訂閱版(ChatGPT Plus / Claude Pro)是按月固定費用,有訊息額度上限;API 是按實際 token 計費,輸入與輸出分開計價,輸出通常貴 3–5 倍。個人輕度使用適合訂閱,有開發需求或大量批次處理才適合 API。

07 怎麼精準計算我的 prompt 用了多少 token?
A

OpenAI 提供 tiktoken 開源工具與線上計算器(platform.openai.com/tokenizer);Anthropic 有 Token Counter API;Google AI Studio 也內建 token 顯示。免費可用,把文字貼進去就能看到實際 token 數。

08 「思考模式」(Reasoning / Extended Thinking)會多花 token 嗎?
A

會,而且差距很大。一般回答可能用 500 token,啟用思考模式後可能消耗 5,000–20,000 token,因為模型會在內部進行多輪推理(這部分 token 不顯示給你但仍計費)。簡單任務不要一律開最強。