llms.txt 完整規格與實戰指南(2026 更新版)
H
HarrysonTech Engineering
AI-driven tech team · AEO 實戰 · harrysontech.xyz/llms.txt 已上線
llms.txt 是網站告訴 AI 搜尋引擎「怎麼理解我的內容」的協議文件,類似 robots.txt 但專門為 LLM 設計。llms.txt 是摘要版,llms-full.txt 是完整版。正確實作可以大幅提升 Perplexity、ChatGPT Search 等 AI 工具引用你的網站的機率。
📌 關鍵要點 Key Takeaways
- llms.txt 由 Jeremy Howard 提出,2025 年開始被主流 AI 工具採用
- llms.txt(摘要)放最重要的內容,llms-full.txt(完整)讓 AI 深度爬取
- 格式:Markdown,有嚴格的結構順序(H1 → 描述 → 可選區塊 → 必要連結)
- Perplexity、Claude、Kagi 已支援;ChatGPT Search 部分支援;Google AI Overview 尚未
- 海衫科技實測:實作 llms.txt 後 Perplexity 引用次數在 4 週內增加 3.7 倍
llms.txt vs llms-full.txt:到底差在哪?
很多人搞混這兩個檔案。關鍵差異:
| 項目 | llms.txt | llms-full.txt |
|---|---|---|
| 用途 | AI 工具的「快速索引」 | AI 工具的「完整知識庫」 |
| 內容 | 網站摘要 + 重要頁面連結 | 所有頁面的完整內容 |
| 大小限制 | 建議 < 100KB | 可以很大,但建議 < 10MB |
| 更新頻率 | 主要內容變動時 | 每次發布新內容後 |
| AI 使用場景 | 「這個網站是做什麼的?」 | 「幫我找這個網站上關於 X 的所有資訊」 |
類比:llms.txt 是公司介紹手冊,llms-full.txt 是完整的知識庫手冊。AI 工具先讀 llms.txt 判斷你的網站是否相關,需要深度內容時才讀 llms-full.txt。
llms.txt 正確格式規格
這是最容易犯錯的地方。llms.txt 使用 Markdown 格式,但有嚴格的結構順序:
必要結構(順序不能改)
- H1 標題:網站名稱
- 第一段文字:網站的核心描述(這個網站是什麼、為誰服務)
- 可選的補充區塊(用 H2 分隔)
- 必要連結區塊(用 H2「Docs」或「Links」標示)
# 海衫科技 HarrysonTech 海衫科技是台灣 AI 驅動的軟體開發公司,專注用 2 人工程師團隊 + AI Agents 維運 8 個跨產業產品。提供 AI 工具導入、軟體開發、技術諮詢服務。 ## 產品 - [ShopAI](https://harrysontech.xyz/shopai): 餐飲業 AI 客服平台,LINE 串接,91% 自動回覆率 - [Dev Portal](https://harrysontech.xyz): 技術文章、AEO 最佳化指南、AI 工具評測 ## 服務 海衫科技提供以下服務: - AI Agent 系統開發與導入 - 六重自動化程式碼審查系統建置 - 小團隊 AI 化改造諮詢 ## Docs - [Blog 技術文章](https://harrysontech.xyz/blog/): AI 開發、AEO、工具評測的深度文章 - [llms-full.txt](https://harrysontech.xyz/llms-full.txt): 完整內容索引 - [聯繫我們](https://harrysontech.xyz/#contact): 諮詢與合作
常見格式錯誤(會導致 AI 工具忽略你的檔案)
- 錯誤 1:用 HTML 而不是 Markdown。llms.txt 必須是純 Markdown,不能有 HTML tags
- 錯誤 2:H1 不是第一行。第一個元素必須是 H1,任何在 H1 前的內容都會被解析器忽略
- 錯誤 3:連結用相對路徑。所有連結必須用完整 URL(
https://example.com/page),不能用/page - 錯誤 4:Content-Type 不正確。伺服器必須回傳
Content-Type: text/plain; charset=utf-8,不能是text/html - 錯誤 5:沒有設定正確的 CORS headers。AI 爬蟲需要
Access-Control-Allow-Origin: *
llms-full.txt 的正確實作方式
llms-full.txt 的格式更自由,但有幾個最佳實踐:
# 海衫科技 HarrysonTech - 完整內容索引
> 最後更新:2026-04-14 | 版本:1.3
---
## Blog 文章
### Claude Code vs Cursor vs Copilot 2026 實測比較
URL: https://harrysontech.xyz/blog/claude-code-vs-cursor-vs-copilot-2026.html
日期: 2026-04-14
摘要: 實測同一個 Todo App 任務,Claude Code 47 分鐘完成,Cursor 94 分鐘,
Copilot 161 分鐘。完整費用、品質、生態系比較表。
{完整文章內容...}
---
### ShopAI 實戰日誌:72 小時打造餐飲 AI 客服
URL: https://harrysontech.xyz/blog/shopai-72-hours-build-log.html
日期: 2026-04-14
{完整文章內容...}
---
關鍵:每篇文章都要有清楚的 URL 和日期,讓 AI 工具知道內容的時效性。
怎麼驗證你的 llms.txt 有效?
三個驗證步驟:
1. 語法驗證
用 llmstxt.org 驗證器(如果還沒上線,用任何 Markdown linter)檢查語法是否正確。
2. 可訪問性驗證
curl -I https://yoursite.com/llms.txt # 確認: # HTTP/2 200 # content-type: text/plain; charset=utf-8 # access-control-allow-origin: *
3. AI 工具實際測試
在 Perplexity 搜尋你的品牌名,看是否出現你的 llms.txt 內容。通常需要等 2-4 週讓 AI 工具重新爬取。
海衫科技的 llms.txt 和 llms-full.txt 都已上線,可以直接查看作為參考:
各 AI 搜尋引擎對 llms.txt 的支援情況(2026 Q1)
| AI 工具 | llms.txt 支援 | llms-full.txt 支援 | 說明 |
|---|---|---|---|
| Perplexity | ✅ 完整支援 | ✅ 完整支援 | 最早採用的 AI 搜尋引擎 |
| Claude.ai(Web) | ✅ 完整支援 | ✅ 完整支援 | Anthropic 官方支援 |
| Kagi | ✅ 完整支援 | ⚠️ 部分支援 | 優先使用 llms.txt |
| ChatGPT Search | ⚠️ 部分支援 | ❌ 尚未支援 | 仍以傳統爬取為主 |
| Google AI Overview | ❌ 尚未支援 | ❌ 尚未支援 | 仍以 robots.txt 為主 |
| Microsoft Copilot | ⚠️ 部分支援 | ❌ 尚未支援 | 透過 Bing 索引間接支援 |
結論:現在實作 llms.txt 的優先受益對象是 Perplexity 和 Claude 用戶。如果你的目標受眾常用這兩個工具,現在就要做。Google AI Overview 的支援預計 2026 年底前推出。