引入 /llms.txt：为大语言模型（LLM）优化网站内容的新标准

作者：小芸

更新于：2025年8月17日 13:10

在人工智能，特别是大语言模型（LLM）应用日益广泛的今天，如何让LLM更高效、更准确地理解我们的网站内容，成为了一个值得探索的问题。/llms.txt 这一新兴标准，正是为此而生。

什么是 /llms.txt？

简单来说，/llms.txt 是一个放置在网站根目录下的特殊文件（如 https://example.com/llms.txt）。它的核心目标，是向LLM提供一个关于网站关键内容的、清晰友好的“导读手册”。

这个构想由 Jeremy Howard 在 2024 年 9 月首次提出，旨在解决LLM在理解复杂网页时面临的挑战：原始HTML通常包含导航、广告、脚本等大量与核心内容无关的元素，导致模型难以快速抓住重点，效率低下。/llms.txt 就像是为LLM量身定制的一份精简版网站地图。

为何需要 /llms.txt？

突破上下文限制： LLM的输入长度（上下文窗口）有限，无法直接处理整个复杂网站。/llms.txt 提供核心内容的精要概述，便于模型快速获取关键信息。
减轻解析负担： 相比结构复杂、充满噪音的HTML，/llms.txt 采用简洁、结构化的Markdown格式，让LLM能更轻松、更快速地解析和理解网站主旨。
精准内容导向： 类似于 robots.txt 指导搜索引擎爬虫，/llms.txt 旨在引导LLM直达网站最有价值的内容区域，如API文档、核心产品指南、重要政策说明等，避免在无关信息中迷失。

/llms.txt 文件规范

一份符合规范的 /llms.txt 文件应遵循以下结构：

H1 标题（必需）： 清晰的项目或网站名称。
块引用（Blockquote）： 一段简短的概要，精准描述项目或网站的核心目的。
可选前言/说明： 提供链接部分所需的额外背景信息或架构解释。
多个 H2 段落： 将网站的关键内容分门别类（例如：核心文档、教程、案例、政策等）。
链接列表： 在每个 H2 类别下，使用 Markdown 列表格式列出重要链接，并附上简明扼要的说明。
“Optional” 段落（可选）： 用于标记次要或补充性资源，明确告知LLM这部分内容可以跳过。

示例结构（markdown）：

# My Awesome Project

> 一个开源的、用于构建下一代AI应用的强大框架。

以下链接指向项目最核心的文档和资源：

## 核心文档
-   [快速入门指南](https://...)：只需5分钟，开启您的第一个项目。
-   [API 参考手册](https://...)：所有接口的详细说明与用法示例。

## 教程与案例
-   [实战教程：构建聊天机器人](https://...)：手把手教学，从零到一实现。
-   [示例项目库](https://...)：丰富的应用案例供您参考和学习。

## Optional
-   [社区论坛](https://...)：与其他开发者交流心得。
-   [历史版本变更日志](https://...)：了解各版本更新内容。

衍生实践：/llms-full.txt 与 Markdown 页面

/llms-full.txt： 对于内容相对精简的网站，可以提供一个包含完整网站内容的Markdown文件，方便LLM一次性加载所有文档进行理解。
.md 页面： 为每个重要的HTML页面提供对应的Markdown版本（例如 page.html.md）。这为LLM提供了一种获取页面清晰语义文本的替代途径，避免解析原始HTML的复杂性。

谁应该考虑使用 /llms.txt？

开发文档网站： 框架、API 平台、SDK 等，便于LLM快速导航到关键文档入口。
企业官网与政策站点： 突出组织结构、核心产品/服务、重要政策条款、资源中心。
电商平台： 提升关键产品页面、分类说明页面的可见性和理解度。
教育类网站/个人作品集： 清晰展示课程体系、作者信息、项目作品集。

现状：支持度与行业实践

目前，主流LLM服务（如OpenAI的ChatGPT、Google Gemini、Anthropic Claude等）尚未官方宣布在其推理流程中自动抓取或解析 /llms.txt 文件。

然而，前瞻性的探索和实践已然开始：

早期采用者： Anthropic、Cloudflare、Mintlify 等知名公司已在其官方网站公开部署了 /llms.txt 文件。
工具支持： WordPress 生态中（如 Rank Math SEO PRO 与 Yoast SEO 插件）已开始集成 /llms.txt 自动生成功能。越来越多的主流托管服务平台（如 Hostinger、zeo.org）也在推广和简化其部署。
社区追踪： 热心社区维护着一个域名目录，记录已实现该标准的网站。截至 2025 年，已有超过 2000 个域名加入实践。

实施建议与注意事项

试点成本低： 创建一个简单的Markdown文件并部署到网站根目录即可开始，维护成本相对较低。虽然短期内可能不会带来显著的流量变化，但提前布局能为未来做好准备。
内容准确至上： 务必保持 /llms.txt 中的链接有效、描述准确。过时或错误的信息会严重误导LLM，增加其产生“幻觉”（不准确回答）的风险。
协同而非替代： /llms.txt 是现有SEO文件（robots.txt, sitemap.xml）的补充而非替代品。它们服务于不同对象（爬虫 vs LLM），应各司其职，协同工作。
注意信息边界： 谨慎选择列入的内容。避免将内部文档、敏感页面或涉及隐私的链接放入 /llms.txt，防止不必要的信息暴露。

拥抱未来的连接方式

/llms.txt 代表了一种前瞻性的网站优化思路，专为日益重要的AI访客——大语言模型而设计。它通过一份结构清晰、语言简练的Markdown“指南”，将网站的核心价值高效地传递给LLM，有望显著提升AI工具获取和理解网站上下文的准确性与效率。

尽管目前缺乏官方模型的广泛支持，但其理念和实践已在技术社区中生根发芽。结合现有的SEO工具和最佳实践，主动部署 /llms.txt，不仅是为未来AI驱动的内容检索生态打下基础，更是向更智能、更高效的网络交互迈出的积极一步。不妨现在就行动起来，为您的网站准备好这份面向未来的“AI名片”。

未经明确书面许可，不得转载、摘编本站内容。对于侵权行为，我们将保留追究法律责任的权利。