配置
Repomix 可以通过配置文件或命令行选项进行配置。配置文件允许你自定义代码库的处理和输出方式。
配置文件格式
Repomix 支持多种配置文件格式,以提供灵活性和易用性。
Repomix 将按以下优先级自动搜索配置文件:
- TypeScript (
repomix.config.ts,repomix.config.mts,repomix.config.cts) - JavaScript/ES Module (
repomix.config.js,repomix.config.mjs,repomix.config.cjs) - JSON (
repomix.config.json5,repomix.config.jsonc,repomix.config.json)
JSON 配置
在项目目录中创建配置文件:
repomix --init这将创建一个带有默认设置的 repomix.config.json 文件。你还可以创建一个全局配置文件,在找不到本地配置时将使用它作为后备:
repomix --init --globalTypeScript 配置
TypeScript 配置文件提供最佳的开发体验,具有完整的类型检查和 IDE 支持。
安装:
要使用带有 defineConfig 的 TypeScript 或 JavaScript 配置,你需要将 Repomix 安装为开发依赖:
npm install -D repomix示例:
// repomix.config.ts
import { defineConfig } from 'repomix';
export default defineConfig({
output: {
filePath: 'output.xml',
style: 'xml',
removeComments: true,
},
ignore: {
customPatterns: ['**/node_modules/**', '**/dist/**'],
},
});优势:
- ✅ IDE 中的完整 TypeScript 类型检查
- ✅ 出色的 IDE 自动完成和 IntelliSense
- ✅ 使用动态值(时间戳、环境变量等)
动态值示例:
// repomix.config.ts
import { defineConfig } from 'repomix';
// 生成基于时间戳的文件名
const timestamp = new Date().toISOString().slice(0, 19).replace(/[:.]/g, '-');
export default defineConfig({
output: {
filePath: `output-${timestamp}.xml`,
style: 'xml',
},
});JavaScript 配置
JavaScript 配置文件的工作方式与 TypeScript 相同,支持 defineConfig 和动态值。
配置选项
| 选项 | 说明 | 默认值 |
|---|---|---|
input.maxFileSize | 要处理的最大文件大小(字节)。超过此大小的文件将被跳过。用于排除大型二进制文件或数据文件 | 50000000 |
output.filePath | 输出文件名。支持 XML、Markdown 和纯文本格式 | "repomix-output.xml" |
output.style | 输出样式(xml、markdown、json、plain)。每种格式对不同的 AI 工具都有其优势 | "xml" |
output.parsableStyle | 是否根据所选样式模式转义输出。可以提供更好的解析,但可能会增加 token 数量 | false |
output.compress | 是否使用 Tree-sitter 执行智能代码提取,在保持结构的同时减少 token 数量 | false |
output.headerText | 要包含在文件头部的自定义文本。对于为 AI 工具提供上下文或指令很有用 | null |
output.instructionFilePath | 包含用于 AI 处理的详细自定义指令的文件路径 | null |
output.fileSummary | 是否在输出开头包含显示文件计数、大小和其他指标的摘要部分 | true |
output.directoryStructure | 是否在输出中包含目录结构。帮助 AI 理解项目组织 | true |
output.files | 是否在输出中包含文件内容。设置为 false 时只包含结构和元数据 | true |
output.removeComments | 是否从支持的文件类型中删除注释。可以减少噪音和 token 数量 | false |
output.removeEmptyLines | 是否从输出中删除空行以减少 token 数量 | false |
output.showLineNumbers | 是否为每行添加行号。有助于引用代码的特定部分 | false |
output.truncateBase64 | 是否截断长的 base64 数据字符串(例如图像)以减少 token 数量 | false |
output.copyToClipboard | 是否除了保存文件外还将输出复制到系统剪贴板 | false |
output.splitOutput | 按每部分最大大小将输出拆分为多个编号文件(例如,1000000 表示约 1MB)。CLI 接受可读大小如 500kb 或 2mb。使每个文件保持在限制以下,并避免跨部分拆分源文件 | 未设置 |
output.topFilesLength | 在摘要中显示的顶部文件数量。如果设置为 0,则不显示摘要 | 5 |
output.includeEmptyDirectories | 是否在仓库结构中包含空目录 | false |
output.includeFullDirectoryStructure | 使用 include 模式时,是否显示完整的目录树(遵守 ignore 模式)同时仅处理包含的文件。为 AI 分析提供完整的仓库上下文 | false |
output.git.sortByChanges | 是否按 Git 更改次数对文件进行排序。更改较多的文件显示在底部 | true |
output.git.sortByChangesMaxCommits | 分析 Git 更改时要分析的最大提交数。限制历史深度以提高性能 | 100 |
output.git.includeDiffs | 是否在输出中包含 Git 差异。分别显示工作树和暂存区的更改 | false |
output.git.includeLogs | 是否在输出中包含 Git 日志。显示提交历史的日期、消息和文件路径 | false |
output.git.includeLogsCount | 要包含的 Git 日志提交数量。限制历史深度以了解开发规律 | 50 |
include | 要包含的文件模式(使用 glob 模式) | [] |
ignore.useGitignore | 是否使用项目的 .gitignore 文件中的模式 | true |
ignore.useDotIgnore | 是否使用项目的 .ignore 文件中的模式 | true |
ignore.useDefaultPatterns | 是否使用默认忽略模式(node_modules、.git 等) | true |
ignore.customPatterns | 额外的忽略模式(使用 glob 模式) | [] |
security.enableSecurityCheck | 是否使用 Secretlint 执行安全检查以检测敏感信息 | true |
tokenCount.encoding | OpenAI 的 tiktoken 分词器使用的 token 计数编码。GPT-4o 使用 o200k_base,GPT-4/3.5 使用 cl100k_base。详见 tiktoken model.py | "o200k_base" |
配置文件支持 JSON5 语法,允许:
- 注释(单行和多行)
- 对象和数组中的尾随逗号
- 无引号属性名
- 更灵活的字符串语法
模式验证
你可以通过添加 $schema 属性为配置文件启用模式验证:
{
"$schema": "https://repomix.com/schemas/latest/schema.json",
"output": {
"filePath": "repomix-output.md",
"style": "markdown"
}
}这在支持 JSON 模式的编辑器中提供自动完成和验证功能。
配置文件示例
以下是完整配置文件(repomix.config.json)的示例:
{
"$schema": "https://repomix.com/schemas/latest/schema.json",
"input": {
"maxFileSize": 50000000
},
"output": {
"filePath": "repomix-output.xml",
"style": "xml",
"parsableStyle": false,
"compress": false,
"headerText": "打包文件的自定义头部信息",
"fileSummary": true,
"directoryStructure": true,
"files": true,
"removeComments": false,
"removeEmptyLines": false,
"topFilesLength": 5,
"showLineNumbers": false,
"truncateBase64": false,
"copyToClipboard": false,
"includeEmptyDirectories": false,
"git": {
"sortByChanges": true,
"sortByChangesMaxCommits": 100,
"includeDiffs": false,
"includeLogs": false,
"includeLogsCount": 50
}
},
"include": ["**/*"],
"ignore": {
"useGitignore": true,
"useDefaultPatterns": true,
// 模式也可以在 .repomixignore 中指定
"customPatterns": [
"additional-folder",
"**/*.log"
],
},
"security": {
"enableSecurityCheck": true
},
"tokenCount": {
"encoding": "o200k_base"
}
}配置文件位置
Repomix 按以下顺序查找配置文件:
- 当前目录中的本地配置文件(优先级:TS > JS > JSON)
- TypeScript:
repomix.config.ts,repomix.config.mts,repomix.config.cts - JavaScript:
repomix.config.js,repomix.config.mjs,repomix.config.cjs - JSON:
repomix.config.json5,repomix.config.jsonc,repomix.config.json
- TypeScript:
- 全局配置文件(优先级:TS > JS > JSON)
- Windows:
- TypeScript:
%LOCALAPPDATA%\Repomix\repomix.config.ts,.mts,.cts - JavaScript:
%LOCALAPPDATA%\Repomix\repomix.config.js,.mjs,.cjs - JSON:
%LOCALAPPDATA%\Repomix\repomix.config.json5,.jsonc,.json
- TypeScript:
- macOS/Linux:
- TypeScript:
~/.config/repomix/repomix.config.ts,.mts,.cts - JavaScript:
~/.config/repomix/repomix.config.js,.mjs,.cjs - JSON:
~/.config/repomix/repomix.config.json5,.jsonc,.json
- TypeScript:
- Windows:
命令行选项优先于配置文件设置。
包含模式
Repomix 支持使用 glob 模式指定要包含的文件。这允许更灵活和强大的文件选择:
- 使用
**/*.js包含任何目录中的所有 JavaScript 文件 - 使用
src/**/*包含src目录及其子目录中的所有文件 - 组合多个模式,如
["src/**/*.js", "**/*.md"]以包含src中的 JavaScript 文件和所有 Markdown 文件
你可以在配置文件中指定包含模式:
{
"include": ["src/**/*", "tests/**/*.test.js"]
}或使用 --include 命令行选项进行一次性过滤。
忽略模式
Repomix 提供多种方法来设置忽略模式,以在打包过程中排除特定文件或目录:
- .gitignore:默认情况下,使用项目的
.gitignore文件和.git/info/exclude中列出的模式。此行为可以通过ignore.useGitignore设置或--no-gitignoreCLI 选项控制。 - .ignore:你可以在项目根目录中使用
.ignore文件,遵循与.gitignore相同的格式。ripgrep 和 the silver searcher 等工具也会遵守此文件,减少了维护多个忽略文件的需要。此行为可以通过ignore.useDotIgnore设置或--no-dot-ignoreCLI 选项控制。 - 默认模式:Repomix 包含常见排除文件和目录的默认列表(例如 node_modules、.git、二进制文件)。此功能可以通过
ignore.useDefaultPatterns设置或--no-default-patternsCLI 选项控制。有关详细信息,请参阅 defaultIgnore.ts。 - .repomixignore:你可以在项目根目录中创建
.repomixignore文件来定义 Repomix 特定的忽略模式。此文件遵循与.gitignore相同的格式。 - 自定义模式:可以使用配置文件中的
ignore.customPatterns选项指定其他忽略模式。你可以使用-i, --ignore命令行选项覆盖此设置。
优先顺序(从高到低):
- 自定义模式(
ignore.customPatterns) - 忽略文件(
.repomixignore、.ignore、.gitignore和.git/info/exclude):- 在嵌套目录中时,更深层目录中的文件具有更高优先级
- 在同一目录中时,这些文件的合并顺序不确定
- 默认模式(如果
ignore.useDefaultPatterns为 true 且未使用--no-default-patterns)
这种方法允许根据项目需求灵活配置文件排除。它通过确保排除安全敏感文件和大型二进制文件来帮助优化生成的打包文件的大小,同时防止机密信息泄漏。
**注意:**默认情况下,二进制文件不包含在打包输出中,但它们的路径列在输出文件的"仓库结构"部分。这提供了仓库结构的完整概述,同时保持打包文件高效且基于文本。有关详细信息,请参阅二进制文件处理。
.repomixignore 示例:
# 缓存目录
.cache/
tmp/
# 构建输出
dist/
build/
# 日志
*.log默认忽略模式
当 ignore.useDefaultPatterns 为 true 时,Repomix 自动忽略以下常见模式:
node_modules/**
.git/**
coverage/**
dist/**完整列表请参见 defaultIgnore.ts
二进制文件处理
二进制文件(如图像、PDF、编译的二进制文件、归档文件等)经过特殊处理以保持高效的基于文本的输出:
- 文件内容:二进制文件不包含在打包输出中,以保持文件基于文本且对 AI 处理高效
- 目录结构:二进制文件路径被列出在目录结构部分,提供仓库的完整概述
这种方法确保你获得仓库结构的完整视图,同时保持为 AI 处理而优化的高效纯文本输出。
示例:
如果你的仓库包含 logo.png 和 app.jar:
- 它们将出现在目录结构部分
- 它们的内容将不会包含在文件部分
目录结构输出:
src/
index.ts
utils.ts
assets/
logo.png
build/
app.jar这样,AI 工具可以理解这些二进制文件存在于你的项目结构中,而无需处理其二进制内容。
**注意:**你可以使用 input.maxFileSize 配置选项(默认值:50 MB)控制最大文件大小阈值。大于此限制的文件将被完全跳过。
高级功能
代码压缩
代码压缩功能(通过 output.compress: true 启用)使用 Tree-sitter 智能提取基本代码结构,同时移除实现细节。这有助于在保持重要的结构信息的同时减少 token 数量。
主要优点:
- 显著减少 token 数量
- 保留类和函数签名
- 保持导入和导出
- 保留类型定义和接口
- 移除函数体和实现细节
更多详细信息和示例,请参阅代码压缩指南。
Git 集成
output.git 配置提供强大的 Git 感知功能:
sortByChanges:当设置为 true 时,文件按 Git 更改次数(修改该文件的提交数)排序。更改次数较多的文件出现在输出的底部。这有助于优先处理更活跃开发的文件。默认值:truesortByChangesMaxCommits:计算文件更改次数时要分析的最大提交数。默认值:100includeDiffs:当设置为 true 时,在输出中包含 Git 差异(同时分别包含工作树和暂存区的更改)。这允许读者查看存储库中的待处理更改。默认值:falseincludeLogs:当设置为 true 时,在输出中包含 Git 日志。显示提交历史的日期、消息和文件路径,帮助 AI 理解哪些文件通常一起更改。默认值:falseincludeLogsCount:要包含的 Git 日志提交数量。控制用于分析开发规律的历史深度。默认值:50
配置示例:
{
"output": {
"git": {
"sortByChanges": true,
"sortByChangesMaxCommits": 100,
"includeDiffs": true,
"includeLogs": true,
"includeLogsCount": 25
}
}
}安全检查
当 security.enableSecurityCheck 启用时,Repomix 使用 Secretlint 在将代码库包含在输出中之前检测敏感信息。这有助于防止意外暴露:
- API 密钥
- 访问令牌
- 私钥
- 密码
- 其他敏感凭据
注释移除
当 output.removeComments 设置为 true 时,将从支持的文件类型中移除注释,以减少输出大小并专注于核心代码内容。这在以下情况特别有用:
- 处理大量文档化的代码
- 尝试减少 token 数量
- 专注于代码结构和逻辑
有关支持的语言和详细示例,请参阅注释移除指南。