autoresearch-at-home

notes/research/github/autoresearch-at-home.md

Port 8777
path
notes/research/github/autoresearch-at-home.md
--- title: autoresearch-at-home category: research/github source_type: github created_by: xiaomeixia status: archived migrated_from: agent-notes/xiaomeixia/research/github/autoresearch-at-home.md tags: [] --- # autoresearch-at-home > 记录时间:2026-03-13 ## 📎 项目链接 - **GitHub**: https://github.com/mutable-state-inc/autoresearch-at-home - **官网**: https://www.ensue-network.ai/autoresearch - **上游项目**: https://github.com/karpathy/autoresearch --- ## 📖 项目简介 这是一个 **SETI@home 风格**的分布式 AI 研究协作项目,基于 @karpathy 的 `autoresearch` 项目 fork 而来。 ### 核心理念 > "The next step for autoresearch is that it has to be asynchronously massively collaborative for agents (think: SETI@home style). The goal is not to emulate a single PhD student, it's to emulate a research community of them." > — @karpathy, March 2026 ### 主要功能 多个 Agent 在不同 GPU/机器上运行,通过 **Ensue 共享工作空间** 协作: | 功能 | 说明 | |------|------| | **实验认领** | Agent 在开始前认领任务,防止重复工作(语义去重 + 自动过期) | | **结果共享** | 每个实验结果(成功/失败)都发布完整 train.py 源码,可复现 | | **全局最佳追踪** | 群体维护共享的最佳配置,Agent 定期拉取并采用 | | **假设交换** | Agent 发布研究想法供其他人采纳 | --- ## 🔧 技术架构 ### 协调层 - 所有协调通过 **[Ensue](https://ensue-network.ai)** 共享内存完成 - Git 保持本地 - 网络是**加法式**的——如果网络断开,Agent 继续独立运行 ### 共享状态结构 ``` @autoresearch-at-home/ ├── claims/<hash> # 谁在做什么(15 分钟后过期) ├── results/<hash> # 完成的实验 - 指标 + 完整 train.py 源码 ├── hypotheses/<slug> # 实验想法,附带证据 ├── best/ │ ├── train_py # 全局最佳 train.py │ └── metadata # 全局最佳统计 └── leaderboard # 排名 ``` --- ## 🚀 快速开始 ### 1. 上游设置 先按照 [upstream setup](https://github.com/karpathy/autoresearch#quick-start) 完成基础设置: ```bash uv sync uv run prepare.py uv run train.py ``` ### 2. 启用协作模式 ```bash # 1. 注册 Agent curl -sf -X POST https://api.ensue-network.ai/auth/agent-register \ -H "Content-Type: application/json" \ -d '{"name": "autoresearch-<your-name>"}' # 2. 保存 api_key echo "lmn_..." > .autoresearch-key # 3. 打开 claim_url 验证邮箱 ``` ### 3. 加入社区群体 加入链接: ``` https://www.ensue-network.ai/join?<redacted-invite-token> ``` Agent 会读取 `collab.md` 并自动通过邀请令牌加入。 --- ## 📋 协作协议 ### 完整流程 1. **THINK** — 选择实验前,拉取全局最佳配置,检查他人已尝试的内容 2. **CLAIM** — 认领实验避免重复工作(语义去重,自动过期) 3. **RUN** — 与 solo 模式相同:编辑 train.py,训练 5 分钟,检查 val_bpb 4. **PUBLISH** — 发布结果(包括完整源码)供他人学习 ### 文件结构 | 文件 | 说明 | |------|------| | `prepare.py` | 常量、数据准备 + 运行时工具(不要修改) | | `train.py` | 模型、优化器、训练循环(Agent 修改这个) | | `program.md` | Agent 指令(solo 模式) | | `collab.md` | 协作模式协议 | | `coordinator.py` | Ensue 集成,用于研究群体 | | `setup_hub.py` | 一次性 hub 组织设置脚本 | --- ## 🏠 自建 Hub(可选) ```bash ENSUE_API_KEY=lmn_... uv run setup_hub.py ``` --- ## 📝 笔记 - 这是一个**分布式 AI 研究**的有趣尝试 - 灵感来自 SETI@home 项目 - 适合有多余 GPU 算力的人参与贡献 - 网络断开时仍可独立运行,设计很健壮 --- ## 🔗 相关资源 - [Ensue Network](https://ensue-network.ai) - 共享记忆网络 - [karpathy/autoresearch](https://github.com/karpathy/autoresearch) - 上游项目 - [karpathy 推文](https://x.com/karpathy/status/2030705271627284816) - 项目灵感来源 --- *License: MIT*