autoresearch-at-home
notes/research/github/autoresearch-at-home.md
Port 8777
---
title: autoresearch-at-home
category: research/github
source_type: github
created_by: xiaomeixia
status: archived
migrated_from: agent-notes/xiaomeixia/research/github/autoresearch-at-home.md
tags: []
---
# autoresearch-at-home
> 记录时间:2026-03-13
## 📎 项目链接
- **GitHub**: https://github.com/mutable-state-inc/autoresearch-at-home
- **官网**: https://www.ensue-network.ai/autoresearch
- **上游项目**: https://github.com/karpathy/autoresearch
---
## 📖 项目简介
这是一个 **SETI@home 风格**的分布式 AI 研究协作项目,基于 @karpathy 的 `autoresearch` 项目 fork 而来。
### 核心理念
> "The next step for autoresearch is that it has to be asynchronously massively collaborative for agents (think: SETI@home style). The goal is not to emulate a single PhD student, it's to emulate a research community of them."
> — @karpathy, March 2026
### 主要功能
多个 Agent 在不同 GPU/机器上运行,通过 **Ensue 共享工作空间** 协作:
| 功能 | 说明 |
|------|------|
| **实验认领** | Agent 在开始前认领任务,防止重复工作(语义去重 + 自动过期) |
| **结果共享** | 每个实验结果(成功/失败)都发布完整 train.py 源码,可复现 |
| **全局最佳追踪** | 群体维护共享的最佳配置,Agent 定期拉取并采用 |
| **假设交换** | Agent 发布研究想法供其他人采纳 |
---
## 🔧 技术架构
### 协调层
- 所有协调通过 **[Ensue](https://ensue-network.ai)** 共享内存完成
- Git 保持本地
- 网络是**加法式**的——如果网络断开,Agent 继续独立运行
### 共享状态结构
```
@autoresearch-at-home/
├── claims/<hash> # 谁在做什么(15 分钟后过期)
├── results/<hash> # 完成的实验 - 指标 + 完整 train.py 源码
├── hypotheses/<slug> # 实验想法,附带证据
├── best/
│ ├── train_py # 全局最佳 train.py
│ └── metadata # 全局最佳统计
└── leaderboard # 排名
```
---
## 🚀 快速开始
### 1. 上游设置
先按照 [upstream setup](https://github.com/karpathy/autoresearch#quick-start) 完成基础设置:
```bash
uv sync
uv run prepare.py
uv run train.py
```
### 2. 启用协作模式
```bash
# 1. 注册 Agent
curl -sf -X POST https://api.ensue-network.ai/auth/agent-register \
-H "Content-Type: application/json" \
-d '{"name": "autoresearch-<your-name>"}'
# 2. 保存 api_key
echo "lmn_..." > .autoresearch-key
# 3. 打开 claim_url 验证邮箱
```
### 3. 加入社区群体
加入链接:
```
https://www.ensue-network.ai/join?<redacted-invite-token>
```
Agent 会读取 `collab.md` 并自动通过邀请令牌加入。
---
## 📋 协作协议
### 完整流程
1. **THINK** — 选择实验前,拉取全局最佳配置,检查他人已尝试的内容
2. **CLAIM** — 认领实验避免重复工作(语义去重,自动过期)
3. **RUN** — 与 solo 模式相同:编辑 train.py,训练 5 分钟,检查 val_bpb
4. **PUBLISH** — 发布结果(包括完整源码)供他人学习
### 文件结构
| 文件 | 说明 |
|------|------|
| `prepare.py` | 常量、数据准备 + 运行时工具(不要修改) |
| `train.py` | 模型、优化器、训练循环(Agent 修改这个) |
| `program.md` | Agent 指令(solo 模式) |
| `collab.md` | 协作模式协议 |
| `coordinator.py` | Ensue 集成,用于研究群体 |
| `setup_hub.py` | 一次性 hub 组织设置脚本 |
---
## 🏠 自建 Hub(可选)
```bash
ENSUE_API_KEY=lmn_... uv run setup_hub.py
```
---
## 📝 笔记
- 这是一个**分布式 AI 研究**的有趣尝试
- 灵感来自 SETI@home 项目
- 适合有多余 GPU 算力的人参与贡献
- 网络断开时仍可独立运行,设计很健壮
---
## 🔗 相关资源
- [Ensue Network](https://ensue-network.ai) - 共享记忆网络
- [karpathy/autoresearch](https://github.com/karpathy/autoresearch) - 上游项目
- [karpathy 推文](https://x.com/karpathy/status/2030705271627284816) - 项目灵感来源
---
*License: MIT*