MoganLab · jetjinser · Feb 12, 2026
diff --git a/docs/coroutine_design.md b/docs/coroutine_design.md
@@ -0,0 +1,69 @@
+# Goldfish 协程设计文档
+
+## 当前实现
+
+### 架构图
+
+```
+┌─────────────────────────────────────────────────────────────┐
+│                      主线程 (Main Thread)                    │
+│  ┌─────────────────────────────────────────────────────┐   │
+│  │              Scheme 代码执行环境                     │   │
+│  │  • 所有 s7_call() 在这里执行                        │   │
+│  │  • 保证线程安全（无竞争条件）                        │   │
+│  └─────────────────────────────────────────────────────┘   │
+│                          │                                  │
+│  ┌───────────────────────┼───────────────────────┐         │
+│  │                       │                       │         │
+│  ▼                       ▼                       ▼         │
+│ g_coroutine-run    g_http-async-get      g_coroutine-wait  │
+│ (任务队列)            (I/O 并发)            (处理回调)      │
+└─────────────────────────────────────────────────────────────┘
+                           │
+                           │ marl::schedule()
+                           ▼
+┌─────────────────────────────────────────────────────────────┐
+│              marl 调度器 (4 个 worker 线程)                  │
+│                                                             │
+│  ┌─────────────┐  ┌─────────────┐  ┌─────────────────────┐ │
+│  │  Fiber 1    │  │  Fiber 2    │  │  Fiber 3 (HTTP)     │ │
+│  │ g_coroutine │  │ g_coroutine │  │ future->get()       │ │
+│  │ -sleep 等待 │  │ -sleep 等待 │  │ 等待 HTTP 响应       │ │
+│  └─────────────┘  └─────────────┘  └─────────────────────┘ │
+│                                                             │
+│  • Fiber 可以在 I/O 等待时让出执行权                        │
+│  • 但 Scheme 代码始终在主线程执行                           │
+└─────────────────────────────────────────────────────────────┘
+```
+
+## 两个层面的"异步"
+
+### 1. Scheme 代码层面（当前：顺序）
+
+```scheme
+(g_coroutine-run (lambda () (do-work-1)))  ; 加入队列
+(g_coroutine-run (lambda () (do-work-2)))  ; 加入队列
+(g_coroutine-wait)                          ; 顺序执行
+```
+
+**结果**: work-1 和 work-2 在主线程顺序执行
+
+### 2. C++ I/O 层面（真正并发）
+
+```scheme
+(g_http-async-get url1 '() callback1)  ; 创建 fiber，立即返回
+(g_http-async-get url2 '() callback2)  ; 创建 fiber，立即返回
+(g_coroutine-sleep 0.1)                ; 让出，允许 fiber 运行
+(g_coroutine-wait)                      ; 处理完成的回调
+```
+
+**结果**: HTTP 请求在后台并发执行
+
+## 结论
+
+Goldfish 的协程设计是：**Scheme 代码单线程，C++ I/O 多线程并发**。
+
+这是为了平衡：
+- 安全性（避免 s7 线程问题）
+- 实用性（HTTP 并发是最常见的需求）
+- 简单性（不需要复杂的锁机制）
diff --git a/docs/cpr_thread_pool_analysis.md b/docs/cpr_thread_pool_analysis.md
@@ -0,0 +1,178 @@
+# CPR 线程池与 Marl 协程的交互分析
+
+## CPR 的异步实现机制
+
+根据 issue 描述，CPR 的异步实现基于：
+
+1. **线程池**：最小 1 个线程，最大 = CPU 核心数
+2. **实现方式**：每个请求占用一个线程进行 `poll` 等待
+3. **限制**：并发请求数受限于 CPU 核心数
+
+## 我们的实现方式
+
+```cpp
+// f_http_async_get 实现
+auto future = std::make_shared<cpr::AsyncResponse>(cpr::GetAsync(cpr::Url(url)));
+
+marl::schedule([sc, callback, gc_loc, future]() mutable {
+    cpr::Response r = future->get();  // 在 marl fiber 中阻塞等待
+    // ... 回调
+});
+```
+
+## 交互分析
+
+### 场景：CPU 4 核心，发起 6 个并发 HTTP 请求
+
+```
+CPR 线程池（4 线程）          Marl 调度器（4 fiber）
+       │                             │
+       ├─ 请求 1 ── 线程 1 ──────────┼─ Fiber 1 ── future->get() [等待]
+       ├─ 请求 2 ── 线程 2 ──────────┼─ Fiber 2 ── future->get() [等待]
+       ├─ 请求 3 ── 线程 3 ──────────┼─ Fiber 3 ── future->get() [等待]
+       ├─ 请求 4 ── 线程 4 ──────────┼─ Fiber 4 ── future->get() [等待]
+       │                             │
+       ├─ 请求 5 ── [等待线程池] ────┼─ Fiber 5 ── future->get() [阻塞]
+       ├─ 请求 6 ── [等待线程池] ────┼─ Fiber 6 ── future->get() [阻塞]
+```
+
+**问题**：
+- CPR 线程池满了（4/4），请求 5、6 在 CPR 队列中等待
+- Marl fiber 5、6 也在等待 `future->get()`
+- 即使 Marl 有更多调度能力，也被 CPR 的线程池限制了
+
+### 测试结果解释
+
+之前的测试结果：
+```
+Total time: 3.9 seconds
+Expected if concurrent: ~2.0 seconds
+```
+
+原因：
+- 请求 1 (/get, ~0.3s): 立即执行
+- 请求 2 (/delay/1, ~1s): 立即执行
+- 请求 3 (/delay/2, ~2s): 立即执行
+- 但只有 3 个 CPR 线程可用（假设测试机是 4 核，可能其他线程被占用）
+- 如果 CPU 核心数更少，并发度会更低
+
+## 优化建议
+
+### 方案 1：增加 CPR 线程池大小（如果 CPR 支持）
+
+检查 CPR 是否允许自定义线程池大小：
+
+```cpp
+// 理想情况下
+cpr::async::setThreadPoolSize(100);  // 如果 CPR 支持
+```
+
+**现状**：CPR 似乎**不支持**自定义线程池大小，线程池是全局的且固定为 CPU 核心数。
+
+### 方案 2：直接使用 libcurl 的多路复用
+
+绕过 CPR，直接使用 libcurl 的 `CURLM`（multi interface）：
+
+```cpp
+// 使用 curl_multi_* API
+CURLM* multi_handle = curl_multi_init();
+curl_multi_add_handle(multi_handle, handle1);
+curl_multi_add_handle(multi_handle, handle2);
+// ...
+
+// 在 marl fiber 中等待
+marl::schedule([sc, callback]() {
+    int running_handles;
+    while (curl_multi_perform(multi_handle, &running_handles) == CURLM_CALL_MULTI_PERFORM);
+
+    // 使用 curl_multi_poll 等待（更高效）
+    curl_multi_poll(multi_handle, NULL, 0, 1000, NULL);
+
+    // 完成后回调
+    queue_callback(sc, callback, response);
+});
+```
+
+**优点**：
+- 真正的单线程多路复用（epoll/kqueue/IOCP）
+- 不受线程池大小限制
+- 可以同时处理数千个连接
+
+**缺点**：
+- 需要额外实现，不再使用 CPR 的便利接口
+
+### 方案 3：使用 CPR 的同步接口 + Marl 线程池
+
+既然 CPR 的异步也是用线程池，不如直接用同步 + marl：
+
+```cpp
+// 创建更多 marl 线程，每个运行同步 CPR
+marl::Scheduler::Config config;
+config.setWorkerThreadCount(100);  // 大量线程
+
+g_coroutine-scheduler-start 100
+
+// 每个请求在一个 fiber 中运行同步 get
+(g_coroutine-run (lambda ()
+  (let ((r (g_http-get url params)))
+    (callback r))))
+```
+
+**问题**：
+- 大量线程开销大
+- 不是真正的协程/异步
+- 浪费内存
+
+### 方案 4：混合模式（推荐）
+
+少量 CPR 异步请求 + 大量快速连接：
+
+```cpp
+// 对于少量重要请求，使用 CPR 异步（保证完成）
+(g_http-async-get slow-url params callback)
+
+// 对于大量快速请求，考虑使用专门的连接池
+```
+
+## 当前实现的影响
+
+### 对用户的影响
+
+```scheme
+; 用户以为这 10 个请求是并发的
+(dotimes (i 10)
+  (g_http-async-get (format "https://api.example.com/item/~a" i) 
+                    '() 
+                    callback))
+
+; 实际行为：
+; - 如果 CPU 是 4 核，只有 4 个请求真正并发
+; - 其他 6 个在 CPR 队列中等待
+; - 总时间 = (最慢的 4 个) + (剩下的 6 个分批)
+```
+
+### 文档应该说明
+
+```markdown
+## 并发限制
+
+`g_http-async-get` 的并发度受限于：
+1. **CPR 线程池大小**：默认为 CPU 核心数
+2. **网络带宽**
+3. **远程服务器限制**
+
+如果需要更高的并发度（如 100+ 并发连接），建议使用专门的 HTTP 客户端库。
+```
+
+## 结论
+
+CPR 的设计选择（线程池 = CPU 核心数）限制了我们的异步 HTTP 并发能力。
+
+### 短期（当前实现）
+- ✅ 适合少量并发请求（< CPU 核心数）
+- ✅ 代码简单，易于维护
+- ⚠️ 不适合高并发场景（100+ 请求）
+
+### 长期改进
+- 考虑直接使用 libcurl multi interface
+- 或寻找支持高并发的 C++ HTTP 客户端库
diff --git a/docs/http_concurrency_options.md b/docs/http_concurrency_options.md
@@ -0,0 +1,137 @@
+# HTTP 并发方案选择指南
+
+## 问题背景
+
+CPR 库使用固定大小的线程池（默认 = CPU 核心数）来实现异步 HTTP。这意味着：
+- 4 核 CPU：最多 4 个并发请求
+- 8 核 CPU：最多 8 个并发请求
+
+如果需要更高的并发度（如 100+），需要使用替代方案。
+
+## 方案对比
+
+### 方案 1：当前实现（CPR + Marl）
+
+```scheme
+(g_http-async-get url params callback)
+```
+
+**适用场景**：
+- ✅ 少量并发请求（< CPU 核心数）
+- ✅ 简单的 API 调用
+- ✅ 不需要极致性能
+
+**限制**：
+- ❌ 并发度受限于 CPU 核心数
+- ❌ 不适合高并发爬虫/压测
+
+---
+
+### 方案 2：直接使用 libcurl multi（推荐用于高并发）
+
+如果需要 100+ 并发连接，可以实现基于 libcurl multi 的版本：
+
+```cpp
+// 伪代码 - 需要实际实现
+static s7_pointer
+f_http_multi_get (s7_scheme* sc, s7_pointer args) {
+    // 使用 curl_multi_* API
+    // 真正的单线程多路复用（epoll/kqueue/IOCP）
+    // 可以处理数千个并发连接
+}
+```
+
+**优点**：
+- ✅ 真正的单线程多路复用
+- ✅ 不受线程池限制
+- ✅ 1000+ 并发连接
+
+**缺点**：
+- ❌ 需要额外实现
+- ❌ 不能使用 CPR 的便利接口
+
+---
+
+### 方案 3：连接池模式
+
+为特定场景（如数据库连接、微服务调用）维护持久连接：
+
+```scheme
+; 创建一个连接池（最多 100 个连接）
+(define pool (g_http-pool-create "https://api.example.com" 100))
+
+; 使用连接池发送请求
+(g_http-pool-get pool "/endpoint" params callback)
+```
+
+---
+
+## 当前建议
+
+### 对于普通用户
+
+继续使用 `g_http-async-get`：
+
+```scheme
+; 适合大多数场景
+(g_coroutine-scheduler-start 4)
+
+(g_http-async-get "https://api.example.com/user/1" '() callback1)
+(g_http-async-get "https://api.example.com/user/2" '() callback2)
+(g_http-async-get "https://api.example.com/user/3" '() callback3)
+```
+
+### 对于高并发需求
+
+**当前 workaround**：手动分批
+
+```scheme
+; 如果 CPU 是 4 核，每批发 4 个请求
+(define (batch-requests urls batch-size callback)
+  (let loop ((remaining urls)
+             (current-batch '()))
+    (cond
+      ; 当前批次已满，等待完成
+      ((= (length current-batch) batch-size)
+       (wait-for-batch current-batch)
+       (loop remaining '()))
+
+      ; 还有 URL，加入当前批次
+      ((not (null? remaining))
+       (let ((url (car remaining)))
+         (g_http-async-get url '() callback)
+         (loop (cdr remaining) (cons url current-batch))))
+
+      ; 处理最后一批
+      ((not (null? current-batch))
+       (wait-for-batch current-batch))
+
+      ; 全部完成
+      (else 'done))))
+```
+
+**长期方案**：如果需要真正的高并发，考虑：
+1. 使用专门的 HTTP 客户端库（如基于 libcurl 的自定义实现）
+2. 使用外部工具（如 `wrk`, `ab`）进行压测
+3. 考虑其他语言/运行时（如 Go, Node.js）专门处理高并发 I/O
+
+---
+
+## 文档更新建议
+
+在 `g_http-async-get` 的文档中添加：
+
+```markdown
+### 并发限制
+
+`g_http-async-get` 使用底层 CPR 库实现异步 HTTP。CPR 使用固定大小的线程池
+（默认等于 CPU 核心数），因此并发请求数受限于 CPU 核心数。
+
+示例：
+- 4 核 CPU：最多 4 个并发请求
+- 8 核 CPU：最多 8 个并发请求
+
+如果需要更高的并发度（如 100+），请考虑：
+1. 使用外部 HTTP 客户端工具
+2. 实现基于 libcurl multi 的自定义方案
+```