API 可以开多少并发？ - weelinking文档

weelinking 的并发限制（Rate Limit）是针对模型维度的，而不是针对账号维度的。这意味着不同模型有独立的并发池。

并发策略

绝大多数文本模型（如 GPT-3.5, GPT-4o mini, Claude 3 Haiku 等）支持极高的并发。

默认并发： 50 RPM (Requests Per Minute) / 50 QPS (Queries Per Second) - 注：具体视模型而定，通常文本模型不做严格限制，除非滥用。
适用场景： 高频对话、批量翻译、数据处理。

由于图像生成涉及大量数据传输（Base64），并发限制相对严格。

此类模型处理时间长，通常采用异步回调模式，并发限制主要取决于任务排队长度。

这意味着您瞬间发起的请求过多，超过了系统保护阈值。

如果您有企业级业务需求，需要更高的并发配额（如每秒数百次请求），请联系客服申请。我们会根据您的实际使用情况和充值额度为您开通企业专线或独立部署通道。