1. 智谱清言
- 平台地址: https://www.bigmodel.cn/
- API请求地址: https://open.bigmodel.cn/api/paas/v4/chat/completions
- 免费模型: GLM-4-Flash
- Tokens: 无限
- 建议最大线程数: 50
- 模型简介: 不限量使用,支持200线程并发
- 备注: 并发策略详见:https://www.bigmodel.cn/dev/howuse/rate-limits
2. 科大讯飞
- 平台地址: https://console.xfyun.cn/services/cbm
- API请求地址: https://spark-api-open.xf-yun.com/v1/chat/completions
- 免费模型: lite
- Tokens: 无限
- 建议最大线程数: 1
- 模型简介: 不限量但限速(QPS=2),需实名认证后免费使用
- 备注: 实名认证入口:https://console.xfyun.cn/user/authentication
3. 腾讯混元
- 平台地址: https://console.cloud.tencent.com/hunyuan/api-key
- API请求地址: https://api.hunyuan.cloud.tencent.com/v1/chat/completions
- 免费模型: hunyuan-lite
- Tokens: 无限
- 建议最大线程数: 5
- 模型简介: 限速5次/秒调用
- 备注: API使用指南参考:https://cloud.tencent.com/document/product/1729/101848
4. DeepSeek本地部署
- 部署图文教程:http://www.ruoshou.com/knowledge/13.html
- 平台地址: https://ollama.com/
- API请求地址: http://localhost:11434/v1/chat/completions
- 免费模型: deepseek-r1
- Tokens: 无限
- 建议最大线程数: 根据本地配置调整
- 模型简介: 完全免费,需自行部署至本地环境
- 备注: 无额外限制,性能依赖硬件资源
5. 通义千问
- 平台地址: https://bailian.console.aliyun.com/
- API请求地址: https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
- 免费模型:
- qwen2.5-1.5b-instruct(限时免费)
- qwen2.5-0.5b-instruct
- qwen2-1.5b-instruct
- qwen2-0.5b-instruct
- qwen1.5-1.8b-chat
- qwen1.5-0.5b-chat
- qwen-1.8b-chat
- Tokens: 部分模型限时免费,需实时确认
- 建议最大线程数: 1
- 模型简介: 限速QPM=60,不同模型规格差异较大
- 备注:模型列表与限速策略详见 模型广场:https://help.aliyun.com/zh/model-studio/getting-started/models
风险提示: 通义千问模型存在今天免费、明天收费导致账号欠费情况,使用前务必确认费用状态