AI训练模型
-
H2O EvalGPT EvalGPT
H2O.ai 推出的、基于 Elo 评级方法的大模型评估系统
-
Comet ML Comet
面向机器学习团队的实验追踪、模型管理、数据集版本与生产监控平台
-
Predibase Predibase
面向企业的开源大模型微调与推理基础设施,覆盖适配器训练、部署监控和 Rubrik Agent Cloud 能力底座
-
Cohere AIStartMap
Cohere 面向业务与内容场景提供 AI 能力,强调可落地效率与可持续迭代
-
Patronus AI Patronus AI
面向企业 AI 团队的模型与 Agent 评测优化平台,覆盖实验、日志、追踪、评测模型和安全护栏
-
CMMLU CMMLU
综合性中文大模型评估基准,覆盖多领域知识,衡量模型在中文语境下的知识与推理
-
OpenRouter AIStartMap
OpenRouter 面向业务与内容场景提供 AI 能力,强调可落地效率与可持续迭代
-
OpenPipe OpenPipe
面向开发者的 LLM 微调、评估与 Agent 强化学习平台
-
Cerebras Inference Cerebras
面向开发者和企业的超高速大模型推理 API 与专属端点服务
-
C-Eval C-Eval
面向中文大模型的多层次多学科评估套件,含 13948 道题、覆盖 52 个学科
-
OpenCompass OpenCompass
上海人工智能实验室推出的开源大模型评测体系
-
BigModel BigModel
智谱 GLM 系列大模型的开放平台,提供 API、智能体、MCP、微调与私有化部署











