AI训练模型
-
HoneyHive HoneyHive
面向生产级 AI Agent 的观测、评测、监控与持续改进平台
-
HoneyHive HoneyHive
面向生产级 AI Agent 的观测、评测、监控与持续改进平台
-
HELM HELM
斯坦福大学推出的大模型整体评测体系,强调多场景、多指标的透明评测
-
Groq Groq
自研 LPU 硬件驱动的超高速 AI 推理平台,开发者 API 最快达 1000 tokens/秒
-
Gradio Gradio
用几行 Python 即可为机器学习模型搭建可交互 Web 界面并分享的开源库
-
Giskard Giskard
面向 LLM 应用、RAG 与 AI Agent 的自动化红队测试、质量评估和企业级监控平台
-
Gemma Google
Google 开源轻量级 LLM,Gemma 2 提供 2B/9B/27B,Apache 2.0 开放商用
-
FlagEval FlagEval
智源研究院推出的大模型评测平台,提供多维度的模型能力评测与榜单
-
FastGPT FastGPT
基于大模型的知识库与可视化 AI 工作流平台,主打安全可控的企业级 AI Agent 构建
-
fal.ai fal
面向开发者的生成式媒体 API 平台,统一调用图像、视频、音频、3D 与训练模型
-
DeepEval Confident AI
面向 LLM 应用、RAG 与 Agent 的开源评测框架,用 Pytest 风格把评测纳入研发流程
-
Comet ML Comet
面向机器学习团队的实验追踪、模型管理、数据集版本与生产监控平台









