HELM

斯坦福大学推出的大模型评测体系

1k 热度 AI模型评测

软件新闻

暂无相关新闻。

使用指南

你可能还感兴趣

Pi Copilot

用于构建LLMs自定义评估和评分系统的AI平台。

Maxim AI

Comprehensive platform for AI evaluation and observability.

Rival

Interactive platform for comparing AI model capabilities.

EvalsOne

Streamline prompt evaluation for AI models.

Non finito

Model evaluation and sharing made simple.