Compare model candidates using weighted metrics and deterministic ranking outputs. Use for benchmark leaderboards and model promotion decisions.
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 ml-model-eval-benchmark-1776296784 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 ml-model-eval-benchmark-1776296784 技能
skillhub install ml-model-eval-benchmark-1776296784
文件大小: 3.52 KB | 发布时间: 2026-4-16 17:58