AI Benchmark Tool 标签,匹配到约1个结果, 耗时0.0782秒
程序员自制开源 AI 评分工具,衡量大模型“愚蠢程度”

程序员自制开源 AI 评分工具,衡量大模型“愚蠢程度”

程序员自制开源 AI 评分工具,衡量大模型“愚蠢程度”
程序员ionutvi发布开源工具AI Benchmark Tool,可量化评估ChatGPT、Grok等AI模型的“愚蠢程度”,通过140项任务测试准确性、稳定性等指标,并综合价格给出性价比排名。#AI工具##开源项目#...
2025-09-18 · 浏览22次
上一页 · 下一页 · 当前第1页