AI 整体在人类最后考试中获得第一名
每个法学硕士都会产生幻觉。他们只是不会产生同样的幻觉。 Sup AI 并行运行多个 LLM(总共 339 个),然后通过测量每个细分的置信度来综合答案。高熵 = 可能是幻觉,权重降低。低熵 = 可能准确、放大。结果:Humanity 期末考试得分为 52.15%,比任何个人模型领先 7.41 分。 10 美元入门积分。卡已验证。没有自动充电。
还没有人点赞