AI 推理的计算高效层
世界无法以足够快的速度构建计算以满足人工智能需求。所以我们走了一条不同的路。 ZeroGPU 是人工智能基础设施,由在混合边缘网络上运行的小语言模型提供支持,重复使用现有的计算。并非每个任务都需要前沿模型。我们专门构建的边缘优化模型的运行速度提高了 10 倍,成本降低了 50%,并将 70-80% 的生产任务转移给具有前沿精度的小型模型。
还没有人点赞