适用于移动设备的超高效 1.3B 视觉语言模型
MiniCPM-V 4.6 是一个开放的 MLLM,用于手机和消费类硬件上的图像和视频理解,具有混合 4x/16x 视觉令牌压缩、iOS/Android/HarmonyOS 演示,并支持 vLLM、SGLang、llama.cpp 和 Ollama。
还没有人点赞