MiniCPM-V 4.5

手机上的GPT-4o级别视觉模型

2025-08-26

MiniCPM-V 4.5
MiniCPM-V 4.5 是一款新的 80 亿参数开源多模态大语言模型,能在手机上提供媲美 GPT-4o 的性能。它在图像、视频和文档理解方面表现出色,在 OCRBench 等关键基准测试中超越了顶级闭源模型。
MiniCPM-V 4.5 是一个拥有 80 亿参数的开源多模态语言模型,专为在移动设备上高效运行而设计。它在处理图像、视频和文档方面提供 GPT-4o 级别的性能,在 OCRBench 和 OpenCompass 等基准测试中超越了众多专有和更大的开源模型。该模型具备先进功能,包括高分辨率图像处理、支持高达 10FPS 理解的高效视频压缩,以及超过 30 种语言的支持。它还包含可控的快速/深度思考模式,用于适应性解决问题,以及强大的 OCR 和文档解析能力。易于集成,它支持在 iOS 和其他平台上的本地推理、微调和 Web 演示,是开发者和研究人员的多功能工具。
Open Source Artificial Intelligence Development