近日,上海 AI 实验室宣布推出书生·万象InternVL2.5模型。这款开源多模态大型语言模型以其卓越的性能,成为首个在多模态理解基准(MMMU)上超过70%准确率的开源模型,与商业模型如GPT-4o和Claude-3.5-Sonnet等的性能相媲美。
InternVL2.5模型通过链式思考(CoT)推理技术实现了3.7个百分点的提升,展现了强大的测试时间可扩展性潜力。该模型基于InternVL2.0进一步发展,通过增强训练和测试策略以及提高数据质量来进一步提升性能。在视觉编码器、语言模型、数据集大小和测试时间配置等方面进行了深入研究,以探索模型规模与性能之间的关系。
声明:《书生·万象多模态大模型InternVL 2.5开源 性能媲美GPT-4o》内容参考资料AIbase基地,不代表本站观点或立场。如有关于作品内容、版权或其它问题,可与本站联系反馈。