$1.99 立即免费试用

Kimi 发布视觉思考模型 k1：试题拍照给出答题思考全过程

David 更新时间 2025年1月14日

快连VPN:速度和安全性最佳的VPN服务

免费试用了解更多

月之暗面kimi团队近期发布了全新视觉思考模型k1，这款基于强化学习的模型原生支持端到端图像理解和思维链技术，其能力已扩展至数学及其他基础科学领域。

官方基准测试结果显示，k1在数学、物理、化学等基础科学学科的测试中，表现超越了OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。

k1模型已集成至最新版Kimi智能助手Android和iOS应用以及网页版kimi.com。用户可在“Kimi视觉思考版”中上传图片或拍照进行体验，并完整查看模型的推理思维链，了解答案推导过程。

k1的训练分为预训练和强化学习后训练两个阶段。其基础模型在字符识别方面进行了重点优化，在OCRBench上取得了903分的领先成绩，并在MathVista-testmini、MMMU-val和DocVQA基准测试中分别获得69.1、66.7和96.9分。强化学习后训练阶段则在数据质量和学习效率方面进行了改进，并实现了强化学习规模化的突破。

为解决大模型行业缺乏基础科学学科图形测试集的难题，Kimi团队自主构建了标准化测试集Science Vista，并计划向全行业开放共享。

尽管k1取得了显著进展，但月之暗面也指出了其局限性，例如在分布外泛化能力、复杂问题解决成功率、抗噪声能力以及多轮问答效果等方面仍有提升空间，与OpenAI的o1系列模型相比仍存在差距。

以上就是Kimi 发布视觉思考模型 k1：试题拍照给出答题思考全过程的详细内容，更多请关注本站其它相关文章！

David

更新时间 2025年1月14日

VPN常见问题

SSID

ssid

什么是 SSID？如何查找您的 SSID？

LuLola

更新时间 2024年12月25日

上海对外经贸大学VPN

上海对外经贸大学VPN设置教程及常见问题解决

LuLola

更新时间 2024年12月12日

武汉理工VPN

武汉理工VPN常见问题解答

LuLola

更新时间 2024年12月9日

VPN

常见问题解答：VPN图标相关问题

LuLola

更新时间 2024年12月3日

中石化vpn

VPN

中石化VPN常见问题解析

LuLola

更新时间 2024年12月3日

风行VPN产品演示

VPN

风行VPN产品演示：使用指南和常见问题

LuLola

更新时间 2024年12月2日