跳至內容

Kimi 發佈視覺思考模型 k1:試題拍照給出答題思考全過程

更新時間
快连VPN:速度和安全性最佳的VPN服务
快连VPN:速度和安全性最佳的VPN服务

月之暗面kimi團隊近期發佈了全新視覺思考模型k1,這款基於強化學習的模型原生支持端到端圖像理解和思維鏈技術,其能力已擴展至數學及其他基礎科學領域。

官方基準測試結果顯示,k1在數學、物理、化學等基礎科學學科的測試中,表現超越了OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。

k1模型已集成至最新版Kimi智能助手Android和iOS應用以及網頁版kimi.com。用戶可在“Kimi視覺思考版”中上傳圖片或拍照進行體驗,並完整查看模型的推理思維鏈,瞭解答案推導過程。

k1的訓練分爲預訓練和強化學習後訓練兩個階段。其基礎模型在字符識別方面進行了重點優化,在OCRBench上取得了903分的領先成績,並在MathVista-testmini、MMMU-val和DocVQA基準測試中分別獲得69.1、66.7和96.9分。強化學習後訓練階段則在數據質量和學習效率方面進行了改進,並實現了強化學習規模化的突破。

爲解決大模型行業缺乏基礎科學學科圖形測試集的難題,Kimi團隊自主構建了標準化測試集Science Vista,並計劃向全行業開放共享。

儘管k1取得了顯著進展,但月之暗面也指出了其侷限性,例如在分佈外泛化能力、複雜問題解決成功率、抗噪聲能力以及多輪問答效果等方面仍有提升空間,與OpenAI的o1系列模型相比仍存在差距。

以上就是Kimi 發佈視覺思考模型 k1:試題拍照給出答題思考全過程的詳細內容,更多請關注本站其它相關文章!

更新時間

發表留言

請注意,留言須先通過審核才能發佈。