8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜deepmind研发的新王新超gemini 1.5 pro 实验版 (0801)在chatbot arena排名登顶,超越gpt 4o和claude-3.5夺得第一。登基度更
这是新王新超继今年3月claude 3 “超大杯”opus版本短暂超越gpt-4以来,openai第二次让出chatbot arena的登基度更overall ranking宝座。
gemini 1.5 pro 实验版 (0801)在chatbot arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在chatbot arena和vision leaderboard排名上均取得了第一名的登基度更好成绩。之前说gpt-4o有刷分技巧,新王新超现在看起来gemini 1.5 pro可能也学到了这个技巧呢。登基度更
gemini 1.5 pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。
gemini 1.5 pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。
从总体胜率图上,也能看出gemini 1.5 pro 实验版 (0801)实力强劲,对阵 gpt-4o 的胜率为 54%,对阵 claude-3.5-sonnet 的胜率为 59%。
前openai的开发者,现google ai studio的产物负责人logan kilpatrick火速转发,向大家宣布gemini 1.5 pro 实验版(0801)目前在 lmsys 的文本和多模式排名中均位居第一的好消息。
deepmind的ceo demis hassabis也转发了这条消息,祝贺gemini 1.5 pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 ai studio上进行试用。
带领研发gemini的jeff dean也随后转发,对此次实验版本的gemini 1.5 pro突破1300 elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。
听闻这则消息,其他从业人员也纷纷发来祝贺。
也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 gpt-4o 和 claude 3.5 sonnet的gemini 1.5 pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,gemini 1.5 pro强大的图像和pdf提取能力给他留下了深刻的印象,gemini 1.5 pro有着和gpt-4o不相上下的视觉能力,也有claude 3.5 sonnet接近的代码生成及pdf理解/推理能力。
有人认为gemini 1.5 pro在解决高级数学难题方面表现相当不错。
也有人说gemini 1.5 pro在图像识别植物和动物方面做得确实要比gpt 4o更好。
也有更多的人在期待gemini 1.5 pro这一版本的正式上线,希望能够api实现gemini 1.5 pro的实际运用。
大家对gemini 1.5 pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。