首页 > 活动线报 > 每日福利 > 谷歌Gemini“悄悄变强”,快速缩小与GPT-4o差距,中文更是完成了超越

谷歌Gemini“悄悄变强”,快速缩小与GPT-4o差距,中文更是完成了超越

发布时间:2024-05-31 23:02:25来源: 15210273549

尽管亮相时被OpenAI压了一头,但谷歌一直在悄悄迭代Gemini大模型,和OpenAI最新大模型GPT-4o的差距已经显著缩小。最新测试结果显示,Gemini 1.5 Pro/Advanced在综合测试中排名第 2,逼近GPT-4o,轻量版Gemini 1.5 flash排名第9,超越 Llama-3-70b,接近GPT-4。

相比4月份的版本,Gemini Pro和Flash的能力有明显加强。且上下文长度可以达到100万token,远远超出GPT-4的12.8万token。

Gemini的中文能力更是惊艳,在中文测试中,Gemini Pro和Advanced双双超越GPT-4o,分别排在第一、第二位。

此外,在Hard Prompts测试中,Gemini同样名列前茅。在Hard Prompts测试中,大模型需要面对那些更具挑战性的问题,Gemini 1.5 Pro在这一测试中排名第二,仅次于GPT-4o.

从大模型置信区间(Confidence Intervals)来看,Gemini的测试结果也名列前茅。

每日福利更多>>

索尼FX2沿用104万像素屏幕,FX3A升级236万像素 小米YU7进店展示引年轻群体热捧,首发或需抢购 爱否开物AKAVO爱否砂岩导热手机壳OPPO Find X8 Ultra款促销 ATFX港股:小米一季度净利翻倍增长,营收连续两个季度破千亿 小米15周年发布会:玄戒芯片驱动“人车家”全生态战略升维 同档唯一骁龙8至尊版双芯!iQOO Neo10 Pro+评测:2K/144FPS爽玩吃鸡 三星已开启 One UI 8.0 Beta 计划:基于 Android 16,Galaxy S25 系列率先体验 索尼 WH-1000XM6 评测:适合几乎所有人的最佳无线耳机 “你敢信千元机也有旗舰体验”!红米Turbo4Pro一个月使用体验 独家透明新生设计,真我Neo7 Turbo配置曝光 一季度净利增六成,小米总裁:SU7一个能打的对手都没有 三星拟退出MLC NAND业务,6月停产 光影兵器谱:2025年五大单反相机战力全解析 2025年索尼微单相机终极指南!10款闭眼入,入门到专业一篇通关 最新|上海2025年4月二手房行情解读 纠结买新房还是二手房?一文讲透优劣势,附避坑指南不后悔 红米Turbo4 Pro和小米Civi5 Pro搭载骁龙8sGen4,为啥差价有1100元 疑似三星 Galaxy Z Fold7 折叠旗舰真机图现身 补贴后为3000元,华为nova 14 Pro大概率成618黑马,五大升级强悍 华为鸿蒙电脑评测:三倍流畅碾压Windows!折叠屏+星闪黑科技真强悍 2025年华硕天选6Pro和ROG枪神9能不能干过联想拯救者Y9000P? 小米自研3nm芯片对标苹果,未来将投入超2000亿 2025年最适合学生党的五款高性价比笔记本电脑推荐 小米15周年!搭载首款自主研发设计3nm旗舰处理器玄戒O1的小米15S Pro等产品发布 小米举办十五周年战略新品发布会:自研芯片玄戒O1与首款SUV YU7正式亮相 7620mAh+190W,vivo刚发布的新机仅售1487元,太狠了 vivo最新vivo S30系列颜值爆表,三丽鸥梦幻联动上线 荣耀登上热搜前排:官宣全球代言人肖战,粉丝晒单霸屏 618 电视选购不纠结!TCL T7L Pro深度体验报告 红米发力618,2K直屏+骁龙8至尊版,16GB+512GB从4299降至2999