相关结果约57个
scs.me相关信息
2025-04-17 12:55:52 - 本周OpenAI还在API中引入GPT-4.1系列模型,GPT-4.1的性能超过GPT-4o。随着GPT-4.1推出,OpenAI准备弃用今年2月刚面世的GPT-4.5预览版。
2025-04-21 07:56:20 - 作为OpenAI目前最强的推理模型,o3在Codeforces、SWE-bench和MMMU等基准测试中创下了新的 SOTA;o4-mini 则是经济高效的小型模型,尤其在数学、编程和视觉任务方面表现较好,在AIME 2024和2025,以及Codeforces基准测试中表现甚至超过
2025-04-17 09:15:07 - 本周是OpenAI新品爆发的一周,周二4月15日,OpenAI刚刚正式推出GPT-4.1系列模型,包括标准版GPT-4.1、轻量高效的GPT-4.1 mini和超小型性价比之选GPT-4.1 nano。
2025-04-17 07:34:25 - 据最新测试结果,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,在Codeforces编程竞赛评分中,o3和o4-mini分别取得了2706和2719的ELO分数,显示出在复杂数学与代码任务中的强大推理与执行能力。
2025-04-17 12:24:56 - 值得注意的是,在推出o3系列最新模型的前一天,OpenAI还推出三款GPT-4.1系列模型,包含标准版GPT-4.1、轻量款GPT-4.1mini,以及超小型版本GPT-4.1nano。
2025-04-17 10:05:45 - 根据OpenAI公布的测试数据显示,o4-mini在AIME 2024和2025中,分别达到了93.4%和92.7%,比满血版o3还强,成为目前准确率最高的模型;在Codeforces测试中达到了2700分,成为全球前200名最强程序员。
2025-03-27 15:51:30 - 华荣股份(603855.SH)3月27日在投资者互动平台表示,公司基于生产经营需要进行CMMI成熟度认证,如有认证升级,公司会在定期报告中披露。谢谢!
2025-03-26 17:35:12 - 目前,实验版Gemini 2.5 Pro在GPQA和AIME 2025等多项基准测试任务中取得了优异成绩,并以39分的显著优势在测试人类偏好的大模型竞技场Chatbot Arena榜上排名第一,超越了Grok-3和GPT-4.5.
123>   跳转