相关结果约572个
搜索范围
2025-04-17 12:55:52 - 本周OpenAI还在API中引入GPT-4.1系列模型,GPT-4.1的性能超过GPT-4o。随着GPT-4.1推出,OpenAI准备弃用今年2月刚面世的GPT-4.5预览版。
2025-04-17 09:15:07 - 据最新测试结果,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,在Codeforces编程竞赛评分中,o3和o4-mini分别取得了2706和2719的ELO分数,显示出在复杂数学与代码任务中的强大推理与执行能力。
2025-04-17 07:34:25 - 据最新测试结果,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,在Codeforces编程竞赛评分中,o3和o4-mini分别取得了2706和2719的ELO分数,显示出在复杂数学与代码任务中的强大推理与执行能力。
2025-04-21 07:56:20 - 作为OpenAI目前最强的推理模型,o3在Codeforces、SWE-bench和MMMU等基准测试中创下了新的 SOTA;o4-mini 则是经济高效的小型模型,尤其在数学、编程和视觉任务方面表现较好,在AIME 2024和2025,以及Codeforces基准测试中表现甚至超过
2025-04-24 15:15:25 - OpenAI首席执行官山姆·奥尔特曼表示,付费用户的o3、o4-mini-high模型消息数量限制已放宽一倍。
2025-04-29 08:14:54 - 其中苹果(AAPL.US)、亚马逊(AMZN.US)、可口可乐(KO.US)、礼来(LLY.US)、Meta(META.US)、微软(MSFT.US)和雪佛龙(CVX.US)等巨头最受瞩目。   FactSet数据显示第一季度财报结果普遍稳健。
2025-04-21 08:56:18 - 根据ARC Prize Foundation(一个测试过o3预发布版本的组织)在X上的一篇文章,公开发布的o3模型和预发布版本“是一个不同的模型……针对聊天/产品使用进行了调优”,这证实了Epoch AI的报告。
2025-05-06 11:20:51 - ‘Xiaomi MiMo’,并且在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上表现不俗。
2025-05-06 15:20:38 - 记者5月6日获悉,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军,并在指令遵循(Instruction Following)这一关键能力上超越o3 High、o4-Mini High、Gemini
2025-04-17 12:24:56 - 值得注意的是,在推出o3系列最新模型的前一天,OpenAI还推出三款GPT-4.1系列模型,包含标准版GPT-4.1、轻量款GPT-4.1mini,以及超小型版本GPT-4.1nano。
123...29>   跳转