搜索结果 - 东方财富网

相关结果约37个

v0o.me相关信息

2025-06-11 07:52:17 - 根据OpenAI内部测试，o3-pro在数学基准测试AIME 2024中超越谷歌Gemini 2.5 Pro，在博士级科学测试GPQA Diamond中击败Anthropic Claude 4 Opus，展现出推理模型领域的领先性能。

http://finance.eastmoney.com/a/202506113427175677.html

AI周报：OpenAI发布新模型o3-pro AMD推出AI芯片MI350“硬刚”英伟达

2025-06-15 09:43:07 - 根据OpenAI内部测试，o3-pro在数学基准测试AIME 2024中超越谷歌最强的模型Gemini 2.5 Pro，在博士级科学测试GPQA Diamond中击败Anthropic最强的Claude 4 Opus。

http://finance.eastmoney.com/a/202506153430802961.html

ESSENCE分析表明：在MASH患者中，相较于安慰剂，司美格鲁肽2.4 mg在组织学和非侵入性检测中均达成了更高的治疗应答率

2025-05-12 19:19:18 - 参考文献　　1. Rinella ME, Abdelmalek MF, Bugianese E, et al.

http://finance.eastmoney.com/a/202505123402194372.html

中信建投：大厂AI产品迭代加速行业持续繁荣

2025-04-21 07:56:20 - 作为OpenAI目前最强的推理模型，o3在Codeforces、SWE-bench和MMMU等基准测试中创下了新的 SOTA；o4-mini 则是经济高效的小型模型，尤其在数学、编程和视觉任务方面表现较好，在AIME 2024和2025，以及Codeforces基准测试中表现甚至超过

http://finance.eastmoney.com/a/202504213382227314.html

OpenAI频繁调整产品更新路线图，最新面世推理模型o3和o4-mini

2025-04-17 12:55:52 - 本周OpenAI还在API中引入GPT-4.1系列模型，GPT-4.1的性能超过GPT-4o。随着GPT-4.1推出，OpenAI准备弃用今年2月刚面世的GPT-4.5预览版。

http://finance.eastmoney.com/a/202504173379783283.html

OpenAI发布新模型o3和o4-mini，可实现“用图像思考”

2025-04-17 09:15:07 - 据最新测试结果，o3和o4-mini（无工具版本）在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%，在Codeforces编程竞赛评分中，o3和o4-mini分别取得了2706和2719的ELO分数，显示出在复杂数学与代码任务中的强大推理与执行能力。

http://finance.eastmoney.com/a/202504173379825343.html

OpenAI发布新模型o3和o4-mini；Claude Research功能上线丨全球科技早参

2025-04-17 07:34:25 - 据最新测试结果，o3和o4-mini（无工具版本）在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%，在Codeforces编程竞赛评分中，o3和o4-mini分别取得了2706和2719的ELO分数，显示出在复杂数学与代码任务中的强大推理与执行能力。

http://finance.eastmoney.com/a/202504173379181394.html

奥特曼自诩：达到或接近天才水平！OpenAI，重磅发布！

2025-04-17 12:24:56 - 此外，在外部专家的评估中，o3在困难的现实任务中比OpenAIo1犯的重大错误少20%，尤其是在编程、商业/咨询和创意构思等领域表现出色。o4-mini作为一款体型更小的模型，则以其尺寸和成本实现了卓越的性能，是AIME2024和2025基准测试中表现最佳的模型。

http://finance.eastmoney.com/a/202504173379771915.html

科技风向标丨OpenAI深夜发布最强模型；京东回应“京东外卖崩了”；淘宝冲上美国App下载榜第二

2025-04-17 10:05:45 - 根据OpenAI公布的测试数据显示，o4-mini在AIME 2024和2025中，分别达到了93.4%和92.7%，比满血版o3还强，成为目前准确率最高的模型；在Codeforces测试中达到了2700分，成为全球前200名最强程序员。

http://finance.eastmoney.com/a/202504173379669193.html

2025-04-09 08:06:59 - 该模型只有140亿参数，但在知名代码测试平台LiveCodeBench的测试分为60.6%，高于OpenAI的o1模型（59.5%），略低于o3-mini（60.9%）。在Codeforces、AIME2024上的评测数据同样非常出色，几乎与o1、o3-mini差不多。

http://finance.eastmoney.com/a/202504093370191279.html

1 2 > 跳转页