搜索结果 - 东方财富网

相关结果约29个

4oz.me相关信息

2025-04-17 12:55:52 - 具体而言，在外部专家评估中，o3面对困难现实任务时，犯的重大错误比前一代的o1少20%，o4-mini则在迅速反应、经济高效方面进行了优化。在数学能力AIME 2025基准测试中，o3、o4-mini分数分别为88.9、92.7，超过o1的79.2。

http://finance.eastmoney.com/a/202504173379783283.html

中信建投：大厂AI产品迭代加速行业持续繁荣

2025-04-21 07:56:20 - 作为OpenAI目前最强的推理模型，o3在Codeforces、SWE-bench和MMMU等基准测试中创下了新的 SOTA；o4-mini 则是经济高效的小型模型，尤其在数学、编程和视觉任务方面表现较好，在AIME 2024和2025，以及Codeforces基准测试中表现甚至超过

http://finance.eastmoney.com/a/202504213382227314.html

OpenAI发布新模型o3和o4-mini，可实现“用图像思考”

2025-04-17 09:15:07 - 据最新测试结果，o3和o4-mini（无工具版本）在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%，在Codeforces编程竞赛评分中，o3和o4-mini分别取得了2706和2719的ELO分数，显示出在复杂数学与代码任务中的强大推理与执行能力。

http://finance.eastmoney.com/a/202504173379825343.html

OpenAI发布新模型o3和o4-mini；Claude Research功能上线丨全球科技早参

2025-04-17 07:34:25 - 据最新测试结果，o3和o4-mini（无工具版本）在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%，在Codeforces编程竞赛评分中，o3和o4-mini分别取得了2706和2719的ELO分数，显示出在复杂数学与代码任务中的强大推理与执行能力。

http://finance.eastmoney.com/a/202504173379181394.html

奥特曼自诩：达到或接近天才水平！OpenAI，重磅发布！

2025-04-17 12:24:56 - o4-mini作为一款体型更小的模型，则以其尺寸和成本实现了卓越的性能，是AIME2024和2025基准测试中表现最佳的模型。而且o4-mini支持比o3高得多的使用限制，具备高容量、高吞吐量的优势。　　二是具备图像思考和推理能力，可实现“看图思考”。

http://finance.eastmoney.com/a/202504173379771915.html

科技风向标丨OpenAI深夜发布最强模型；京东回应“京东外卖崩了”；淘宝冲上美国App下载榜第二

2025-04-17 10:05:45 - 根据OpenAI公布的测试数据显示，o4-mini在AIME 2024和2025中，分别达到了93.4%和92.7%，比满血版o3还强，成为目前准确率最高的模型；在Codeforces测试中达到了2700分，成为全球前200名最强程序员。

http://finance.eastmoney.com/a/202504173379669193.html

健合集团2025年第一季度营收为31.7亿元中国市场营收占比近七成

2025-04-11 14:36:33 - Swisse斯维诗继续在中国内地线上VHMS市场稳占No.12。

http://finance.eastmoney.com/a/202504113374825698.html

【调研快报】莱宝高科接待财通基金管理有限公司等多家机构调研

2025-04-08 20:29:04 - 3.06 -8.09 -5.19 2.84 -4.65 -4.56 数据来源：Choice数据注：1.

http://stock.eastmoney.com/a/202504083369719064.html

2025-04-09 08:06:59 - ｜2025年4月9日星期三｜　　NO.1 “3天5货机”！苹果上演关税“大逃亡” 　　4月8日，据《印度时报》报道，3月27日至29日期间，5架满载iPhone和其他产品的货机从印度起飞，直抵美国。这是苹果为规避美国所谓“对等关税”而进行的紧急行动。

http://finance.eastmoney.com/a/202504093370191279.html

2025-03-26 09:11:17 - 例如经典的“4升水壶问题”和数学竞赛题（如AIME 2025题目），部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证，允许自由修改、分发及商业化应用，进一步降低了开发者的使用门槛。

http://finance.eastmoney.com/a/202503263356268093.html

1 2 > 跳转页