相关结果约178个
搜索范围
默认排序
- 默认排序
- 按相关度排序
- 按时间排序
2025-08-28 11:28:36 - 当无法确定正确答案时,Anthropic的Claude Opus 4和Sonnet 4模型会拒绝回答高达70%的问题,转而给出“我没有可靠信息”等回应;而OpenAI的o3和o4-mini模型拒绝回答问题的频率,则远低于前者,同时出现幻觉的概率却高得多——它们会在信息不足时仍试图作答
2025-08-14 03:24:15 - 在决赛中,OpenAI的o3以4-0的比分战胜了Grok 4,取得冠军。值得一提的是,o3在三场比赛中的比分都是4-0,还在半决赛中横扫了同门的o4 mini。
2025-08-24 17:41:44 - 8月6日,OpenAI推出自GPT-2以来的首批开源权重语言模型gpt-oss-120b与gpt-oss-20b,性能堪比o4-mini和o3-mini,可在高端笔记本和手机上运行。
2025-08-08 08:44:10 - 低于GPT-4.1每百万token的输入、输出价格3美元、12美元,也低于o4-mini每百万token的输入、输出价格4美元、16美元。 从推出节奏看,2022年11月,OpenAI推出ChatGPT,2023年3月推出GPT-4,两者之间间隔只有数月时间。
2025-08-21 15:06:56 - 早在今年4月,OpenAI发布的大模型o3与o4-mini所具备的视觉推理能力就引发了AI“开盒”的担忧。
2025-08-08 07:25:36 - 例如在数学领域,GPT-5在2025年AIME测试中无工具辅助达到94.6%,大幅超过了o3模型;在健康领域,GPT-5的表现大幅超越包括GPT-4o、o1、o3和o4-mini在内的所有前代模型。
2025-08-10 12:20:19 - 小红书开源多模态大模型dots.vlm1 8月6日,小红书hi lab(人文智能实验室)开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自研的12亿参数视觉编码器NaViT,具备多模态理解与推理能力。
2025-08-19 21:28:23 - OpenAI的推理模型o3和o4-mini的幻觉率不仅高于前代推理模型,也超过了GPT-4o等非推理模型。DeepSeek推理模型R1的幻觉率也显著高于V3模型。
2025-07-25 20:05:06 - 本报讯 (记者梁傲男)7月25日,阿里巴巴集团控股有限公司(以下简称“阿里”)全新开源千问3推理模型,性能大幅提升,一举夺下“全球最强开源模型”王座,比肩顶级闭源模型Gemini-2.5pro、o4-mini。
2025-07-25 19:29:44 - 每经杭州7月25日电(记者叶晓丹)7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下“全球最强开源模型”王座,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。