搜索结果 - 东方财富网

相关结果约1,165个

搜索范围全部标题正文

默认排序

2025-05-06 11:42:34 - 4月29日阿里通义千问发布Qwen3系列开源大模型，旗舰版Qwen3-235B-A22B在代码、数学、通用能力等基准测试中，超越DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型。

2025-05-02 15:16:49 - 在数学推理（AIME24-25）和代码竞赛（LiveCodeBenchv5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

2025-05-06 14:47:21 - 4月30日，小米开源首个参数规模7B的推理大模型XiaomiMiMo，在数学推理和代码竞赛测评表现超越o1-mini和QwQ-32B-Preview。30日DeepSeek发布Prover-V2模型，参数量达6710亿。

2025-04-30 11:00:59 - 在数学推理（AIME24-25）和代码竞赛（LiveCodeBenchv5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

2025-05-05 21:54:31 - 今年3月，公司正式发布全新AI音乐生成模型Mureka V6与Mureka O1，其中Mureka O1是全球首款引入CoT（思维链）技术的音乐推理模型。

2025-05-06 06:02:19 - 在数学推理（AIME24-25）和代码竞赛（LiveCodeBenchv5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

2025-04-29 15:38:14 - AI智能助手方面，昆仑万维预计将于2025年5月中旬在海外发布全球首款生产力场景通用Agent平台Skywork.ai，深度聚焦个人生产力场景，解决通用Agent“通而不精”的痛点。

2025-04-29 05:36:50 - 与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等其他顶级模型相比，旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了有竞争力的结果。

2025-05-06 08:18:48 - 在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

2025-04-29 06:16:37 - 旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中，与DeepSeek-R1、OpenAI的（o1、o3-mini）、马斯克的Grok-3和谷歌公司Gemini-2.5-Pro等顶级模型相比，表现出极具竞争力的结果。

1 2 3...50 > 跳转页