相关结果约1,165个
搜索范围
2025-05-06 11:42:34 - 4月29日阿里通义千问发布Qwen3系列开源大模型,旗舰版Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,超越DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型。
2025-05-02 15:16:49 - 在数学推理(AIME24-25)和代码竞赛(LiveCodeBenchv5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
2025-05-06 14:47:21 - 4月30日,小米开源首个参数规模7B的推理大模型XiaomiMiMo,在数学推理和代码竞赛测评表现超越o1-mini和QwQ-32B-Preview。30日DeepSeek发布Prover-V2模型,参数量达6710亿。
2025-04-30 11:00:59 - 在数学推理(AIME24-25)和代码竞赛(LiveCodeBenchv5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
2025-05-05 21:54:31 - 今年3月,公司正式发布全新AI音乐生成模型Mureka V6与Mureka O1,其中Mureka O1是全球首款引入CoT(思维链)技术的音乐推理模型。
2025-05-06 06:02:19 - 在数学推理(AIME24-25)和代码竞赛(LiveCodeBenchv5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
2025-04-29 15:38:14 - AI智能助手方面,昆仑万维预计将于2025年5月中旬在海外发布全球首款生产力场景通用Agent平台Skywork.ai,深度聚焦个人生产力场景,解决通用Agent“通而不精”的痛点。
2025-04-29 05:36:50 - 与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等其他顶级模型相比,旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了有竞争力的结果。
2025-05-06 08:18:48 - 在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
2025-04-29 06:16:37 - 旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、OpenAI的(o1、o3-mini)、马斯克的Grok-3和谷歌公司Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。
123...50>   跳转