相关结果约1,159个
o1m.name相关信息
2025-03-08 17:15:58 - 3月6日,Monica.im研发的全球首款AI Agent产品 Manus宣布推出。根据研发团队介绍,该产品为自主的AI代理,能够解决各类复杂多变的任务。
2025-03-06 10:06:06 - 美国计算机协会(ACM)宣布,Andrew Barto和Richard Sutton荣获2024年ACM A.M.图灵奖,以表彰他们在强化学习领域奠定的概念与算法基础。
2025-03-10 14:22:07 - 在数学、代码及通用能力的多项权威评测集中,千问QwQ-32B表现与“满血版”671B的DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
2025-03-11 17:05:11 - 据了解,千问QwQ-32B是阿里通义团队最新开源的推理模型,在数学、代码及通用能力的多项权威评测集中,表现与“满血版”671B的DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
2025-03-16 11:14:45 - 其中,27B参数的Gemma 3击败了o1-preview、o3-mini high、DeepSeek V3,堪称仅次于DeepSeek-R1的最优开源模型。
2025-03-09 12:31:14 - 据官方公示的基准评测结果,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
2025-03-09 11:45:34 - 据官方公示的基准评测结果,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
2025-03-10 11:10:23 - 其测试数学能力与评估代码能力与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
2025-03-11 20:34:01 - 据该公司介绍,R1模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的o1模型正式版,该模型同时延续了该公司高性价比的优势。
2025-03-06 15:15:46 - 其在文章中展示了在一系列基准测试中与DeepSeek-R1、o1-mini等模型的功能对比,如在测试数学能力的 AIME24 评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B 表现与DeepSeek-R1相当,胜于 o1-mini 及相同尺寸的R1