相关结果约1,033个
搜索范围
默认排序
- 默认排序
- 按相关度排序
- 按时间排序
2025-09-18 10:08:46 - DeepSeek R1的核心创新在于采用了“纯强化学习”这一自动化试错方法,R1通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。 在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。
2025-09-09 15:57:50 - 现场,灵波R1机器人重点展示了餐饮这一场景,可完成从识别餐品、抓取、装盘等全流程,体现了在相对复杂的生活服务场景中,机器人能力的提升。R1同时还支持景区导览、医疗问诊等场景。 值得关注的是,R1并非停留在概念阶段。
2025-09-09 16:00:39 - 现场,灵波R1机器人重点展示了餐饮这一场景,可完成从识别餐品、抓取、装盘等全流程,体现了在相对复杂的生活服务场景中,机器人能力的提升。R1同时还支持景区导览、医疗问诊等场景。 值得关注的是,R1并非停留在概念阶段。
2025-09-10 09:05:48 - 【热点要闻】 1. 9月9日,据报道,在近日开幕的柏林国际电子消费品展览会(IFA)上,中国科技企业蚂蚁灵波科技推出的智能服务机器人R1吸引了不少人驻足。这款融合多模态交互、环境感知与AI决策能力的机器人,展示了其在家庭、医疗等场景的应用潜力。
2025-09-18 12:51:13 - 其中,在训练成本方面,R1-Zero和R1都使用了512张H800GPU,分别训练了198个小时和80个小时,以H800每GPU小时2美元的租赁价格换算,R1的总训练成本为29.4万美元(约合人民币209万元)。
2025-09-18 17:32:04 - R1的训练成本仅有29.4万美元,就算加上基础模型的600万美元,总花费也远远低于许多闭源巨头。 团队首次回应了“蒸馏OpenAI”的质疑,称训练数据仅来自普通网页和电子书,不包含任何OpenAI生成的合成数据。
2025-09-18 12:39:19 - 在DeepSeek-R1的研究过程中,团队使用 A100 GPU 完成了较小规模模型(30B参数)的实验,随后团队将训练扩展至 660B参数的R1-Zero和R1模型。 具体而言,DeepSeek-R1-Zero训练使用了64×8张H800GPU,耗时约198小时。
2025-09-18 22:42:56 - “此次R1模型登上《自然》,有助于让AI融入更大的‘科学群聊’。”
2025-09-18 10:46:03 - 图据澎湃新闻 据悉,DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。
2025-09-18 17:08:27 - 深度求索严正声明: 1. 深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2. 任何冒用公司名义开展“算力租赁”、“融资”等行为均属违法,将依法追究其法律责任。