相关结果约40个
law.nz相关信息
2025-03-04 14:20:36 - 当前绝大部分需求是文生文的token,多模态尚未真正开启scaling law,有理由相信,随着模型能力的进一步提升,需求将进一步井喷,算力建设将复刻云计算的黄金十年。
2025-03-12 08:53:03 - 基流科技创始人兼 CEO胡效赫对《科创板日报》记者表示,DeepSeek-R1的全球影响力是对scaling law在推理和合成数据方向发展的强有力印证,这将进一步驱动算力需求的指数级增长。
2025-02-28 23:51:26 - 在马斯克旗下xAI的Grok 3发布时,大家都兴奋地表示,Scaling Law(规模法则)还没有撞墙。但GPT-4.5一出,外界发现,OpenAI“撞墙”了。   GPT-4.5的预训练计算量是GPT-4的10倍,但是基准测试只比4o好5%。
2025-02-28 21:08:21 - 但公司高管接连出走、Scaling law放缓等变化,都让OpenAI的投入产出变得更加不确定。尤其是DeepSeek R1等开源模型的崛起,让整个行业的风向发生了改变,外界十分好奇,OpenAI接下来能否借助酝酿已久的GPT-5来捍卫自己的市场地位。
2025-02-21 16:08:38 - 记者注意到,在Grok 3发布前后,OpenAI方面宣布即将推出GPT-4.5,该公司CEO山姆·奥特曼在社交平台发文称:“体验GPT-4.5比我预期的更像是感受AGI(通用人工智能)的时刻。”
2025-02-24 18:02:31 - 1998年《强化学习简介(Reinforcement Learning: An Introduction)》由Richard S. Sutton and Andrew G. Barto发表。Sutton和Barto在书中介绍了人通过与环境互动而学习的机制。
2025-02-18 21:06:34 - 图片来源:xAI   也难怪有人说Grok 3是终极的Scaling Law测试了,是靠吞噬算力训练起来的怪物。   演示团队为了使大家更直观地了解Grok 3的强大之处,还演示了物理学和游戏的例子。
2025-02-13 08:14:34 - 该研究还揭示了新架构的Scaling Law(规模定律),证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。   点评:豆包大模型团队提出的稀疏模型架构UltraMem,解决了混合专家模型(MoE)推理时高额的访存问题,显著提升了推理速度和降低了成本。
2025-02-13 08:10:13 - 该研究还揭示了新架构的Scaling Law(规模定律),证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。   点评:这一技术突破不仅显著降低了推理成本,还提升了模型的推理速度。这对于大规模商业应用和实时场景具有重要意义,使得大模型的部署和使用更加经济高效。
2025-02-13 16:09:02 - 摩尔线程相关技术负责人则认为,从训练侧来看,Scaling Law规模定律仍然有效,模型迭代会加快,对于国产优质训练算力的需求不会降低。
12>   跳转