相关结果约2,453个
搜索范围
默认排序
- 默认排序
- 按相关度排序
- 按时间排序
2025-05-06 16:26:02 - 值得一提的是,日前百度发布文心大模型4.5 Turbo和文心大模型X1 Turbo,后者为深度推理模型,官方测试结果显示其整体效果领先DeepSeek R1、V3最新版,价格为DeepSeek R1调用价格的25%。
2025-05-07 10:57:47 - 基金管理人在一季报中表示,一季度初,DeepSeek 开源推理模型 R1 的发布引起了全球资本市场的关注。R1 成为了全球大部分人使用过的第一个免费、联网且具有推理能力的大模型。
2025-05-08 15:51:57 - 具体的,1月底DeepSeek R1模型发布时,产品刚成立。
2025-05-06 10:57:10 - 阿里云方面表示,千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降,并在ChatBotArena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。
2025-05-06 10:45:21 - 阿里云方面表示,千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降,并在ChatBotArena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。
2025-05-06 10:52:31 - DeepSeek R1出现代表推理能力媲美海外。Deepseek、Llama4等开源模型在能力上与闭源模型旗鼓相当。对比闭源模型,开源生态的透明性与可定制性更适应企业级应用的多样化需求,有望带动AI应用热潮。 注:指数/基金短期涨跌幅及历史表现仅供分析参考,不预示未来表现。
2025-05-06 09:42:37 - 相比DeepSeek-R1,千问3的参数量缩减了三分之二,但性能表现却全面超越R1及OpenAI-o1等主流模型。这是国内首款同时整合“快思考”和“慢思考”的混合推理模型,大幅降低了推理成本和算力消耗。 业内人士表示,Qwen3历经7个月研发,内部称之为“一场封闭式推进”。
2025-05-01 19:40:35 - 著名华裔AI学者吴恩达的公司Artificial Analysis对包括Qwen3和DeepSeek R1在内的大模型测试显示,Qwen3只是在某些指标上超越DeepSeek R1,并非全面碾压。
2025-05-01 10:25:06 - DeepSeek R1基于V3,以强化学习训练为核心,通过冷启动数据、多阶段优化、模型蒸馏等创新,在数学推理、代码生成等领域达到顶尖模型水平,并实现高效推理和轻量化部署。其无监督版本R1-Zero创新采用组相对策略优化算法,通过组内答案比较优化策略,降低训练成本并提升推理能力。
2025-05-06 17:22:37 - 公司布局非Transformer架构大模型(如DeepSeek R1),推动AI协同创新,契合市场对技术路径多样化的关注。 新能源业务占比提升 新能源业务占比已提升至45%,业务结构优化带动市场对其增长潜力的关注。