相关结果约1,156个
o1s.tk相关信息
2025-04-23 14:23:54 - 从人工智能的演化角度看,OpenAI 发布 o1 模型后,曾有用户用门萨测试题进行测试,结果是OpenAI o1的“智商”得分达到120分。近期发布的o3和o4-mini模型在门萨智商测试的表现则更胜一筹。
2025-04-21 14:46:35 - 升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。
2025-04-21 08:12:04 - 这大约是OpenAI之前的推理模型o1和o3 mini幻觉率的两倍。o4 mini在PersonQA上的表现更差,48%的问题都出现了幻觉。AI研究员Neil Chowdhury认为,用于o系列模型的强化学习可能会放大幻觉问题。
2025-04-21 20:17:01 - 升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。
2025-04-17 12:55:52 - 本周OpenAI还在API中引入GPT-4.1系列模型,GPT-4.1的性能超过GPT-4o。随着GPT-4.1推出,OpenAI准备弃用今年2月刚面世的GPT-4.5预览版。
2025-04-18 18:39:19 - 值得关注的是,3月26日商汤集团(0020.HK)发布了2024年财报,其数据表现仍为亮眼。去年,商汤集团总体收入同比增长10.8%,达到37.7亿元,其中生成式AI收入突破24亿元,同比增长103.1%,连续两年保持三位数增长。
2025-04-21 17:46:05 - 作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。
2025-04-22 23:02:02 - 作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。
2025-04-21 14:24:11 - 据介绍,作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。
2025-04-17 08:40:24 - 在OpenAI提供的示例中,当用户询问电池技术的突破对电动汽车的影响时,o1模型在推理5秒后给出了文字、代码片段为主的回复,而o3模型经过40秒的推理时间,多次使用搜索功能,除文字外还能直接生成图像和图表。
123...50>   跳转