相关结果约2个
zeng.рф相关信息
2025-01-28 11:02:16 - 港科大助理教授何俊贤的团队(共同一作黄裕振、Weihao Zeng),只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练,模型在复杂的数学推理上取得了十分强劲结果。
2025-01-28 11:01:23 - 港科大助理教授何俊贤的团队(共同一作黄裕振、Weihao Zeng),只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练,模型在复杂的数学推理上取得了十分强劲结果。