相关结果约2个
j8b.ro相关信息
2025-02-17 20:59:58 - 清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目公布更新:一块24G显存的4090D就可以在本地运行DeepSeek-R1、V3的671B“满血版”。预处理速度最高达到286tokens/s,推理生成速度最高能达到14tokens/s。
2025-01-17 14:05:13 - 海光信息(688041.SH)的DCU也属于GPU的一种,其DCU协处理器全面兼容ROCm GPU计算生态。