DeepSeek 模型训练 - 数智AI导航｜AI工具提示词大全 - 专业学习资源资讯知识库

DeepSeek华丽文风从何而来？业内人士：训练数据、训练策略和迭代优化缺一不可

DeepSeek华丽文风从何而来？业内人士：训练数据、训练策略和迭代优化缺一不可

DeepSeek华丽文风从何而来？业内人士：训练数据、训练策略和迭代优化缺一不可 “他...

3小时前 0

DeepSeek-V3 高效训练关键技术分析

DeepSeek-V3 高效训练关键技术分析

DeepSeek-V3 高效训练关键技术分析本文从模型架构、并行策略、通信优化和显存优化...

3小时前 0

DeepSeek-R1的训练流程强化学习（RL）阶段采用了GRPO算法

DeepSeek-R1的训练流程强化学习（RL）阶段采用了GRPO算法

DeepSeek-R1的训练流程强化学习（RL）阶段采用了GRPO算法 DeepSeek-R1的训练流程确...

3小时前 0

DeepSeek-R1的四个训练阶段

DeepSeek-R1的四个训练阶段

DeepSeek-R1的四个训练阶段 DeepSeek-R1的训练流程包含四个阶段，分为两个强化学习...

3小时前 0