deepseek蒸馏技术

deepseek蒸馏技术

DeepSeek的蒸馏技术是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术,其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使其更适合在资源受限的环境中...
11个月前
6830