登录社区云,与社区用户共同成长
邀请您加入社区
不到10行代码、小时级完成适配,还有原始权重一站直达
DeepSeek V3 的新版本模型 DeepSeek-V3-0324 借鉴 DeepSeek-R1 中的强化学习技术,参数量只增加至 685B,推理能力却大幅提升,在数学、代码类任务上超过GPT-4.5!相较于第一代 V3,基准测试的准确率最高提升了近20%。新版本V3 还具有更强的中文写作和搜索能力。新模型采用 MIT License,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。Mi
近日,基于昇思 MindSpore AI 框架+vLLM的DeepSeek-V3-0324 模型完成适配并上线魔乐社区。
想要在香橙派上快速部署 DeepSeek模型?魔乐社区联合华为昇腾和香橙派,已为你准备好了“一键资源包” -- AI PC专区,帮助开发者快速上手端侧模型推理
在进行DeepSeek昇腾部署时,你是否遇到了问题?本文汇总了常见问题,助你快速定位并迅速部署DeepSeek。
DeepSeek模型量化的最佳实践
今天,我们为大家带来本地部署的R1模型Prompt优化实践,涵盖优化成果、推理过程解析以及官方使用建议,优化后回答效果从效果丰富度、想象力、稳定性三块均有大幅提升。
为了更好提升推理性能,让企业使用DeepSeek模型服务更高效,社区还提供了DeepSeek INT8量化模型,欢迎开发者从魔乐社区获取使用。
量化技术就像神奇的魔法,一边稳稳保住DeepSeek 模型的高精度,一边还能把模型的计算效率和资源占用问题轻松搞定。这样一来,模型在实际应用中就能表现得更加出色,开发者和企业也能享受到更加灵活高效的部署方式。