https://pan.quark.cn/s/64ea713257ce
课程分为模型架构与工程应用两大模块:模型部分深入解析Llama2架构 设计 (包括RMSNorm、ROPE位置编码等),手把手实现LoRA/QLoRA高效微调、PTuning 方法 及幻觉处理;工程部分涵盖DeepSpeed分布式训练、ChatGLM3全量微调、Int8/NF4 量化 等优化 技术 ,并延伸至Prompt工程、Function Calling 开发 等应用实践。
通过 股票 分析等实战项目,学员可掌握从模型研发到 产品 落地的完整能力链,特别适合希望深入理解大模型底层原理并具备工业级开发能力的技术人员。
课程提供完整代码实现和优化文档,强调"手写实现"以加深理解。
评论列表
发表评论