该课程讲解大模型原理与训练实战,涵盖神经网络基础(DNN/RNN)、Transformer架构、LLaMA实现等核心内容,并配套Python/PyTorch基础与LlaMA训练实战。课程从理论推导到代码实现,完整覆盖大模型技术栈,包括注意力机制、位置编码、KV缓存等关键技术,同时提供NLP入门和大模型应用开发指导。
更新时间:2025年4月28日