本系列的文章由浅入深介绍LLM的基础知识,从大模型的使用,到原理解析,再到LLM系统实战。 本文着重介绍LLM主流架构Transformer的原理,结合我近期阅读的几本大模型原理书籍、浏览的相关文章做了深度总结+拓展阅读,希望能帮助大家理解大模型的原理。