这大概是我读过关于AI大模型最全面、好读又易懂的文章了

出处： mp.weixin.qq.com

推开AI的门，你是站在门外怕迟到的人。很多人害怕迟到，害怕在众目睽睽之下，被视作一个犯错的学生。就如同，AI“呼的一下”就来了，并且发展迅猛，很多人也怕被它甩在后面，而我就是其中之一。神经网络是了解AI大模型无法绕过的话题，是现代大模型的基石。但是别看它现在风光，在过去的半个多世纪，却是无人问津，甚至备受争议，以至于等到它再次复出时，不得不被迫改名换姓，叫作深度学习。我在第一个部分将围绕神经网络基本概念，并将自己学习过程中的疑问，融入到文章内容，希望有着同样疑问人也能有所收获。第二部分，我会利用前文的神经网络的知识，为大家勾勒大模型的大致轮廓，先是大模型的推理，而后是大模型训练。由于GPU与大模型相生相伴，我也将在其后，分享一些AI浪潮下，它对基础设施有哪些新要求。大多数人其实很少会直接接触到大模型，而更多是通过Agent来使用它，因此在文章的最后，会简单分享一下人们是如何使用大模型的。