![Mark的AI产品经理知识库](https://www.zjnav.com/wp-content/uploads/2025/02/1739003376-1739003376-a324f7144ff8c64.jpg)
这是一篇用于零基础入⻔大语言模型(Large,Language,Model,LLM)底层技术原理的⻜书文档。其最直接面向群体为非科班出身但想要了解AI技术原理的投资人,此外兼顾任何对ChatGPT等大语言模型感兴趣,希望入⻔了解大语言模型这件事,知道这个世界上正在发生什么的朋友。•虽然这篇文档号称“零⻔槛”,但人工智能在本质上是永远绕不开微积分、概率论和线性代数的。具备这些数学的基础,至少要了解导数和极小值、多元函数求微分的链式法则、条件概率,条件概率的链式展开与概率分布函数、向量于矩阵的意义及运算等,这些基本的数学知识对于读懂这篇文档非常重要,•这篇文档从浅到深,覆盖非常非常多的内容细节。从最基础的多层感知器MLP,到卷积神经网络CNN、循环神经网络RNN(及其变体LSTM和GRU)、强化学习RL,再到seq2seq架构、自监督学习,再到Transformer模型、GPT模型(及IFT、SFT、RLHF、思维链提示CoT)、BERT模型等,都会有所覆盖。•这篇文档会持续更新迭代,把关于LM的最新的技术进展及相关原理持续的搬运进来。
文档地址:https://qqs7y1hozd1.feishu.cn/wiki/QnPwwpKgKiGpFCkUrs7ciMIbnff
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...