原贴链接

自2023年6月起，我录制了44个从零开始构建GPT架构的视频。制作这些视频的参考书籍是Sebastian Raschka的《从零构建大型语言模型（LLM）》。每个讲座时长接近40 - 45分钟，第一个视频在Youtube上现在有近10万的观看量。我满怀热情制作了这些视频，希望你们能从中学到东西。这是整个播放列表的地址：https://www.youtube.com/playlist?list=PLPTV0NXA_ZSgsLAr8YCgCwhPIJNNtexWu，以下是前15个讲座：讲座1：从零构建大型语言模型：系列介绍：https://youtu.be/Xpr8D6LeAtw；讲座2：大型语言模型（LLM）基础：https://youtu.be/3dWzNZXA8DY；讲座3：预训练大型语言模型与微调大型语言模型：https://youtu.be/-bsa3fCNGg4；讲座4：什么是Transformer？https://youtu.be/NLn4eetGmf8；讲座5：GPT - 3到底如何工作？https://youtu.be/xbaYCf2FHSY；讲座6：从零构建大型语言模型的阶段：https://youtu.be/z9fgKz1Drlc；讲座7：用Python从头编写大型语言模型标记器代码：https://youtu.be/rsy5Ragmso8；讲座8：GPT标记器：字节对编码：https://youtu.be/fKd8s29e - l4；讲座9：使用Python DataLoader创建输入 - 目标数据对：https://youtu.be/iQZFH8dr2yI；讲座10：什么是标记嵌入？https://youtu.be/ghCSGRgVB_o；讲座11：位置嵌入的重要性：https://youtu.be/ufrPLpKnapU；讲座12：大型语言模型（LLMs）的整个数据预处理管道：https://youtu.be/mk - 6cFebjis；讲座13：大型语言模型（LLMs）中注意力机制的介绍：https://youtu.be/XN7sevVxyUM；讲座14：简化的注意力机制 - 用Python从头编写代码 | 无训练权重：https://youtu.be/eSRhpYLerw4；讲座15：用键、查询和值矩阵编写自注意力机制代码：https://youtu.be/UjdRN80c6p8

讨论总结

原帖作者宣称自己毕业于MIT且有博士学位，并从2023年6月开始录制了44个构建GPT架构的视频，在YouTube上的首个视频有近10万观看量。评论者反应不一，部分人对作者的工作表示赞赏、感谢并认可，认为这是很棒的教学资源；也有人持怀疑和批评态度，认为不应强调身份标识，还有对原帖内容空洞类似自助书籍的批评；同时也有关于YouTube推荐、内容存放平台、LLM相关原理疑问等讨论，整体氛围较积极但也存在不同声音。

主要观点

👍 原帖作者的工作值得赞赏
- 支持理由：视频包含大量高质量数据，有助于很多人甚至后代，是杰出的工作，作者明确内容独特性且兑现承诺。
- 反对声音：无。
🔥 不应强调表面的身份标识，应专注内容本身
- 正方观点：聪明的人不必靠身份标识博眼球，应让内容说话，原帖呈现方式类似空洞的自助书籍。
- 反方观点：无明显反驳观点。
💡 存在对原帖持怀疑态度并与某书作比较的情况
- 解释：有评论者给出怀疑态度的reddit讨论链接，将原帖与Sebastian Raschka的书作比较。

金句与有趣评论

“😂 golfvek: Outstanding work.”
- 亮点：简洁有力地表达了对原帖作者工作的高度认可。
“🤔 OtherRaisin3426: I hope this community is better. More than focusing on the quality of the content, people were busy making personal attacks. I like the thoughtful discussions in this community and thought of posting here”
- 亮点：表达了对社区讨论氛围的期望，希望更多关注有深度的讨论而非人身攻击。
“👀 Southern - Pause2151: Ripping off another person without giving them credit and flaunting a piece of paper from a university every chance you get is worthy of ridicule though.”
- 亮点：指出抄袭和炫耀学历等行为应被批评。

情感分析

总体情感倾向是积极的，大部分评论者对原帖作者的视频教学资源表示赞赏、感谢和认可。主要分歧点在于部分人对原帖作者强调自己MIT博士身份以及原帖内容呈现方式存在质疑和批评。可能的原因是对于学术成果分享，一部分人更看重实质内容，而对于自我宣传的部分比较反感。

趋势与预测

新兴话题：可能会引发关于LLM更多原理知识讲解的视频制作和分享，以及其他平台存放此类学习资料的探索。
潜在影响：如果有更多此类优质的LLM构建教学资源，可能会提高更多人对LLM构建的理解和参与度，推动相关技术知识的传播。

详细内容：

标题：MIT 博士分享从零构建 LLM 视频系列引发 Reddit 热议

在 Reddit 上，一个题为“[D] Graduated from MIT with a PhD | Teaching you how to build an entire LLM from scratch”的帖子引起了广泛关注。该帖子的作者称，从 2023 年 6 月起，已录制 44 个关于从零构建 GPT 架构的视频。其参考了 Sebastian Raschka 的《Build a LLM from scratch》一书，每个讲座时长约 40 - 45 分钟，首个视频在 YouTube 上的浏览量已接近 10 万次。作者还热情地分享了整个播放列表的链接：https://www.youtube.com/playlist?list=PLPTV0NXA\_ZSgsLAr8YCgCwhPIJNNtexWu 以及前 15 个讲座的具体链接。

这个帖子引发了众多讨论。有人对其表示怀疑，并将其与 Sebastian Raschka 的书进行比较：https://www.reddit.com/r/MachineLearning/comments/1h07crj/d_graduated_from_mit_with_a_phd_in_ml_teaching/ 有人认为社区不应只关注内容质量，而忽略了个人攻击的问题。但也有人称赞这是杰出的工作，比如[golfvek] 表示观看了第一集，很欣赏作者将自己的作品与该领域的其他作品进行对比和区分，并提供了有价值的内容。[onicarps] 则称已订阅并保存，感谢作者的分享。还有人认为这是巨大的高质量免费数据，比如[ramzeez88] 。也有人提出疑问，如[iamjkdn] 询问关于给定一系列检索文档，LLM 如何通过查看问题来形成答案，哪些视频有助于理解这一点。

在讨论中，既有对作者的赞扬和感谢，也有质疑和比较。但总体来说，这个分享在社区中引起了不小的反响，激发了大家对于从零构建 LLM 这一主题的深入探讨。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#