This is a bilingual snapshot page saved by the user at 2025-7-4 6:55 for https://gcn4sk03ztjz.feishu.cn/wiki/UbiPwOokyiynZckJDKuc0DEynsH?fromScene=spaceOverview, provided with bilingual support by Immersive Translate. Learn how to save?

🔥
大模型入门基础知识(by Meteor导航站)

飞书用户4371LY
Modified June 21
点击关注文档更新通知点击加入微信大模型交流群Meteor学习交流站—留下你的记忆Meteor导航站—新手村指引
时间不在于你拥有多少,而在于你怎样使用。
每一次倒计时,都是离目标更近的一步。别让今天的松懈,成为明天的遗憾。冲!
📒
简介:你好呀👋,欢迎来到我打造的Meteor导航站。这里记录了我从零开始学习大模型的全过程,包括学习路线图、基础原理、项目实战、面试题库等内容。如果你也在探索大模型的世界,希望这份笔记能给你一些启发 🌟
这里更适合基础知识的学习与搜索,快速的记录一些基础公式、知识点,便于日后学习与回忆。
更新日期
知识系列更新内容
2025-01-30
我的大模型学习路线速成版——三个月算法岗实习
2025-02-10
基于Qwen的预训练、微调、DPO全流程跑通
2025-02-15
DeepSeek-LLM:以长期主义扩展开源语言模型
2025-02-21
DeepSeek-MoE:迈向混合专家语言模型的终极专业化
2025-02-22
DeepSeek-V2:高效的混合专家模型
2025-02-22
DeepSeek-V3:技术报告分析
2025-02-23
DeepSeek-R1:通过强化学习激发大语言模型的推理能力
2025-02-23
Transformer:Encoder-Decoder 架构分析
2025-02-23
Transformer:Tokenizer 分词算法
2025-02-23
Transformer:Embeeding 在大模型中的应用
2025-02-24
Transformer:Self-Attention 原理解析
2025-02-24
Transformer:FFN 非线性变换
2025-02-24
Transformer:激活函数的奥秘
2025-02-24
Transformer:归一化的作用
2025-02-25
Transformer:残差连接的设计妙处
2025-02-26
Transformer:位置编码
2025-02-26
vLLM-PageAttention:推理加速好帮手
2025-02-26
大模型预训练:预训练基本常识
2025-02-26
大模型预训练:监督学习
2025-02-26
大模型预训练:Next Token Prediction
2025-02-27
大模型预训练:常用预训练数据集
2025-02-27
大模型预训练:继续预训练
2025-02-27
大模型微调:微调的背景与动机
2025-02-27
大模型微调:策略分析
2025-02-27
大模型微调:各种损失函数的作用
2025-02-27
大模型微调:优化目标是什么
Comments (0)
Go to the first comment
0 words