Skip to content

Commit

Permalink
Merge pull request #66 from zjhellofss/zjhellofss-patch-3
Browse files Browse the repository at this point in the history
Update README.md
  • Loading branch information
zjhellofss authored Sep 24, 2024
2 parents 6ab59cf + 314b88f commit 522aa01
Showing 1 changed file with 9 additions and 99 deletions.
108 changes: 9 additions & 99 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,109 +1,19 @@
# News:新课发布,《动手自制大模型推理框架》
Hi,各位朋友们好!我是 KuiperInfer 的作者。KuiperInfer 作为一门开源课程,迄今已经在 GitHub 上已斩获 2.4k star。
如今在原课程的基础上,**我们全新推出了《动手自制大模型推理框架》, 新的课程不仅支持 CPU 推理 Llama 系列模型,还支持 Cuda 加速和 Int8 量化**,自推出以来便广受好评。

# KuiperInfer (自制深度学习推理框架)
**我们在本项目的基础上开设了一个全新的课程,《从零自制大模型推理框架》,以下是目录,感兴趣的同学可以扫描二维码或者添加微信 lyrry1997 了解,欢迎大家参加。**

<img src="imgs/me.jpg" />

## 《动手自制大模型推理框架》常见问题

1. **课程更新完了吗?**

主体已经更新完毕,完全可以开始自习。支持cuda, int8推理。

2. **这是收费课程吗?怎么收费,怎么付款,过段时间买可以吗?**

收费课程,256,微信转账。可以,但是我微信好友快满了,隔一段时间会清理,而且不定期会涨价。

3. **为什么b站会贵一点,内容都一样吗?**

现在价格都一样了,推荐还是微信购课

4. **怎么看课**

飞书网盘,打开浏览器就可以看

5. **有答疑吗**

有的,且有答疑群,群友也很热情。

6. **不会cpp可以学吗?**

事在人为,我也尽量深入浅出教学

7. **课程目录有吗**

见下文

9. **作者是干嘛的?**
## 《动手自制大模型推理框架》课程目录:

主业就是开发大模型推理框架的,课件已经被人民邮电出版社约稿,同时也是kuiperinfer项目,也就是本项目的发起人,目前全github cpp项目排名120位。
https://l0kzvikuq0w.feishu.cn/docx/ZF2hd0xfAoaXqaxcpn2c5oHAnBc

**《动手自制大模型推理框架》项目运行效果fp32模型1.1b参数。**
![](./imgs/do.gif)
**如果你对大模型推理感兴趣,想要深入了解并掌握相关技术,那么这门课程绝对不容错过。快来加入我们,一起开启学习之旅吧!
感兴趣的同学欢迎扫一扫课程下方二维码或者添加微信 lyrry1997 参加课程**

KuipeInfer目前2.3k star,帮助很多人获得了大厂岗位。
## 《动手自制大模型推理框架》课程目录

**一、项目整体架构和设计**

> 学习架构思维,防止自己只会优化局部实现
1. 环境的安装和课程简介
2. 资源管理和内存管理类的设计与实现
3. 张量类的设计与实现
4. 算子类的设计与实现
5. 算子的注册和管理

**二、支持LLama2模型结构**
> 本节将为大家补齐算法工程师思维,在算法层面讲解大模型和Transformer的原理之后,开始对LLama2进行支持

6. LLama模型的分析
7. MMap内存映射技术打开大模型的权重文件
8. LLama模型文件的参数和权重载入
9. LLama中各个层的初始化以及输入张量、权重张量的分配和申请
10. 实现大模型中的KV Cache机制

**三、模型的量化**

> 为了减少显存的占用,我们开发了int8模型量化模块
11. 量化模型权重的导出
12. 量化系数和权重的加载
13. 量化乘法算子的实现

**四、Cuda基础和算子实现**

> 带你学Cuda并在实战大模型算子的实现,为大模型推理赋能
14. Cuda基础入门1 - 内容待定
15. Cuda基础入门2 - 内容待定
16. Cuda基础入门3 - 内容待定
17. Cuda基础入门4 - 内容待定
18. RMSNorm算子的Cuda实现
19. Softmax算子的Cuda实现
20. Add算子的Cuda实现
21. Swiglu算子的Cuda实现
22. GEMV算子的Cuda实现
23. 多头注意力机制的Cuda实现
24. 让框架增加Cuda设备的支持和管理
25. 完成Cuda推理流程

**五、用推理框架做点有趣的事情**

26. 文本生成
27. 讲一段小故事
28. 让大模型和你进行多轮对话


**六、学习其他商用推理框架的实现,查漏补缺**

29. LLama.cpp的设计和实现讲解
30. Miopen(AMD出品,对标CUDNN)的设计和实现讲解
31. 总结
<img src="imgs/me.jpg" />



# KuiperInfer (自制深度学习推理框架)
![](https://github.com/zjhellofss/kuiperinfer/actions/workflows/cmake.yml/badge.svg)

![](./imgs/logo.jpg)
Expand Down

0 comments on commit 522aa01

Please sign in to comment.