大语言模型优化及英特尔处理器平台的部署实践介绍|龙蜥大讲堂
原创

438
浏览
发布于 2024-7-26 17:41:15
举报
0
了解大语言模型相关优化技术,如 Weight only Quantization,Streaming-LLM等的实现方式,掌握通过Intel® Extension for Transformers在英特尔处理器平台上进行优化及部署的最佳实践。
©视频版权归作者和鸿蒙开发者社区共同所有,如需转载,请注明出处,否则将追究法律责任
0/500
发布
互动
暂无数据
这个用户很懒,还没有个人简介
视频
帖子
声望
粉丝
发布视频

热门标签

操作系统自动化运维平台龙蜥基础设施开发者服务平台OpenAnolis龙蜥自动化运维安全管理CentOS迁移KeyarchOS浪潮信息开源CI框架龙蜥大讲堂技术干货基础设施大模型国产操作系统AISysOM 2.0龙蜥自动化运维平龙蜥龙蜥社区大语言模型eBPF