大语言模型优化及英特尔处理器平台的部署实践介绍|龙蜥大讲堂
原创
了解大语言模型相关优化技术,如 Weight only Quantization,Streaming-LLM等的实现方式,掌握通过Intel® Extension for Transformers在英特尔处理器平台上进行优化及部署的最佳实践。
©视频版权归作者和鸿蒙开发者社区共同所有,如需转载,请注明出处,否则将追究法律责任
0/500
发布
互动
暂无数据