加速替代CUDA!摩尔线程开源vLLM
11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。
摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。
vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。
目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。
摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。
值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。
同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。
摩尔线程vLLM-MUSA开源地址:
https://github.com/MooreThreads/vLLM_musa
- ·[流言板]字母哥连续得分追到19分,下场一分钟被骑士打出8
- ·[流言板]盖棺定论!鲍威尔抛投不中,小史密斯命中三分杀死比赛悬念
- ·[流言板]拼尽全力!恩比德全场空砍35分11篮板2助攻1抢断2封盖
- ·隆戈:米兰有意冬季先租后买楚克乌梅卡,凯尔特人在竞争中占优
- ·全国所有省份医保“家庭共济”范围扩大至近亲属
- ·阿斯:小将阿森西奥对利物浦表现出色,获皇马一致认可+超预期
- ·欧塞尔主席周云杰:我们非常希望拥有一名能在法甲踢球的中国球员
- ·A卡翻身短期无望了!AMD新一代Radeon显卡RDNA 4亮相:两大升级 一大遗憾
- ·博帝发布P400 V4 PCIe 4.0 SSD:配轻薄石墨烯散热片
- ·暴雪将为《暗黑破坏神4:憎恨之躯》持续提供支持
- ·平局大师!尤文各赛事三连平,联赛14轮已平8场&欧冠5轮平2场
- ·欧塞尔主席周云杰:我们非常希望拥有一名能在法甲踢球的中国球员
- ·一图读懂一加Ace 5 Pro:定价最激进的骁龙8至尊版手机 3399元起
- ·前法国国脚德塞利拒认亲生女儿,称已破产付不了每月5000欧抚养费
- ·第十二届全国少数民族传统体育运动会上的西藏健儿 共赴体育盛会 唱响团结赞歌
- ·马竞收获各项赛事9连胜,并列队史连胜场次第二多