RISC-V+AI 生态进展:llama.cpp RVV 1.0 优化搞定了,最高 350% 性能提升!代码开源,欢迎复现

llama.cpp 是使用纯 C/C++ 实现的大语言模型(LLM)推理框架,内部大量使用其衍生项目 ggml 进行张量运算,对计算性能要求较高。

近日,PLCT 实验室的实习生 xctan 为 ggml 的 Q4_0_8_8 量化方式的矩阵乘法算子增加了优化后的 RISC-V Vector 1.0 支持,取得了显著的性能提升。

阅读全文