• 环境

    • linux:ubuntu 22.04
    • cuda:11.8
  • 创建环境

    conda create -n vllm python=3.10
    conda activate vllm
    
  • 安装ninjia

    sudo apt update
    sudo apt install ninja-build
    
  • 安装vllm

    pip install vllm
    
  • 启动openai-server

    VLLM_USE_MODELSCOPE=True vllm serve <model_tag> [--args]
    
    • <model_tag>:模型id,具体的查看modelscopehuggingface的repo
    • 查看vllm serve有哪些参数可选:vllm serve -h

不要从源码安装,很多的问题!!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐