vLLM - 观星指南 Stargazers.cn

ai-gatewaybert-classificationfine-tuninggolanghuggingface-candlehuggingface-transformerskubernetesllmllmroutermcpmixture-of-modelsopenclawpii-detectionprompt-engineeringprompt-guardrustsemantic-routervllm

vllm-project/recipes

897

Common recipes to run vLLM

JavaScript

vllm-project/vllm-omni

5.4k

A framework for efficient model inference with omni-modality models

Python

audio-generationdiffusionimage-generationinferencemodel-servingmultimodalpytorchtransformervideo-generationworld-model

vllm-project/vllm

85.3k

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

amdblackwellcudadeepseekdeepseek-v3gptgpt-ossinferencekimillamallmllm-servingmodel-servingmoeopenaipytorchqwenqwen3tputransformer

vllm-project/vllm-ascend

2.3k

Community maintained hardware plugin for vLLM on Ascend

C++

ascendinferencellmllm-servingllmopsmlopsmodel-servingtransformervllm