代码库

Kubernetes enhancements for Network Topology Aware Gang Scheduling & Autoscaling

agenticauto-scalingauto-scaling-groupdisaggregatedgang-schedulinggpugroveinferencekubernetesleader-workermultinodeoperatorrole-basedtopology-aware-scheduling

ai-dynamo/aitune

189

NVIDIA AITune is an inference toolkit designed for tuning and deploying Deep Learning models with a focus on NVIDIA GPUs.

Python

deep-learninginferencenvidianvidia-gpu

ai-dynamo/dynamo

6.8k

A Datacenter Scale Distributed Inference Serving Framework

Rust