Deployment

llms.py

Deployment

Deploy llms.py to production

Deployment Options

llms.py can be deployed in various ways depending on your needs.

Docker (Recommended)

The easiest way to deploy llms.py:

Pre-built images on GitHub Container Registry
Multi-architecture support (amd64, arm64)
docker compose for easy orchestration
Persistent storage with volumes

Learn more about Docker deployment →

Python Package

Install and run as a Python package:

pip install llms-py
llms --serve 8000

From Source

Clone and run from source:

git clone https://github.com/ServiceStack/llms
cd llms
python -m llms.main --serve 8000

Security

GitHub OAuth

Secure your deployment with GitHub OAuth authentication:

User authentication via GitHub
Optional user access restrictions
Session management
CSRF protection

Learn more about GitHub OAuth →

Network Security

For production deployments:

Use HTTPS: Always use TLS in production
Firewall: Restrict access to necessary ports
Reverse Proxy: Use nginx or similar
Rate Limiting: Prevent abuse

Production Checklist

Monitoring

Health Checks

Docker images include built-in health checks:

docker ps  # Check container status
docker inspect --format='{{json .State.Health}}' container-name

Logs

View server logs:

# Docker
docker logs llms-server

# docker compose
docker compose logs -f

# Direct
llms --serve 8000 --verbose

Provider Status

Check provider connectivity:

llms --check groq
llms --check openai anthropic

Scaling

Multiple Instances

Run multiple instances behind a load balancer:

# docker-compose.yml
version: '3.8'
services:
  llms-1:
    image: ghcr.io/servicestack/llms:latest
    ports:
      - "8001:8000"
    environment:
      - GROQ_API_KEY=${GROQ_API_KEY}

  llms-2:
    image: ghcr.io/servicestack/llms:latest
    ports:
      - "8002:8000"
    environment:
      - GROQ_API_KEY=${GROQ_API_KEY}

Load Balancing

Use nginx, Traefik, or similar for load balancing.

Backup & Recovery

Configuration Backup

Backup configuration files:

# Backup
tar -czf llms-backup.tar.gz ~/.llms/

# Restore
tar -xzf llms-backup.tar.gz -C ~/

Docker Volumes

For Docker deployments, backup volumes:

# Backup
docker run --rm -v llms-data:/data -v $(pwd):/backup \
  ubuntu tar czf /backup/llms-data-backup.tar.gz /data

# Restore
docker run --rm -v llms-data:/data -v $(pwd):/backup \
  ubuntu tar xzf /backup/llms-data-backup.tar.gz -C /

Troubleshooting

Common Issues

Port already in use:

# Use different port
llms --serve 3000

API keys not working:

# Verify environment variables
env | grep API_KEY

# Check config
llms ls

Provider failures:

# Check provider status
llms --check provider-name

# Enable verbose logging
llms --serve 8000 --verbose

Next Steps

Docker Deployment

GitHub OAuth

Configuration

Avatars

Personalize your chat experience by adding custom avatars for yourself and AI agents.

Docker Deployment

Deploy llms.py using Docker and docker compose

Docker Deployment

GitHub OAuth

Configuration

On this page