SCYTHE GPU Possession Scheduler

1. Stakeholder Communication Tool

The charts turn abstract scheduling policies into something tangible:
- SLA lines + tenant latencies → investors & customers can see QoS differentiation.
- Queue depth vs. GPU occupancy → shows why overprovisioning is wasteful and how your scheduler avoids it.
- Job completion distributions → fairness & predictability made concrete.

Instead of raw math, you’ve now got a demo deck that can go in front of:

A CTO at a cloud company (“here’s how we guarantee tenant A’s LLM inference stays <30ms while tenant C’s batch analytics don’t starve”).
A DoD program office (“this ensures mission-critical signals intelligence workloads preempt non-critical batch jobs”).

2. Experimentation Sandbox

Seeds → variability exploration. You already ran seed sweeps and showed variance in SLA violations and job sharing.
Interference matrices → you can add knobs (e.g., RF vs. NLP jobs interfere at X% more) and run comparative visualizations.
Scaling → move from 3 tenants to 30 with synthetic traffic models (Poisson arrivals, bursty loads, periodic sweeps).
Stress test → crank total arrival rate beyond GPU capacity and measure which tenants degrade, and how.

This lets you prove robustness before deploying into messy production workloads.

3. Productization Hook

Your harness is now a demo-able feature:

Run it live in front of an audience → tweak SLAs interactively and watch graphs react.
Wrap it in a simple web dashboard (Flask + React) → prospective customers can spin up tenants and see “their” jobs behave under your scheduler.
Position it as a QoS enforcement simulator:
- Cloud GPU tenancy: Hugging Face, Lambda Labs, RunPod.
- Enterprise AI ops: inference on shared GPU clusters.
- Gov/defense: ISR workloads with strict timelines.

4. Competitive Differentiator

Most schedulers in the wild (e.g. Kubernetes + NVIDIA MPS) don’t show transparent tenant-level metrics.
Your harness makes that visibility a feature:

“Not only do we schedule fairly, but here’s how you can prove it.”
That becomes both a sales story and a compliance artifact (think NIST/FedRAMP).

5. Bridge to Real-World Signals

The beauty is: this isn’t limited to synthetic jobs.
Next step = swap MockScheduler with real:

Torch jobs (torch.cuda load).
RF sweeps (SoapySDR/BladeRF workloads).
NLP inference (transformer forward passes).

Then your visualizations become a control tower for real GPU fleets.

cd /home/bgilbert/editable_files/SignalIntelligence && chmod +x test_scheduler.py && ./test_scheduler.py
=== GPU Possession Scheduler Test Harness ===
Target latency SLA: 50.0ms

=== Simulating default QoS (latency factor: 1.0) ===
[Step 00] Latency p95=16.7ms Occ=0.00 QPS=239.8 Batch=4 → Suggest=8
[Step 01] Latency p95=17.4ms Occ=0.11 QPS=348.6 Batch=8 → Suggest=16
[Step 02] Latency p95=30.2ms Occ=0.15 QPS=401.3 Batch=16 → Suggest=32
[Step 03] Latency p95=46.4ms Occ=0.25 QPS=464.3 Batch=32 → Suggest=32
[Step 04] Latency p95=49.3ms Occ=0.31 QPS=501.1 Batch=32 → Suggest=32
[Step 05] Latency p95=49.3ms Occ=0.35 QPS=528.1 Batch=32 → Suggest=32
[Step 06] Latency p95=50.5ms Occ=0.38 QPS=542.3 Batch=32 → Suggest=16
[Step 07] Latency p95=50.4ms Occ=0.37 QPS=542.4 Batch=16 → Suggest=8
[Step 08] Latency p95=50.3ms Occ=0.34 QPS=522.2 Batch=8 → Suggest=4
[Step 09] Latency p95=50.3ms Occ=0.31 QPS=491.3 Batch=4 → Suggest=2
[Step 10] Latency p95=50.2ms Occ=0.29 QPS=461.3 Batch=2 → Suggest=1
[Step 11] Latency p95=50.1ms Occ=0.26 QPS=428.3 Batch=1 → Suggest=1
[Step 12] Latency p95=50.0ms Occ=0.25 QPS=405.1 Batch=1 → Suggest=1
[Step 13] Latency p95=49.9ms Occ=0.23 QPS=382.8 Batch=1 → Suggest=1
[Step 14] Latency p95=49.9ms Occ=0.21 QPS=361.7 Batch=1 → Suggest=1
[Step 15] Latency p95=49.8ms Occ=0.20 QPS=347.0 Batch=1 → Suggest=1
[Step 16] Latency p95=49.7ms Occ=0.19 QPS=333.9 Batch=1 → Suggest=1
[Step 17] Latency p95=49.6ms Occ=0.18 QPS=319.8 Batch=1 → Suggest=1
[Step 18] Latency p95=49.5ms Occ=0.18 QPS=307.6 Batch=1 → Suggest=1
[Step 19] Latency p95=49.4ms Occ=0.17 QPS=299.0 Batch=1 → Suggest=1
[Step 20] Latency p95=49.4ms Occ=0.16 QPS=287.9 Batch=1 → Suggest=1
[Step 21] Latency p95=49.3ms Occ=0.16 QPS=280.2 Batch=1 → Suggest=1
[Step 22] Latency p95=49.3ms Occ=0.15 QPS=273.9 Batch=1 → Suggest=1
[Step 23] Latency p95=49.3ms Occ=0.14 QPS=266.4 Batch=1 → Suggest=1
[Step 24] Latency p95=49.3ms Occ=0.14 QPS=260.2 Batch=1 → Suggest=1
[Step 25] Latency p95=49.3ms Occ=0.13 QPS=253.8 Batch=1 → Suggest=1
[Step 26] Latency p95=49.2ms Occ=0.13 QPS=247.0 Batch=1 → Suggest=1
[Step 27] Latency p95=49.2ms Occ=0.13 QPS=241.1 Batch=1 → Suggest=1
[Step 28] Latency p95=49.2ms Occ=0.12 QPS=235.3 Batch=1 → Suggest=1
[Step 29] Latency p95=49.2ms Occ=0.12 QPS=231.1 Batch=1 → Suggest=1

=== Simulating high QoS (latency factor: 0.8) ===
[Step 00] Latency p95=7.5ms Occ=0.08 QPS=266.6 Batch=2 → Suggest=4
[Step 01] Latency p95=16.5ms Occ=0.05 QPS=250.9 Batch=4 → Suggest=8
[Step 02] Latency p95=19.5ms Occ=0.06 QPS=301.8 Batch=8 → Suggest=8
[Step 03] Latency p95=19.4ms Occ=0.08 QPS=378.5 Batch=8 → Suggest=8
[Step 04] Latency p95=19.3ms Occ=0.08 QPS=402.9 Batch=8 → Suggest=8
[Step 05] Latency p95=19.1ms Occ=0.09 QPS=419.0 Batch=8 → Suggest=8
[Step 06] Latency p95=21.8ms Occ=0.08 QPS=409.8 Batch=8 → Suggest=8
[Step 07] Latency p95=21.6ms Occ=0.08 QPS=421.2 Batch=8 → Suggest=8
[Step 08] Latency p95=21.5ms Occ=0.09 QPS=431.0 Batch=8 → Suggest=8
[Step 09] Latency p95=21.3ms Occ=0.08 QPS=444.9 Batch=8 → Suggest=8
[Step 10] Latency p95=21.2ms Occ=0.09 QPS=461.0 Batch=8 → Suggest=8
[Step 11] Latency p95=21.1ms Occ=0.08 QPS=468.0 Batch=8 → Suggest=8
[Step 12] Latency p95=21.5ms Occ=0.08 QPS=461.6 Batch=8 → Suggest=8
[Step 13] Latency p95=21.4ms Occ=0.08 QPS=463.5 Batch=8 → Suggest=8
[Step 14] Latency p95=21.3ms Occ=0.09 QPS=462.7 Batch=8 → Suggest=8
[Step 15] Latency p95=21.2ms Occ=0.09 QPS=461.5 Batch=8 → Suggest=8
[Step 16] Latency p95=21.1ms Occ=0.09 QPS=460.4 Batch=8 → Suggest=8
[Step 17] Latency p95=21.1ms Occ=0.08 QPS=466.9 Batch=8 → Suggest=8
[Step 18] Latency p95=21.0ms Occ=0.08 QPS=468.5 Batch=8 → Suggest=8
[Step 19] Latency p95=20.9ms Occ=0.09 QPS=470.3 Batch=8 → Suggest=8

=== Simulating low QoS (latency factor: 1.2) ===
[Step 00] Latency p95=25.4ms Occ=0.08 QPS=315.2 Batch=8 → Suggest=16
[Step 01] Latency p95=29.3ms Occ=0.18 QPS=428.4 Batch=16 → Suggest=32
[Step 02] Latency p95=51.3ms Occ=0.28 QPS=484.3 Batch=32 → Suggest=16
[Step 03] Latency p95=50.6ms Occ=0.30 QPS=483.6 Batch=16 → Suggest=8
[Step 04] Latency p95=49.6ms Occ=0.28 QPS=454.9 Batch=8 → Suggest=8
[Step 05] Latency p95=48.6ms Occ=0.25 QPS=441.9 Batch=8 → Suggest=8
[Step 06] Latency p95=47.6ms Occ=0.23 QPS=446.9 Batch=8 → Suggest=8
[Step 07] Latency p95=46.5ms Occ=0.22 QPS=433.6 Batch=8 → Suggest=8
[Step 08] Latency p95=45.5ms Occ=0.22 QPS=419.3 Batch=8 → Suggest=8
[Step 09] Latency p95=44.5ms Occ=0.22 QPS=409.1 Batch=8 → Suggest=8
[Step 10] Latency p95=43.5ms Occ=0.21 QPS=400.9 Batch=8 → Suggest=8
[Step 11] Latency p95=42.4ms Occ=0.20 QPS=393.4 Batch=8 → Suggest=8
[Step 12] Latency p95=41.4ms Occ=0.19 QPS=389.7 Batch=8 → Suggest=8
[Step 13] Latency p95=40.4ms Occ=0.19 QPS=393.2 Batch=8 → Suggest=8
[Step 14] Latency p95=39.4ms Occ=0.19 QPS=391.7 Batch=8 → Suggest=16
[Step 15] Latency p95=39.5ms Occ=0.19 QPS=396.0 Batch=16 → Suggest=32
[Step 16] Latency p95=54.4ms Occ=0.20 QPS=405.6 Batch=32 → Suggest=16
[Step 17] Latency p95=54.2ms Occ=0.21 QPS=409.0 Batch=16 → Suggest=8
[Step 18] Latency p95=54.0ms Occ=0.20 QPS=406.6 Batch=8 → Suggest=4
[Step 19] Latency p95=53.9ms Occ=0.20 QPS=399.3 Batch=4 → Suggest=2

=== Simulating load spike for default QoS ===
[Step 00] Latency p95=49.2ms Occ=0.12 QPS=230.3 Batch=2 → Suggest=2 
[Step 01] Latency p95=49.2ms Occ=0.12 QPS=229.1 Batch=2 → Suggest=2 
[Step 02] Latency p95=49.1ms Occ=0.11 QPS=229.6 Batch=2 → Suggest=2 
[Step 03] Latency p95=49.1ms Occ=0.11 QPS=227.0 Batch=2 → Suggest=2 
[Step 04] Latency p95=49.1ms Occ=0.11 QPS=227.3 Batch=2 → Suggest=2 
[Step 05] Latency p95=49.1ms Occ=0.11 QPS=226.0 Batch=2 → Suggest=2 
[Step 06] Latency p95=49.1ms Occ=0.10 QPS=225.0 Batch=2 → Suggest=2 
[Step 07] Latency p95=49.0ms Occ=0.10 QPS=223.2 Batch=2 → Suggest=2 
[Step 08] Latency p95=49.0ms Occ=0.10 QPS=221.3 Batch=2 → Suggest=2 
[Step 09] Latency p95=49.0ms Occ=0.10 QPS=219.0 Batch=2 → Suggest=2 
[Step 10] Latency p95=49.0ms Occ=0.10 QPS=216.8 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 11] Latency p95=48.9ms Occ=0.11 QPS=215.3 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 12] Latency p95=48.9ms Occ=0.11 QPS=213.0 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 13] Latency p95=48.9ms Occ=0.12 QPS=211.2 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 14] Latency p95=48.8ms Occ=0.12 QPS=208.8 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 15] Latency p95=48.8ms Occ=0.13 QPS=206.6 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 16] Latency p95=48.8ms Occ=0.13 QPS=204.7 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 17] Latency p95=48.7ms Occ=0.13 QPS=203.2 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 18] Latency p95=48.7ms Occ=0.14 QPS=201.1 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 19] Latency p95=48.7ms Occ=0.14 QPS=199.2 Batch=2 → Suggest=2 🔥 SPIKE 🔥
[Step 20] Latency p95=48.7ms Occ=0.14 QPS=196.8 Batch=2 → Suggest=2 
[Step 21] Latency p95=48.7ms Occ=0.14 QPS=192.5 Batch=2 → Suggest=2 
[Step 22] Latency p95=48.7ms Occ=0.13 QPS=186.3 Batch=2 → Suggest=2 
[Step 23] Latency p95=39.8ms Occ=0.12 QPS=178.5 Batch=2 → Suggest=4 
[Step 24] Latency p95=26.2ms Occ=0.11 QPS=172.0 Batch=4 → Suggest=8 
[Step 25] Latency p95=21.1ms Occ=0.11 QPS=166.8 Batch=8 → Suggest=16 
[Step 26] Latency p95=21.1ms Occ=0.10 QPS=164.0 Batch=16 → Suggest=32 
[Step 27] Latency p95=21.1ms Occ=0.11 QPS=166.4 Batch=32 → Suggest=32 
[Step 28] Latency p95=27.0ms Occ=0.11 QPS=172.9 Batch=32 → Suggest=32 
[Step 29] Latency p95=40.5ms Occ=0.12 QPS=181.9 Batch=32 → Suggest=32 

=== Simulating multi-QoS interaction ===

[Step 00] Shared occupancy: 0.33
  HIGH: Latency p95=20.8ms Batch=4 QPS=452.5
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=181.7
  LOW: Latency p95=53.7ms Batch=4 QPS=391.1

[Step 01] Shared occupancy: 0.55
  HIGH: Latency p95=22.5ms Batch=8 QPS=439.9
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=183.8
  LOW: Latency p95=52.8ms Batch=2 QPS=379.6

[Step 02] Shared occupancy: 0.69
  HIGH: Latency p95=22.8ms Batch=8 QPS=433.4
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=185.3
  LOW: Latency p95=51.8ms Batch=1 QPS=367.3

[Step 03] Shared occupancy: 0.60
  HIGH: Latency p95=26.8ms Batch=8 QPS=427.3
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=187.5
  LOW: Latency p95=50.9ms Batch=1 QPS=354.6

[Step 04] Shared occupancy: 0.61
  HIGH: Latency p95=27.8ms Batch=8 QPS=421.3
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=190.5
  LOW: Latency p95=50.0ms Batch=1 QPS=342.8

[Step 05] Shared occupancy: 0.44
  HIGH: Latency p95=27.8ms Batch=8 QPS=418.6
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=191.8
  LOW: Latency p95=49.1ms Batch=1 QPS=331.5

[Step 06] Shared occupancy: 0.56
  HIGH: Latency p95=27.8ms Batch=8 QPS=414.6
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=193.7
  LOW: Latency p95=48.1ms Batch=1 QPS=321.2

[Step 07] Shared occupancy: 0.65
  HIGH: Latency p95=28.5ms Batch=8 QPS=409.2
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=195.4
  LOW: Latency p95=47.2ms Batch=1 QPS=311.4

[Step 08] Shared occupancy: 0.56
  HIGH: Latency p95=28.5ms Batch=8 QPS=407.2
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=197.5
  LOW: Latency p95=46.3ms Batch=1 QPS=302.2

[Step 09] Shared occupancy: 0.69
  HIGH: Latency p95=28.9ms Batch=8 QPS=402.8
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=197.8
  LOW: Latency p95=45.4ms Batch=1 QPS=294.1

[Step 10] Shared occupancy: 0.64
  HIGH: Latency p95=28.9ms Batch=8 QPS=398.9
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=200.3
  LOW: Latency p95=44.4ms Batch=1 QPS=286.2

[Step 11] Shared occupancy: 0.62
  HIGH: Latency p95=28.9ms Batch=8 QPS=396.5
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=202.4
  LOW: Latency p95=43.5ms Batch=1 QPS=278.7

[Step 12] Shared occupancy: 0.69
  HIGH: Latency p95=28.9ms Batch=8 QPS=393.7
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=202.8
  LOW: Latency p95=42.6ms Batch=1 QPS=272.2

[Step 13] Shared occupancy: 0.54
  HIGH: Latency p95=28.9ms Batch=8 QPS=390.7
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=204.5
  LOW: Latency p95=41.7ms Batch=1 QPS=265.6

[Step 14] Shared occupancy: 0.69
  HIGH: Latency p95=29.3ms Batch=8 QPS=387.1
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=206.3
  LOW: Latency p95=40.7ms Batch=1 QPS=259.3

[Step 15] Shared occupancy: 0.45
  HIGH: Latency p95=29.3ms Batch=8 QPS=384.5
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=208.1
  LOW: Latency p95=39.8ms Batch=2 QPS=253.9

[Step 16] Shared occupancy: 0.31
  HIGH: Latency p95=29.2ms Batch=8 QPS=383.1
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=210.2
  LOW: Latency p95=38.9ms Batch=4 QPS=249.8

[Step 17] Shared occupancy: 0.56
  HIGH: Latency p95=29.1ms Batch=8 QPS=380.6
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=211.4
  LOW: Latency p95=37.9ms Batch=8 QPS=248.2

[Step 18] Shared occupancy: 0.55
  HIGH: Latency p95=30.3ms Batch=8 QPS=376.9
  DEFAULT: Latency p95=40.5ms Batch=4 QPS=213.3
  LOW: Latency p95=37.7ms Batch=16 QPS=247.5

[Step 19] Shared occupancy: 0.65
  HIGH: Latency p95=30.6ms Batch=8 QPS=372.9
  DEFAULT: Latency p95=41.5ms Batch=4 QPS=213.5
  LOW: Latency p95=46.2ms Batch=16 QPS=250.1

[Step 20] Shared occupancy: 0.65
  HIGH: Latency p95=34.2ms Batch=8 QPS=369.0
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=211.5
  LOW: Latency p95=50.8ms Batch=8 QPS=251.7

[Step 21] Shared occupancy: 0.55
  HIGH: Latency p95=34.0ms Batch=8 QPS=367.3
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=210.3
  LOW: Latency p95=50.6ms Batch=4 QPS=251.6

[Step 22] Shared occupancy: 0.54
  HIGH: Latency p95=33.8ms Batch=8 QPS=365.6
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=208.8
  LOW: Latency p95=50.3ms Batch=2 QPS=250.2

[Step 23] Shared occupancy: 0.51
  HIGH: Latency p95=33.6ms Batch=8 QPS=364.9
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=209.8
  LOW: Latency p95=50.1ms Batch=1 QPS=246.7

[Step 24] Shared occupancy: 0.44
  HIGH: Latency p95=33.4ms Batch=8 QPS=363.9
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=209.2
  LOW: Latency p95=49.8ms Batch=1 QPS=242.2

[Step 25] Shared occupancy: 0.38
  HIGH: Latency p95=33.2ms Batch=8 QPS=363.4
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=209.5
  LOW: Latency p95=49.6ms Batch=1 QPS=238.1

[Step 26] Shared occupancy: 0.42
  HIGH: Latency p95=33.0ms Batch=8 QPS=363.1
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=208.9
  LOW: Latency p95=49.3ms Batch=1 QPS=234.0

[Step 27] Shared occupancy: 0.54
  HIGH: Latency p95=32.9ms Batch=8 QPS=363.0
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=209.5
  LOW: Latency p95=49.1ms Batch=1 QPS=230.0

[Step 28] Shared occupancy: 0.41
  HIGH: Latency p95=32.7ms Batch=8 QPS=361.2
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=209.6
  LOW: Latency p95=48.8ms Batch=1 QPS=226.1

[Step 29] Shared occupancy: 0.68
  HIGH: Latency p95=32.5ms Batch=8 QPS=361.6
  DEFAULT: Latency p95=42.5ms Batch=4 QPS=210.2
  LOW: Latency p95=48.6ms Batch=1 QPS=222.9

=== Simulation Complete ===
Summary of final recommendations:
HIGH: Suggested batch=8, P95 Latency=32.5ms, QPS=361.6
DEFAULT: Suggested batch=4, P95 Latency=42.5ms, QPS=210.2
LOW: Suggested batch=1, P95 Latency=48.6ms, QPS=222.9

2