[1]

M. Sullivan, B. He, and P. Evans, “Learning When to Reason: Gating LLM Inference for Cost-Efficient Serverless Function Scheduling at Scale”, AJAS, vol. 2, no. 1, pp. 39–45, Jun. 2026, doi: 10.54097/gwmv0761.