論文 arXiv 発表: 2026-05-14

Concurrency without Model Changes: Future-based Asynchronous Function Calling for LLMs

著者: Guangyu Feng, Huanzhi Mao, Prabal Dutta, Joseph E. Gonzalez

要約

Function calling, also known as tool use, is a core capability of modern LLM agents but is typically constrained by synchronous execution semantics. Under these semantics, LLM decoding is blocked until each function call completes, resulting in increasing end-to-end latency. In this work, we introdu…

#llm#coding#benchmark#agent#fine-tuning

Concurrency without Model Changes: Future-based Asynchronous Function Calling for LLMs

要約

同じカテゴリの記事

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

World-R1: テキストから動画生成における3D制約の強化学習による整合

OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents