ai-cli-runner

Async Python package for calling AI CLI tools (Claude, Gemini, Cursor) via subprocess. Includes LLM cost calculation via LiteLLM pricing data and model listing/validation.

Install

uv add ai-cli-runner

Quick Start

import asyncio
from ai_cli_runner import call_ai_cli

async def main():
    result = await call_ai_cli(
        prompt="What is the capital of France?",
        ai_provider="claude",
        ai_model="claude-haiku-4-20250514",
        output_format="json",
    )

    if result.success:
        print(result.text)
        if result.usage:
            print(f"Tokens: in={result.usage.input_tokens} out={result.usage.output_tokens}")
            if result.usage.cost_usd is not None:
                print(f"Cost: ${result.usage.cost_usd:.6f}")

asyncio.run(main())

See examples/ for complete usage:

Example	What it shows
`basic_call.py`	Parallel calls to all 3 providers with token usage
`with_pricing.py`	LLM cost tracking via LiteLLM pricing
`model_listing.py`	List models, validate names, check CLI availability
`session_usage.py`	Session management — start, resume, and continue

Run any example: uv run examples/basic_call.py

API

`call_ai_cli(prompt, cwd, ai_provider, ai_model, ai_cli_timeout, cli_flags, output_format, session_id, continue_session) → AIResult`

Call an AI CLI tool. Pass output_format="json" to get structured token usage and session IDs.

`check_ai_cli_available(ai_provider, ai_model, cli_flags) → AIResult`

Send a trivial prompt to verify the CLI is installed and working.

`AIResult`

Field	Type	Description
`success`	`bool`	Whether the call succeeded
`text`	`str`	Response text
`usage`	`AITokenUsage \| None`	Token usage (when `output_format="json"`)
`session_id`	`str \| None`	Session ID for resuming (when `output_format="json"`)
`thinking`	`str`	Intermediate reasoning/chain-of-thought (populated for Cursor; empty for Claude/Gemini)

Supports tuple unpacking (success, text = await call_ai_cli(...)) and boolean evaluation (if result: ...).

`AITokenUsage`

Field	Type	Description
`input_tokens`	`int`	Tokens in the prompt
`output_tokens`	`int`	Tokens in the response
`cache_read_tokens`	`int`	Tokens read from cache
`cache_write_tokens`	`int`	Tokens written to cache
`cost_usd`	`float \| None`	Cost in USD (native or LiteLLM calculated)
`duration_ms`	`int \| None`	Wall-clock duration
`model`	`str`	Model used
`provider`	`str`	Provider name
`session_id`	`str`	Session ID from provider response

Cost Calculation

Claude reports cost natively. For Gemini and Cursor, costs are calculated using LiteLLM pricing data:

from ai_cli_runner import pricing_cache

await pricing_cache.load()  # call once at startup
# cost_usd is now auto-populated on all output_format="json" calls

Session Management

All providers support multi-turn conversations via sessions. Use output_format="json" to get session IDs:

# Start a session
result = await call_ai_cli(
    prompt="My name is Alice.",
    ai_provider="claude",
    ai_model="claude-haiku-4-20250514",
    output_format="json",
)
session_id = result.session_id  # capture for later

# Resume by session ID
followup = await call_ai_cli(
    prompt="What is my name?",
    ai_provider="claude",
    ai_model="claude-haiku-4-20250514",
    output_format="json",
    session_id=session_id,
)

# Continue the most recent session (no ID needed)
continued = await call_ai_cli(
    prompt="Thanks!",
    ai_provider="claude",
    ai_model="claude-haiku-4-20250514",
    output_format="json",
    continue_session=True,
)

session_id and continue_session are mutually exclusive.

Model Listing & Validation

from ai_cli_runner import model_cache, pricing_cache

await pricing_cache.load()
models = await model_cache.list_models("claude")
is_valid = model_cache.is_valid_model("claude", "claude-haiku-4-20250514")

Supported Providers

Provider	Binary	Notes	Session flags
`claude`	`claude`	`-p` flag for non-interactive mode	`--continue`, `--resume <id>`
`gemini`	`gemini`	Stdin prompt	`--resume`, `--resume <id>`
`cursor`	`agent`	`--workspace` for cwd	`--continue`, `--resume <id>`

Environment Variables

Variable	Default	Purpose
`AI_CLI_TIMEOUT`	`10`	Timeout in minutes for AI CLI calls

Development

uv sync --all-extras
uv run pytest
uv run ruff check .
uv run ruff format .
uv run mypy src/

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
examples		examples
src/ai_cli_runner		src/ai_cli_runner
tests		tests
.flake8		.flake8
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
AGENTS.md		AGENTS.md
CLAUDE.md		CLAUDE.md
README.md		README.md
pyproject.toml		pyproject.toml
ruff.toml		ruff.toml
tox.toml		tox.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ai-cli-runner

Install

Quick Start

API

`call_ai_cli(prompt, cwd, ai_provider, ai_model, ai_cli_timeout, cli_flags, output_format, session_id, continue_session) → AIResult`

`check_ai_cli_available(ai_provider, ai_model, cli_flags) → AIResult`

`AIResult`

`AITokenUsage`

Cost Calculation

Session Management

Model Listing & Validation

Supported Providers

Environment Variables

Development

About

Uh oh!

Releases 7

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ai-cli-runner

Install

Quick Start

API

call_ai_cli(prompt, cwd, ai_provider, ai_model, ai_cli_timeout, cli_flags, output_format, session_id, continue_session) → AIResult

check_ai_cli_available(ai_provider, ai_model, cli_flags) → AIResult

AIResult

AITokenUsage

Cost Calculation

Session Management

Model Listing & Validation

Supported Providers

Environment Variables

Development

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 7

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`call_ai_cli(prompt, cwd, ai_provider, ai_model, ai_cli_timeout, cli_flags, output_format, session_id, continue_session) → AIResult`

`check_ai_cli_available(ai_provider, ai_model, cli_flags) → AIResult`

`AIResult`

`AITokenUsage`

Packages