OpenAI: GPT Audio

openai/gpt-audio

ToolsJSONAudio

Use via OpenRouter ↗

Intelligence

—

Design Elo

—

Speed

—

tokens/sec

Latency

—

first token

Input price

$2.50

284th cheapest

Context

128K

16K max out

How it compares

Cheaper than14%

of all ranked models

Overview

The gpt-audio model is OpenAI's first generally available audio model. The new snapshot features an upgraded decoder for more natural sounding voices and maintains better voice consistency. Audio is priced...

Providers & pricing (1)

Provider	In $/M	Out $/M	Context	Uptime
OpenAI	$2.50	$10.00	128K	—

Specifications

Context window128K

Max output16K

Knowledge cutoff—

Input modalitiestext, audio

Output modalitiestext, audio

Prompt caching—

Cache read price—

ModeratedYes

GPT Audio FAQ

How much does GPT Audio cost?

GPT Audio costs $2.50 per million input tokens and $10.00 per million output tokens via OpenRouter, making it 284th cheapest of 332 paid models.

What is GPT Audio's context window?

GPT Audio supports a 128K-token context window and can output up to 16K tokens. It accepts text, audio input.

More from openai

All GPT Audio alternatives →

openai/gpt-5.6-luna-pro

Intel —$0.100/M

openai/gpt-5.6-luna

Intel 51.2$0.100/M

openai/gpt-5.6-terra-pro

Intel —$1.00/M

openai/gpt-5.6-terra

Intel 55.0$1.00/M

openai/gpt-5.6-sol-pro

Intel —$5.00/M

openai/gpt-5.6-sol

Intel 58.9$5.00/M

Compare head-to-head

OpenAI: GPT Audio vs OpenAI: GPT-5.6 Luna Pro OpenAI: GPT Audio vs OpenAI: GPT-5.6 Luna OpenAI: GPT Audio vs OpenAI: GPT-5.6 Terra Pro OpenAI: GPT Audio vs OpenAI: GPT-5.6 Terra OpenAI: GPT Audio vs OpenAI: GPT-5.6 Sol Pro OpenAI: GPT Audio vs OpenAI: GPT-5.6 Sol