Qwen: Qwen3 VL 8B Thinking

qwen/qwen3-vl-8b-thinking

ReasoningToolsJSONVision

Use via OpenRouter ↗

Intelligence

—

Design Elo

—

Speed

—

tokens/sec

Latency

—

first token

Input price

$0.180

91st cheapest

Context

131K

33K max out

How it compares

Cheaper than73%

of all ranked models

Overview

Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences. It integrates enhanced multimodal alignment and...

Providers & pricing (1)

Provider	In $/M	Out $/M	Context	Uptime
Alibabafp8	$0.180	$2.10	131K	—

Specifications

Context window131K

Max output33K

Knowledge cutoff—

Input modalitiesimage, text

Output modalitiestext

Prompt caching—

Cache read price—

ModeratedNo

Open weightsQwen/Qwen3-VL-8B-Thinking ↗

Qwen3 VL 8B Thinking FAQ

How much does Qwen3 VL 8B Thinking cost?

Qwen3 VL 8B Thinking costs $0.180 per million input tokens and $2.10 per million output tokens via OpenRouter, making it 91st cheapest of 332 paid models.