Qwen: Qwen2.5 VL 72B Instruct
Qwen: Qwen2.5 VL 72B Instruct は マルチモーダル モデルで、視覚言語理解 に向いています。マルチモーダル入力処理、画像理解、32K tokensのコンテキスト、低コストの特性を組み合わせ、vision-language understanding and content analysis で安定した動作を支えます。品質・速度・コスト が重要な場面に合っており、安定した出力、柔軟な導入、拡張性を求めるチームに実用的です。 安定した応答、長い文脈処理、そして試作から本番まで広く使える柔軟さが必要な場面で役立ちます。 安定した応答、長い文脈処理、そして試作から本番まで広く使える柔軟さが必要な場面で役立ちます。 安定した応答、長い文脈処理、そして試作から本番まで広く使える柔軟さが必要な場面で役立ちます。
Input
$0.25/1M
Output
$0.75/1M
Cached
$0.06/1M
Batch
$0.13/1M