Meta: Llama 3.2 11B Vision Instruct

meta-llama/llama-3.2-11b-vision-instruct

Try model on Ridvay Chat Get Ridvay API Keys

Description

Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data. It excels in tasks such as image captioning and...

API Usage Examples

OpenAI Compatible Endpoint

Use this endpoint with any OpenAI-compatible library. Model: Meta: Llama 3.2 11B Vision Instruct (meta-llama/llama-3.2-11b-vision-instruct)

curl https://api.ridvay.com/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer YOUR_API_KEY"   -d '{
    "model": "meta-llama/llama-3.2-11b-vision-instruct",
    "messages": [
      {
        "role": "user",
        "content": "Explain the capabilities of the Meta: Llama 3.2 11B Vision Instruct model"
      }
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'

Supported Modalities

Text
Images

API Pricing

Input: 0.345$ / 1M tokens
Output: 0.345$ / 1M tokens

Token Limits

Max Output: 16,384 tokens
Max Context: 131,072 tokens

Subscription Tiers

free
pro
ultimate

Meta: Llama 3.2 11B Vision Instruct

Description

API Usage Examples

OpenAI Compatible Endpoint

Supported Modalities

API Pricing

Token Limits

Subscription Tiers

More from meta-llama

Meta: Llama 3 8B Instruct

Meta: Llama 3.1 8B Instruct

Meta: Llama 4 Scout

Meta: Llama 4 Maverick

Meta: Llama 3 70B Instruct

Meta: Llama 3.1 70B Instruct

Meta: Llama 3.2 1B Instruct

Meta: Llama 3.3 70B Instruct