Roobia

Posted on Apr 16 • Originally published at apidog.com

Cómo Utilizar la API de Claude Opus 4.7

TL;DR

Claude Opus 4.7 (claude-opus-4-7) es el modelo GA más potente de Anthropic, con ventana de contexto de 1M de tokens, salida máxima de 128K, pensamiento adaptativo, esfuerzo xhigh, presupuestos de tareas, visión de alta resolución (3.75 MP) y uso de herramientas. Aquí tienes una guía de implementación paso a paso: configuración de la API, autenticación y ejemplos de código en Python, TypeScript y cURL para cada capacidad principal.

Prueba Apidog hoy mismo

Introducción

Anthropic lanzó Claude Opus 4.7 el 16 de abril de 2026. Es el modelo más avanzado de la familia Claude, ideal para razonamiento complejo, agentes autónomos y flujos de trabajo con visión avanzada.

Si ya usaste la API de Claude, la mayoría de la interfaz te será familiar, pero Opus 4.7 introduce cambios clave: los presupuestos de pensamiento extendido y los parámetros de muestreo (temperature, top_p, top_k) fueron eliminados. El modo de pensamiento ahora es solo adaptativo y está desactivado por defecto.

En esta guía aprenderás a:

Obtener la clave API
Hacer tu primera solicitud
Usar pensamiento adaptativo
Enviar imágenes de alta resolución
Configurar uso de herramientas
Usar presupuestos de tareas
Transmitir respuestas (streaming)
Depurar y probar tus llamadas API con Apidog

Cada ejemplo está listo para copiar y ejecutar.

Primeros pasos

Obtén tu clave API

Regístrate en console.anthropic.com
Ve a Claves API en el panel
Haz clic en Crear clave y copia la clave
Guárdala como variable de entorno:

export ANTHROPIC_API_KEY="sk-ant-your-key-here"

Instala el SDK

Python:

pip install anthropic

TypeScript/Node.js:

npm install @anthropic-ai/sdk

Punto final de la API

Todas las solicitudes usan:

POST https://api.anthropic.com/v1/messages

Encabezados requeridos:

x-api-key: YOUR_API_KEY
anthropic-version: 2023-06-01
content-type: application/json

Solicitud de texto básica

Envía un mensaje y recibe una respuesta.

Python:

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explain how HTTP/2 server push works in three sentences."}
    ]
)

print(message.content[0].text)

TypeScript:

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic();

const message = await client.messages.create({
  model: "claude-opus-4-7",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Explain how HTTP/2 server push works in three sentences." }
  ],
});

console.log(message.content[0].text);

cURL:

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-opus-4-7",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Explain how HTTP/2 server push works in three sentences."}
    ]
  }'

Pensamiento adaptativo

El pensamiento adaptativo es el único modo soportado en Opus 4.7. Permite a Claude ajustar el razonamiento según la tarea. Debes activarlo explícitamente.

Python:

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16384,
    thinking={
        "type": "adaptive",
        "display": "summarized"  # opcional, muestra el razonamiento
    },
    messages=[
        {"role": "user", "content": "Analyze this algorithm's time complexity and suggest optimizations:\n\ndef find_pairs(arr, target):\n    result = []\n    for i in range(len(arr)):\n        for j in range(i+1, len(arr)):\n            if arr[i] + arr[j] == target:\n                result.append((arr[i], arr[j]))\n    return result"}
    ]
)

for block in message.content:
    if block.type == "thinking":
        print("Thinking:", block.thinking)
    elif block.type == "text":
        print("Response:", block.text)

Puntos clave:

Usa "type": "adaptive" para activar el modo. No uses budget_tokens.
Con "display": "summarized" ves el razonamiento en la respuesta.
Combina con el parámetro effort para controlar la profundidad.

Uso del parámetro de esfuerzo

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16384,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},  # xhigh | high | medium | low
    messages=[
        {"role": "user", "content": "Review this pull request for security vulnerabilities..."}
    ]
)

Niveles de esfuerzo recomendados:

Nivel	Ideal para
`xhigh`	Codificación, agentes, razonamiento complejo
`high`	Tareas intensivas en inteligencia
`medium`	Equilibrio velocidad/calidad
`low`	Tareas simples, respuestas rápidas

Visión de alta resolución

Opus 4.7 acepta imágenes de hasta 2.576 píxeles en el borde largo (3.75MP). Las coordenadas se mapean 1:1 a los píxeles.

Python — imagen desde URL:

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://example.com/architecture-diagram.png"
                    }
                },
                {
                    "type": "text",
                    "text": "Describe this architecture diagram. List every service and the connections between them."
                }
            ]
        }
    ]
)

print(message.content[0].text)

Python — imagen local en base64:

import base64

with open("screenshot.png", "rb") as f:
    image_data = base64.standard_b64encode(f.read()).decode("utf-8")

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": "image/png",
                        "data": image_data
                    }
                },
                {
                    "type": "text",
                    "text": "What UI bugs do you see in this screenshot?"
                }
            ]
        }
    ]
)

Las imágenes de mayor resolución consumen más tokens. Redimensiona si no necesitas máxima fidelidad.

Uso de herramientas (Llamada a funciones)

Claude puede llamar funciones que defines. Opus 4.7 usa menos llamadas por defecto; sube el esfuerzo para forzarlas.

Python:

import json

tools = [
    {
        "name": "get_weather",
        "description": "Get current weather for a city. Returns temperature, conditions, and humidity.",
        "input_schema": {
            "type": "object",
            "properties": {
                "city": {
                    "type": "string",
                    "description": "City name, e.g. 'San Francisco'"
                },
                "units": {
                    "type": "string",
                    "enum": ["celsius", "fahrenheit"],
                    "description": "Temperature unit"
                }
            },
            "required": ["city"]
        }
    }
]

messages = [
    {"role": "user", "content": "What's the weather like in Tokyo right now?"}
]

# Primer llamado — Claude solicita una herramienta
response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    tools=tools,
    messages=messages,
)

# Procesa llamadas a herramientas
if response.stop_reason == "tool_use":
    messages.append({"role": "assistant", "content": response.content})

    tool_results = []
    for block in response.content:
        if block.type == "tool_use":
            # Ejecuta tu función aquí
            result = {"temperature": 22, "conditions": "Partly cloudy", "humidity": 65}

            tool_results.append({
                "type": "tool_result",
                "tool_use_id": block.id,
                "content": json.dumps(result)
            })

    messages.append({"role": "user", "content": tool_results})

    # Segundo llamado — Claude procesa el resultado
    final_response = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        tools=tools,
        messages=messages,
    )
    print(final_response.content[0].text)

Patrón de bucle de agente

Para agentes autónomos con múltiples herramientas en secuencia:

def run_agent(system_prompt: str, tools: list, user_message: str) -> str:
    messages = [{"role": "user", "content": user_message}]

    while True:
        response = client.messages.create(
            model="claude-opus-4-7",
            max_tokens=16384,
            system=system_prompt,
            tools=tools,
            thinking={"type": "adaptive"},
            output_config={"effort": "xhigh"},
            messages=messages,
        )

        messages.append({"role": "assistant", "content": response.content})

        if response.stop_reason != "tool_use":
            return "".join(
                block.text for block in response.content
                if hasattr(block, "text")
            )

        tool_results = []
        for block in response.content:
            if block.type == "tool_use":
                result = execute_tool(block.name, block.input)
                tool_results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": result,
                })

        messages.append({"role": "user", "content": tool_results})

Presupuestos de tareas (Beta)

Los presupuestos de tareas asignan tokens para todo un ciclo de agente. Claude ve y gestiona el presupuesto.

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    },
    messages=[
        {"role": "user", "content": "Review the codebase and propose a refactor plan."}
    ],
    betas=["task-budgets-2026-03-13"],
)

Restricciones:

Mínimo: 20,000 tokens
Es una sugerencia, no un límite estricto
Diferente a max_tokens
Requiere el encabezado beta task-budgets-2026-03-13

Respuestas en streaming

Transmite respuestas para salida en tiempo real en chats.

Python:

with client.messages.stream(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {"role": "user", "content": "Write a Python function to parse CSV files with error handling."}
    ]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

TypeScript:

const stream = await client.messages.stream({
  model: "claude-opus-4-7",
  max_tokens: 4096,
  messages: [
    { role: "user", content: "Write a Python function to parse CSV files with error handling." }
  ],
});

for await (const event of stream) {
  if (event.type === "content_block_delta" && event.delta.type === "text_delta") {
    process.stdout.write(event.delta.text);
  }
}

Si usas pensamiento adaptativo con display: "summarized", verás primero bloques de pensamiento, luego el texto.

Almacenamiento en caché de prompts

Reduce costos almacenando prompts repetidos o documentos largos.

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "You are a senior code reviewer. Review code for security vulnerabilities, performance issues, and best practices violations...",
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[
        {"role": "user", "content": "Review this function:\n\ndef process_user_input(data):\n    return eval(data)"}
    ]
)

Precios de caché Opus 4.7:

Operación	Costo
Escritura 5 min	$6.25 / MTok (1.25x)
Escritura 1 hora	$10 / MTok (2x)
Lectura/acierto caché	$0.50 / MTok (0.1x)

Una sola lectura de caché cubre la escritura de 5 min; dos lecturas cubren 1 hora.

Conversaciones multi-turno

Mantén el contexto agregando mensajes al array.

messages = []

# Turno 1
messages.append({"role": "user", "content": "I need to build a REST API for a todo app."})

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=messages,
)

messages.append({"role": "assistant", "content": response.content})

# Turno 2
messages.append({"role": "user", "content": "Add authentication with JWT tokens."})

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=messages,
)

Probando tus llamadas API con Apidog

Construir integraciones para Claude implica cargas útiles complejas (multi-turnos, herramientas, imágenes base64, streaming). Apidog facilita la depuración y pruebas.

Configura tu entorno:

Crea un proyecto en Apidog y agrega el endpoint de Claude
Guarda tu ANTHROPIC_API_KEY como variable de entorno
Configura encabezados requeridos (x-api-key, anthropic-version, content-type)

Prueba flujos de herramientas:

Encadena solicitudes para simular un ciclo completo de uso de herramientas y visualiza cada payload en el inspector.

Compara modelos:

Ejecuta los mismos prompts en claude-opus-4-6 y claude-opus-4-7 y compara tokens, calidad y latencia. El ejecutor de pruebas de Apidog facilita A/B testing.

Valida esquemas:

Define esquemas JSON para validar automáticamente las respuestas de Claude y detectar regresiones.

Errores comunes y soluciones

Error	Causa	Solución
400: `thinking.budget_tokens` no compatible	Sintaxis de pensamiento extendido	Usa `thinking: {"type": "adaptive"}`
400: `temperature` no compatible	Parámetros de muestreo no soportados	Elimina `temperature`, `top_p`, `top_k`
400: `max_tokens` excedido	Tokenizador usa más tokens	Aumenta `max_tokens` (hasta 128,000)
429: Límite de tasa alcanzado	Demasiadas solicitudes	Implementa retroceso exponencial; revisa tus límites
Bloques de pensamiento en blanco	`display` por defecto es `"omitted"`	Añade `display: "summarized"` en la configuración

Referencia de precios

Uso	Costo
Tokens de entrada	$5 / MTok
Tokens de salida	$25 / MTok
Entrada por lotes	$2.50 / MTok
Salida por lotes	$12.50 / MTok
Lecturas de caché	$0.50 / MTok
Escrituras caché 5 min	$6.25 / MTok
Escrituras caché 1 hora	$10 / MTok

Nota: El tokenizador de Opus 4.7 puede usar hasta 35% más tokens que Opus 4.6 para el mismo texto. Usa el endpoint /v1/messages/count_tokens para estimar costos antes de producción.

Conclusión

Claude Opus 4.7 es el modelo más avanzado de la familia Claude. Aunque la API sigue siendo compatible con Opus 4.6, elimina presupuestos de pensamiento extendido y parámetros de muestreo, lo que requiere ajustes en tu código. Las nuevas funciones — pensamiento adaptativo, esfuerzo xhigh, presupuestos de tareas y visión de alta resolución — te dan más control sobre el razonamiento y costes.

Empieza con solicitudes de texto simples, agrega pensamiento adaptativo para casos complejos y conecta herramientas y presupuestos de tareas según crezca tu agente. Usa Apidog para probar, validar y comparar versiones de modelo en tus integraciones.

DEV Community

Cómo Utilizar la API de Claude Opus 4.7

TL;DR

Introducción

Primeros pasos

Obtén tu clave API

Instala el SDK

Punto final de la API

Solicitud de texto básica

Pensamiento adaptativo

Uso del parámetro de esfuerzo

Visión de alta resolución

Uso de herramientas (Llamada a funciones)

Patrón de bucle de agente

Presupuestos de tareas (Beta)

Respuestas en streaming

Almacenamiento en caché de prompts

Conversaciones multi-turno

Probando tus llamadas API con Apidog

Errores comunes y soluciones

Referencia de precios

Conclusión

Top comments (0)