Precio único, cubre todos los modelos.

Controlador de motor de programación de desarrollo propio: reconocimiento de intención + clasificación de dificultad L1-L5 enruta automáticamente cada solicitud al modelo con el mejor rendimiento de costos. Los usuarios no tienen que preocuparse por elegir.

Selección de archivos, enrutamiento dentro del grupo: precios predecibles, límites mensuales autoestablecidos

Rápido

precio más bajo

Nivel de entrada, suficiente para satisfacer la mayoría de las necesidades de las empresas.

$0.80 / 1M input

$2 / 1M output

API

modelo: inteligente/rápido

Adecuado para: tareas de formación diarias, sensibles al presupuesto, reducción de costes y mejora de la eficiencia.

Empezar ahora

Equilibrado

Recomendado

Archivo avanzado, adecuado para usuarios que tienen requisitos estrictos de calidad.

$5 / 1M input

$20 / 1M output

API

modelo: inteligente/equilibrado

Adecuado para: generación de código, análisis en profundidad, creación de contenido, razonamiento de varios pasos, generación de imágenes / audio-vídeo

Empezar ahora

Trust by design

Límite de consumo mensual (tú tienes la última palabra)

Pague solo por lo que usa — el servicio se pausa automáticamente cuando se agota el saldo (recargue para continuar). Incluso si nuestra plataforma sufre pérdidas, no pausaremos su servicio — **el precio que prometemos es el precio que obtiene**.

Control de usuario: establezca el límite superior usted mismo y deténgase cuando alcance el límite
Garantía de plataforma: la pérdida es asunto nuestro y no le obligaremos a actualizar
Seguro inteligente: seleccione automáticamente modelos más baratos (de calidad ligeramente inferior) cuando pierda dinero y nunca fuerce las interrupciones

Example

$32/ $100

spent32%

Auto-pause at

$100

Uso

Totalmente compatible con OpenAI SDK, simplemente escriba el nombre del archivo en el campo del modelo:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.nexevo.ai/v1",
    api_key="sk-...",
)

response = client.chat.completions.create(
    model="nexevo/balanced",     # 或 "nexevo/fast"
    messages=[{"role": "user", "content": "..."}],
)

Routing engine

5 algoritmos principales para el enrutamiento inteligente

Identificación de intenciones, clasificación de dificultades, enrutamiento de capacidades, compensación de costos, interrupción de circuitos: 5 algoritmos centrales seleccionan automáticamente el modelo más adecuado dentro del archivo, ahorrando un promedio de más del 50%.

IntentDifficultySmart routingQualityCircuit breaker

Ahorro promedio de 50%+

¿Aún tienes preguntas?

Vea las preguntas frecuentes sobre la programación de autoestudio, la privacidad de los datos y los descuentos en caché.