Precio único, cubre todos los modelos.
Controlador de motor de programación de desarrollo propio: reconocimiento de intención + clasificación de dificultad L1-L5 enruta automáticamente cada solicitud al modelo con el mejor rendimiento de costos. Los usuarios no tienen que preocuparse por elegir.
Selección de archivos, enrutamiento dentro del grupo: precios predecibles, límites mensuales autoestablecidos
Rápido
precio más bajoNivel de entrada, suficiente para satisfacer la mayoría de las necesidades de las empresas.
modelo: inteligente/rápidoEquilibrado
RecomendadoArchivo avanzado, adecuado para usuarios que tienen requisitos estrictos de calidad.
modelo: inteligente/equilibradoLímite de consumo mensual (tú tienes la última palabra)
Pague solo por lo que usa — el servicio se pausa automáticamente cuando se agota el saldo (recargue para continuar). Incluso si nuestra plataforma sufre pérdidas, no pausaremos su servicio — **el precio que prometemos es el precio que obtiene**.
- Control de usuario: establezca el límite superior usted mismo y deténgase cuando alcance el límite
- Garantía de plataforma: la pérdida es asunto nuestro y no le obligaremos a actualizar
- Seguro inteligente: seleccione automáticamente modelos más baratos (de calidad ligeramente inferior) cuando pierda dinero y nunca fuerce las interrupciones
Uso
Totalmente compatible con OpenAI SDK, simplemente escriba el nombre del archivo en el campo del modelo:
from openai import OpenAI
client = OpenAI(
base_url="https://api.nexevo.ai/v1",
api_key="sk-...",
)
response = client.chat.completions.create(
model="nexevo/balanced", # 或 "nexevo/fast"
messages=[{"role": "user", "content": "..."}],
)5 algoritmos principales para el enrutamiento inteligente
Identificación de intenciones, clasificación de dificultades, enrutamiento de capacidades, compensación de costos, interrupción de circuitos: 5 algoritmos centrales seleccionan automáticamente el modelo más adecuado dentro del archivo, ahorrando un promedio de más del 50%.