Nexevo.aiNexevo.ai

FAQ

자체 개발한 스케줄링 엔진, 가격, 비용 절감 방법에 대한 설명입니다.

제가 모델을 선택하게 해주시지 않겠습니까?
모델을 선택하는 것이 번거롭고 수동으로 정확하게 선택하기 어렵기 때문입니다. 자체 개발한 스케줄링 엔진에는 5가지 주요 알고리즘 모듈(의도 인식, L1-L5 난이도 분류, 지능형 라우팅, 품질 평가, 회로 차단기 성능 저하)이 있습니다. 난이도를 평가하고 각 요청의 의도를 분류한 다음 자격을 갖춘 모델 풀에서 가장 저렴한 모델을 선택합니다. L1 간단한 작업의 경우 Qwen-Turbo($0.20/M)를 사용하고, L4 심층 추론의 경우 GPT-4o-mini 또는 DeepSeek-Reasoner를 사용하고, L5 복잡한 작업의 경우 GPT-4o/Claude Sonnet을 사용하세요. 완전 자동이며 근거가 확실합니다.
OpenRouter/일반 집계 게이트웨이와의 차이점은 무엇입니까?
대부분의 집계 게이트웨이는 "모델 이름 지정 → 전달"을 위한 씬 프록시입니다. 우리는 그렇지 않습니다. 자체 개발한 일정 엔진을 사용하여 난이도를 평가하고 각 요청의 의도를 분석한 다음 "품질 임계값을 충족하는 가장 저렴한 모델"을 기반으로 결정을 내립니다. 성능 차원은 해외 벤치마크(HumanEval/MMLU-Pro/MATH/MT-Bench)와 중국 벤치마크(OpenCompass/SuperCLUE/CMMLU)의 종합 점수로 가중치 60/40이며, 제조사가 자체 보고하지 않습니다.
얼마나 절약할 수 있나요?
혼합 비용 모델에 따르면 트래픽의 80%는 효율적인 모델(약 $0.40/1M 입력)에서 제공되는 일일 채팅이고, 20%는 플래그십 모델(약 $8/1M)에서 제공되는 하드 트래픽입니다. 귀하의 정액 가격은 $3/$12입니다. 항상 플래그십 모델을 구매하는 것에 비해 이슈 조합에 따라 40~56%를 절약할 수 있습니다.
재시도 및 헤징 경로에 대한 비용을 지불해야 합니까?
아니요. 내부 재시도, 헤징, 캐시 워밍 비용은 당사가 부담합니다. 실제로 받은 입력 + 최종 출력에 대해서만 비용을 지불하면 됩니다. 관리 백엔드에는 전체 분석을 볼 수 있는 조정 도구가 있습니다.
캐시할인이란 무엇인가요?
캐시 적중(정확한 또는 의미적)에는 일반 가격의 25%가 청구됩니다. 질문을 반복하는 것은 두 번째로 75% 저렴합니다. 또한 내부적으로 업스트림 프롬프트 캐싱(OpenAI/Anthropic/DeepSeek)을 사용하고 있으며, 절약된 비용은 정액 가격에 반영되었습니다.
OpenAI SDK를 사용할 수 있나요?
수 있습니다. 우리의 API는 OpenAI와 완벽하게 호환됩니다. SDK의 base_url을 우리 게이트웨이인 model=nexevo/balanced로 지정하고 사용을 시작하세요. 함수 호출, 스트리밍 및 시각적 입력을 모두 변경 없이 사용할 수 있습니다.
내 데이터가 훈련에 사용되나요?
아니요. 당사는 업스트림 제조업체의 "교육용 아님" 조건에 따라 요청을 전달합니다. 귀하의 프롬프트와 응답은 모델 개선을 위해 보관되지 않습니다.
어떤 모델로 라우팅합니까?
OpenAI, Anthropic, Google, DeepSeek, Mistral, xAI, Tongyi, Moonshot, Zhipu, Cohere, Together, Fireworks, Groq, Cerebras, Perplexity, SiliconFlow — 총 60개 이상의 모델. 우리는 계속해서 백엔드에 새로운 모델을 통합하고 있으며 귀하의 코드는 전혀 변경되지 않을 것입니다.
자주 묻는 질문 · 가격, 개인 정보 보호, 라우팅 메커니즘 | Nexevo.ai