Question 1

제가 모델을 선택하게 해주시지 않겠습니까?

Accepted Answer

모델을 선택하는 것이 번거롭고 수동으로 정확하게 선택하기 어렵기 때문입니다. 자체 개발한 스케줄링 엔진에는 5가지 주요 알고리즘 모듈(의도 인식, L1-L5 난이도 분류, 지능형 라우팅, 품질 평가, 회로 차단기 성능 저하)이 있습니다. 난이도를 평가하고 각 요청의 의도를 분류한 다음 자격을 갖춘 모델 풀에서 가장 저렴한 모델을 선택합니다. L1 간단한 작업의 경우 Qwen-Turbo($0.20/M)를 사용하고, L4 심층 추론의 경우 GPT-4o-mini 또는 DeepSeek-Reasoner를 사용하고, L5 복잡한 작업의 경우 GPT-4o/Claude Sonnet을 사용하세요. 완전 자동이며 근거가 확실합니다.

Question 2

OpenRouter/일반 집계 게이트웨이와의 차이점은 무엇입니까?

Accepted Answer

대부분의 집계 게이트웨이는 "모델 이름 지정 → 전달"을 위한 씬 프록시입니다. 우리는 그렇지 않습니다. 자체 개발한 일정 엔진을 사용하여 난이도를 평가하고 각 요청의 의도를 분석한 다음 "품질 임계값을 충족하는 가장 저렴한 모델"을 기반으로 결정을 내립니다. 성능 차원은 해외 벤치마크(HumanEval/MMLU-Pro/MATH/MT-Bench)와 중국 벤치마크(OpenCompass/SuperCLUE/CMMLU)의 종합 점수로 가중치 60/40이며, 제조사가 자체 보고하지 않습니다.

Question 3

얼마나 절약할 수 있나요?

Accepted Answer

혼합 비용 모델에 따르면 트래픽의 80%는 효율적인 모델(약 $0.40/1M 입력)에서 제공되는 일일 채팅이고, 20%는 플래그십 모델(약 $8/1M)에서 제공되는 하드 트래픽입니다. 귀하의 정액 가격은 $3/$12입니다. 항상 플래그십 모델을 구매하는 것에 비해 이슈 조합에 따라 40~56%를 절약할 수 있습니다.

Question 4

재시도 및 헤징 경로에 대한 비용을 지불해야 합니까?

Accepted Answer

아니요. 내부 재시도, 헤징, 캐시 워밍 비용은 당사가 부담합니다. 실제로 받은 입력 + 최종 출력에 대해서만 비용을 지불하면 됩니다. 관리 백엔드에는 전체 분석을 볼 수 있는 조정 도구가 있습니다.

Question 5

캐시할인이란 무엇인가요?

Accepted Answer

캐시 적중(정확한 또는 의미적)에는 일반 가격의 25%가 청구됩니다. 질문을 반복하는 것은 두 번째로 75% 저렴합니다. 또한 내부적으로 업스트림 프롬프트 캐싱(OpenAI/Anthropic/DeepSeek)을 사용하고 있으며, 절약된 비용은 정액 가격에 반영되었습니다.

Question 6

OpenAI SDK를 사용할 수 있나요?

Accepted Answer

수 있습니다. 우리의 API는 OpenAI와 완벽하게 호환됩니다. SDK의 base_url을 우리 게이트웨이인 model=nexevo/balanced로 지정하고 사용을 시작하세요. 함수 호출, 스트리밍 및 시각적 입력을 모두 변경 없이 사용할 수 있습니다.

Question 7

내 데이터가 훈련에 사용되나요?

Accepted Answer

아니요. 당사는 업스트림 제조업체의 "교육용 아님" 조건에 따라 요청을 전달합니다. 귀하의 프롬프트와 응답은 모델 개선을 위해 보관되지 않습니다.

Question 8

어떤 모델로 라우팅합니까?

Accepted Answer

OpenAI, Anthropic, Google, DeepSeek, Mistral, xAI, Tongyi, Moonshot, Zhipu, Cohere, Together, Fireworks, Groq, Cerebras, Perplexity, SiliconFlow — 총 60개 이상의 모델. 우리는 계속해서 백엔드에 새로운 모델을 통합하고 있으며 귀하의 코드는 전혀 변경되지 않을 것입니다.

FAQ