Question 1

आप मुझे एक मॉडल चुनने की अनुमति क्यों नहीं देते?

Accepted Answer

क्योंकि मॉडल का चयन करना एक कठिन काम है और मैन्युअल रूप से सटीक चयन करना कठिन है। हमारे स्व-विकसित शेड्यूलिंग इंजन में पांच प्रमुख एल्गोरिदम मॉड्यूल (आशय पहचान, एल 1-एल 5 कठिनाई वर्गीकरण, बुद्धिमान रूटिंग, गुणवत्ता मूल्यांकन, सर्किट ब्रेकर गिरावट) हैं। यह कठिनाई का मूल्यांकन करता है और प्रत्येक अनुरोध के इरादे को वर्गीकृत करता है, और फिर योग्य मॉडल पूल से सबसे सस्ते का चयन करता है। L1 सरल कार्यों के लिए, क्वेन-टर्बो ($0.20/M) का उपयोग करें, L4 गहन तर्क के लिए, GPT-4o-मिनी या डीपसीक-रीज़नर का उपयोग करें, और L5 जटिल कार्यों के लिए, GPT-4o / क्लाउड सॉनेट का उपयोग करें - पूरी तरह से स्वचालित और अच्छी तरह से स्थापित।

Question 2

ओपनराउटर/सामान्य एकत्रीकरण गेटवे से क्या अंतर है?

Accepted Answer

अधिकांश एकत्रीकरण गेटवे "आप मॉडल नाम निर्दिष्ट करते हैं → हम इसे अग्रेषित करते हैं" के लिए पतली प्रॉक्सी हैं। हम नहीं हैं - हम कठिनाई को ग्रेड करने और प्रत्येक अनुरोध के इरादे का विश्लेषण करने के लिए अपने स्व-विकसित शेड्यूलिंग इंजन का उपयोग करते हैं, और फिर "गुणवत्ता सीमा को पूरा करने वाले सबसे सस्ते मॉडल" के आधार पर निर्णय लेते हैं। क्षमता आयाम 60/40 के वजन के साथ विदेशी बेंचमार्क (ह्यूमनएवल/एमएमएलयू-प्रो/एमएटीएच/एमटी-बेंच) और चीनी बेंचमार्क (ओपनकंपास/सुपरक्लू/सीएमएमएलयू) का व्यापक स्कोर है, और निर्माता द्वारा स्वयं-रिपोर्ट नहीं किया गया है।

Question 3

आप कितना बचा सकते हैं?

Accepted Answer

हमारे मिश्रित लागत मॉडल के अनुसार: 80% ट्रैफ़िक कुशल मॉडल (लगभग $0.40/1M इनपुट) द्वारा प्रदान की जाने वाली दैनिक चैट है, 20% फ्लैगशिप मॉडल (लगभग $8/1M इनपुट) द्वारा प्रदान किया जाने वाला हार्ड ट्रैफ़िक है। आपके फ्लैट की कीमत $3/$12 है। हमेशा फ्लैगशिप मॉडल खरीदने की तुलना में, आप मुद्दों के संयोजन के आधार पर 40 ~ 56% बचा सकते हैं।

Question 4

क्या मुझे पुनः प्रयास और हेजिंग पथ के लिए भुगतान करना होगा?

Accepted Answer

नहीं, आंतरिक पुनर्प्रयास, हेजिंग और कैश वार्मिंग की लागत हमारे द्वारा वहन की जाती है। आप केवल उस इनपुट के लिए भुगतान करते हैं जो आपको वास्तव में प्राप्त होता है + अंतिम आउटपुट के लिए। संपूर्ण ब्रेकडाउन देखने के लिए प्रबंधन बैकएंड में एक समाधान उपकरण है।

Question 5

कैश डिस्काउंट क्या है?

Accepted Answer

कैश हिट्स (सटीक या सिमेंटिक) पर नियमित कीमत का 25% शुल्क लिया जाता है। एक प्रश्न को दूसरी बार दोहराना 75% सस्ता है। हम आंतरिक रूप से अपस्ट्रीम प्रॉम्प्ट कैशिंग (ओपनएआई / एंथ्रोपिक / डीपसीक) का भी उपयोग करते हैं, और बचाया गया पैसा फ्लैट कीमत में परिलक्षित होता है।

Question 6

क्या मैं OpenAI SDK का उपयोग कर सकता हूँ?

Accepted Answer

कर सकते हैं. हमारा एपीआई OpenAI के साथ पूरी तरह से संगत है। SDK के बेस_यूआरएल को हमारे गेटवे, मॉडल=स्मार्टिसन-ऑटो पर इंगित करें, और इसका उपयोग शुरू करें। फ़ंक्शन कॉलिंग, स्ट्रीमिंग और विज़ुअल इनपुट सभी शून्य परिवर्तन के साथ उपलब्ध हैं।

Question 7

क्या मेरे डेटा का उपयोग प्रशिक्षण के लिए किया जाएगा?

Accepted Answer

नहीं, हम अपस्ट्रीम निर्माता की "प्रशिक्षण के लिए नहीं" शर्तों के अनुसार अनुरोध अग्रेषित करते हैं। मॉडल सुधार के लिए आपके संकेत और प्रतिक्रियाएँ बरकरार नहीं रखी जाती हैं।

Question 8

आप किन मॉडलों पर रूट करते हैं?

Accepted Answer

ओपनएआई, एंथ्रोपिक, गूगल, डीपसीक, मिस्ट्रल, एक्सएआई, टोंगयी, मूनशॉट, जिपु, कोहेयर, टुगेदर, फायरवर्क्स, ग्रोक, सेरेब्रस, पर्प्लेक्सिटी, सिलिकॉनफ्लो - कुल मिलाकर 60+ मॉडल। हम बैकएंड में नए मॉडलों को एकीकृत करना जारी रखते हैं, और आपके कोड में शून्य परिवर्तन होंगे।

अक्सर पूछे जाने वाले प्रश्न