अक्सर पूछे जाने वाले प्रश्न

स्व-विकसित शेड्यूलिंग इंजन, कीमत और हम लागत को कैसे कम रखते हैं, इसका स्पष्टीकरण।

आप मुझे एक मॉडल चुनने की अनुमति क्यों नहीं देते?
क्योंकि मॉडल का चयन करना एक कठिन काम है और मैन्युअल रूप से सटीक चयन करना कठिन है। हमारे स्व-विकसित शेड्यूलिंग इंजन में पांच प्रमुख एल्गोरिदम मॉड्यूल (आशय पहचान, एल 1-एल 5 कठिनाई वर्गीकरण, बुद्धिमान रूटिंग, गुणवत्ता मूल्यांकन, सर्किट ब्रेकर गिरावट) हैं। यह कठिनाई का मूल्यांकन करता है और प्रत्येक अनुरोध के इरादे को वर्गीकृत करता है, और फिर योग्य मॉडल पूल से सबसे सस्ते का चयन करता है। L1 सरल कार्यों के लिए, क्वेन-टर्बो ($0.20/M) का उपयोग करें, L4 गहन तर्क के लिए, GPT-4o-मिनी या डीपसीक-रीज़नर का उपयोग करें, और L5 जटिल कार्यों के लिए, GPT-4o / क्लाउड सॉनेट का उपयोग करें - पूरी तरह से स्वचालित और अच्छी तरह से स्थापित।
ओपनराउटर/सामान्य एकत्रीकरण गेटवे से क्या अंतर है?
अधिकांश एकत्रीकरण गेटवे "आप मॉडल नाम निर्दिष्ट करते हैं → हम इसे अग्रेषित करते हैं" के लिए पतली प्रॉक्सी हैं। हम नहीं हैं - हम कठिनाई को ग्रेड करने और प्रत्येक अनुरोध के इरादे का विश्लेषण करने के लिए अपने स्व-विकसित शेड्यूलिंग इंजन का उपयोग करते हैं, और फिर "गुणवत्ता सीमा को पूरा करने वाले सबसे सस्ते मॉडल" के आधार पर निर्णय लेते हैं। क्षमता आयाम 60/40 के वजन के साथ विदेशी बेंचमार्क (ह्यूमनएवल/एमएमएलयू-प्रो/एमएटीएच/एमटी-बेंच) और चीनी बेंचमार्क (ओपनकंपास/सुपरक्लू/सीएमएमएलयू) का व्यापक स्कोर है, और निर्माता द्वारा स्वयं-रिपोर्ट नहीं किया गया है।
आप कितना बचा सकते हैं?
हमारे मिश्रित लागत मॉडल के अनुसार: 80% ट्रैफ़िक कुशल मॉडल (लगभग $0.40/1M इनपुट) द्वारा प्रदान की जाने वाली दैनिक चैट है, 20% फ्लैगशिप मॉडल (लगभग $8/1M इनपुट) द्वारा प्रदान किया जाने वाला हार्ड ट्रैफ़िक है। आपके फ्लैट की कीमत $3/$12 है। हमेशा फ्लैगशिप मॉडल खरीदने की तुलना में, आप मुद्दों के संयोजन के आधार पर 40 ~ 56% बचा सकते हैं।
क्या मुझे पुनः प्रयास और हेजिंग पथ के लिए भुगतान करना होगा?
नहीं, आंतरिक पुनर्प्रयास, हेजिंग और कैश वार्मिंग की लागत हमारे द्वारा वहन की जाती है। आप केवल उस इनपुट के लिए भुगतान करते हैं जो आपको वास्तव में प्राप्त होता है + अंतिम आउटपुट के लिए। संपूर्ण ब्रेकडाउन देखने के लिए प्रबंधन बैकएंड में एक समाधान उपकरण है।
कैश डिस्काउंट क्या है?
कैश हिट्स (सटीक या सिमेंटिक) पर नियमित कीमत का 25% शुल्क लिया जाता है। एक प्रश्न को दूसरी बार दोहराना 75% सस्ता है। हम आंतरिक रूप से अपस्ट्रीम प्रॉम्प्ट कैशिंग (ओपनएआई / एंथ्रोपिक / डीपसीक) का भी उपयोग करते हैं, और बचाया गया पैसा फ्लैट कीमत में परिलक्षित होता है।
क्या मैं OpenAI SDK का उपयोग कर सकता हूँ?
कर सकते हैं. हमारा एपीआई OpenAI के साथ पूरी तरह से संगत है। SDK के बेस_यूआरएल को हमारे गेटवे, मॉडल=स्मार्टिसन-ऑटो पर इंगित करें, और इसका उपयोग शुरू करें। फ़ंक्शन कॉलिंग, स्ट्रीमिंग और विज़ुअल इनपुट सभी शून्य परिवर्तन के साथ उपलब्ध हैं।
क्या मेरे डेटा का उपयोग प्रशिक्षण के लिए किया जाएगा?
नहीं, हम अपस्ट्रीम निर्माता की "प्रशिक्षण के लिए नहीं" शर्तों के अनुसार अनुरोध अग्रेषित करते हैं। मॉडल सुधार के लिए आपके संकेत और प्रतिक्रियाएँ बरकरार नहीं रखी जाती हैं।
आप किन मॉडलों पर रूट करते हैं?
ओपनएआई, एंथ्रोपिक, गूगल, डीपसीक, मिस्ट्रल, एक्सएआई, टोंगयी, मूनशॉट, जिपु, कोहेयर, टुगेदर, फायरवर्क्स, ग्रोक, सेरेब्रस, पर्प्लेक्सिटी, सिलिकॉनफ्लो - कुल मिलाकर 60+ मॉडल। हम बैकएंड में नए मॉडलों को एकीकृत करना जारी रखते हैं, और आपके कोड में शून्य परिवर्तन होंगे।
अक्सर पूछे जाने वाले प्रश्न · मूल्य निर्धारण, गोपनीयता, रूटिंग तंत्र | Nexevo.ai