返回模型庫
Groq 2024-07-23
llama-3.1-8b-instant
开源极速档 · 海量批量处理
一般文字超低成本極速推理
数据政策 / Data Policy:未知 / Unknown
未经法务确认上游 ToS,不做承诺
查看 Groq 服务条款提示:此 provider 数据政策待法务审定;medical / legal 客户请联系商务确认 DPA。
上下文視窗
128K
tokens
最大輸出
8.2K
tokens
知識截止
2023-12
綜合評分
7.14
/ 10
能力雷達
程式碼6.5
數學6.5
推理6.5
創意6.5
多語言7.0
長情境7.0
速度10.0
定價
輸入價$0.060000/ 1M tokens
輸出價$0.096000/ 1M tokens
支援特性
工具調用串流輸出
推薦場景
开源极速档
海量批量处理
呼叫範例
透過 Nexevo.ai 網關呼叫 — 與 OpenAI SDK 完全相容,只需取代 base URL
curl https://api.nexevo.ai/v1/chat/completions \
-H "Authorization: Bearer $NEXEVO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.1-8b-instant",
"messages": [
{ "role": "user", "content": "Hello!" }
]
}'