Nexevo.aiNexevo.ai
返回模型庫
Groq 2024-07-23

llama-3.1-8b-instant

开源极速档 · 海量批量处理

一般文字超低成本極速推理

数据政策 / Data Policy:未知 / Unknown

未经法务确认上游 ToS,不做承诺

查看 Groq 服务条款

提示:此 provider 数据政策待法务审定;medical / legal 客户请联系商务确认 DPA。

上下文視窗
128K
tokens
最大輸出
8.2K
tokens
知識截止
2023-12
綜合評分
7.14
/ 10

能力雷達

codemathreasoncreatimultillong_cspeed
程式碼6.5
數學6.5
推理6.5
創意6.5
多語言7.0
長情境7.0
速度10.0

定價

輸入價$0.060000/ 1M tokens
輸出價$0.096000/ 1M tokens

支援特性

工具調用串流輸出

推薦場景

开源极速档
海量批量处理

呼叫範例

透過 Nexevo.ai 網關呼叫 — 與 OpenAI SDK 完全相容,只需取代 base URL

curl https://api.nexevo.ai/v1/chat/completions \
  -H "Authorization: Bearer $NEXEVO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b-instant",
    "messages": [
      { "role": "user", "content": "Hello!" }
    ]
  }'

Groq 的其他模型

llama-3.1-8b-instant — Nexevo.ai | Nexevo.ai