Nexevo.aiNexevo.ai
返回模型库
Groq 2024-07-23

llama-3.1-8b-instant

开源极速档 · 海量批量处理

通用文本超低成本极速推理

数据政策 / Data Policy:未知 / Unknown

未经法务确认上游 ToS,不做承诺

查看 Groq 服务条款

提示:此 provider 数据政策待法务审定;medical / legal 客户请联系商务确认 DPA。

上下文窗口
128K
tokens
最大输出
8.2K
tokens
知识截止
2023-12
综合评分
7.14
/ 10

能力雷达

codemathreasoncreatimultillong_cspeed
代码6.5
数学6.5
推理6.5
创意6.5
多语言7.0
长上下文7.0
速度10.0

定价

输入价$0.060000/ 1M tokens
输出价$0.096000/ 1M tokens

支持特性

工具调用流式输出

推荐场景

开源极速档
海量批量处理

调用示例

通过 Nexevo.ai 网关调用 — 与 OpenAI SDK 完全兼容,只需替换 base URL

curl https://api.nexevo.ai/v1/chat/completions \
  -H "Authorization: Bearer $NEXEVO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b-instant",
    "messages": [
      { "role": "user", "content": "Hello!" }
    ]
  }'

Groq 的其他模型

llama-3.1-8b-instant — Nexevo.ai | Nexevo.ai