返回模型库
Groq 2024-07-23
llama-3.1-8b-instant
开源极速档 · 海量批量处理
通用文本超低成本极速推理
数据政策 / Data Policy:未知 / Unknown
未经法务确认上游 ToS,不做承诺
查看 Groq 服务条款提示:此 provider 数据政策待法务审定;medical / legal 客户请联系商务确认 DPA。
上下文窗口
128K
tokens
最大输出
8.2K
tokens
知识截止
2023-12
综合评分
7.14
/ 10
能力雷达
代码6.5
数学6.5
推理6.5
创意6.5
多语言7.0
长上下文7.0
速度10.0
定价
输入价$0.060000/ 1M tokens
输出价$0.096000/ 1M tokens
支持特性
工具调用流式输出
推荐场景
开源极速档
海量批量处理
调用示例
通过 Nexevo.ai 网关调用 — 与 OpenAI SDK 完全兼容,只需替换 base URL
curl https://api.nexevo.ai/v1/chat/completions \
-H "Authorization: Bearer $NEXEVO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.1-8b-instant",
"messages": [
{ "role": "user", "content": "Hello!" }
]
}'