Nexevo Modellbibliothek
Alle Modelle, auf die unsere Routing-Schicht zugreift – Echtzeit-Preise, Leistungsbewertung und Empfehlungsszenarien – sind auf einen Blick klar
135 / 135 Modelle
gpt-5.5
gemini-3.1-pro
gpt-5
gpt-5.2-codex
nexevo/balanced
复杂推理 / 代码 / 内容创作 / Agent 任务
claude-opus-4-6
gpt-5-codex
claude-sonnet-4-6
生产级 Agent · 代码生成
qwen3.6-plus
claude-opus-4-7
学术研究 · 复杂代码工程
glm-5
glm-5.1
gemini-2.5-pro
qwen3.5-plus
grok-4
kimi-k2.6
claude-3-7-sonnet-20250219
可见思考链推理 · 代码 review
gpt-4.1
mistral-large-3
minimax-m2.8
claude-3-5-sonnet
代码生成 · Agent / 工具调用
doubao-seed-1.6
hunyuan-3.0
qwen3-coder
glm-4.6
kimi-k2.5
qwen3-max
gpt-4o
多模态分析 · 复杂代码
deepseek-v3.2
o3
gemini-2.5-flash
minimax-m2.7
o3-pro
claude-haiku-4-5
低延迟客服 · 高频自动化
qwen3-vl-plus
minimax-m2.5
qwen2.5-72b-instruct
开源中文旗舰 · 私有化部署候选
grok-3
X 实时数据分析 · 创意写作
o3-mini
复杂推理 · 代码工程任务
llama-4-maverick
o4-mini
最新代际推理 · 代码工程任务
glm-4-plus
中文旗舰 · 复杂推理
command-r-plus
企业 RAG · 多语种检索增强
gpt-4.1-mini
gemini-2.0-flash
超长文档摘要(1M) · 音视频理解
doubao-pro-128k
长文档中文分析 · 企业知识库问答
mixtral-8x7b-32768
开源 MoE 通用 · 中等长上下文
ling-2.6-flash
qwen-max
中文旗舰任务 · 金融 / 法律专业写作
o1
博士级数学 · 竞赛代码
MiniMax-M1
国产推理旗舰 · 1M 长上下文推理
meta-llama/Meta-Llama-3.1-405B-Instruct
最大开源模型 · 私有化部署候选
deepseek-v4-pro
DeepSeek V4 旗舰预览 · 高性价比通用任务
qwen-plus
中文 RAG · 客服 / 工作流自动化
step-2-16k
国产万亿参数旗舰 · 复杂中文推理
gpt-4.1-nano
deepseek-r1
doubao-pro-32k
中文客服 · 电商 / 短视频文案
moonshot-v1-8k
中文写作 · 短文本对话
llama-3.3-70b-groq
超低延迟开源 · 实时聊天 / 语音
mistral-large
欧洲合规场景 · 多语种欧洲业务
moonshot-v1-32k
文档摘要 · 中等长度报告
moonshot-v1-128k
整本书阅读 · 海量中文长文档分析
hunyuan-pro
微信生态集成 · 企业内容审核
abab6.5-chat
245k 长上下文 · 海螺 AI 同款
Qwen/QwQ-32B
开源推理小模型 · 本地部署可承担
deepseek-v3
phi-4
gpt-4o-mini
客服自动化 · 高并发分类
yi-large
中英双语写作 · 通用问答
gemini-2.0-flash-lite
超低成本多模态 · 高并发批处理
claude-3-haiku
超低成本入门 · 高并发简单任务
codestral
代码补全 IDE 集成 · FIM 中间填充
ernie-4.0-turbo-8k
国产合规中文旗舰 · 百度生态深度集成
mistral-medium-latest
欧洲合规中档 · 多语种工作流
command-r
企业 RAG 经济版 · 工具调用工作流
deepseek-v4-flash
DeepSeek V4 极速档 · 超低成本高并发
nexevo/fast
日常问答 / 摘要 / 翻译 / 大批量处理
glm-4-air
中文性价比 · 工具调用 / Agent
mistral-small
欧洲低成本对话 · 多语种工作流
hunyuan-code
国产代码补全 · 中文注释生成
spark4.0-ultra
教育辅导 · 政务问答
qwen-long
整本书理解(10M) · 代码库整体审查
step-1v-32k
国产视觉理解 · 图文混排分析
Baichuan4
金融合规 · 医疗专业问答
doubao-lite-32k
低成本中文应用 · 高并发简单生成
llama-3.1-sonar-large-128k-online
实时网络搜索 · 新闻摘要
glm-4-flash
免费档原型 · 极速响应
llama-3.1-8b-instant
开源极速档 · 海量批量处理
gemma2-9b-it
Google 开源轻量 · Groq LPU 极速
qwen-turbo
中文超低成本入门 · 海量分类标注
yi-vision
OCR / 截图分析 · 产品图理解
dall-e-3
OpenAI DALL-E 3 — 高质量文生图,prompt rewriting
dall-e-3-hd
DALL-E 3 HD — 双倍画质
gpt-image-1
GPT Image 1 — 新一代,支持图生图编辑
imagen-4
Google Imagen 4 — SOTA 文生图(同步 :predict,base64 返回)
imagen-4-ultra
Google Imagen 4 Ultra — 高质量档(细节 + 排版,$0.06)
sora-2
OpenAI Sora 2 — 文生视频 / 图生视频(异步,OSS 自动镜像出 URL)
sora-2-pro
OpenAI Sora 2 Pro — 4K 高质量档(更贵更慢,$0.80/sec)
veo-3
Google Veo 3 — 文生视频 + 音频(异步,OSS 自动镜像出 URL)
veo-3-fast
Google Veo 3 Fast — 速度档(画质略降,$0.20/sec)
wan-2.6
阿里 Wan2.6 — 文生视频 + 多镜头叙事(DashScope 异步)
wan-2.6-pro
阿里 Wan2.6 Pro — 高保真档($0.15/sec)
wan-2.5-video
阿里 Wan 2.5 video — 日常主力档,音画同步,5s/10s 固定($0.06/sec)。适合 UGC / 社交媒体大批量生产
wan-2.5-video-pro
阿里 Wan 2.5 video Pro — 日常高画质($0.09/sec)
qwen-image-2.0
千问图像 2.0 — t2i 主力档($0.035/img),通用文生图
qwen-image-2.0-pro
千问图像 2.0 Pro — t2i 旗舰($0.075/img),细节 / 语义遵循 / 文字渲染均强化
qwen-image-edit
千问图像编辑 — image + text → image 修改($0.040/img),需 reference_image_url
qwen-image-translation
千问图像翻译 — 把图上文字翻成另一种语言($0.030/img),文档 / 海报国际化场景
z-image-turbo
Z-Image Turbo — 文生图廉价档($0.020/img),跑量 / 测试场景
wan2.7-image
Wan 2.7 image — 思考模式 + 文字精准渲染($0.040/img),复杂构图与逻辑场景
wan2.7-image-pro
Wan 2.7 image Pro — 极致画质($0.080/img),适合商业海报 / 印刷品 / 含文字图像
wan2.6-image
Wan 2.6 image — 上一代图像生成($0.030/img),稳定经济档
wan-image-edit-2.5
Wan 通用图像编辑 2.5 — 蒙版 / 局部修改($0.030/img)
seedance-2.0
字节豆包 Seedance 2.0 — 多镜头叙事视频($0.20/sec),文/图/视频生视频均支持
seedance-2.0-fast
Seedance 2.0 Fast — 经济档($0.15/sec),速度优先,适合大批量生产
runway-gen4
Runway Gen-4 Turbo — image-to-video(必需 ref image,OSS 镜像)
runway-gen4-standard
Runway Gen-4 Standard — 画质档(非 Turbo,$0.20/sec)
hunyuan-3d-2
腾讯混元 3D 2.0 — 文/图 → 3D 资产(直连腾讯云,TC3-HMAC 签名)
hunyuan-3d-2-pro
腾讯混元 3D 2.0 Pro — 高面数档(细节贴图 + 拓扑优化)
flux-pro
Black Forest Labs FLUX 1.1 Pro(via Replicate)
flux-1.1-ultra
FLUX 1.1 Pro Ultra — 4K 输出 + 真实质感(via Replicate)
sd-3.5
Stable Diffusion 3.5 large(via Replicate)
text-embedding-3-large
OpenAI 顶级 embedding 模型 — 3072 维,支持降维到 256/512/1024。
text-embedding-3-small
OpenAI 性价比最高 embedding — 1536 维,$0.02/1M token。
voyage-3-large
Voyage 旗舰 — 32K 长上下文 + 多语言,专为 RAG 优化。
voyage-3
Voyage 主力档 — 32K 长上下文,RAG 性价比首选。
jina-embeddings-v3
Jina v3 — 89 语言,Matryoshka 降维(可截 32-1024)。
bge-m3
智源 BGE-m3 (DashScope 托管)— 100+ 语言,中文场景首选。
embed-multilingual-v3.0
Cohere 企业级多语言 — 100+ 语言,GDPR/SOC2 合规友好。
rerank-v3.5
Cohere rerank-v3.5 — 100+ 语言,RAG 行业标准,2026 主力档。
rerank-multilingual-v3.0
Cohere v3 多语言版 — legacy 选项,新项目推荐 v3.5。
jina-reranker-v2-base
Jina rerank-v2 — 89 语言,长 context,RAG 性价比首选。
bge-reranker-v2
智源 BGE-reranker-v2(DashScope 托管)— 中文 RAG 首选,极便宜。
nexevo/agent
高层任务自动分解 + 多步执行(基于 chat brain + 内置 tool)