更新日志
发版历史与值得关注的改动
v0.13.32026-04-30功能 langchain-nexevo v0.1 — drop-in LangChain 集成
pip install langchain-nexevo。ChatNexevo 一行替换 ChatOpenAI 自动获得智能路由 + ELO + cascade。含 NexevoEmbeddings(RAG)+ NexevoCheckpointSaver(LangGraph 状态落到 /v1/conversations — 多 pod 安全 + admin 可审计,无需自建 Postgres)。13/13 测试绿;等 PyPI 发版。
v0.13.22026-04-30功能 OAuth 第三方登录(Google + GitHub) + 地区感知 Cookie 同意
/login 页加 Continue with Google / GitHub — 自动注册、自动 grant 邮箱验证 +$2 奖励、跳过 2FA gate(provider 已 step-up)。Cookie 同意横栏仅在 GDPR / CCPA / PIPL / LGPD / nFADP / PoPIA 国家弹;localStorage 持久 + dispatchEvent 让第三方 SDK 决定是否初始化。
v0.13.12026-04-30功能 Layer 3+ 路由 — ELO 反喂 catalog + 历史 sparkline + 反馈采样金标 prompt
ELO 评分(≥30 局)以 internal_elo 优先级源反喂 effective_catalog 的 reasoning + creative 维度。Admin /routing 加跨周快照 SVG sparkline(无图表库依赖)。新 POST /admin/feedback/seed-golden-prompts 从 RLHF buffer 采样高质 + 客服采纳样本入金标库 — 对战题随用户语料演进。
v0.13.02026-04-30安全 全量审计修复 sprint:P0 多进程计费锁 + 11 项 P1 加固
Pg advisory lock 保护计费临界区(workers > 1 安全)。Stripe webhook 跨 worker 持久化 dedup。BYOK 计费纳入 cache token。python_exec DoS 上限。Per-email 登录锁定。DAG checkpoint 状态字段。另 4 项 P2 修复(余额不足专门错码 / 上传 magic byte / XFF 反向遍历 / approve_task 端内自动续跑)。4505 tests 全绿。
v0.12.52026-04-30功能 Admin BYOK + Agents 监控页;用户 geo policy + 月度发票 + 对账 UI
新增 /admin/dashboard/byok 与 /agents 页。用户 keys 页加 per-key 地理策略(允许/屏蔽 ISO 国家)。Billing 页加月度发票 PDF 下载。Security 页加按租户实时对账面板。
v0.12.02026-04-28功能 生成网关:8 家 provider 全实装
图像 / 视频 / 3D 生成统一接口 — OpenAI Sora 2 + Images,Google Veo 3 + Imagen 4,腾讯 Hunyuan 3D 直连(TC3-HMAC,比 Replicate 省 30%),Runway Gen-4 Turbo,阿里 Wan 2.6,Replicate 聚合。零 stub。
v0.12.12026-04-28功能 Catalog 扩到 22 个生成模型 + 档位
每家 provider 都有 fast / balanced / pro 三档。新增:imagen-4-ultra、sora-2-pro(4K)、veo-3-fast、wan-2.6-pro、runway-gen4-standard、hunyuan-3d-2-pro、flux-1.1-ultra、nexevo/{image-pro, video-pro, 3d-fast/balanced}。
v0.12.22026-04-28基础设施 阿里云 OSS 接入:参考图上传 + GC + 租户配额
POST /v1/generation/upload(multipart,10 MB 上限),上传历史 + 删除,默认每租户 200 MB / 100 文件配额,OSS GC CLI + /admin/health/oss-gc 端点清孤儿。Sora 2 / Veo 3 / Runway 视频自动镜像到 OSS,签 24h URL。
v0.12.32026-04-28功能 TypeScript SDK v0.3 + Python SDK v0.2 — 生成资源
nexevo.images.generate / videos.generate(_and_wait) / models3d.generate / generation.{models, jobs.{list,get,cancel,retry,wait_for_completion}, uploads.{upload,list,delete}}。Python sync + async 双轨。64 + 33 SDK 测试绿。
v0.12.42026-04-28功能 Playground 4-tab:Chat / Image / Video / 3D
/dashboard/playground 加 tabs 让用户在 chat 之外直接试图像/视频/3D 生成。轻量内嵌生成器 + 右上角"高级 ↗"链接到完整 /dashboard/generate。Admin /admin/integrations 一站管 8 家 provider 凭证 + 7 个健康 ping(含 TC3-HMAC 签名探活)。
2026-04-28功能 Catalog 扩到 92 模型
新增 18 个 2026-Q2 旗舰:DeepSeek-V4 Preview、Qwen3.6-Plus、Qwen3-VL-Plus、Kimi K2.6、GLM-5.1、MiniMax M2.5/M2.8、Ant Ling-2.6-Flash、Hunyuan 3.0、GPT-5.5、GPT-4.1 nano、GPT-5.2 Codex、Gemini 3.1 Pro、Claude Opus 4.6、Mistral Large 3、Phi-4。
2026-04-28功能 JSON-LD 结构化 SEO
Organization / WebSite SearchAction / SoftwareApplication / FAQPage / TechArticle / BreadcrumbList — 主页 / pricing / faq / docs / cookbook 全部接入,Google rich snippets 启用。
2026-04-28功能 Cascade audit trail
scoring v2 拆账透传到 cascade.recent_decisions(maxlen 64),admin 一站式排查决策来由。
2026-04-28功能 新 provider:Ant Group + Microsoft
Ant Ling-2.6-Flash($0.10/M 超低价)+ Microsoft Phi-4(端侧友好 14B)。Provider 总数 25 → 27。
2026-04-27功能 智能路由 v2
80 specialty 标签 + 10 域分类法 + 自动打标(平均 14 标签/模型)+ 8 信号加权 scoring + 4 硬筛 + 人工 override + 5 Tab admin UI + draft/publish 权重灰度。33 个新 test 全过。
2026-04-27功能 Stripe 充值闭环 + 阿里邮件
Stripe Customer/SetupIntent/off-session 自动充值 + AliyunDirectMailProvider(新加坡)+ 一站式 /admin/integrations 配置 + 健康检查。214 case 全过。
2026-04-27功能 BYOK 自带 API key 闭环
独立 byok/ 模块,scheduler 优先级 BYOK > settings,固定 5% 服务费。113 case 全过。
2026-04-27功能 GET /v1/generation 防穷举
trace_id 改 UUID4 防顺序枚举。
2026-04-27功能 Provider data_policy 4 态
unknown/public/anonymous/private 四态字段 + 法务可填的 ToS URL。
2026-04-27功能 5 Tab Admin Routing UI
/admin/dashboard/routing 重构成 5 Tab:专长 / 难度 / 价格 / 算法 / 权重 & 试算。原 capability/bandit/elo/cascade 全部保留在 算法 Tab。
2026-04-27功能 nexevo-auto 服务费统一 5%
原 +10% 智能路由附加费废止,跟其他 Passthrough 上游一致。
2026-04-27功能 Catalog 大清洗
删除 11 个停止维护的模型(deepseek-chat/reasoner、gpt-4-turbo、o1-mini、claude-3-5-haiku、claude-3-opus、gemini-1.5、grok-2 等),加 10 个最新旗舰(gpt-4.1、gpt-5、o3/o3-pro、gemini-2.5、grok-4 等)。
2026-04-27功能 Pricing 页面 / 文档统一改文案
去掉月度套餐叙述(纯按量付费)、去掉 +10% 智能路由附加费、统一价格示例为 DeepSeek-V4 Pro / Qwen3-Max / Claude Opus 4.7 / GPT-5。
2026-04-27功能 Docs 页 3 Tab + 拉宽对齐
顶部加 Docs / SDK / Cookbook 三 Tab(OpenRouter 风);全局 max-w-7xl 拉宽对齐 navbar;sidebar 字号加大加粗;chat model desc 多行 + 加跳转链接。
2026-04-27功能 Distill v1 自建模型方案确定
Qwen-2.5-32B + AWQ + LoRA + RunPod A100($1800-2500/月)。catalog 占位 + train_lora.py 已就绪,等数据起训。完整 SOP 在 docs/SELF_HOSTED_MODEL_ROADMAP.md。
2026-04-26功能 Cascade routing(P0 成本优化)
先试便宜 level,confidence ≥ 0.7 直接返回省 token;启发信号(length/refusal/format/logprob)几何平均;额外省 30-50% token。
2026-04-26功能 Layer 3 ELO duel 对战
GoldenPromptStore 20 seed + EloStore K=24 + duel engine(swiss-pair + position-bias swap voting)+ admin UI + 周更 cron。
2026-04-26功能 Layer 2 Bandit 自学习
Thompson Sampling + cost penalty + RoutingDecisionLog + feedback 钩子 + admin UI BanditSection;kill switch + 持久化。
2026-04-26功能 Layer 1 数据驱动 catalog
benchmark fetcher + ChatbotArena/HF Open LLM adapter + CapabilityOverrideStore + effective_catalog 合并 + admin UI。
2026-04-26功能 Provider 定价自动拉取 + 审核队列
OpenRouter mirror 拉 ~300 模型 + 6 stub + 永不 auto-apply 的 PriceProposalStore + admin UI diff 表。
2026-04-26功能 生产加固 A+B sprint
provider keys 加密 / TOTP 加密 / DistillationCollector PII 脱敏 + PgUserStore + Alembic 0003。
2026-04-26功能 生产部署架构拍板
HK ECS 后端 + 同机 nginx+Next 前端 + 阿里云 RDS + 深圳 ECS proxy_cn + 阿里云 ESA。代码已上 GitHub bejason/nexevo-ai。
v0.10.222026-04-25功能 团队管理上线
/dashboard/organization 支持创建团队 / 邀请邮箱成员 / 分配角色 / 转让 owner;后端 31 tests。
v0.10.212026-04-25功能 公开服务状态页
/status 页实时显示各 provider 可用性,含 24h 可用率、P50/P95 延迟、断路器状态。
v0.10.202026-04-25功能 Provider 数据政策透明化
GET /v1/providers 公开每家 provider 的数据保留政策(unknown/public/anonymous/private)及上游 ToS 链接。
v0.10.192026-04-25功能 Generation 详情端点
GET /v1/generation?id=<gen_id> 可查任意请求 30 天内的详细元数据(provider/延迟/usage/成本估算)。
v0.10.182026-04-25基础设施 代理主部署改至大陆深圳
代理主部署迁至阿里云深圳 Region(VPC 内网),解锁仅大陆 IP 可调的模型(Moonshot / Doubao / 部分 Zhipu)。HK 保留为合规备份。
v0.10.102026-04-25功能 @nexevo/sdk TypeScript SDK v0.1.0
官方 TS SDK,完整类型覆盖所有扩展字段(models[]、max_price、provider、X-Nexevo-* 元数据)及流式 async iterator。
v0.10.92026-04-25功能 seed / logprobs / n 跨 provider 行为归一化
上游不支持的语义字段会带 X-Nexevo-Params-Warnings header,客户能感知到被剥离或被 clamp。
v0.10.82026-04-25功能 参数兼容矩阵
按 provider 维护黑名单,自动剥离会导致上游 400 的参数(logit_bias / 部分 provider 的 logprobs/seed)。
v0.10.72026-04-25功能 按 end-user 限流
OpenAI 标准 `user` 字段透传给上游 + 按租户隔离的 per-user 限流,响应带 X-Nexevo-RateLimit-* header。
v0.10.62026-04-24功能 max_price 单请求成本上限
请求级 `max_price: {prompt, completion, total}` 过滤超价 provider + 估算最坏成本,超限直接 400。
v0.10.52026-04-24功能 Provider 路由偏好
OpenRouter 风格的 `provider: {order, allow_fallbacks, data_collection}` 控制路由顺序与合规选项。
v0.10.42026-04-24功能 :fast / :cheap / :quality 模型后缀
通过 model 名后缀(如 `deepseek-chat:fast`)给路由提示,无需重组请求体。
v0.10.32026-04-24功能 Generation ID + 延迟 header
每个响应都带 X-Nexevo-Generation-Id 用于追溯 + X-Nexevo-(Total|Upstream)-Latency-Ms 用于性能调试。
v0.10.22026-04-24修复 流式自动开启 include_usage
代理自动注入 stream_options.include_usage=true,客户忘传也能拿到最后一帧的 token 计数。
v0.10.12026-04-24功能 models[] 客户端 fallback 链
传 `models: ['deepseek-chat', 'qwen-plus', 'glm-4-air']`,代理从左到右逐个 try,第一个成功即返回。