変更ログ
リリース履歴と注目すべき変更点
v0.10.222026-04-25特徴 チーム管理はオンラインで
/dashboard/organization は、チームの作成/電子メール メンバーの招待/役割の割り当て/所有者の転送をサポートします。バックエンド 31 テスト。
v0.10.212026-04-25特徴 公共サービスのステータスページ
/status ページには、24 時間の可用性、P50/P95 の遅延、サーキット ブレーカーのステータスなど、各プロバイダーの可用性がリアルタイムで表示されます。
v0.10.202026-04-25特徴 プロバイダーのデータポリシーの透明性
GET /v1/providers は、各プロバイダーのデータ保持ポリシー (不明/パブリック/匿名/プライベート) と上流の ToS リンクを公開します。
v0.10.192026-04-25特徴 生成詳細エンドポイント
GET /v1/generation?id=<gen_id> は、30 日以内のリクエストの詳細なメタデータ (プロバイダー/遅延/使用量/コストの見積もり) を確認できます。
v0.10.182026-04-25インフラストラクチャ エージェントの配置が中国本土の深センに変更されました
エージェント マスター デプロイメントは Alibaba Cloud 深セン地域 (VPC イントラネット) に移動され、メインランドの IP 調整可能モデル (Moonshot / Doubao / Zhipu の一部) のみがロック解除されます。 HK はコンプライアンスのバックアップとして保持されます。
v0.10.102026-04-25特徴 @nexevo/sdk TypeScript SDK v0.1.0
公式 TS SDK の完全なタイプは、すべての拡張フィールド (models[]、max_price、provider、X-Nexevo-* メタデータ) とストリーミング非同期イテレーターをカバーします。
v0.10.92026-04-25特徴 seed/logprobs/n はプロバイダー全体の動作を正規化します
アップストリームによってサポートされていないセマンティック フィールドには X-Nexevo-Params-Warnings ヘッダーが含まれるため、顧客はそれらが削除されているかクランプされていると認識できます。
v0.10.82026-04-25特徴 パラメータ互換性マトリックス
プロバイダーごとにブラックリストを維持し、アップストリーム 400 (一部のプロバイダーの logit_bias / logprobs/seed) の原因となるパラメーターを自動的に削除します。
v0.10.72026-04-25特徴 エンドユーザーによる電流制限
OpenAI 標準の「user」フィールドは、テナントによって分離されたアップストリーム + ユーザーごとの電流制限に透過的に送信され、応答には X-Nexevo-RateLimit-* ヘッダーが含まれます。
v0.10.62026-04-24特徴 max_price 単一リクエストのコスト制限
リクエスト レベル `max_price: {prompt, completion, total}` は、価格が高すぎるプロバイダーをフィルタリングし、最悪のコストを推定します。制限を超えた場合は、直接 400 になります。
v0.10.52026-04-24特徴 プロバイダーのルーティング設定
OpenRouter スタイルの「プロバイダー: {order, allow_fallbacks, data_collection}」は、ルーティングの順序と準拠オプションを制御します。
v0.10.42026-04-24特徴 :速い / :安い / :高品質のモデル接尾辞
リクエスト本文を再編成せずに、モデル名のサフィックス (`deepseek-chat:fast` など) を介してルーティング ヒントを提供します。
v0.10.32026-04-24特徴 生成ID + 遅延ヘッダー
各応答には、トレースバック用の X-Nexevo-Generation-Id + パフォーマンス デバッグ用の X-Nexevo-(Total|Upstream)-Latency-Ms が付属しています。
v0.10.22026-04-24修正する ストリーミングでは include_usage が自動的にオンになります
エージェントは自動的に stream_options.include_usage=true を挿入し、クライアントは送信を忘れた場合でも最後のフレームのトークン カウントを取得できます。
v0.10.12026-04-24特徴 models[] クライアント フォールバック チェーン
`models: ['deepseek-chat', 'qwen-plus', 'glm-4-air']` を渡すと、エージェントは左から右に 1 つずつ試行し、最初に成功したものが返されます。