すべての更新
Workshop v0.2.0
Workshop v0.2.0
改善点
- 全精度および量子化 GGUF 変換パイプライン
- 量子化対応変換のための設定可能なキャリブレーションデータセット
- .nvx パッケージング:モデル + トークナイザー + 推論設定を単一のデプロイ可能アーティファクトに
- 差分とマージツールを備えたデルタベースのモデルバージョニング
- 大規模モデルコレクションのバッチ処理サポート
パフォーマンス改善
- 並列化テンソル演算により量子化パイプラインスループットが 28% 向上
- デルタ差分計算を最適化 — 10B パラメータ超のモデルで 4 倍高速化
バグ修正
- MHA アーキテクチャの GGUF 変換時の誤ったアテンションヘッドマッピングを修正
- トークナイザー設定が 64KB を超える場合の .nvx パッケージ破損を修正