すべての更新

April 10, 2026Workshop v0.2.0

Workshop v0.2.0

改善点

全精度および量子化 GGUF 変換パイプライン
量子化対応変換のための設定可能なキャリブレーションデータセット
.nvx パッケージング：モデル + トークナイザー + 推論設定を単一のデプロイ可能アーティファクトに
差分とマージツールを備えたデルタベースのモデルバージョニング
大規模モデルコレクションのバッチ処理サポート

パフォーマンス改善

並列化テンソル演算により量子化パイプラインスループットが 28% 向上
デルタ差分計算を最適化 — 10B パラメータ超のモデルで 4 倍高速化

バグ修正

MHA アーキテクチャの GGUF 変換時の誤ったアテンションヘッドマッピングを修正
トークナイザー設定が 64KB を超える場合の .nvx パッケージ破損を修正