すべての更新
Workshop v0.2.0

Workshop v0.2.0

改善点

  • 全精度および量子化 GGUF 変換パイプライン
  • 量子化対応変換のための設定可能なキャリブレーションデータセット
  • .nvx パッケージング:モデル + トークナイザー + 推論設定を単一のデプロイ可能アーティファクトに
  • 差分とマージツールを備えたデルタベースのモデルバージョニング
  • 大規模モデルコレクションのバッチ処理サポート

パフォーマンス改善

  • 並列化テンソル演算により量子化パイプラインスループットが 28% 向上
  • デルタ差分計算を最適化 — 10B パラメータ超のモデルで 4 倍高速化

バグ修正

  • MHA アーキテクチャの GGUF 変換時の誤ったアテンションヘッドマッピングを修正
  • トークナイザー設定が 64KB を超える場合の .nvx パッケージ破損を修正