エンジニアリング
Workshop
GGUF 変換、量子化、ファインチューニング準備、.nvx パッケージングのための完全なモデルエンジニアリングスイート。
GGUF オーサリング
設定可能なキャリブレーションデータセットを使用した全精度および量子化 GGUF 変換。
.nvx パッケージング
モデル、トークナイザー、推論設定を単一のデプロイ可能アーティファクトにパッケージします。
差分とマージツール
デルタベースのモデルバージョニング — ファインチューニングされたチェックポイント間の変更のみを保存します。
Workshop
FP164.2G
Q82.1G
Q41.1G
GGUF.nvx
$ nvx workshop quantize
--model model.fp16.safetensors
--output model.q4.gguf
--type q4_k_m
> Exporting .nvx package...
概要 Workshop
Workshop は Naviorx エコシステムのモデルエンジニアリングスイートです。形式変換、デプロイ用量子化、.nvx(Naviorx の自己完結型モデルアーティファクト形式)へのパッケージングという、完全なモデル準備パイプラインを処理します。Workshop は、設定可能なキャリブレーションデータセットを使用した全精度および量子化 GGUF 変換をサポートし、デルタベースのモデルバージョニングを含むため、ファインチューニングされたチェックポイント間の差分のみを保存します。結果は、モデル、トークナイザー、推論設定を含む単一の .nvx ファイルです — Capsule でデプロイする準備ができています。
機能
- 全精度および量子化 GGUF 変換
- 量子化用の設定可能なキャリブレーションデータセット
- .nvx パッケージング:モデル + トークナイザー + 設定を 1 ファイルに
- デルタベースのモデルバージョニングと差分ツール
- ファインチューニングされたチェックポイントのマージとリベース
- 大規模モデルコレクションのバッチ処理
システム要件
OS 対応
Windows, macOS
バージョン
0.1.0