April 10, 2026Workshop v0.2.0

Workshop v0.2.0

改进

全精度和量化 GGUF 转换流水线
用于量化感知转换的可配置校准数据集
.nvx 打包：模型 + 分词器 + 推理配置于单一可部署产物
基于差量的模型版本控制，支持 diff 和合并工具
支持大型模型集合的批量处理

性能提升

量化流水线吞吐量提升 28%，通过并行化张量运算实现
Delta diff 计算优化——10B 参数以上模型速度提升 4 倍

错误修复

修复了 MHA 架构 GGUF 转换中注意力头映射错误的问题
修复了分词器配置超过 64KB 时 .nvx 包损坏的问题