すべての更新
Capsule v0.3.0
Capsule v0.3.0
改善点
- マルチバックエンド推論対応 — CPU、GPU(Metal/CUDA/Vulkan)、NPU の自動バックエンド選択
- 設定可能なチャンクサイズでのストリーミングトークン生成
- ランタイムとモデルレイヤー間の共有バッファによるゼロコピーメモリモデル
- GGUF、ONNX、CoreML 形式サポートの拡張
パフォーマンス改善
- ゼロコピーメモリアーキテクチャにより GPU バックエンドでの推論スループットが 32% 向上
- 最適化された重みマッピングによりモデル読み込み時間を 45% 短縮
バグ修正
- 大きすぎるコンテキストウィンドウによる GGUF 読み込みクラッシュ問題を修正
- Metal バックエンドのスレッド同期の競合状態を修正
💙 コントリビューターに感謝
- @user123 — GGUF 読み込みクラッシュ問題の報告
- @ml-researcher — Snapdragon X Elite での NPU バックエンドのテスト