所有产品

运行时

Capsule

专为速度、效率和隐私设计的本地推理引擎 — 直接在您的硬件上运行 AI 模型,零网络遥测。

本地优先执行

在 CPU、GPU 或 NPU 后端上原生运行 GGUF、ONNX 和 CoreML 模型。

零拷贝内存模型

运行时与模型层之间的共享内存缓冲区消除了冗余分配。

流式与批处理

支持 token 流式生成和自适应批处理,以优化吞吐量。

Capsule
GPU
CPU
NPU
RAM
127 tok/s·0.0ms network

关于 Capsule

Capsule 是 Naviorx 生态系统的核心运行时引擎。它在您的硬件上本地执行 AI 模型 — 无云、无 API 密钥、无延迟。Capsule 专为生产级推理设计,支持多种模型格式(GGUF、ONNX、CoreML),并自动为您的硬件选择最优后端(CPU、GPU 或 NPU)。零拷贝内存架构消除了模型层之间的冗余分配,提供可与云端方案媲美的吞吐量 — 完全在您的设备上实现。

功能特性

  • 多后端推理(CPU、GPU 通过 Metal/CUDA/Vulkan、NPU)
  • 支持 GGUF、ONNX 和 CoreML 格式
  • 可配置分块大小的 token 流式生成
  • 自适应批处理以优化吞吐量
  • 零拷贝内存架构
  • CLI 和编程 API 接口

系统要求

操作系统支持

Windows, macOS

版本

0.1.0

下载 Capsule