lunalulu

🎯

Focusing

Stars

5 stars written in C++

Tengine is a lite, high performance, modular inference engine for embedded device

C++ 4,489 979 Updated Mar 6, 2025

fastllm是后端无依赖的高性能大模型推理库。同时支持张量并行推理稠密模型和混合模式推理MOE模型，任意10G以上显卡即可推理满血DeepSeek。双路9004/9005服务器+单显卡部署DeepSeek满血满精度原版模型，单并发20tps；INT4量化模型单并发30tps，多并发可达60+。

C++ 3,966 407 Updated Sep 26, 2025

Use TensorRT API to implement Caffe-SSD， SSD（channel pruning）， Mobilenet-SSD

C++ 250 84 Updated Oct 23, 2018

Caffe implementation of FAIR paper "Focal Loss for Dense Object Detection" for SSD.

C++ 173 58 Updated Nov 30, 2017

GraspSplats: Efficient Manipulation with 3D Feature Splatting

C++ 130 17 Updated Nov 21, 2024