使用ngrok做内网穿透
1 minute read
Published:
为什么使用ngrok?
分布式大语言模型服务引擎vLLM论文解读
2 minute read
Published:
论文地址:Efficient Memory Management for Large Language Model Serving with PagedAttention
大语言模型推理和部署开源库VLLM解读
less than 1 minute read
Published:
vLLM是借助分页注意力机制实现轻松、快速且低成本的大语言模型服务。
jetson orin nano super AI模型部署之路(一)deepseek r1模型部署
less than 1 minute read
Published:
先看一下部署完成后的效果。可以直接在手机上访问jetson,有web界面供使用。