240 发简信
IP属地:广东
  • Resize,w 360,h 240
    推理引擎vLLM使用笔记 -- 0x01

    01 背景 在火山云下,运行DS-70B模型;官方推荐的推荐引擎是vLLM,相关环境按火山文档逐步安装GPU-部署DeepSeek-R1-Dis...

  • 知识库RAG应用技术点整理--文档加载

    知识库RAG应用技术点 -- 知识处理 文档解析 关于知识库应用,第一步的操作都是需要加载解析相关文档(doc,PFD,PPT等),再此基础上才...

    0.4 31 0 1
  • uv + vLLM使用笔记 -- 0x01

    uv安装 查看可用python版本 查找已安装python版本 配置相关镜像及参数 安装指定版本python 创建项目并指定python版本 创...

  • Resize,w 360,h 240
    Xinference使用笔记 -- 0x01

    参考链接 https://inference.readthedocs.io/[https://inference.readthedocs.io/...

  • Resize,w 360,h 240
    dify本地源码启动实操&填坑

    0. dify本地源码启动参考地址: https://docs.dify.ai/zh-hans/getting-started/install-...

  • 模型文件(gguf,safetensors)转换笔记

    1. gguf 转 safetensors 以ollama下运行的模型为例a.) 查看模型路径ollama show 模型名称 --model...

  • Resize,w 360,h 240
    open-webui安装步骤笔记

    概述 目前大模型爆火,蹭着这个热度,根据网上教程个人也部署一份个人知识库;整个应用包含大模型应用,WEB端应用;其中大模型应用一般都是部署一个推...

  • JAVA 工具命令集

    JAVA 工具命令集 jstat jstat - [-t] [-h ] <vmid> [ [<count>]]参数解释:Options — ...

    2.5 52 0 3
  • Resize,w 360,h 240