Press "Enter" to skip to content

分类: ollama

Ollama设置外部访问和高级配置

1. Ollama可配置环境变量 Ollama可配置环境变量: 设置外部访问+模型保存在内存中,设置如下环境变量: OLLAMA_KEEP_ALIVE: -1 OLLAMA_HOST: 0.0.0.0 2. 显卡资源使用不均横 设置环境变量OLLAMA_SCHED_SPREAD为1即可。 3. 加速计算 FlashAttention 是一种优化的注意力机制,用于加速深度学习模型中常见的自…

Leave a Comment