<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Local-Ai on Kalend's Blog</title><link>https://blog.kalend.top/tags/local-ai/</link><description>Recent content in Local-Ai on Kalend's Blog</description><generator>Hugo -- gohugo.io</generator><language>zh</language><atom:link href="https://blog.kalend.top/tags/local-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Ollama</title><link>https://blog.kalend.top/wiki/entities/ollama/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://blog.kalend.top/wiki/entities/ollama/</guid><description>&lt;h1 id="ollama"&gt;Ollama
&lt;/h1&gt;&lt;h2 id="概述"&gt;概述
&lt;/h2&gt;&lt;p&gt;本地大语言模型运行框架，支持一键部署和运行 LLM、Embedding 模型。通过 CLI 或 API 调用，无需 GPU 云服务。&lt;/p&gt;
&lt;h2 id="核心能力"&gt;核心能力
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;模型管理&lt;/strong&gt;：&lt;code&gt;ollama pull/run&lt;/code&gt; 简化模型获取与运行&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;API服务&lt;/strong&gt;：兼容 OpenAI API 格式，&lt;code&gt;localhost:11434&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Embedding支持&lt;/strong&gt;：用于向量检索的嵌入模型本地部署&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="实际用途"&gt;实际用途
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;部署 Qwen3-Embedding-0.6B 作为 [[mempalace]] 的嵌入模型&lt;/li&gt;
&lt;li&gt;中文命中率从 all-MiniLM-L6-v2 的 50% 提升到 100%&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="相关"&gt;相关
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;[[mempalace]] — 使用 Ollama 部署嵌入模型&lt;/li&gt;
&lt;li&gt;[[memory-layered-architecture]] — 五层记忆架构中的嵌入模型&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>