10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

SeekDB:一款AI原生的混合搜索数据库!还支持MCP

11小时前 AI开源项目 32 0

最近在调研本地AI知识库方案时,我发现了一个有趣的开源项目——SeekDB。

它来自蚂蚁集团OceanBase团队,是一款AI原生的混合搜索数据库。

相比于业界常见的"数据库拼图方案",SeekDB的核心逻辑很清晰:通过统一数据架构,解决Agentic RAG应用的复杂度问题。

为什么需要SeekDB?

在推进RAG应用落地时,大多数团队会面临一个共同的架构困境:需要同时处理三种不同的数据形态。

  • 业务元数据(结构化数据):Agent创建时间、作者权限、工作流节点等,需要关系型数据库存储以保证事务安全
  • 语义向量(非结构化数据):文本转换为数学向量供AI理解语义,需要向量数据库
  • 全文索引:处理关键词精确匹配,向量搜索有偏差时用来兜底

传统做法是采用分布式"拼图"架构——MySQL/PostgreSQL存元数据 + Milvus/Chroma存向量 + Elasticsearch做全文检索。

这种方案的代价很高:

  • 需要维护三套完全不同的系统
  • 自行处理跨系统数据同步
  • 很难保证事务一致性(网络抖动导致单边写入失败,数据状态不一致)
  • 系统复杂度与运维成本成正比增长

SeekDB的思路是"做减法":将向量、文本、结构化/半结构化数据统一存储在一个数据库内。

SeekDB的核心能力

维度 能力特性 实际意义
混合搜索 在数据库内核层支持向量、全文和标量过滤的联合查询 一条SQL完成多路召回和精排,无需应用层编排
AI函数 内置调用大模型/向量模型的能力 数据库层面直接进行嵌入和推理,AI功能内置
协议兼容 支持MySQL协议,支持MCP Server标准 无需修改客户端代码,Navicat直连;支持Claude、Cursor等工具集成
资源占用 最低配置:1核CPU + 2GB内存 适合个人/小团队本地部署和边缘设备

适用场景分析

1. 个人或小团队的本地知识库

  • 轻量级架构,资源占用极低
  • 可部署在旧电脑或低成本云服务器上
  • 快速验证AI知识库效果

2. 边缘设备应用

  • 手机、车机、工业网关等资源受限环境
  • 重型数据库无法满足部署条件
  • SeekDB的轻量级特性正好匹配

3. Agent长期记忆体系

  • 同时存储结构化对话记录和非结构化向量记忆
  • 为AI Agent提供持久化记忆能力

4. Dify知识库效果升级

  • Dify官方已在v1.10.1版本兼容SeekDB
  • 可替代默认的PostgreSQL+Weaviate方案
  • 通过粗排+精排机制实现毫秒级响应和百亿向量检索

部署与配置

4.1 本地部署(三种方式)

方式一:Python SDK(推荐轻量应用)

pip install pyseekdb

方式二:Docker(推荐标准部署)

docker run -d --name seekdb -p 2881:2881 oceanbase/seekdb:latest

特点:

  • 启动速度秒级
  • 可用Python SDK或MySQL客户端操作
  • 支持Navicat等可视化管理工具直连

4.2 与Dify集成(完整示例)

第一步:更新版本

修改docker/docker-compose.yaml,将api、worker、worker_beat、web的image版本改为1.10.1或main,例如:

langgenius/dify-api:1.10.1

第二步:修改环境配置

编辑.env文件(Mac查看隐藏文件:Cmd+Shift+. ;Windows:Ctrl+Shift+H)

选择以下配置方案之一:

方案A:SeekDB作为元数据库和向量数据库

DB_TYPE=mysql
DB_USERNAME=root
DB_HOST=seekdb
DB_PORT=2881
DB_DATABASE=test
VECTOR_STORE=oceanbase
OCEANBASE_VECTOR_HOST=seekdb
OCEANBASE_VECTOR_USER=root
COMPOSE_PROFILES=seekdb

方案B:仅作为元数据库

DB_TYPE=mysql
DB_USERNAME=root
DB_HOST=seekdb
DB_PORT=2881
DB_DATABASE=test
COMPOSE_PROFILES=${VECTOR_STORE:-weaviate},seekdb

方案C:仅作为向量数据库

VECTOR_STORE=oceanbase
OCEANBASE_VECTOR_HOST=seekdb
OCEANBASE_VECTOR_USER=root
COMPOSE_PROFILES=seekdb,${DB_TYPE:-postgresql}

第三步:启动服务

docker-compose up -d

默认密码:difyai123456(可在.env中修改)

启动完成后,SeekDB将同时扮演元数据库、向量数据库和全文检索系统的三重角色。

在Navicat中查询时,可在vector_index开头的表中查看已存储的向量数据。

4.3 MCP Server集成(连接本地Agent)

前置条件:

  • 已部署SeekDB
  • Python 3.11+
  • 安装uv包管理器:pip install uv

集成步骤:

1. 克隆并安装MCP项目

git clone https://github.com/oceanbase/mcp-oceanbase.git
cd mcp-oceanbase
uv venv
source .venv/bin/activate  # Windows用 .venv\Scripts\activate
uv pip install

2. 在Trae/Cursor等工具配置MCP Server

{
  "mcpServers": {
    "oceanbase": {
      "command": "uv",
      "args": [
        "--directory",
        "/path/to/mcp-oceanbase/src/oceanbase_mcp_server",
        "run",
        "oceanbase_mcp_server"
      ],
      "env": {
        "OB_HOST": "127.0.0.1",
        "OB_PORT": "2881",
        "OB_USER": "root",
        "OB_PASSWORD": "difyai123456",
        "OB_DATABASE": "test"
      }
    }
  }
}

注意:首次启动会下载MySQL驱动,速度较慢,后续启动正常。

MCP Server提供的10个工具

工具名 功能说明
execute_sql 在OceanBase上执行任意SQL语句
get_ob_ash_report 生成ASH报告用于性能分析(可指定时间范围和租户)
get_current_time 获取数据库当前系统时间
get_current_tenant 获取当前连接所属租户名称
get_all_server_nodes 列出集群中所有server节点(需sys租户权限)
get_resource_capacity 获取集群资源容量信息(需sys租户权限)
search_oceanbase_document 从OceanBase官方文档自动检索相关内容
oceanbase_text_search 在表中执行全文检索(支持指定文本列、WHERE条件、返回列)
oceanbase_vector_search 执行向量相似度搜索(支持距离算法选择、TopK设置)
oceanbase_hybrid_search 混合搜索:结合结构化过滤和向量相似度的多模态检索

与同类项目的对比

SeekDB的差异化优势:

  • 统一存储模型:无需维护多个系统,减少数据同步复杂度
  • 事务一致性:所有数据更新在同一ACID事务内完成
  • 资源效率:最低配置最优,特别适合资源受限环境
  • AI友好:内置AI函数,支持MCP标准,与现代AI工具链无缝对接

实践建议

快速验证阶段:使用Docker一键启动,通过Python SDK或SQL客户端测试功能。

与Dify集成:如果已使用Dify开源版,升级到v1.10.1后可无缝切换为SeekDB作为向量库,预期可提升检索精度(通过粗排+精排机制)和响应速度(毫秒级)。

Agent工具集成:接入MCP Server后,Cursor、Claude Code等工具可直接访问本地知识库,为编码助手补充私有知识。混合搜索工具适合需要"精确匹配+语义理解"并行处理的场景。

生产部署参考:对于中等规模应用(百万级文档、十亿级向量),SeekDB支持集群扩展,但具体配置建议查阅官方文档。

总体评价

从产品层面看,SeekDB抓住了AI应用落地中的真实痛点——数据架构复杂度。

通过"统一存储+混合检索"的设计思路,将原本需要多个系统协作的工作流内聚到单一数据库内核,降低了系统维护的认知负担。

尤其是对个人开发者、小团队或初创企业而言,快速搭建一个可靠的AI知识库系统变得更加可行。

同时,通过兼容MySQL协议和MCP标准,SeekDB展现出了对现有生态的尊重——不是要替代所有存储方案,而是提供一个更高效的统一入口。

如果你正在评估本地知识库方案,或者为Dify知识库的检索效果头疼,SeekDB是值得一试的选项。

相比自行搭建"三件套"系统,节省的运维成本和架构复杂度的降低是显而易见的。

官方资源:

GitHub:https://github.com/oceanbase/seekdb

文档:https://www.oceanbase.ai/docs/zh-CN/

MCP集成:https://github.com/oceanbase/mcp-oceanbase

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:SeekDB:一款AI原生的混合搜索数据库!还支持MCP
#SeekDB #混合搜索数据库 #MCP #Dify 
收藏 1
next-ai-draw-io:一键生成各类复杂专业图表、流程图、架构图
Mistral 3 来了:这次只对标中国模型
推荐阅读
  • 思源笔记siyuan:本地优先、隐私优先的个人知识管理与 AI 知识库开源项目
  • TEN Framework:几分钟就能搭建Voice Agent 的AI 语音框架,开源GitHub 热榜第一
  • AutoGLM 沉思:Agent智能体工具,具备深度研究和自主执行能力的AI智能体
  • VibeVoice:微软开源的长文本TTS框架,重新定义语音合成
  • Open Notebook:不想把研究资料交给 Google?试试这款 NotebookLM 的开源平替
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
5646 1月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
4249 1月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
3802 2月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
3297 1月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
3093 3月前
SurfSense:私人AI研究助手,私有版的NotebookLM 和 Perplexity开源平替,
3018 1月前
KrillinAI:开源AI视频翻译配音工具,100种语言双向翻译,一键部署全流程
2846 1月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
2267 2月前
Bytebot:开源AI桌面代理(Desktop Agent),给AI配一台自己的电脑
2223 2月前
Fogsight (雾象):一句话自动生成任何科普动画
2203 1月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 SeekDB:一款AI原生的混合搜索数据库!还支持MCP
2 next-ai-draw-io:一键生成各类复杂专业图表、流程图、架构图
3 APITable:开源可视化数据库,用表格界面快速搭建业务管理系统
4 EasyAIoT:工业物联网的开源边端一体化平台
5 Lobe Chat:LLMs 聊天应用与开发框架,AI 大模型操作台
6 思源笔记siyuan:本地优先、隐私优先的个人知识管理与 AI 知识库开源项目
7 GELab-Zero:本地可控的移动设备GUI智能体,仅 4B 轻量小模型
8 Presentation AI:一款开源AI PPT工具,AI一键生成精美幻灯片!
9 TrendRadar:AI 驱动的多平台热点资讯聚合与舆情监控工具
10 OmniBox:开源AI知识管理系统,让你的收藏夹不再吃灰!
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联