• SpringAI更新:向量数据库不可用的解决方案!

SpringAI更新:向量数据库不可用的解决方案!

2025-04-27 10:40:28 栏目:宝塔面板 104 阅读

Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。

此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。

解决方案:Redis 向量数据库

虽然 SimpleVectorStore 不支持了,但 Spring AI 内置了 Redis 或 ES 作为向量数据库的分布式存储中间件,我们可以用他们来进行向量的存储。

而在这两种方案中,显然 Redis 使用成本更低,因此,我们来看如何将向量存储到 Redis 数据库中。

它的具体实现步骤如下。

安装Redis-Stack

  1. 下载 Docker Hub:https://www.docker.com/get-started/

图片

  1. 安装 redis-stack-server:使用“docker run -d --name redis-stack-server -p 6379:6379 redis/redis-stack-server”。

添加依赖

我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:


  org.springframework.ai
  spring-ai-starter-vector-store-redis



  org.springframework.ai
  spring-ai-starter-model-openai

设置配置信息

配置 Redis 连接信息,以及嵌入模型的配置信息:

spring:
  data:
    redis:
      host: localhost
      port: 6379
  ai:
    vectorstore:
      redis:
        initialize-schema: true
        index-name: custom-index
        prefix: custom-prefix
    openai:
      api-key: ${ALIYUN-AK}
      embedding:
        options:
          model: text-embedding-v3

阿里云百炼平台支持的向量模型:

图片

代码实现

Redis 添加向量数据

@Autowired
private VectorStore vectorStore;

// 构建数据
List documents =
List.of(new Document("I like Spring Boot"),
        new Document("I love Java"));
// 添加到向量数据库
vectorStore.add(documents);

当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的文本作为数据源。

VectorStore 提供的常用方法如下:

  • add(Listdocuments):添加文档。
  • delete(ListidList):按 ID 删除文档。
  • delete(Filter.Expression filterExpression):按过滤表达式删除文档。
  • similaritySearch(String query) 和 similaritySearch(SearchRequest request):相似性搜索。

执行结果如下:

图片

查询向量数据

@RestController
@RequestMapping("/vector")
public class VectorController {

    @Resource
    private VectorStore vectorStore;

    @RequestMapping("/find")
    public List find(@RequestParam String query) {
        // 构建搜索请求,设置查询文本和返回的文档数量
        SearchRequest request = SearchRequest.builder()
        .query(query)
        .topK(3)
        .build();
        List result = vectorStore.similaritySearch(request);
        System.out.println(result);
        return result;
    }
}

执行结果如下:

图片

从上述结果可以看出,和“java”相似度最高的向量为“I love Java”,相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询“I love Java”这条数据,如下图所示:

图片


本文地址:https://www.yitenyun.com/126.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 JumpServer SSL 堡垒机 跳板机 HTTPS HexHub Docker 服务器 管理口 服务器性能 JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 SQL 查询 序列 核心机制 Windows Windows server net3.5 .NET 安装出错 HTTPS加密 Windows宝塔 Mysql重置密码 开源 PostgreSQL 存储引擎 锁机制 宝塔面板打不开 宝塔面板无法访问 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 行业 趋势 Oracle 处理机制 无法访问宝塔面板 Undo Log 机制 Spring Redis 异步化 连接控制 InnoDB 数据库锁 监控 优化 万能公式 机器学习 动态查询 Serverless 无服务器 语言 响应模型 ES 协同 group by 索引 技术 分页查询 openHalo scp Linux的scp怎么用 scp上传 scp下载 scp命令 缓存方案 缓存架构 缓存穿透 Postgres OTel Iceberg 工具 存储 高可用 GreatSQL 连接数 数据 主库 SVM Embedding R edis 线程 日志文件 MIXED 3 国产数据库 Linux 安全 Netstat Linux 服务器 端口 SQLite-Web SQLite 数据库管理工具 R2DBC 加密 场景 启动故障 ​Redis 推荐模型 Recursive 自定义序列化 防火墙 黑客 云原生 共享锁 SQLark RocketMQ 长轮询 配置 向量数据库 大模型 OB 单机版 AI 助手 Hash 字段 PG DBA Rsync 信息化 智能运维 Ftp 不宕机 磁盘架构 架构 电商 系统 向量库 Milvus 数据分类 IT运维 Canal Python filelock 修改DNS Centos7如何修改DNS 业务 流量 传统数据库 向量化 • 索引 • 数据库 线上 库存 预扣 分库 分表 sftp 服务器 参数 PostGIS MVCC 人工智能 推荐系统 语句 MySQL 9.3 聚簇 非聚簇 mini-redis INCR指令 redo log 重做日志 同城 双活 频繁 Codis MongoDB MCP 开放协议 失效 Doris SeaTunnel 高效统计 今天这篇文章就跟大家 缓存 Redisson 锁芯 数据类型 虚拟服务器 虚拟机 内存 工具链 INSERT COMPACT 事务 Java 开发 主从复制 代理 prometheus Alert 数据备份 千万级 大表 窗口 函数 数据结构 ZODB 发件箱模式 网络架构 网络配置 SSH EasyExcel MySQL8 容器 QPS 高并发 崖山 新版本 引擎 性能 Web 分布式架构 分布式锁​ 聚簇索引 非聚簇索引 B+Tree ID 字段 数据脱敏 加密算法 分布式 集中式 RDB AOF 核心架构 订阅机制 Go 数据库迁移 OAuth2 Token Redis 8.0 分页 速度 服务器中毒 Web 接口 播客 模型 数据页 数据集成工具 读写 自动重启 网络故障 StarRocks 数据仓库 容器化 SpringAI 排行榜 排序 池化技术 连接池 微软 SQL Server AI功能 Redka DBMS 管理系统 JOIN MGR 分布式集群 Caffeine CP 原子性 Entity 部署 LRU 业务场景 事务隔离 网络 Testcloud 云端自动化 Valkey Valkey8.0 分页方案 排版 数据字典 兼容性 Pottery dbt 数据转换工具 ReadView 优化器 sqlmock 1 事务同步 悲观锁 乐观锁 关系数据库 意向锁 记录锁 日志 Weaviate 对象 单点故障 单线程 UUIDv7 主键 仪表盘 Order AIOPS UUID ID InfluxDB 编程 RAG HelixDB Ansible Pump Crash 代码 双引擎 分布式锁 Zookeeper 产业链 IT 恢复数据 订单 字典 LLM List 类型 线程安全 国产 用户 慢SQL优化 表空间 拦截器 动态代理 解锁 调优 Next-Key RR 互联网 GitHub Git 快照读 当前读 视图 神经系统 矢量存储 数据库类型 AI代理 查询规划 count(*) count(主键) 行数 CAS 算法 技巧 多线程 并发控制 恢复机制 闪回