• SpringAI更新:向量数据库不可用的解决方案!

SpringAI更新:向量数据库不可用的解决方案!

2025-04-27 10:40:28 栏目:宝塔面板 85 阅读

Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。

此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。

解决方案:Redis 向量数据库

虽然 SimpleVectorStore 不支持了,但 Spring AI 内置了 Redis 或 ES 作为向量数据库的分布式存储中间件,我们可以用他们来进行向量的存储。

而在这两种方案中,显然 Redis 使用成本更低,因此,我们来看如何将向量存储到 Redis 数据库中。

它的具体实现步骤如下。

安装Redis-Stack

  1. 下载 Docker Hub:https://www.docker.com/get-started/

图片

  1. 安装 redis-stack-server:使用“docker run -d --name redis-stack-server -p 6379:6379 redis/redis-stack-server”。

添加依赖

我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:


  org.springframework.ai
  spring-ai-starter-vector-store-redis



  org.springframework.ai
  spring-ai-starter-model-openai

设置配置信息

配置 Redis 连接信息,以及嵌入模型的配置信息:

spring:
  data:
    redis:
      host: localhost
      port: 6379
  ai:
    vectorstore:
      redis:
        initialize-schema: true
        index-name: custom-index
        prefix: custom-prefix
    openai:
      api-key: ${ALIYUN-AK}
      embedding:
        options:
          model: text-embedding-v3

阿里云百炼平台支持的向量模型:

图片

代码实现

Redis 添加向量数据

@Autowired
private VectorStore vectorStore;

// 构建数据
List documents =
List.of(new Document("I like Spring Boot"),
        new Document("I love Java"));
// 添加到向量数据库
vectorStore.add(documents);

当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的文本作为数据源。

VectorStore 提供的常用方法如下:

  • add(Listdocuments):添加文档。
  • delete(ListidList):按 ID 删除文档。
  • delete(Filter.Expression filterExpression):按过滤表达式删除文档。
  • similaritySearch(String query) 和 similaritySearch(SearchRequest request):相似性搜索。

执行结果如下:

图片

查询向量数据

@RestController
@RequestMapping("/vector")
public class VectorController {

    @Resource
    private VectorStore vectorStore;

    @RequestMapping("/find")
    public List find(@RequestParam String query) {
        // 构建搜索请求,设置查询文本和返回的文档数量
        SearchRequest request = SearchRequest.builder()
        .query(query)
        .topK(3)
        .build();
        List result = vectorStore.similaritySearch(request);
        System.out.println(result);
        return result;
    }
}

执行结果如下:

图片

从上述结果可以看出,和“java”相似度最高的向量为“I love Java”,相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询“I love Java”这条数据,如下图所示:

图片


本文地址:https://www.yitenyun.com/126.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 JumpServer SSL 堡垒机 跳板机 HTTPS TIME_WAIT 运维 负载均衡 HexHub Docker JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 服务器 管理口 序列 核心机制 HTTPS加密 Windows Windows server net3.5 .NET 安装出错 服务器性能 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 宝塔面板打不开 宝塔面板无法访问 开源 PostgreSQL 存储引擎 Windows宝塔 Mysql重置密码 Oracle 处理机制 无法访问宝塔面板 InnoDB 数据库锁 连接控制 机制 监控 Serverless 无服务器 语言 Spring Redis 异步化 SQL 优化 万能公式 ES 协同 技术 Undo Log group by 索引 缓存方案 缓存架构 缓存穿透 分页查询 高可用 动态查询 机器学习 GreatSQL 连接数 工具 响应模型 查询 日志文件 MIXED 3 scp Linux的scp怎么用 scp上传 scp下载 scp命令 R edis 线程 SVM Embedding 锁机制 R2DBC 数据 主库 Netstat Linux 服务器 端口 openHalo 加密 场景 云原生 Linux 安全 Postgres OTel Iceberg RocketMQ 长轮询 配置 AI 助手 Recursive 自定义序列化 存储 ​Redis 推荐模型 SQLite-Web SQLite 数据库管理工具 共享锁 SQLark PG DBA 向量数据库 大模型 Hash 字段 OB 单机版 Ftp 电商 系统 启动故障 国产数据库 架构 修改DNS Centos7如何修改DNS MySQL 9.3 • 索引 • 数据库 数据分类 防火墙 黑客 人工智能 推荐系统 流量 磁盘架构 sftp 服务器 参数 线上 库存 预扣 redo log 重做日志 分库 分表 Rsync 同城 双活 信息化 智能运维 向量库 Milvus mini-redis INCR指令 业务 不宕机 Python 传统数据库 向量化 行业 趋势 MVCC Canal PostGIS 高效统计 今天这篇文章就跟大家 INSERT COMPACT 缓存 聚簇 非聚簇 网络架构 网络配置 Doris SeaTunnel Redisson 锁芯 prometheus Alert 数据备份 filelock 事务 Java 开发 ZODB 语句 Web 窗口 函数 虚拟服务器 虚拟机 内存 MongoDB 数据结构 RDB AOF 读写 引擎 性能 数据脱敏 加密算法 失效 OAuth2 Token 核心架构 订阅机制 Go 数据库迁移 容器 频繁 Codis B+Tree ID 字段 IT运维 数据类型 模型 分布式 集中式 崖山 新版本 Redis 8.0 发件箱模式 容器化 自动重启 网络故障 播客 SpringAI SSH 微软 SQL Server AI功能 DBMS 管理系统 聚簇索引 非聚簇索引 QPS 高并发 JOIN Entity 数据页 MCP 开放协议 Web 接口 原子性 数据集成工具 工具链 速度 服务器中毒 网络 Pottery 部署 StarRocks 数据仓库 排行榜 排序 Testcloud 云端自动化 Redka 分页方案 排版 大表 业务场景 Caffeine CP 事务隔离 分布式架构 分布式锁​ 1 悲观锁 乐观锁 池化技术 连接池 主从复制 代理 dbt 数据转换工具 日志 LRU 优化器 EasyExcel MySQL8 单点故障 AIOPS sqlmock Order 分页 意向锁 记录锁 仪表盘 数据字典 兼容性 事务同步 对象 UUIDv7 主键 InfluxDB RAG HelixDB Ansible ReadView 订单 Crash 代码 UUID ID 单线程 IT 双引擎 LLM 字典 Weaviate 产业链 编程 Valkey Valkey8.0 恢复数据 MGR 分布式集群 分布式锁 Zookeeper 线程安全 千万级 Pump List 类型 关系数据库 拦截器 动态代理 Next-Key 表空间 解锁 调优 慢SQL优化 快照读 当前读 视图 国产 用户 RR 互联网 GitHub Git 矢量存储 数据库类型 AI代理 算法 神经系统 查询规划 count(*) count(主键) 行数 技巧 CAS 并发控制 恢复机制 多线程 闪回