Hydra Columnar：一个开源的PostgreSQL列式存储引擎

Hydra Columnar：一个开源的PostgreSQL列式存储引擎

Hydra Columnar：一个开源的PostgreSQL列式存储引擎

2025-04-27 10:40:26 栏目：宝塔面板 118 阅读

Hydra Columnar 是一个 PostgreSQL 列式存储插件，专为分析型（OLAP）工作负载设计，旨在提升大规模分析查询和批量更新的效率。

Hydra Columnar 以扩展插件的方式提供，主要特点包括：

采用列式存储，利用列内数据相似性，支持多种压缩算法，大幅降低存储成本。
并行查询优化，结合 PostgreSQL 的并行执行框架，充分利用多核资源处理复杂分析。
向量化执行，批量处理列数据，减少函数调用开销，提升 CPU 缓存利用率，加速查询。
PostgreSQL 兼容性，同时支持 OLTP 以及 OLAP 负载场景。

目前，Hydra Columnar 还不支持 PostgreSQL 逻辑复制和外键，索引只支持 BTREE 或者 HASH。

以下是一个 Hydra Columnar 与 PostgreSQL、Citus 以及 TimescaleDB 使用 ClickBench 工具进行的分析性能测试比较：

从可以看出，Hydra Columnar 在绝大多数查询中获得了极大的性能提升，具体数据可以参考下面的网站：

https://tinyurl.com/clickbench

以下则是 TPC-H 数据仓库测试场景下的性能比较：

Hydra Columnar 提供了多种安装方式，使用 Docker 安装运行的命令如下：

git clone https://github.com/hydradatabase/hydra && cd hydra
cp .env.example .env
docker compose up

# 在另一个窗口中连接
psql postgres://postgres:hydra@127.0.0.1:5432

连接数据库之后，启用插件并创建数据表：

CREATE EXTENSION IF NOT EXISTS columnar;

CREATE TABLE sensor_data (
    timestamp TIMESTAMP,
    device_id INT,
    temperature FLOAT
);

我们也可以明确指定存储引擎，默认使用 Hydra Columnar：

CREATE TABLE heap_table (...) USING heap;
CREATE TABLE columnar_table (...) USING columnar; -- 默认值

然后可以正常导入数据并执行查询分析。

-- 批量插入数据（列式存储适合批量写入）
INSERT INTO sensor_data SELECT ...;

-- 分析查询（仅扫描 temperature 列）
SELECT AVG(temperature) FROM sensor_data WHERE timestamp > '2023-01-01';

详细信息可以参考文档：

https://columnar.docs.hydra.so/

本文地址：https://www.yitenyun.com/127.html

上一篇：SpringAI更新：向量数据库不可用的解决方案！

下一篇：dbt：新一代数据转换工具

搜索文章

最新文章

运维必杀技：关闭这些默认服务，让你的服务器飞起来···

千万别忽视！TIME_WAIT 堆积背后的秘密和应对技巧

数据库优化实战：25 个 SQL 性能调优技巧，查询速度···

数据库事务与锁机制：十个核心场景 + SQL 实战案例

2025 TDBC 大会归来...

热门文章

FastAPI 实战：打造高效的 CRUD 接口（增删改查优秀···

SpringBoot与Calcite整合，实现多数据源统一查询系统···

FastAPI + Tortoise-ORM：异步数据库操作优秀实践

阿里二面：聊聊 MySQL 主从同步方案的优缺点

面试官：MySQL双主架构有什么优缺点？

所有分类

宝塔面板（254） Windows （2） Linux （8）香港服务器（0）美国服务器（0）香港站群服务器（0）美国站群服务器（0）

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用异步数据库数据同步 ACK 双主架构循环复制 TIME_WAIT 运维负载均衡 Deepseek 宝塔面板 Linux宝塔 Docker JumpServer JumpServer安装堡垒机安装 Linux安装JumpServer esxi esxi6 root密码不对无法登录 web无法登录生命周期序列核心机制 SSL 堡垒机跳板机 HTTPS HexHub Windows Windows server net3.5 .NET 安装出错宝塔面板打不开宝塔面板无法访问 HTTPS加密查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 InnoDB 数据库锁 Oracle 处理机制连接控制机制无法访问宝塔面板 Windows宝塔 Mysql重置密码 ES 协同监控 Serverless 无服务器语言开源 PostgreSQL 存储引擎技术 group by 索引 Spring Redis 异步化分页查询高可用服务器管理口缓存方案缓存架构缓存穿透 SQL 动态查询响应模型数据主库 SVM Embedding 自定义序列化 GreatSQL 连接数日志文件 MIXED 3 服务器性能 SQLark 云原生 PG DBA Redis 机器学习推荐模型 R edis 线程 scp Linux的scp怎么用 scp上传 scp下载 scp命令向量数据库大模型 Netstat Linux 服务器端口 AI 助手 Linux 安全工具 SQLite-Web SQLite 数据库管理工具共享锁存储 Undo Log 查询 openHalo OB 单机版电商系统 Rsync Recursive 架构 R2DBC Postgres OTel Iceberg • 索引 • 数据库聚簇非聚簇 RocketMQ 长轮询配置数据分类加密流量 sftp 服务器参数优化万能公式修改DNS Centos7如何修改DNS redo log 重做日志 Hash 字段磁盘架构同城双活防火墙黑客场景信息化智能运维 Ftp 数据备份 MySQL 9.3 mini-redis INCR指令 RDB AOF MVCC 人工智能推荐系统窗口函数缓存高效统计今天这篇文章就跟大家业务网络架构网络配置 INSERT COMPACT Redisson 锁芯向量库 Milvus Doris SeaTunnel 线上库存预扣事务 Java 开发核心架构订阅机制 prometheus Alert 引擎性能 Python 库 B+Tree ID 字段不宕机 Web PostGIS 崖山新版本 MongoDB 数据结构 IT运维数据脱敏加密算法数据类型虚拟服务器虚拟机内存传统数据库向量化读写分布式集中式 ZODB Canal 网络故障容器容器化 DBMS 管理系统模型 OAuth2 Token filelock JOIN QPS 高并发 Redis 8.0 微软 SQL Server AI功能自动重启 Pottery 部署聚簇索引非聚簇索引 Testcloud 云端自动化发件箱模式速度服务器中毒分库分表事务隔离 SpringAI 锁机制分页方案排版 Entity 工具链排行榜排序启动故障数据页 Caffeine CP Web 接口 1 悲观锁乐观锁 StarRocks 数据仓库 SSH 单点故障 Go 数据库迁移 MCP 开放协议 sqlmock LRU 池化技术连接池 Redka 频繁 Codis 原子性大表业务场景数据集成工具分页意向锁记录锁 AIOPS 网络分布式架构分布式锁优化器 Order EasyExcel MySQL8 dbt 数据转换工具 IT 仪表盘日志单线程字典对象 InfluxDB 双引擎 RAG HelixDB 行业趋势 Ansible 事务同步 Crash 代码国产数据库 LLM UUIDv7 主键 List 类型订单线程安全 Pump UUID ID 主从复制代理编程 Next-Key 锁关系数据库语句 Valkey Valkey8.0 播客解锁调优 ReadView 产业链兼容性恢复数据数据字典 MGR 分布式集群表算法失效国产用户 GitHub Git 矢量存储数据库类型 AI代理查询规划千万级快照读当前读视图慢SQL优化 Weaviate RR 互联网 count(*) count(主键) 行数神经系统表空间分布式锁 Zookeeper 拦截器动态代理并发控制恢复机制 CAS 多线程技巧闪回

Copyright © 2014-2025 yitenyun.com 保留所有权利网站地图皖ICP备16015960号-7