• 回归基本面:确保虚拟机不超过主机容量

回归基本面:确保虚拟机不超过主机容量

2025-04-27 11:13:11 栏目:宝塔面板 48 阅读

我的雇主最近购买了需要新虚拟机的软件产品,正好可以趁此机会来审查为每个虚拟机合理分配硬件内存和计算资源的几个重要基本面。

这样做,我们才能处于故障切换就绪状态;在我们的环境下,由于新软件特别耗费资源,这意味着为生产级应用程序运行虚拟机的两个集群物理主机适当分配资源尤为重要。

该任务还提供了审查和调整分配给我们所有现有虚拟服务器的资源的机会,以便分配的资源数量适中。

为了启动该项目,需要对使用物理资源的已有系统进行审查,以便我们清楚地了解哪里还有余地可以创建新实例,哪里存在资源分配不当。也正好可以趁机为即使在高峰使用期间也未充分利用的服务器调整资源多寡,并且停用不再使用的服务器。

总之,这种审查的主要价值归结为两点:平衡内存和处理器分配以及停用服务器。

平衡内存和处理器资源

在分配内存资源和处理器资源时,目标一样:任何分配的资源不应超过物理主机支持的总量的一半。因此,如果每台物理机有128个处理器,为该主机上所有虚拟机分配的处理器总数不应超过64个。同样,如果有500GB的内存,那么该主机上所有虚拟机之间已分配的内存总量不应超过250GB。

值得一提的是,为每个虚拟机分配的内存和处理器通常也远高于哪怕高峰时段的实际使用量,这是为了两者的需求激增时留有余量。

平衡这些资源的一种方法是,在电子表格上记下分配给每个物理主机上每个虚拟机的内存和处理器资源,并为每个主机记下总量。如果任何一台主机上存在资源分配过度,可以在主机之间移动虚拟机,以达到所需的平衡。如果需要的资源多于可用资源,可以通过重新评估已分配的内存和处理器来找到更多资源,找出可以在不降低性能的情况下缩减哪些虚拟服务器的资源。为此,明智的做法是观察已分配资源的实际使用情况,衡量它们在高峰期间离耗尽资源有多近。一条好的经验法则是,允许内存和处理器的使用量高达已分配资源的80%,因为超过这个比例,进程会开始出故障。如果你发现一个虚拟服务器使用的内存或处理器资源从不超过15%,就可以精简。

服务器停用

当业务应用程序或网络部件报废或被替换时,它需要合理停用。停用频次在很大程度上取决于服务器环境的大小、业务需求以及硬件/软件支持生命周期。在我工作的公司,这种情况每年发生两到五次。

要考虑的一件事是,先针对可能驻留在用户工作站上的应用程序删除客户端。从应用程序本身删除客户端可能是最简单的方法,但其他方法包括使用组策略、登录脚本或SCCM,可实现同样的目标。

一旦完成这一步,关闭托管应用程序的虚拟机,将其从集群中断开。在Windows环境下,这可以由Hyper-V集群管理器来完成。从集群中断开可防止虚拟机成为任何故障切换操作的一部分;在Hyper-V的情况下,您无法在虚拟机仍在集群中时删除它。由于它是虚拟机,它只作为虚拟硬盘驱动器文件而存在,存在于物理主机或SAN中的某个地方。

下一步是将这些虚拟硬盘驱动器文件移到归档或冷存储,以便在需要时可以恢复它们,并从主机中删除虚拟机实例。然后,同样在微软环境下,禁用Active Directory中的计算机对象,并将它移到非生产级组织部门。

最后,精简已停用服务器的备份内容,只保留最近一份好的镜像,本地和云端各留一份。

原文标题:​​Back to basics: Make sure VMs don’t exceed host capacity​​,作者:Michael A.Flowers Sr.

本文地址:https://www.yitenyun.com/158.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL 数据同步 ACK Web 应用 异步数据库 双主架构 循环复制 Deepseek 宝塔面板 Linux宝塔 Docker 生命周期 序列 核心机制 JumpServer JumpServer安装 堡垒机安装 Linux安装JumpServer esxi esxi6 root密码不对 无法登录 web无法登录 Windows Windows server net3.5 .NET 安装出错 宝塔面板打不开 宝塔面板无法访问 SSL 堡垒机 跳板机 HTTPS 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 无法访问宝塔面板 Windows宝塔 Mysql重置密码 HTTPS加密 连接控制 机制 ES 协同 Oracle 处理机制 Serverless 无服务器 语言 OB 单机版 Spring SQL 动态查询 scp Linux的scp怎么用 scp上传 scp下载 scp命令 技术 存储 索引 运维 缓存方案 缓存架构 缓存穿透 分页查询 Rsync 架构 InnoDB 日志文件 MIXED 3 响应模型 RocketMQ 长轮询 配置 监控 修改DNS Centos7如何修改DNS HexHub Redis 电商 系统 Linux 安全 服务器 MySQL 9.3 聚簇 非聚簇 异步化 防火墙 黑客 数据 主库 group by sftp 服务器 参数 自定义序列化 查询 SQLark PostgreSQL 数据库锁 开源 存储引擎 管理口 业务 SQLite-Web SQLite 数据库管理工具 R edis 线程 线上 库存 预扣 人工智能 向量数据库 推荐系统 Doris SeaTunnel MVCC 加密 场景 流量 工具 共享锁 PG DBA Ftp ​Redis 机器学习 推荐模型 信息化 智能运维 数据备份 网络架构 网络配置 redo log 重做日志 高可用 Canal B+Tree ID 字段 • 索引 • 数据库 RDB AOF Redis 8.0 AI 助手 GreatSQL 连接数 Postgres OTel Iceberg Python 优化 万能公式 缓存 核心架构 订阅机制 同城 双活 网络故障 INSERT COMPACT Hash 字段 Web 云原生 微软 SQL Server AI功能 prometheus Alert 不宕机 自动重启 IT运维 大模型 引擎 性能 分库 分表 SVM Embedding 高效统计 今天这篇文章就跟大家 虚拟服务器 虚拟机 内存 向量库 Milvus OAuth2 Token Netstat Linux 服务器 端口 单点故障 Entity 开发 ZODB DBMS 管理系统 MongoDB 容器 sqlmock LRU 崖山 新版本 Undo Log 容器化 窗口 函数 mini-redis INCR指令 JOIN openHalo 数据集成工具 分布式 集中式 SpringAI 悲观锁 乐观锁 磁盘架构 排行榜 排序 Redka 数据脱敏 加密算法 Redisson 锁芯 QPS 高并发 PostGIS Testcloud 云端自动化 分页 数据结构 EasyExcel MySQL8 Recursive 数据类型 模型 启动故障 大表 业务场景 StarRocks 数据仓库 意向锁 记录锁 分布式架构 分布式锁​ Pottery 聚簇索引 非聚簇索引 原子性 AIOPS R2DBC Caffeine CP SSH IT 网络 MCP 开放协议 InfluxDB 1 事务 Java 池化技术 连接池 Web 接口 部署 dbt 数据转换工具 RAG HelixDB 工具链 发件箱模式 数据分类 filelock 速度 服务器中毒 字典 传统数据库 向量化 对象 读写 Go 数据库迁移 事务隔离 仪表盘 优化器 单线程 双引擎 频繁 Codis 分页方案 排版 数据页 Order 线程安全 LLM Crash 代码 List 类型 事务同步 UUIDv7 主键 订单 Pump 日志 Ansible