• 回归基本面:确保虚拟机不超过主机容量

回归基本面:确保虚拟机不超过主机容量

2025-04-27 11:13:11 栏目:宝塔面板 30 阅读

我的雇主最近购买了需要新虚拟机的软件产品,正好可以趁此机会来审查为每个虚拟机合理分配硬件内存和计算资源的几个重要基本面。

这样做,我们才能处于故障切换就绪状态;在我们的环境下,由于新软件特别耗费资源,这意味着为生产级应用程序运行虚拟机的两个集群物理主机适当分配资源尤为重要。

该任务还提供了审查和调整分配给我们所有现有虚拟服务器的资源的机会,以便分配的资源数量适中。

为了启动该项目,需要对使用物理资源的已有系统进行审查,以便我们清楚地了解哪里还有余地可以创建新实例,哪里存在资源分配不当。也正好可以趁机为即使在高峰使用期间也未充分利用的服务器调整资源多寡,并且停用不再使用的服务器。

总之,这种审查的主要价值归结为两点:平衡内存和处理器分配以及停用服务器。

平衡内存和处理器资源

在分配内存资源和处理器资源时,目标一样:任何分配的资源不应超过物理主机支持的总量的一半。因此,如果每台物理机有128个处理器,为该主机上所有虚拟机分配的处理器总数不应超过64个。同样,如果有500GB的内存,那么该主机上所有虚拟机之间已分配的内存总量不应超过250GB。

值得一提的是,为每个虚拟机分配的内存和处理器通常也远高于哪怕高峰时段的实际使用量,这是为了两者的需求激增时留有余量。

平衡这些资源的一种方法是,在电子表格上记下分配给每个物理主机上每个虚拟机的内存和处理器资源,并为每个主机记下总量。如果任何一台主机上存在资源分配过度,可以在主机之间移动虚拟机,以达到所需的平衡。如果需要的资源多于可用资源,可以通过重新评估已分配的内存和处理器来找到更多资源,找出可以在不降低性能的情况下缩减哪些虚拟服务器的资源。为此,明智的做法是观察已分配资源的实际使用情况,衡量它们在高峰期间离耗尽资源有多近。一条好的经验法则是,允许内存和处理器的使用量高达已分配资源的80%,因为超过这个比例,进程会开始出故障。如果你发现一个虚拟服务器使用的内存或处理器资源从不超过15%,就可以精简。

服务器停用

当业务应用程序或网络部件报废或被替换时,它需要合理停用。停用频次在很大程度上取决于服务器环境的大小、业务需求以及硬件/软件支持生命周期。在我工作的公司,这种情况每年发生两到五次。

要考虑的一件事是,先针对可能驻留在用户工作站上的应用程序删除客户端。从应用程序本身删除客户端可能是最简单的方法,但其他方法包括使用组策略、登录脚本或SCCM,可实现同样的目标。

一旦完成这一步,关闭托管应用程序的虚拟机,将其从集群中断开。在Windows环境下,这可以由Hyper-V集群管理器来完成。从集群中断开可防止虚拟机成为任何故障切换操作的一部分;在Hyper-V的情况下,您无法在虚拟机仍在集群中时删除它。由于它是虚拟机,它只作为虚拟硬盘驱动器文件而存在,存在于物理主机或SAN中的某个地方。

下一步是将这些虚拟硬盘驱动器文件移到归档或冷存储,以便在需要时可以恢复它们,并从主机中删除虚拟机实例。然后,同样在微软环境下,禁用Active Directory中的计算机对象,并将它移到非生产级组织部门。

最后,精简已停用服务器的备份内容,只保留最近一份好的镜像,本地和云端各留一份。

原文标题:​​Back to basics: Make sure VMs don’t exceed host capacity​​,作者:Michael A.Flowers Sr.

本文地址:https://www.yitenyun.com/158.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL 数据同步 ACK 双主架构 循环复制 Web 应用 异步数据库 序列 核心机制 生命周期 Deepseek 宝塔面板 Linux宝塔 Docker JumpServer JumpServer安装 堡垒机安装 Linux安装JumpServer esxi esxi6 root密码不对 无法登录 web无法登录 Windows Windows server net3.5 .NET 安装出错 宝塔面板打不开 宝塔面板无法访问 SSL 堡垒机 跳板机 HTTPS Windows宝塔 Mysql重置密码 无法访问宝塔面板 HTTPS加密 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 ES 协同 修改DNS Centos7如何修改DNS scp Linux的scp怎么用 scp上传 scp下载 scp命令 防火墙 服务器 黑客 Serverless 无服务器 语言 存储 Spring SQL 动态查询 Oracle 处理机制 Linux 安全 网络架构 工具 网络配置 加密 场景 开源 PostgreSQL 存储引擎 RocketMQ 长轮询 配置 HexHub Canal MySQL 9.3 Rsync 架构 InnoDB 缓存方案 缓存架构 缓存穿透 信息化 智能运维 响应模型 日志文件 MIXED 3 索引 数据 业务 监控 线上 库存 预扣 AI 助手 数据库锁 单点故障 聚簇 非聚簇 B+Tree ID 字段 分库 分表 云原生 Redis Redis 8.0 GreatSQL Hash 字段 DBMS 管理系统 自定义序列化 SpringAI 优化 万能公式 openHalo OB 单机版 数据集成工具 SQLite Redka ​Redis 机器学习 推荐模型 SVM Embedding PostGIS 系统 SQLark 虚拟服务器 虚拟机 内存 Netstat Linux 服务器 端口 分页查询 自动重启 运维 sqlmock 排行榜 排序 Testcloud 云端自动化 查询 EasyExcel MySQL8 prometheus Alert SQLite-Web 数据库管理工具 同城 双活 缓存 sftp 服务器 参数 共享锁 • 索引 • 数据库 RDB AOF StarRocks 数据仓库 技术 向量数据库 大模型 不宕机 容器化 Postgres OTel Iceberg 分布式架构 分布式锁​ 聚簇索引 非聚簇索引 数据类型 OAuth2 Token Entity 开发 Doris SeaTunnel 人工智能 推荐系统 IT运维 分页 数据结构 连接控制 机制 AIOPS IT 数据备份 MongoDB 容器 Caffeine CP Python Web 部署 LRU Milvus 悲观锁 乐观锁 Ftp redo log 重做日志 池化技术 连接池 崖山 新版本 高可用 向量库 磁盘架构 流量 MCP mini-redis INCR指令 单线程 线程 MVCC 事务隔离 开放协议 Web 接口 字典 电商 对象 微软 SQL Server AI功能 速度 服务器中毒 数据脱敏 加密算法 R2DBC QPS 高并发 原子性 窗口 函数 双引擎 RAG HelixDB ZODB Order SSH 频繁 Codis Crash 代码 主库 引擎 性能 List 类型 网络 dbt 数据转换工具 1 PG DBA 工具链 优化器 Pottery 意向锁 记录锁 InfluxDB 模型 发件箱模式 事务同步 网络故障 传统数据库 向量化 UUIDv7 主键 仪表盘 Redisson 锁芯 INSERT COMPACT Undo Log LLM 线程安全 连接数 订单 JOIN