• 回归基本面:确保虚拟机不超过主机容量

回归基本面:确保虚拟机不超过主机容量

2025-04-27 11:13:11 栏目:宝塔面板 73 阅读

我的雇主最近购买了需要新虚拟机的软件产品,正好可以趁此机会来审查为每个虚拟机合理分配硬件内存和计算资源的几个重要基本面。

这样做,我们才能处于故障切换就绪状态;在我们的环境下,由于新软件特别耗费资源,这意味着为生产级应用程序运行虚拟机的两个集群物理主机适当分配资源尤为重要。

该任务还提供了审查和调整分配给我们所有现有虚拟服务器的资源的机会,以便分配的资源数量适中。

为了启动该项目,需要对使用物理资源的已有系统进行审查,以便我们清楚地了解哪里还有余地可以创建新实例,哪里存在资源分配不当。也正好可以趁机为即使在高峰使用期间也未充分利用的服务器调整资源多寡,并且停用不再使用的服务器。

总之,这种审查的主要价值归结为两点:平衡内存和处理器分配以及停用服务器。

平衡内存和处理器资源

在分配内存资源和处理器资源时,目标一样:任何分配的资源不应超过物理主机支持的总量的一半。因此,如果每台物理机有128个处理器,为该主机上所有虚拟机分配的处理器总数不应超过64个。同样,如果有500GB的内存,那么该主机上所有虚拟机之间已分配的内存总量不应超过250GB。

值得一提的是,为每个虚拟机分配的内存和处理器通常也远高于哪怕高峰时段的实际使用量,这是为了两者的需求激增时留有余量。

平衡这些资源的一种方法是,在电子表格上记下分配给每个物理主机上每个虚拟机的内存和处理器资源,并为每个主机记下总量。如果任何一台主机上存在资源分配过度,可以在主机之间移动虚拟机,以达到所需的平衡。如果需要的资源多于可用资源,可以通过重新评估已分配的内存和处理器来找到更多资源,找出可以在不降低性能的情况下缩减哪些虚拟服务器的资源。为此,明智的做法是观察已分配资源的实际使用情况,衡量它们在高峰期间离耗尽资源有多近。一条好的经验法则是,允许内存和处理器的使用量高达已分配资源的80%,因为超过这个比例,进程会开始出故障。如果你发现一个虚拟服务器使用的内存或处理器资源从不超过15%,就可以精简。

服务器停用

当业务应用程序或网络部件报废或被替换时,它需要合理停用。停用频次在很大程度上取决于服务器环境的大小、业务需求以及硬件/软件支持生命周期。在我工作的公司,这种情况每年发生两到五次。

要考虑的一件事是,先针对可能驻留在用户工作站上的应用程序删除客户端。从应用程序本身删除客户端可能是最简单的方法,但其他方法包括使用组策略、登录脚本或SCCM,可实现同样的目标。

一旦完成这一步,关闭托管应用程序的虚拟机,将其从集群中断开。在Windows环境下,这可以由Hyper-V集群管理器来完成。从集群中断开可防止虚拟机成为任何故障切换操作的一部分;在Hyper-V的情况下,您无法在虚拟机仍在集群中时删除它。由于它是虚拟机,它只作为虚拟硬盘驱动器文件而存在,存在于物理主机或SAN中的某个地方。

下一步是将这些虚拟硬盘驱动器文件移到归档或冷存储,以便在需要时可以恢复它们,并从主机中删除虚拟机实例。然后,同样在微软环境下,禁用Active Directory中的计算机对象,并将它移到非生产级组织部门。

最后,精简已停用服务器的备份内容,只保留最近一份好的镜像,本地和云端各留一份。

原文标题:​​Back to basics: Make sure VMs don’t exceed host capacity​​,作者:Michael A.Flowers Sr.

本文地址:https://www.yitenyun.com/158.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 Deepseek 宝塔面板 Linux宝塔 Docker JumpServer JumpServer安装 堡垒机安装 Linux安装JumpServer esxi esxi6 root密码不对 无法登录 web无法登录 生命周期 SSL 堡垒机 跳板机 HTTPS 序列 核心机制 HexHub Windows Windows server net3.5 .NET 安装出错 HTTPS加密 宝塔面板打不开 宝塔面板无法访问 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 InnoDB 数据库锁 Oracle 处理机制 连接控制 机制 无法访问宝塔面板 ES 协同 监控 Windows宝塔 Mysql重置密码 Serverless 无服务器 语言 技术 开源 PostgreSQL 存储引擎 group by 索引 Spring Redis 异步化 分页查询 服务器 管理口 高可用 缓存方案 缓存架构 缓存穿透 SQL 动态查询 响应模型 数据 主库 SVM Embedding 自定义序列化 GreatSQL 连接数 日志文件 MIXED 3 云原生 PG DBA 服务器性能 SQLark scp Linux的scp怎么用 scp上传 scp下载 scp命令 ​Redis 机器学习 推荐模型 R edis 线程 Netstat Linux 服务器 端口 AI 助手 向量数据库 大模型 Linux 安全 工具 存储 Undo Log 查询 SQLite-Web SQLite 数据库管理工具 共享锁 openHalo OB 单机版 电商 系统 Rsync Recursive 架构 R2DBC • 索引 • 数据库 Postgres OTel Iceberg RocketMQ 长轮询 配置 聚簇 非聚簇 数据分类 加密 修改DNS Centos7如何修改DNS redo log 重做日志 sftp 服务器 参数 优化 万能公式 Hash 字段 磁盘架构 流量 同城 双活 防火墙 黑客 Ftp 场景 信息化 智能运维 mini-redis INCR指令 RDB AOF MVCC 人工智能 推荐系统 数据备份 MySQL 9.3 业务 窗口 函数 缓存 高效统计 今天这篇文章就跟大家 网络架构 网络配置 INSERT COMPACT 向量库 Milvus Redisson 锁芯 Doris SeaTunnel 线上 库存 预扣 事务 Java 开发 核心架构 订阅机制 prometheus Alert 引擎 性能 Python B+Tree ID 字段 MongoDB 数据结构 IT运维 不宕机 Web PostGIS 崖山 新版本 数据脱敏 加密算法 数据类型 传统数据库 向量化 虚拟服务器 虚拟机 内存 ZODB 读写 分布式 集中式 OAuth2 Token filelock JOIN Canal 网络故障 容器 容器化 DBMS 管理系统 模型 Redis 8.0 QPS 高并发 微软 SQL Server AI功能 自动重启 Pottery Testcloud 云端自动化 发件箱模式 部署 聚簇索引 非聚簇索引 Entity 工具链 排行榜 排序 速度 服务器中毒 分库 分表 事务隔离 SpringAI 锁机制 分页方案 排版 启动故障 数据页 1 悲观锁 乐观锁 StarRocks 数据仓库 SSH Caffeine CP Web 接口 池化技术 连接池 单点故障 Go 数据库迁移 MCP 开放协议 sqlmock LRU 原子性 大表 业务场景 数据集成工具 Redka 频繁 Codis 分页 意向锁 记录锁 AIOPS 优化器 Order 网络 分布式架构 分布式锁​ dbt 数据转换工具 EasyExcel MySQL8 IT 仪表盘 日志 对象 单线程 字典 InfluxDB 行业 趋势 双引擎 RAG HelixDB Ansible 事务同步 国产数据库 Crash 代码 LLM UUIDv7 主键 线程安全 List 类型 订单 Pump UUID ID 主从复制 代理 Next-Key 编程 关系数据库 解锁 调优 ReadView 产业链 兼容性 语句 Valkey Valkey8.0 播客 恢复数据 MGR 分布式集群 数据字典 算法 失效 国产 用户 快照读 当前读 视图 GitHub Git 矢量存储 数据库类型 AI代理 查询规划 千万级 Weaviate RR 互联网 慢SQL优化 count(*) count(主键) 行数 分布式锁 Zookeeper 神经系统 表空间 并发控制 恢复机制 拦截器 动态代理 CAS 多线程 技巧 闪回