数据中心入门学习(六):服务器之硬盘
目录
- 硬盘
- 1 概述
- 1.1 概念
- 1.2 按介质分
- 1.3 按接口类型分
- 1.4 关键指标
- 2 HDD、SSD与RAID
- 2.1 HDD
- 2.2 SSD
- 2.3 按业务类型分类
- 2.4 区别
- 2.5 RAID磁盘阵列
- 参考
本篇记录和梳理服务器方面的知识,目前写的还比较简略,后续会逐步补充。
硬盘
1 概述
1.1 概念
硬盘是计算机中用于长期存储数据的一种设备。
1.2 按介质分
-
机械硬盘 HDD Hard Disk Driver
使用旋转的磁盘和移动的读写磁头来存储和检索数据。
优点:成本低,适合大容量存储。
缺点:读写速度满,易受物理冲击损坏。
适用场景:大容量存储需求、成本敏感、对速度要求不高且对物理冲击较为容忍的场景,如态势电脑、备份存储和大型数据中心。 -
固态硬盘 SSD Solid State Disk
不含任何运动部件,采用闪存芯片作为存储介质。
优点:成本低,适合大容量存储;无机械运动,不容易发生数据损坏。
缺点:价格较高。
适用场景:高速读写、低功耗、轻便、无噪音、耐用性场景,如笔记本电脑、游戏主机、服务器。 -
混合硬盘 HDD Hybrid Hard Disk
结合了HDD的大容量和SSD的速度优势,在传统HDD的基础上加入了一定量的闪存作为缓存。
优点:提供接近SSD的性能,同时保持HDD的成本效益。
缺点:性能不如纯SSD稳定,价格介于两者之间。

1.3 按接口类型分
接口类型指的是硬盘与计算机或其他设备之间进行数据传输和通信时所使用的连接接口。
不同的接口类型代表不同的协议。
SATA接口(Serial ATA):串行接口,当前最常见接口。具有较高的数据传输速率和兼容性,用于连接内部硬盘或外部硬盘盒。
mSATA接口:迷你版SATA接口,用于超薄设备。
SAS接口(Serial Attached SCSI):用于连接企业级服务器和存储设备的接口,提供更高的数据传输速度和更可靠的连接。能够兼容SATA。
USB接口:一种通用的外部设备连接接口,用于连接外置硬盘、闪存盘、移动硬盘等。不同版本的USB具有不同的数据传输速率和功率输出。


图源:sata/sas/pcie/usb传输速率对比

PCI-E XX vX具体的速度如下:

图源:USB、PCI、SATA等各接口速度/带宽总结
注1:SATA最大传输速率为,6Gbps(约750MB/s),实际读写速度500MB/s左右。
注2:USB3.0和 3.1带宽并不是5Gb/s除以8得到的625MB/s,而是采用与SATA相同的10Bit传输模式(在USB2.0的基础上新增了一对纠错码),因此其全速只有500MB/s。
注3:传输速率是比特每秒bps(bits per second),数据传输量是字节每秒Bps(Bytes per second,B/s),1 byte = 8 bits。
以SATA接口传输速率为例,6 Gbps = 6000 Mbps,1Mbps = 1/8 MB/s,6000Mbps = 6000/8 = 750 MB/s。注4:SCSI Small Computer System Interface小型计算机接口,本质上是一套协议,SCSI协议定义了一套不同设备(磁盘、磁带、处理器、光设备、网络设备等)利用该框架进行信息交互的模型和必要指令集。本质上与传输介质无关,SCSI可以在多种介质上实现。
注5:PCI较老,正在逐步淘汰,也就是新主板基本不再设置PCI接口或者只保留1个。PCI-E接口则是根据插槽的长度,也就是触点的多少,可以分为X1、X4、X8,X16。

- Thunderbolt接口(雷电口)
一种高速的串行接口,支持同时传输数据和视频信号,用于连接高性能外置硬盘、显示器等,提供更快的数据传输速度和更多的扩展功能。
与Type-C相比多一个闪电标志,Type-C是USB接口,正式名称为USB-C(USB Type-C)

- M.2(Next Gengeration Form Factor,NGFF)
是Intel推出的一种替代mSATA的新的接口规范。
mSATA接口,全称迷你版SATA接口(mini-SATA)。是早期为了更适应于超级本这类超薄设备的使用环境,针对便携设备开发的mSATA接口应运而生。
M.2的接口有两种不同的规格,分别是“socket2”和”socket3”,支持的协议不同,一个是SATA总线,一个是PCIe总线。
Socket 2 支持 SATA 和 PCIe x2 通道,而 Socket 3 支持 PCIe x4 通道,后者性能更强。
SATA通道由于理论带宽的限制(6Gb/s),极限传输速度也只能到600MB/s;
但PCI-E通道就不一样了,带宽可以达到10Gb/s。

图源:SATA、mSATA、M.2、M.2(NVMe)、PCIE固态硬盘接口详解
1.4 关键指标
硬盘的关键指标影响硬盘的性能、可靠性和适用性。
- 容量(Capacity):存储数据总量,一般以GB(千兆字节)、TB(太字节)为单位。
- 转速(RAM,Revolution Per Minute):硬盘内部盘片每分钟旋转的次数,转速越高数据读取速度越快。
- 缓存(Cache):缓存是高速存储器,用于临时存储频繁访问的数据,提高读写速度,缓存越大,硬盘性能越好。
- 平均寻道时间(Average Seek Time):硬盘读写头移动到目标数据位置所需时间,通常以毫秒(ms)。
- 平均访问时间(Average Access Time):=平均寻道时间+平均等待时间
- 读写速度(Read/Write Speed):硬盘读取或写入数据的速度,读写速度越快,硬盘性能越高。以MB/s(每秒兆字节)为单位。
- 可靠性(Reliability)和MTBF(Mean Time Between Failures):可靠性是硬盘在正常使用情况下的故障率,MTBF表示平均故障间隔时间,通常以小时为单位。MTBF越高,硬盘越可靠。
- 功耗(Power Consumption):硬盘在工作和待机状态下消耗的电量,以瓦特W为单位。功耗越低,硬盘越节能。
- 数据传输率(Data Transfer Rate):硬盘在单位时间内传输数据的速度,以MB/s(每秒兆字节)或Gbps(每秒千兆比特)为单位。数据传输率越高,硬盘读写数据速度越快。
- IOPS(Input/Output Operations Per Second):每秒输入/输出操作次数的缩写, 指硬盘每秒能够处理的读写操作次数。IOPS越高,硬盘在处理小文件和随机读写任务时性能越好。
- 数据吞吐量(Thoughput):指单位时间内可以成功传输的数据数量。对于大量顺序读写的应用,会更加关注吞吐量指标。

2 HDD、SSD与RAID
2.1 HDD
机械硬盘里面由1张或几张可读写数据的储存盘体组成,盘体上有只读写枪,有点象老式光碟机,硬盘里面还有一保马达带动储存盘转动,从而能读取到不同部分的数据。
优点:生产成本低,容量大,便宜。
缺点:速度慢,不能受外界冲压、挤压或震动,需要轻拿轻放,携带不方便,噪音大。

HDD常见的接口主要是SATA接口,其接口是断开的,分为数据线接口和供电线接口。

HDD根据尺寸可以分为2.5英寸和3.5英寸两个版本。2.5英寸往往用于笔记本,2.5和3.5英寸都可以用于台式机中。

2.2 SSD
固态硬盘有点像U盘,只是电路板更复杂。没有像机械硬盘那样的马达及储存碟盘,而主要使用固态电子存储芯片阵列而制成的硬盘。
优点:速度快、稳定、寿命长、防震,工作噪音值为0分贝。
缺点:容量小,价格偏贵。

SSD由控制单元和存储单元组成。
控制单元包括SSD控制器、主机接口、DRAM等。
存储单元主要是Flash闪存颗粒。
SSD常见接口形态有多种,包括SATA接口(只有2.5英寸)、mSATA接口、M.2 SATA接口、M.2 nvme接口、PCIe接口等。

2.3 按业务类型分类
HDD主要分为企业级Performance类、企业级Capacity类、企业级云盘类、桌面级硬盘Desktop Disk类。
SSD分为读密集型(Read Intensive)、写密集型(Write Intensive)、均衡型(Main Stream)。
读密集型SSD:用于大量需要数据读取的工作负载,写入速率低,读取速度快。
写密集型SSD:用于处理大量数据写入的工作负载,高耐久性和稳定性。
均衡性:同时需要处理大量读取和写入操作的应用。
2.4 区别
SSD将数据存储在闪存中,HDD将数据存储在磁盘中。
容量方面,2.5英寸HDD的容量可以做到最高4TB,主流为1TB和2TB,而SSD即使迎来QLC,目前主流容量还集中在256GB和512GB。SSD是完全可以做大容量的,但由于价格问题,中等容量SSD更容易被接受。
SSD的读写速度远超HDD,硬盘速度和接口类型密不可分。
一般情况下,HDD的持续读写最高大约200MB/s左右,普通SATA SSD可实现500MB/s读写速度,NVMe SSD最高读取可超过3000MB/s。
价格上,1TB 2.5英寸HDD的价格大约在275元左右,而1TB的SSD大品牌在850-1300元之间,小品牌旗下价格在500-600元。
注1:SSD颗粒类型分为SLC、MLC、TLC、QLC颗粒(电子单元密度差异)。
SLC单层次存储单元、MLC双层存储单元、TLC三层存储单元、QLC四层存储单元。
SLC每个cell可以存放1bit/cell数据,MLC可存放2bit/cell,TLC可存放3bit/cell,QLC可存放4bit/cell。
成本上:SLC>MLC>TLC>QLC;
寿命上:SLC>MLC>TLC>QLC。
举个例子,我们将芯片可以看做一张画满格子的纸张,cell相当于纸张上的一个个的格子,数据看做是一个黄豆。也就是说,SLC方案每个格子中只能放入一颗黄豆,所以存储空间较小,MLC方案每个格子可以放入两颗黄豆,TCL方案每个格子可以放入三颗黄豆,而QLC方案每个格子可以存放四个黄豆,成本不变的情况下,存储空间较大。要知道这个纸张(芯片晶圆)价格也十分昂贵的,也就是说同样的晶圆如果做成SLC只有128G,做成MLC就有256G了,做成TLC的话变成512G,而做成QLC我们可以做成更大容量,而成本是相同的。
既然如此,全部采用QLC不好吗?答案是否。
每一个Cell单元存储数据越多,单位面积容量就越高,但是同时会导致不同电压状态越多,并且越难控制,所以采用QLC颗粒的固态,虽然容量更大价格更便宜,但是稳定性较差,并且P/E寿命较低,速度最慢。
注2:P/E周期(编程/擦除周期 Program/Erase Cycle)
编程 Program:将数据写入到闪存单元的过程。
擦除 Erase:清除闪存单元中已有数据的过程。在闪存技术中,不能简单覆盖原有数据,需要先进行擦除操作才能写入新技术。
2.5 RAID磁盘阵列
由于采用单块磁盘进行数据存储和读写的方式,由于寻址和读写的时间消耗,导致I/O性能非常低,存储容量首先,并且单块磁盘容易出现物理故障导致数据丢失,由此出现了RAID技术。
RAID(Redunant Array of Independent Disks,独立磁盘冗余阵列),是由多个独立的磁盘组成的大磁盘系统,实现比单块磁盘更好的存储性能和可靠性。
RAID常见可分为RAID0、RAID1、RAID5、RAID6、RAID10。
| RAID0 | RAID1 | RAID5 | RAID6 | RAID10 | RAID50 | |
|---|---|---|---|---|---|---|
| 介绍 | 将多块磁盘组合在一起,形成大容量存储。在写数据时将数据分为N份,以独立方式实现N块磁盘的读写,N份数据会同时并发写入磁盘 | 单位成本最高,其原理是将一份数据无差别的写两份到磁盘(工作磁盘与镜像磁盘),那么实际空间使用率50% | 兼顾存储性能、数据安全、存储成本,校验码信息分布在各个磁盘上,N块磁盘要写入的数据会并发写入N块磁盘中,数据校验码信息也会写入N块磁盘中,数据与对应校验码信息需要存储在不同磁盘,一旦某块损坏,可以用剩下数据与对应的奇偶校验码信息恢复损坏的数据 | 通过双重校验(除了每块磁盘有同级数据XOR校验区外,还有针对数据块的XOR校验区) | RAID1和RAID0的合体,基于RAID1模式将磁盘分两份,写入双份数据,基于RAID0技术将数据分为N份并发读写,保障数据的效率 | 将RAID5和RAID0进行两级组合,具有很高的容错性 |
| 缺点 | 不提供数据校验或冗余备份,一旦磁盘损坏,数据会直接丢失无法恢复 | 性能一般 | 至少需要三块磁盘组建RAID5,允许最多同时坏一块磁盘,两块磁盘同时损坏,数据无法恢复 | 数据冗余性好,读取效率高,写数据性能较差 | 有一半磁盘空间用于存储冗余数据,浪费严重 | |
| 适用场景 | 可靠性要求不高,读写性能要求高 | 数据可靠性非常强 | 使用最广泛 | 应用较少 | 应用较少 | 常用 |

图源:服务器RAID技术
- 热备盘
当RAID组中某个磁盘失效时,在不干扰当前RAID正常工作的情况下,用一个正常备用的磁盘顶替失效的磁盘。
全局热备盘:可以替换任意RAID组中的失效磁盘。
局部热备盘:只能替换本RAID组失效的磁盘。
-
重构
当磁盘数据损坏,热备盘会顶替上去,通过异或运算恢复数据,当换上新磁盘,数据会重新恢复,热备盘会继续充当热备盘。 -
预拷贝
利用检测系统检测到硬盘有可能失效但是还没有失效的时候就采取措施。
①检测系统发现RAID组中有磁盘疑似失效
②把疑似失效磁盘上的所有数据都拷贝到热备盘中
③提示用户把失效磁盘替换
④热备盘数据复制回新替换的磁盘中
参考
[1] 硬盘知识总结
[2] SATA、mSATA、M.2、M.2(NVMe)、PCIE固态硬盘接口详解
[3] 雷电口和Type-C有区别吗,为什么雷电口长得和Type-c一模一样?
[4] USB、PCI、SATA等各接口速度/带宽总结
[5] sata/sas/pcie/usb传输速率对比
[6] SSD与HDD有什么区别?一文看懂机械硬盘和固态硬盘
[7] QLC颗粒怎么样?固态硬盘QLC、SLC、MLC、TLC颗粒区别对比知识
[8] 了解CPU内部工作原理
[9] RAID磁盘阵列是什么(一看就懂)
[10] 服务器RAID技术




既然如此,全部采用QLC不好吗?答案是否。






