1. 什么是存储(上篇)

在这里插入图片描述

  • 狭义的存储定义:CD、DVD、ZIP,磁带,硬盘等存储介质
  • 广义的存储定义:
    • 存储硬件系统(磁盘阵列,控制器,磁盘柜,磁带库等)
    • 存储软件(备份软件,管理软件,快照,复制等增值软件)
    • 存储网络(HBA卡,光纤交换机,FC/SAS线缆等)
    • 存储解决方案(集中存储,归档,备份,容灾等)

2. 存储的发展历程

在这里插入图片描述

  • 存储架构的发展历程经历了传统存储、外挂存储、存储网络、分布式存储和云存储几个阶段。
  • 传统存储是由单硬盘组成,1956年IBM发明了世界上第一块机械硬盘,这个硬盘有50个24英寸盘片,容量只有5 MB。体积与两台冰箱差不多大,重量超过一吨。被用于当时的工业领域,且独立于主机以外。
  • 外挂存储即直连存储,最早的形态是JBOD,仅仅是将一些磁盘串联在一起,被称为JBOD(Just a Bunch Of Disks,磁盘簇),主机看到的就是一堆独立的硬盘,只增加了容量,无法提供安全保障。
  • SAN是典型的存储网络,主要使用FC网络传输数据,随后出现了IP存储区域网络。
  • 分布式存储采用通用服务器硬件构建存储资源池,更适合云计算的场景。在后续的课程中会进行介绍。

2.1 从附属于服务器到脱离成独立系统

在这里插入图片描述

2.2 从独立系统到网络共享存储

在这里插入图片描述

  • 通过存储引擎直接与服务器互联的方式可以解决之前的硬盘槽位有限、单盘存放数据、硬盘接口性能成为系统性能瓶颈等问题。
  • 但无法解决存储空间利用率低、各存储系统之间数据分散管理、各存储系统之间数据文件共享能力弱等问题,网络共享存储可以通过SAN和NAS两种服务模式解决这些痛点问题,

3. 硬盘的关键指标

  • **硬盘容量(Disk Capacity):**容量的单位为兆字节(MB)或千兆字节(GB)。影响硬盘容量的因素有单碟容量和碟片数量。
  • **转速(Rotational speed):**硬盘的转速指硬盘盘片每分钟转过的圈数,单位为RPM(Rotation Per Minute)。一般硬盘的转速都达到5400 RPM/7200 RPM。SCSI接口硬盘转速可达10000-15000 RPM。
  • **平均访问时间(Average Access Time)**=平均寻道时间+平均等待时间。
  • 数据传输率(Date Transfer Rate):硬盘的数据传输率是指硬盘读写数据的速度,单位为兆字节每秒(MB/s)。硬盘数据传输率包括内部传输率和外部传输率两个指标。
  • IOPS(Input/Output Per Second):即每秒的输入输出量(或读写次数),是衡量磁盘性能的主要指标之一。随机读写频繁的应用,如OLTP(Online Transaction Processing),IOPS是关键衡量指标。另一个重要指标是数据吞吐量(Throughput),指单位时间内可以成功传输的数据数量。对于大量顺序读写的应用,如电视台的视频编辑,视频点播等则更关注吞吐量指标。

在这里插入图片描述

硬盘类型 IOPS(4K随机写) 带宽(128k顺序读)
SATA 330 200 MB/s
SAS 10K 350 195 MB/s
SAS 15K 450 290 MB/s
SATA SSD 30-60 K 540 MB/s
SAS SSD 155 K 1000 MB/s
NVMe SSD 300 K 3500 MB/s

4. 机械硬盘

在这里插入图片描述

  • 类型

    • SATA
    • SAS
    • NL-SAS
      • 采用了SAS结构和SATA盘体
  • 磁盘组件

    • 磁盘接口
    • 磁头臂/磁头
      • 通过磁头对数据进行读写操作
    • 主轴
      • 带动盘片旋转
    • 盘片
      • 用于存放数据
  • 数据读写

    • 磁道:数据存放在磁道上

    • 扇区/块:对磁盘划分扇区,扇区大小为512B,以扇区为单位读写数据

    • LBA:Logical Block Number,为扇区分配的编号

    • 元数据:描述数据的数据,例如文件的大小、位置等等,元数据一般保存在硬盘的头部扇区

    • 文件系统:

      • 由操作系统为硬盘添加的软件,可以用来管理硬盘,通过建立元数据表可以获取扇区中有哪些数据,
    • 原理:

      • 过去是通过CHS(Cylinder、Heads、Sector)的方式读写数据

      • 现在为每一个扇区分配一个编号,叫做LBA

      • 系统通过文件系统读取文件系统中的元数据表的数据和LBA的映射关系,从而对文件进行读写操作

      • 硬盘本身是没有元数据的,有了文件系统之后,会生成元数据

    • 性能指标

      • 转速
        • 决定了盘片旋转时间,转速越快,时间越短,性能越好
      • 平均访问时间(平均寻道时间+平均旋转时间)
        • 寻道时间
          • 磁头从一个磁道移动到另一个磁盘的时间
        • 旋转时间
          • 磁头等待磁道旋转道指定扇区的时间
      • IOPS
        • IOPS:每秒钟读写的IO个数
        • IO:INPUT/OUTPUT,输入输出,即主机和IO设备进行信息的传递
        • IO类型
          • 顺序IO
            • 对连续的扇区进行IO,进行寻道的时间相对较少
          • 随机IO
            • 对不连续的扇区进行IO,要进行大量寻道
      • 硬盘容量
      • 数据传输率
        • 硬盘的数据传输率是指硬盘读写数据的速度,单位为兆字节每秒(MB/s)。硬盘数据传输率包括内部传输率和外部传输率两个指标

5. 固态硬盘

在这里插入图片描述

  • 闪存颗粒类型

    • SLC:单层式存储单元,每个cell存储1bit数据
    • MLC:多层式存储单元,每个cell存储2bit数据
    • TLC:三层式存储单元,每个cell存储3bit数据
  • 存储单元:cell

  • 执行顺序:SLC 》 MLC 》 TLC

    • 原理:

      ​ 在每个cell进行存储时,都会将cell先进行填满,当后续想要添加新的数据,会将原来cell中的数据抹除再将新数据存入。而这样的操作,就使得寿命问题也显而易见。

      ​ 当cell存储单元数据空间全部存储完毕,算作一次 P/E,通常来说,P/E 的次数会达到几千次以上,所以从存储方式来说 SSD 的寿命不长(但也没那么短,经常使用除外),不容易坏。

      假设,一块 1T SSD 最高可使用 3000 P/E,那么这块硬盘需要读写 3000t 才可能损坏。

6. 存储架构

控制器

  • 作用:处理IO请求
  • 组成
    • CPU
    • 内存
      • 作为cache,内存缓存数据之后,直接返回结果给主机
    • 存储接口
  • 类型:
    • 工作控制器
      • 谁接收到IO,谁就是工作控制器
    • 归属控制器
      • LUN所属的控制器,控制器会创建LUN提供给主机

硬盘框

  • 作用:提供硬盘

6.1 DAS

  • Direct Attached Storage,直连附加存储,即主机直接连接存储,中间不经过任何设备
  • 缺点
    • 扩展性差
    • 主机和存储距离不能太远

在这里插入图片描述

6.2 SAN

  • Storage Area Networks,存储区域网络,即主机和存储之间通过网络设备构建了存储网络
  • 类型
    • FC-SAN
      • 通过光纤以及光纤交换机构建存储网络
    • IP-SAN
      • 通过网线以及以太网交换机构建存储网络
  • 缺点:
    • 不利于共享

在这里插入图片描述

  • 存储区域网络(Storage Area Networks,SAN):一个存储网络是一个用在服务器和存储资源之间的、专用的、高性能的网络体系

    ​ SAN是独立于LAN的服务器后端存储专用网络。 SAN采用可扩展的网络拓扑结构连接服务器和存储设备,每个存储设备不隶属于任何一台服务器,所有的存储设备都可以在全部的网络服务器之间作为对等资源共享。

  • SAN主要利用Fibre Channel Protocol(光纤通道协议)通过FC交换机建立起与服务器和存储设备之间的直接连接,因此我们通常也称这种利用FC连接建立起来的SAN为FC-SAN

    ​ FC特别适合这项应用,原因在于一方面它可以传输大块数据,另一方面它能够实现较远距离传输。SAN主要应用在对于性能、冗余度和数据的可获得性都有很高要求的高端、企业级存储应用上。

  • 随着存储技术的发展,目前基于TCP/IP协议的IP-SAN也得到很广泛的应用

    ​ IP-SAN具备很好的扩展性、灵活的互通性,并能够突破传输距离的限制,具有明显的成本优势和管理维护容易等特点。

  • NAS和SAN最大的区别就在于NAS有文件操作和管理系统,而SAN却没有这样的系统功能,其功能仅仅停留在文件管理的下一层,即数据管理。

    SAN和NAS并不是相互冲突的,是可以共存于一个系统网络中的,但NAS通过一个公共的接口实现空间的管理和资源共享,SAN仅仅是为服务器存储数据提供一个专门的快速后方存储通道。

6.3 NAS

  • Network Attached Storage,网络附加存储,对外提供文件系统
  • 共享协议
    • NFS
    • CIFS
    • FTP
  • 缺点
    • 性能相比DAS或SAN差一些

在这里插入图片描述

​ NFS(Network File System)是Sun Microsystems在1984年创建的Internet标准协议。开发NFS是为了允许在局域网上的系统之间共享文件。
​ Linux NFS客户端支持三个版本的NFS协议:NFSv2 [RFC1094]、NFSv3 [RFC1813] 和NFSv4 [RFC3530]。其中NFSv2使用UDP协议,数据访问和传输能力有限,已经过时;

  • NFSv3版本在1995年发布,添加了TCP协议作为传输选项,被广泛使用;
  • NFSv4版本在2003年发布,已获得更好的性能和安全性。

NFS的工作机制:主要是采用远程过程调用RPC机制。

  • RPC提供了一组与机器、操作系统以及低层传送协议无关的存取远程文件的操作,允许远程客户端以与本地文件系统类似的方式,来通过网络进行访问。
  • NFS客户端向NFS服务器端发起RPC请求,服务器将请求传递给本地文件访问进程,进而读取服务器主机上的本地磁盘文件,返回给客户端。

CIFS(Common Internet File System)是一种网络文件系统协议,用于在网络上的机器之间提供对文件和打印机的共享访问。现在主要实现在Windows主机之间进行网络文件共享功能。

在这里插入图片描述

​ NAS可作为网络节点,直接接入网络中,理论上NAS可支持各种网络技术,支持多种网络拓扑,但是以太网是目前最普遍的一种网络连接方式,我们主要讨论是以以太网为网络基础的NAS环境。
NAS本身能够支持多种协议(如NFS、CIFS等),而且能够支持各种操作系统。通过任何一台工作站,采用IE或Netscape浏览器就可以对NAS设备进行直观方便的管理。

6.4 FC-SAN

在这里插入图片描述

​ - FC:Fiber Channel,光纤通道,是指一种用于在光纤或者铜缆上传输100 Mbit/s到4.25 Gbit/s信号的标准数据存储网络。

  • 用于建立存储区域网的高速传输技术。

    光纤通道能够用于支持ATM, IP等协议的一般网络,但它主要用途是从服务器上传输小型计算机系统接口(SCSI)流量到磁盘阵列。

6.5 IP-SAN

在这里插入图片描述

  • iSCSI:Internet Small Computer System Interface,Internet小型计算机系统接口,是一种基于因特网及SCSI-3协议下的存储技术,它将原来只用于本机的SCSI协议透过TCP/IP网络发送,使连接距离可作无限延伸。

6.6 存储架构总结对比

DAS NAS FC-SAN IP-SAN
传输类型 SCSI、FC、SAS IP FC IP
数据类型 块级 文件级 块级 块级
典型应用 任何 文件服务器 数据库应用 视频监控
优点 易于理解,兼容性好 易于安装,成本低 高扩展性,高性能,高可用性 高扩展性,成本低
缺点 难管理,扩展性有限,存储空间利用率不高 性能较低,对某些应用不适合 较昂贵,配置复杂,组网兼容性问题 性能较低

7. 缩略语

  • FC ———————————— Fiber Channel,光纤通道
  • FCIP ———————————— Fibre Channel over IP,基于IP的光纤通道
  • FCoE ———————————— Fibre Channel over Ethernet,以太网光纤通道
  • iFCP ———————————— Internet Fibre Channel Protocol,Internet光纤信道协议
  • iSCSI ———————————— Internet Small Computer System Interface,Internet小型计算机系统接口
  • IPFC —————————————— IP over Fiber Channel,在光纤通道上的IP
  • IOPS —————————————— Input/Output Per Second,每秒的输入输出量或读写次数
  • MTBF —————————————— Mean Time Between Failure,平均无故障工作时间
  • NAS —————————————— Network Attached Storage,网络附加存储
  • RAID —————————————— Redundant Array of Independent Disks,独立磁盘冗余阵列
  • SAN —————————————— Storage Area Networks,存储区域网络
  • SCSI —————————————— Small Computer System Interface,小型计算机系统接口

8. ❤️HCIP专栏——前文链接

9. 💕👉博客专栏

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐