VMware Hands-on Labs - HOL-SDC-1608-SpringRelease


练习概述 - Virtual SAN 6.2 的新功能特性

练习指导


本练习涵盖 Virtual SAN 6.2中的新功能特性

本培训包含 5 个单元:

1. 全闪存 Virtual SAN 集群:Virtual SAN 集群包含两个或两个以上的物理主机,这些主机或采用磁盘和闪存设备的组合(混合配置)或采用全闪存设备(全闪存配置),它们为 Virtual SAN 分布式数据存储提供缓存和容量。Virtual SAN 使用重复数据删除和压缩来删除重复数据。这些技术减少了满足您的需求所需的存储总量。

2. 启用性能服务:在创建新的 Virtual SAN 集群时,将禁用性能服务。启用 Virtual SAN 性能服务以监控 Virtual SAN 集群、主机、磁盘和虚拟机的性能。性能服务启用后,Virtual SAN 将在数据存储中放置一个统计信息数据库对象,用于收集统计数据。统计信息数据库是驻留在集群 Virtual SAN 数据存储中的命名空间对象。在此任务中,您将启用性能服务。

3. 基于存储的策略管理:Virtual SAN 6.2 引入了已针对全闪存配置优化的空间利用率技术,以便在确保性能和可用性的同时最大程度地减少存储容量消耗。这些新功能特性包括 RAID5/6 纠删码功能,此功能可在确保以较低的总体拥有成本实现相同级别的可用性和性能的同时减少容量消耗。另一项基于存储策略的管理功能特性是对象校验和。这项功能有利于保证 Virtual SAN 集群中的数据完整性。在 Virtual SAN 的混合配置和全闪存配置中均提供校验和功能。

4. 稀疏虚拟机交换对象:利用这项新的功能特性,可大大节省在以精简形式部署虚拟机交换时所使用的容量空间。具体则取决于您部署的虚拟机的数量以及虚拟机交换空间的大小(实际上就是分配给虚拟机的未预留内存的大小)。

5. Virtual SAN 延伸集群:故障域、双节点 Virtual SAN 和 Virtual SAN 延伸集群等功能现已提供新的向导,以使整个设置过程变得简单明了。确保 Virtual SAN极其简单这一目标仍是 Virtual SAN 开发的核心。

练习负责人:John Browne、Ken Osborn、Tony Okwechime、Jitender Rohilla


 

激活提示或水印

 

首次开始练习时,您可能会注意到桌面上有一个水印,提示 Windows 尚未激活。

虚拟化的一个主要优势在于,可以在任意平台上移动和运行虚拟机。本动手练习利用了这一优势,我们可以跨多个数据中心运行练习。但是,这些数据中心的处理器可能不同,导致需要通过 Internet 进行 Microsoft 激活检查。

请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求。您正在使用的练习是一个独立的单元,没有对 Internet 的完全访问权限,而 Windows 验证激活正需要这一权限。如果没有对 Internet 的完全访问权限,此自动化过程会无法运行,并会显示此水印。

这一表面问题不会影响到您的练习。如果您有任何疑问或顾虑,请随时使用可用的支持选项:您可以通过 VMworld 动手练习部分中由专家主持的研讨会获得支持,也可以通过调查评论获得在线支持。我们一直在寻找各种方式改善您的动手练习体验。

 

 

有关键盘的说明

 

注意:如果您使用的不是美式键盘,请注意 和 @ 符号可能相反或位于不同的位置,具体取决于您的连接方式。

您可单击 ControlCenter VM 系统托盘上的键盘图标以弹出屏幕键盘。

 

第 1 单元 - 全闪存 Virtual SAN 6.2 集群

全闪存 Virtual SAN 集群


Virtual SAN 可配置为全闪存或混合式存储。在 Virtual SAN 的早期版本中,每个磁盘组通常只有一个固态磁盘 (SSD) 用于读写缓存。磁盘组中的所有其他磁盘用于容量,并且是常规的磁性 SAS 或 SATA 硬盘。这种搭配就是混合 Virtual SAN配置。

创建全闪存 Virtual SAN 意味着固态磁盘 (SSD) 既可用于缓存,也可用于容量层。

只使用 vSphere Web Client 就可以配置全闪存 Virtual SAN 数据存储。


 

登录 vSphere Web Client

 

要启动 vSphere Web Client,请使用桌面上的图标启动 Mozilla Firefox 

 

 

登录 vSphere Web Client

 

使用下列凭证或选中Use Windows session authentication(使用 Windows 会话身份验证)登录 vSphere Web Client

User name : administrator@corp.local
Password : VMware1!

单击Login(登录)

 

 

导航到Hosts and Clusters(主机和集群)

 

vSphere Web Client的主页上,从Inventories(清单)窗格中选择Hosts and Clusters(主机和集群)

 

 

查看可用存储设备

 

1. 从Hosts and Clusters(主机和集群)视图中,选择名为 esx-01a.corp.local的 ESXi 主机。

2. 选择Manage(管理)

3. 选择Storage(存储)

4. 选择Storage Devices(存储设备)

上面突出显示的磁盘是固态磁盘。有 2个大小为 5 GB 的磁盘(将用于缓存层),以及另外 4个大小为 10 GB的磁盘(将用于容量层)。

我们将使用这些磁盘组成 Virtual SAN 集群。

检查另外三台主机(esx-02a.corp.local、esx-03a.corp.local、esx-04a.corp.local),确认其是否也具有 2 个大小为 5 GB 的固态磁盘和 4 个大小为 10 GB 的固态磁盘。

现在该组成 Virtual SAN 集群了。

 

 

 

在集群中启用 Virtual SAN

 

1. 选择名为Cluster Site A(集群站点 A)的集群

2. 选择Manage(管理)

3. 选择Settings(设置)

4. 选择Virtual SAN

5. 选择General(常规)

6. 单击Configure...(配置...)按钮

 

 

打开 Virtual SAN

 

这里我们将介绍新的Configure Virtual SAN(配置 Virtual SAN)向导。

通过该向导,您可以决定是选择Manual(手动)还是Automatic(自动)磁盘申领,是否在为Fault Domains(故障域)和Stretched Cluster(延伸集群)创建磁盘组和其他选项时启用Deduplication and Compression(重复数据删除和压缩)。

在我们的环境中,已经创建了一个 Virtual SAN 集群,我们将启用它。我们还将查看已并入 Virtual SAN 配置向导中的其他检查项。

确认Add disks to storage(将磁盘添加到存储)已设置为Manual(手动)

确认Deduplication and Compression(重复数据删除和压缩)的状态为Enabled(已启用)

确认Fault Domains and Stretched Cluster(故障域和延伸集群)已设置为Do Not configure(不配置)

要简要了解这些功能特性,请单击功能特性旁边的信息 (i)

单击Next(下一步)

 

 

确认网络验证

 

已实施检查以确认是否配置了 VMkernel适配器以及Virtual SAN network service(Virtual SAN 网络服务)的状态是否为Enabled(已启用)。

请注意,名为 esx-04a.corp.local的 ESXi 主机报告:不存在已启用VSAN traffic(Virtual SAN 流量)的VMkernel adapters(VMkernel 适配器)。

下面我们通过在这些 VMkernel 适配器上启用 Virtual SAN 流量来纠正这个问题。

单击Cancel(取消)

 

 

启用 VMkernel Virtual SAN 流量服务

 

1. 从Hosts and Clusters(主机和集群)视图中,选择名为 esx-04a.corp.local的 ESXi 主机。

2. 选择Manage(管理)

3. 选择Networking(网络连接)

4. 选择VMkernel adapters(VMkernel 适配器)

在这里您会看到,我们有 2 个 VMkernel 适配器,分别名为 VSAN-PG-vmk3VSAN-PG-vmk4。我们将在这 2 个 VMkernel 适配器上启用 Virtual SAN 流量服务。

选择 VSAN-PG-vmk3并单击Pencil(铅笔)图标以编辑 VMkernel 适配器。

 

 

启用 VMkernel Virtual SAN 流量服务

 

在Port Properties(端口属性)中,选择Virtual SAN traffic(Virtual SAN 流量)选项。

单击OK(确定)

 

 

启用 VMkernel Virtual SAN 流量服务

 

编辑 VSAN-PG-vmk4的Properties(属性)并启用Virtual SAN traffic(Virtual SAN 流量)。

单击OK(确定)

 

 

启用 VMkernel Virtual SAN 流量服务

 

在 VMkernel 端口上启用 Virtual SAN 流量后,确认 Virtual SAN 流量是否已启用。

此处显示 2 个 VMkernel 端口,并且 Virtual SAN 流量已启用。

您可能需要滚动到屏幕右侧才能看到Virtual SAN traffic(Virtual SAN 流量)列。

这项任务至此就完成了,下面我们来创建 Virtual SAN 集群。

 

 

在集群中启用 Virtual SAN

 

1. 选择名为Cluster Site A(集群站点 A)的集群

2. 选择Manage(管理)

3. 选择Settings(设置)

4. 选择General(常规)

5. 单击Configure...(配置...)按钮

 

 

打开 Virtual SAN

 

在我们的环境中,已经创建了一个 Virtual SAN 集群,我们将启用它。我们还将查看已并入 Virtual SAN 配置向导中的其他检查项。

确认Add disks to storage(将磁盘添加到存储)已设置为Manual(手动)

确认Deduplication and Compression(重复数据删除和压缩)的状态为Enabled(已启用)

确认Fault Domains and Stretched Cluster(故障域和延伸集群)已设置为Do Not configure(不配置)

要简要了解这些功能特性,请单击功能特性旁边的信息 (i)

单击Next(下一步)

 

 

确认网络验证

 

已实施检查以确认是否配置了 VMkernel适配器以及Virtual SAN network service(Virtual SAN 网络服务)的状态是否为Enabled(已启用)。

请注意,名为 esx-04a.corp.local的 ESXi 主机此时报告:存在已启用Virtual SAN traffic(Virtual SAN 流量)的 VMkernel 适配器

单击Next(下一步)

 

 

按磁盘型号/大小申领磁盘

 

如前所述,我们将打开 Virtual SAN。我们已经创建一个了 Virtual SAN 集群,在这里我们会向这个 Virtual SAN 集群添加更多的磁盘组。

在 Virtual SAN 集群中选择应为缓存容量申领的磁盘。磁盘是按型号和大小主机分组的。

已根据您的环境中可用的设备提供建议的选择。您可展开磁盘列表来选择单个磁盘。

对于每台主机,申领的容量磁盘的数量必须大于或等于缓存磁盘的数量。

从Group by(分组依据)下拉列表中,选择Host(主机)

 

 

按主机申领磁盘

 

在Group by: Host(分组依据:主机)视图中,我们会看到名为 esx-01a.corp.local、esx-02a.corp.localesx-03a.corp.local的 ESXi 主机中已申领所有磁盘。

对于名为 esx-04a.corp.local的 ESXi 主机,我们会看到将创建 2 个磁盘组,每个磁盘组均包含 1 个固态磁盘2 个容量磁盘

单击Next(下一步)

 

 

 

即将完成

 

查看并确认您的选择。

在这里可以看到,Deduplication and Compression(重复数据删除和压缩)的状态为Enabled(已启用)。

Virtual SAN 总容量为 160 GB,其中 120 GB已在磁盘组申领,剩余的 40 GB将在我们在名为 esx-04a.corp.local的 ESXi 主机上创建其他磁盘组时创建

我们不会配置Fault Domains(故障域)和Stretched Cluster(延伸集群)

单击Finish(完成)

 

 

等待集群重新配置完成

 

可单击 vSphere Web Client 左下角的My Tasks(我的任务)来监视任务。

等待Reconfigure Virtual SAN configuration(重新配置 Virtual SAN 配置)任务完成。

 

 

确认初始 Virtual SAN 集群配置

 

Virtual SAN 数据存储创建完毕后,General(常规)屏幕将有所更新。

可以看到,Virtual SAN 的状态现在为Turned On(已打开)。Deduplication and compression(重复数据删除和压缩)的状态为Enabled(已启用),磁盘组中所有磁盘的状态为Disk format version 3.0(磁盘格式 3.0 版)。

 

 

检查新磁盘组

 

1. 选择名为Cluster Site A(集群站点 A)的集群

2. 选择Manage(管理)

3. 选择Settings(设置)

4. 选择Disk Management(磁盘管理)

将在每台独立的 ESXi 主机上创建 Virtual SAN 磁盘组

选择ESXi Host(ESXi 主机)或Disk Group(磁盘组)将显示其包含的磁盘和每个磁盘扮演的角色(缓存容量)。

 

 

 

检查新磁盘

 

可单击此屏幕右上方的Disks(磁盘)链接更改为磁盘视图

 

 

验证 Virtual SAN 运行状况

 

在 Virtual SAN 集群配置过程中,将触发大量 Virtual SAN 运行状况警报。

可忽略和/或确认这些警报并将其重置为绿色。它们不会影响练习的剩余内容。

对于硬件兼容性测试,由于我们是在虚拟化环境中运行,这些警报将始终显示为警告

如提示网络分区失败,请等待片刻,然后重新运行测试。

单击Retest(重新测试)按钮再次运行 Virtual SAN 运行状况检查。

 

 

验证 Virtual SAN 运行状况

 

展开Hardware Compatibility(硬件兼容性)。

可以看到,我们已选中VMware Hardware Compatibility List(VMware 硬件兼容列表)中的Hardware ( Controller Driver, Controller Release, and SCSI Controller)(硬件(控制器驱动程序、控制器版本和 SCSI 控制器))。

在我们的练习环境中,由于我们是在虚拟化环境中运行,这些警报将始终显示为警告。

 

 

 

验证 Virtual SAN 运行状况

 

扩展性能服务。

由于我们尚未启用性能服务,因此性能服务将显示为警告。我们将后面的任务中启用性能服务。

 

 

Virtual SAN 硬件兼容列表数据库

 

选择集群Cluster Site A(集群站点 A)-Manage(管理)-Settings(设置)-Health and Performance(运行状况和性能)

Virtual SAN 硬件兼容列表数据库可通过Health and Performance(运行状况和性能)屏幕更新。

可从文件上传更新后的硬件兼容列表数据库,也可从在线版本更新。

注意:练习环境中可能没有 Internet 连接,因此无法更新硬件兼容列表数据库。

 

 

检查新的 Virtual SAN 数据存储

 

1. 切换到Datastores(数据存储)视图。

2. 选择新的 Virtual SAN 数据存储 (vsanDatastore)

3. 查看Summary(摘要)选项卡中的基本信息。

我们现在已经成功创建一个全闪存 Virtual SAN 集群

 

 

通过命令行获取 Virtual SAN 信息 (esxcli vsan)

 

打开桌面上的 PuTTY图标。

选择名为 esx-01a.corp.local的会话,您将自动登录到 ESXi 主机。

root密码为 VMware1!(供参考)

 

 

 

获取 Virtual SAN 集群信息

 

vSphere CLI 命令集允许您从所选的管理服务器对 vSphere 系统运行常见系统管理命令。

esxcli vsan是 Virtual SAN 管理命令的命名空间。

如需获取帮助,请运行esxcli vsan --help

[root@esx-01a:~] esxcli vsan
Usage: esxcli vsan {cmd} [cmd options]
Available Namespaces:
  cluster               Commands for VSAN host cluster configuration
  datastore             Commands for VSAN datastore configuration
  network               Commands for VSAN host network configuration
  storage               Commands for VSAN physical storage configuration
  faultdomain           Commands for VSAN fault domain configuration
  maintenancemode       Commands for VSAN maintenance mode operation
  policy                Commands for VSAN storage policy configuration
  trace                 Commands for VSAN trace configuration

要获取有关此主机加入到的 Virtual SAN 集群的信息,请运行以下命令:

esxcli vsan cluster get

在单独的 ESXi 主机上运行命令 esxcli vsan cluster get可获知主机是否加入 Virtual SAN 集群。

上面显示的是在运行状况良好的 4 节点 Virtual SAN 集群中的一台 ESXi 主机上运行此命令。

可从输出中检索本地节点 UUID。您还可看到子集群成员 UUID(共四个)。

 

 

获取 Virtual SAN 网络信息

 

为了加入 Virtual SAN 集群,并组成完全连接的 ESXi 主机的单个分区,Virtual SAN 集群中的每一个 ESXi 主机都必须拥有一个针对 Virtual SAN 流量而配置的 vmknic(VMkernel 网卡或 VMkernel 适配器)。

注意:即使某个隶属 Virtual SAN 集群的 ESXi 主机没有提供存储,它也必须有一个针对 Virtual SAN 流量而配置的 VMkernel 网卡。

查询 ESXi 主机级别的 Virtual SAN 网络配置:

esxcli vsan network list

在我们的输出中,VMkernel 网卡 vmk3vmk4用于 Virtual SAN 流量。

我们还可从该输出中看到多播配置。

 

 

 

获取 Virtual SAN 存储信息

 

查询 ESXi 主机中的本地磁盘信息:

 esxcli vsan storage list

我们可使用 esxcli vsan storage list检查磁盘是否为 SSD磁盘,磁盘是否通过 CMMDS(集群监控、成员资格和目录服务)申领。我们还可查看磁盘格式版本

还可检查是否已启用Deduplication and Compression(重复数据删除和压缩)。

最后,检查磁盘加入的是 Virtual SAN 磁盘组中的缓存层还是容量层

 

 

获取 Virtual SAN 策略信息

 

查询 Virtual SAN 集群中的默认策略:

esxcli vsan policy getdefault

默认情况下,将应用容许的故障数为 N+1策略,以便即使在用户忘记创建和设置策略对象的情况下也能恢复。建议不要更改默认策略。

 

 

第 1 单元 - 小结

在本单元中,我们演练了启用全闪存 Virtual SAN 集群的各个步骤,演示了新的 Virtual SAN 配置向导和其他 Virtual SAN 流量 VMkernel 检查,向 Virtual SAN 集群额外添加了一个磁盘组来增加 Virtual SAN 数据存储的容量,初步了解了 Virtual SAN 运行状况检查,最后,我们了解了一些用于查询 Virtual SAN 集群配置相关信息的命令行 (esxcli) 工具。

 

第 2 单元 - 启用性能服务

启用性能服务


当您创建新的 Virtual SAN 集群时,将禁用性能服务。启用 Virtual SAN 性能服务以监控 Virtual SAN 集群、主机、磁盘和虚拟机的性能。

性能服务启用后,Virtual SAN 将在数据存储中放置一个统计信息数据库对象,用于收集统计数据。统计信息数据库是驻留在集群 Virtual SAN 数据存储中的命名空间对象。

在启用 Virtual SAN 性能服务之前,请确保已正确配置集群且不存在尚未处理的运行状况问题。

随着 Virtual SAN 6.2 性能服务的发布,VMware 通过 vSphere Web Client 提供 Virtual SAN 基本性能报告。目标是使此功能特性始终开启、与 vSphere Web Client UI 完全集成、易于访问和使用以及保留 Virtual SAN 性能的历史数据。

Virtual SAN 命名空间对象用于存储统计信息数据库 (stats DB)。此对象是一个常规对象(统计信息对象)并具有与之关联的策略。当管理员启用性能服务时将选择此策略。如果未选择任何特定策略,将使用默认的 Virtual SAN 数据存储策略。默认策略的 NumberOfFailuresToTolerate设置为 1,这表示如果 Virtual SAN 集群出现故障,性能服务将不受影响并且将继续运行。因此,性能服务无单点故障。

在 Virtual SAN 集群中的每台 ESXi 主机上,性能服务将运行守护进程来收集性能指标。每隔 5 分钟计算一次指标平均值。统计信息收集一直处于开启状态。这些统计信息存储在统计信息对象的统计信息数据库中。这表示统计信息基础架构的任何方面(如设置、收集、存储和查询)都不需要 vCenter Server。

 


 

启用性能服务

 

当您创建新的 Virtual SAN 集群时,将禁用性能服务。

要启用性能服务,必须在集群上配置 Virtual SAN。

选择名为Cluster Site A(集群站点 A)的集群

选择Manage(管理)

选择Settings(设置)

选择Health and Performance(运行状况和性能)

单击Edit(编辑)

 

 

 

启用性能服务

 

选中Turn On Virtual SAN performance service(启用 Virtual SAN 性能服务)复选框。

统计信息数据库对象选择存储策略

选择Virtual SAN Default Policy(Virtual SAN 默认策略)

默认情况下将选择Virtual SAN Default Storage Policy(Virtual SAN 默认存储策略)。其中包括NumberOfFailuresToTolerate set to 1(容许的故障数设置为 1)的策略属性,该属性可保证性能服务的高可用性。

单击OK(确定)

 

 

启用性能服务

 

检查Recent Tasks(近期任务)窗格。

将执行Enable Virtual SAN performance service(启用 Virtual SAN 性能服务)任务。

 

 

启用性能服务

 

选择Cluster Site A(集群站点 A)-Manage(管理)-Settings(设置)-Health and Performance(运行状况和性能)

在性能服务启用后检查其状态时,将看到与以下内容类似的状态。

还可以从该处Turn off(禁用)或Edit the Storage policy(编辑存储策略)(由性能服务使用)。

 

 

启用性能服务

 

选择Cluster Site A(集群站点 A)-Monitor(监控)-Virtual SAN-Health(运行状况)

启用性能服务后,可以从这里看到性能服务运行状况检查现已通过。

有关更多信息,请展开性能服务,选择各项性能服务检查。

 

 

监控 Virtual SAN 性能 - 集群

 

选择Cluster Site A(集群站点 A)-Monitor(监控)-Performance(性能)-Virtual SAN - Virtual Machine Consumption(Virtual SAN - 虚拟机使用情况)

您可使用 Virtual SAN 性能服务监控 Virtual SAN 环境的性能并调查潜在的问题。

性能服务将收集并分析性能统计信息,并且以图形形式显示数据,以便您确定问题的根本原因。您可查看集群的性能图以及 Virtual SAN 集群中每个主机、磁盘组和磁盘的性能图。您还可查看虚拟机和虚拟磁盘的性能图。

Virtual SAN 性能服务显示的性能图可帮助您监控工作负载以及确定问题的根本原因。

启用性能服务后,集群的Summary(摘要)将显示 Virtual SAN 性能统计信息的概述,包括 Virtual SAN 容量、吞吐量、IOPS 和延迟。在集群级别,您可查看虚拟机使用情况和 Virtual SAN 后端的详细统计信息图。

目前还没有用图表形式表示的性能数据,不过,我们可以在后面的单元中回过头来查看这些性能图。

 

 

监控 Virtual SAN 性能 - 集群

 

选择Cluster Site A(集群站点 A)-Monitor(监控)-Performance(性能)-Virtual SAN - Backend(Virtual SAN - 后端)

Virtual SAN 显示主机后端操作的性能图,包括 IOPS、吞吐量、延迟、拥塞和待处理 IO。

我们尚没有要显示的数据。在 Virtual SAN 集群中的每台 ESXi 主机上,性能服务将运行守护进程来收集性能指标。

每隔 5 分钟计算一次指标平均值。

 

 

 

监控 Virtual SAN 性能 - 主机

 

存在主机级别的类似的性能图。

选择esx-01a.corp.localMonitor(监控)-Performance(性能)

此处可用的图为:

 

 

第 2 单元 - 小结

在本单元中,我们介绍了如何启用 Virtual SAN 性能服务(默认情况下,此服务处于禁用状态)。新的 Virtual SAN 性能服务将在 Virtual SAN 数据存储中具有其自己的独立数据库并且可通过虚拟机存储策略进行保护。在 vCenter Server 清单中选择集群、主机或虚拟机时,可在Performance(性能)Monitor(监控)视图下找到性能服务的所有图表。

现在可通过 vSphere Web Client 轻松监控 Virtual SAN。

 

第 3 单元 - 基于存储的策略管理

基于存储的策略管理


当您使用 Virtual SAN 时,可以通过策略的形式来定义虚拟机存储要求(如性能和可用性)。Virtual SAN 可确保对于部署到 Virtual SAN 数据存储的虚拟机至少分配一个虚拟机存储策略。

分配存储策略之后,系统会在创建虚拟机时将这些存储策略要求向下推送到 Virtual SAN 层。虚拟设备将跨 Virtual SAN 数据存储分布,以满足性能和可用性要求。

在了解虚拟机的存储要求后,可参照数据存储告知的功能来创建存储策略。

您可以创建多个策略以捕获不同类型或类别的要求。


 

基于存储的策略管理

 

Virtual SAN 6.2添加了大量新的存储策略,即Disable object checksum(禁用对象校验和)、Failure tolerance method(容错方法)和IOPs limit for object(对象的 IOP 限制)。

我们在这里将简短描述每种存储策略。

每个对象的磁盘条带数 -用于对虚拟机的每个副本进行条带化的容量设备的数目。此值大于 1 会获得更好的性能,但也会占用更多的系统资源。

闪存读缓存预留 - 作为虚拟机对象的读缓存预留的闪存容量。指定为虚拟机磁盘 (vmdk) 对象的逻辑大小的百分比。其他对象不能使用预留的闪存容量。未预留的闪存在所有对象之间平等共享。此选项应仅用于解决特定的性能问题。

容许的故障数 - 定义虚拟机对象可容许的主机和设备故障的数量。要容许 n 个故障,则要创建 n+1 个虚拟机对象副本,并且需要 2*n+1 台主机提供存储。

强制调配 -如果此选项设置为Yes(是),则即使数据存储不符合存储策略中指定策略的要求,仍将调配对象。在引导场景中或故障期间无法使用标准调配时,可使用此参数。

对象空间预留 - 在部署虚拟机时应预留或应厚置备的虚拟机磁盘 (vmdk) 对象的逻辑大小的百分比。

禁用对象校验和 - 如果此选项设置为No(否),则对象将计算校验和信息以确保其数据的完整性。如果此选项设置为Yes(是),则对象将不会计算校验和信息。校验和通过确认每个文件副本是否与源文件完全相同来确保数据的完整性。如果检测到校验和不匹配,则 Virtual SAN 将用正确数据覆盖错误数据来修复数据。

容错方法 - 指定数据复制方法是针对性能还是容量进行优化。如果您选择性能,则 Virtual SAN 将使用更多磁盘空间来放置对象的组件,但可提供更好的对象访问能。如果选择容量,Virtual SAN 将使用较少的磁盘空间,但会降低性能。

对象的 IOPS 限制 - 定义磁盘的 IOPS 限制。IOPS 的计算结果为使用加权大小的 IO 操作的数量。如果系统使用默认基本大小 32 KB,则 64 KB IO 表示 2 个 IO 操作。计算 IOPS 时,读取操作和写入操作将被视为等效,而且不会考虑缓存命中率和顺序。如果磁盘的 IOPS 超出限制,则 IO 操作将受限。如果对象的 IOPS 限制设置为 0,则不会强制实施 IOPS 限制。

 

 

基于存储的策略管理 - Raid 5/6(纠删码)

 

 

要允许管理员跟踪出现存储使用的位置,Virtual SAN 6.2 中引入了全新的容量视图。

选择Cluster Site A(集群站点 A)-Monitor(监控)-Virtual SAN-Capacity(容量)

如果我们先关注Capacity Overview(容量概述),可看到 Virtual SAN 数据存储的完整大小。此大小约为 160 GB。我们还可看到Deduplication and compression(删除重复数据和压缩)开销。

Virtual SAN 数据存储上的Used  Total(已使用  总计)空间量意指物理写入的空间量(与逻辑大小相对)。这是虚拟磁盘、虚拟机主页对象、交换对象、性能管理对象和其他可能驻留在数据存储上的项的组合。例如,其他项可能是 ISO 映像、未注册的虚拟机或模板。

通过右上方的Deduplication and Compression(重复数据删除和压缩)概述,管理员可获知实现的空间节省重复数据删除比率,以及管理员决定要禁用 Virtual SAN 上的空间利用功能并重新扩充任何已进行重复数据删除和压缩的对象时可能需要的空间量。

部署的类似虚拟机越多,空间节省比率越大。

这告知我们,没有重复数据删除和压缩,可能需要约 9.5 GB 容量才能部署当前工作负载。使用重复数据删除和压缩,我们只需使用约 4.25 GB 容量即可做到这一点。

 

 

基于存储的策略管理 - Raid 5/6(纠删码)

 

选择Home(主页)-Policies and Profiles(策略和配置文件)-VM Storage Policies(虚拟机存储策略)

选择Create a New VM Storage policy(创建新的虚拟机存储策略)

 

 

基于存储的策略管理 - Raid 5/6(纠删码)

 

使用以下信息创建新的虚拟机存储策略

Name : FTT=1-Raid5

单击Next(下一步)

 

 

基于存储的策略管理 - Raid 5/6(纠删码)

 

在Rule-Sets(规则集)信息页上,单击Next(下一步)

使用以下信息创建新的规则集

Rules based on data services : VSAN
Rule 1 : Number of failures to tolerate = 1
Rule 2 : Failure tolerance method = Raid-5/6 (Erasure Coding)-Capacity

在您单击Next(下一步)之前,请检查以下内容:

更改Failure tolerance method = RAID-1 (Mirroring) - Performance(容错方法 = RAID-1 [镜像] - 性能)

查看屏幕右侧的Storage Consumption Model(存储使用模式)。请注意,使用的存储空间将为 200 GB(基于 100 GB的虚拟磁盘)。现在更改Failure tolerance method = Raid-5/6 (Erasure Coding)-Capacity(容错方法 = Raid-5/6 [纠删码] - 容量),您会看到存储空间将减少至 133 GB。

单击Next(下一步)

 

 

基于存储的策略管理

 

存储兼容性将由虚拟机存储策略决定。

在这里,我们可以看到,Virtual SAN 数据存储符合我们即将创建的虚拟机存储策略

单击Next(下一步)

 

 

基于存储的策略管理 - Raid 5/6(纠删码)

 

查看虚拟机存储策略设置

单击Finish(完成)

 

 

 

基于存储的策略管理 - Raid 5/6(纠删码)

 

选择FTT=1-Raid5-Manage(管理)-Rule-Set-1:VSAN

我们在此处可以看到组成我们的虚拟机存储策略的规则。

 

 

Virtual SAN 容量 - Raid 5/6(纠删码)

 

选择Cluster Site A(集群站点 A)-Monitor(监控)-Virtual SAN-Capacity(容量)

在此处记下容量指数。

 

 

将虚拟机克隆到 Virtual SAN 数据存储 - Raid 5/6(纠删码)

 

我们会将名为 linux-micro-01a的虚拟机(当前驻留在网络文件系统数据存储上)克隆到 Virtual SAN 数据存储并应用我们刚创建的虚拟机存储策略 (FTT=1-Raid5)。

右键单击名为 linux-micro-01a的虚拟机并选择Clone(克隆)-Clone to Virtual Machine(克隆到虚拟机)

 

 

将虚拟机克隆到 Virtual SAN 数据存储 - Raid 5/6(纠删码)

 

为虚拟机指定名称 FTT=1-Raid5

单击Next(下一步)

 

 

将虚拟机克隆到 Virtual SAN 数据存储 - Raid 5/6(纠删码)

 

选择名为集群站点 A的计算资源

单击Next(下一步)

 

 

将虚拟机克隆到 Virtual SAN 数据存储 - Raid 5/6(纠删码)

 

对于虚拟机存储策略,选择 FTT=1-Raid5

将显示最终的可兼容数据存储列表,在我们的示例中,此列表为 vsanDatastore

在屏幕的下部,我们可看到 Virtual SAN 存储使用为 1.33 GB 磁盘空间和 0.00 B 预留闪存空间。

由于我们具有包含 1 GB磁盘和虚拟机存储策略 Raid 5的虚拟机,Virtual SAN 磁盘使用将为 1.33 GB磁盘。

单击Next(下一步)

单击Select clone(选择克隆)选项上的Next(下一步)

 

 

将虚拟机克隆到 Virtual SAN 数据存储 - Raid 5/6(纠删码)

 

单击Finish(完成)

等待克隆操作完成。

检查Recent Tasks(近期任务)中是否有Clone virtual machine(克隆虚拟机)任务的状态更新。

 

 

将虚拟机克隆到 Virtual SAN 数据存储 - Raid 5/6(纠删码)

 

在克隆操作完成后,选择名为 FTT=1-Raid5的虚拟机

选择Summary(摘要)-VM Storage Policies(虚拟机存储策略)

我们在此处可看到此虚拟机的虚拟机存储策略设置为 FTT=1-Raid5且策略是兼容的

选择Summary(摘要)-Related Objects(相关对象)

此虚拟机现在驻留在 vsanDatastore

 

 

磁盘策略 - FTT=1 Raid 5

 

选择虚拟机FTT=1-Raid5-Monitor(监控)-Policies(策略)-Hard Disk 1(硬盘 1)-Physical Disk Placement(物理磁盘布局)

请注意,使用此虚拟机存储策略,我们具有由 4 个组件组成的 Raid 5磁盘布局。

集群中每台主机上均驻留了 1 个组件。

 

 

Virtual SAN 容量 - Raid 5/6(纠删码)

 

 

要允许管理员跟踪出现存储使用的位置,Virtual SAN 6.2 中引入了全新的容量视图。

选择Cluster Site A(集群站点 A)-Monitor(监控)-Virtual SAN-Capacity(容量)

如果我们先关注Capacity Overview(容量概述),可看到 Virtual SAN 数据存储的完整大小。此大小约为 160 GB。我们还可看到Deduplication and compression(删除重复数据和压缩)开销。

Virtual SAN 数据存储上的Used  Total(已使用  总计)空间量意指物理写入的空间量(与逻辑大小相对)。这是虚拟磁盘、虚拟机主页对象、交换对象、性能管理对象和其他可能驻留在数据存储上的项的组合。例如,其他项可能是 ISO 映像、未注册的虚拟机或模板。

通过右上方的Deduplication and Compression(重复数据删除和压缩)概述,管理员可获知实现的空间节省重复数据删除比率,以及管理员决定要禁用 Virtual SAN 上的空间利用功能并重新扩充任何已进行重复数据消除和压缩的对象时可能需要的空间量。

部署的类似虚拟机越多,空间节省比率越大。

这告知我们,没有重复数据消除和压缩,可能需要约 9.5 GB 容量才能部署当前工作负载。使用重复数据消除和压缩,我们只需使用约 4.25 GB 容量即可做到这一点。

 

 

Virtual SAN 容量 - Raid 5/6(纠删码)

 

选择Cluster Site A(集群站点 A)-Monitor(监控)-Virtual SAN-Capacity(容量)

在容量屏幕的底部,我们将看到对象的细分。

按对象类型分组:

性能管理对象:启用性能服务时为存储性能指标创建的对象所使用的容量

文件系统开销:容量驱动器上的磁盘文件系统 (VirstoFS) 占用的任何开销,它与重复数据删除、压缩或校验和开销无关。启用重复数据删除和压缩时,文件系统开销将增加 10 倍以反映 Virtual SAN 数据存储的逻辑大小已增大。

重复数据删除和压缩开销:获得重复数据删除和压缩的好处时产生的开销。这包括关联的映射表、哈希表以及重复数据删除和压缩所需的其他机制。

校验和开销:存储所有校验和所需的开销。启用重复数据删除和压缩后,校验和开销将增加 10 倍,以反映 Virtual SAN 数据存储逻辑大小的增长。

在 Virtual SAN 数据存储上部署虚拟机和模板时,将显示更多对象:

虚拟磁盘:驻留在 Virtual SAN 数据存储上的虚拟机磁盘 (VMDK) 对象所使用的容量

虚拟机主页对象:驻留在 Virtual SAN 数据存储上的虚拟机主页命名空间对象(包含虚拟机文件)所使用的容量

交换对象:驻留在 Virtual SAN 数据存储上的虚拟机交换空间所使用的容量

Vmem为包含虚拟机内存的虚拟机拍摄快照而创建的内存对象或来自挂起的虚拟机的内存对象所使用的容量。请注意,只有至少使用虚拟硬件版本 10 的虚拟机才具备此功能。

其他:例如,虚拟机模板、未注册的虚拟机、未与虚拟机关联的独立 VMDK、手动创建的 Virtual SAN 对象、手动创建的存储 ISO 的目录所使用的容量。

 

 

实施 Raid 6 - 磁盘策略

 

您的练习环境当前运行 4 节点 Virtual SAN 集群。要实施 Raid 6,您的 Virtual SAN 集群至少需要具备 6 台主机。

虚拟机存储策略将具有容错方法Raid 5/6 - ( Erasure Coding ) - Capacity(Raid 5/6 - [纠删码] - 容量)且Number of failures to tolerate(容许的故障数)设置为 2

Raid-6 中,您使用的存储空间是分配给虚拟机的存储空间的 1.5 倍

 

 

 

实施 Raid 6 - 磁盘策略

 

 

以下是采用 Raid 6虚拟机存储策略配置的虚拟机的示例。

在 Raid 6 配置中,有 6 个组件,这些组件分布在集群中的 6 台 ESXi 主机上。

 

 

 

 

基于存储的策略管理 - 对象校验和

Virtual SAN 6.2 引入了另一项新的功能特性,即端到端软件数据校验和,可帮助客户避免因基础存储介质问题而导致的数据完整性问题。在 Virtual SAN 6.2 中,默认情况下将启用校验和功能,但可通过虚拟机存储策略在每台虚拟机/对象上启用或禁用此功能。

由于我们认为客户始终需要使用校验和功能,因此默认情况下将启用这项出色的新功能。禁用此功能的唯一原因可能是应用程序已包含此功能。

Virtual SAN 上的校验和的简要概述

遵循 Intel 处理器上的特殊 CPU 说明使用很常见的循环冗余检验 CRC-32C (Castagnoli)实施 Virtual SAN 上的校验和以获得最佳性能。每 4 KB 块均具有关联的校验和。校验和的大小为 5 字节。写入数据时,将在发出数据的相同主机上验证校验和以确保能捕获到通过网络实施的任何损坏。校验和将与数据一起保存。

清理程序机制

除了针对读取操作的校验和验证之外,Virtual SAN 还具有检查磁盘上的数据是否存在任何无提示损坏的清理程序机制。此清理程序设计为一年检查一次所有数据,但可通过高级设置VSAN.ObjectScrubsPerYear将其调整为更频繁地运行。例如,如果您希望清理程序一周检查一次所有数据,请将此项设置为 52,但请注意,此操作运行时将产生一些性能开销。

 

 

 

在禁用对象校验和的情况下创建虚拟机存储策略

 

在此练习中,我们将模拟名为对象校验和的新虚拟机存储策略规则。我们将创建 2 个虚拟机存储策略,一个策略是在启用对象校验和的情况下创建的,一个策略是在禁用对象校验和的情况下创建的。

我们会将 2 个磁盘附加到虚拟机,并将可识别模式写入 2 个磁盘。随后,我们将验证此模式。我们将运行另一个工具已在组件上注入坏模式。随后,我们将读取数据以验证坏模式。

禁用对象校验和的情况下,坏模式未修复且在客户操作系统中可见。

启用对象校验和的情况下,坏模式将被修复。我们将通过查看 ESXi VMkernel 日志了解此信息。

在 vSphere Web Client 的Home(主页)屏幕中,选择Policies and Profiles(策略和配置文件)

选择VM Storage Policies(虚拟机存储策略)

单击Create VM Storage Policy(创建虚拟机存储策略)

 

 

在禁用对象校验和的情况下创建虚拟机存储策略

 

输入存储策略的名称

Name : SDB-No-Checksum

单击Next(下一步)

 

 

在禁用对象校验和的情况下创建虚拟机存储策略

 

单击Rule-Sets(规则集)上的Next(下一步)

对于Rules based on data services(基于数据服务的规则),选择Virtual SAN

添加下列规则

Number of failures to tolerate : 1
Disable object checksum : Yes

单击Next(下一步)

 

 

在禁用对象校验和的情况下创建虚拟机存储策略

 

确认 vsanDatastore可与此虚拟机存储策略兼容

单击Next(下一步)

 

 

在禁用对象校验和的情况下创建虚拟机存储策略

 

在Ready to complete(即将完成)屏幕上,单击Finish(完成)

 

 

在禁用对象校验和的情况下创建虚拟机存储策略

 

将创建虚拟机存储策略。

 

 

在启用对象校验和的情况下创建虚拟机存储策略

 

启用对象校验和的情况下创建另一个虚拟机存储策略

调用虚拟机存储策略,如下所示:

Name : SDC-Checksum

单击Rule-Sets(规则集)上的Next(下一步)

对于Rules based on data services(基于数据服务的规则),选择Virtual SAN

添加下列规则

Number of failures to tolerate : 1
Disable object checksum : No

单击Next(下一步)

单击Next(下一步)

单击Finish(完成)

 

 

虚拟机存储策略

 

虚拟机存储策略已创建完毕。

 

 

准备好虚拟机进行对象校验和测试

 

在您的桌面上,您将看到名为 Prepare Photon VMPowerCLI脚本。

双击 Prepare Photon VM使之运行。

这样将仅注册 Virtual SAN 数据存储上的虚拟机。

 

 

准备好虚拟机进行对象校验和测试

 

返回 vSphere Web Client,您应看到 Photon-01a 虚拟机已注册已开启

此虚拟机共有 3 个磁盘,我们将使用这些磁盘进行对象校验和测试。

 

 

准备好虚拟机进行对象校验和测试

 

选择名为 Photon-01a的虚拟机

选择Manage(管理)-Policies(策略)-Edit VM Storage Policies(编辑虚拟机存储策略)

 

 

准备好虚拟机进行对象校验和测试

 

修改虚拟机存储策略,如下所示:

VM Home : Virtual SAN Default Storage Policy
Hard disk 1 : Virtual SAN Default Storage Policy
Hard disk 2 : SDB-No-Checksum
Hard disk 3 : SDC-Checksum

单击与虚拟机主页硬盘关联的虚拟机存储策略进行更改。

从下拉列表中选择虚拟机存储策略。

这些策略是我们之前在练习中创建的虚拟机存储策略。

单击OK(确定)

 

 

准备好虚拟机进行对象校验和测试

 

确认是否已分配虚拟机存储策略,如下所示。

Hard disk 2 : SDB-No-Checksum
Hard disk 3 : SDC-Checksum

 

 

准备好虚拟机进行对象校验和测试

 

记下分配的 IP 地址和虚拟机运行于的 ESXi 主机

 

 

准备好磁盘以进行对象校验和测试

 

打开与 Photon-01a 虚拟机的 putty会话。

使用已分配给虚拟机的 IP 地址。

root用户身份并使用密码 VMware1!进行登录

我们已准备好此虚拟机,可进行对象校验和测试。

我们做了什么?我们基本上已使用 dd命令将已知的零模式写入磁盘。

验证已写入到 2 个磁盘的模式是否都为。我们可使用 hexdump命令达到此目的。

对虚拟机中的 2 个磁盘运行以下命令:(命令的运行时间可能为一分钟或两分钟,请耐心等待)

hexdump -C /dev/sdb
hexdump -C /dev/sdc

您将看到与屏幕截图类似的输出。

 

 

测试对象校验和 - 已禁用

 

登录运行 Photon-01a虚拟机的 ESXi 主机

打开一个连接 ESXi 主机putty会话。

用户名为 root,密码为 VMware1!

更改为以下文件夹:

cd /vmfs/volumes/NFSA/Software/

我们将用于模拟这些测试的脚本称为 test_checksum_v19.sh

 

 

 

测试对象校验和 - 已禁用

 

请注意:此工具不受 VMware 支持。它在此处用于模拟 Virtual SAN 6.2 功能特性。

要运行脚本,请执行以下命令:(密切注意提示

./test_checksum_v19.sh

回答下列提示:

Do you acknowledge that this tool is unsupported? [y/n] y
Please type in the name of the VM that you want to test checkum on: Photon-01a

 

 

测试对象校验和 - 已禁用

 


Is Object-Checksum-Test the virtual machine you wish to test checksum on? [y/n] y
Do you want to display the VMDKs by label [l] or by .vmdk name [n] l
Please enter the label that you wish to use for the checksum test: Hard disk 2
Is Hard disk 2 the label of the VMDK you wish to test checksum on? [y/n] y

Enter以继续

 

 

 

测试对象校验和 - 已禁用

 

ESXi 主机的所有密码都为 VMware1!

Do you want to enable it for the duration of this test? [y/n] y
Are you sure you want to inject the bad data on a component on host esx-02a.corp.local? [y/n] y

在此屏幕暂停片刻。我们需要确认数据已写入磁盘。我们现在将转到 Photon-01a 虚拟机。

 

 

测试对象校验和 - 已禁用

 

返回您已为 Photon-01a 虚拟机打开的 putty会话。

通过运行以下命令确认模式已写入磁盘:

hexdump -C /dev/sdb

在此处,我们可以看到已写入的数据模式。

这是我们已禁用对象校验和虚拟机存储策略的硬盘。

返回您的 ESXi主机 putty 会话

 

 

测试对象校验和 - 已禁用

 

Enter以继续。

系统可能需要您接受RSA key fingerprint(RSA 密钥指纹),如果要求,则请选择Yes(是)。

在此处,我们从DOM Owner Scrub Stats(DOM 所有者清理统计)输出中可以看到,未检测到任何错误,这是因为我们已为此磁盘禁用对象校验和

在此处,我们可看到 VMkernel.log 文件是干净的,例如,未检测到任何 Virtual SAN 校验和错误。忽略任何与校验和负载分流相关的 VMkernel 日志条目(如果显示),它们是与网卡相关的条目,我们要查看的是 VMKernel 日志中的校验和操作。

这是我们禁用了对象校验和的磁盘。

 

 

测试对象校验和 - 已启用

 

下面我们对已启用对象校验和虚拟机存储策略的磁盘运行此脚本。

执行以下命令:(请特别留意系统提示)

./test_checksum_v19.sh

回答下列提示:

Do you acknowledge that this tool is unsupported? [y/n] y
Please type in the name of the VM that you want to test checkum on: Photon-01a

 

 

测试对象校验和 - 已启用

 

Is Object-Checksum-Test the virtual machine you wish to test checksum on? [y/n] y
Do you want to display the VMDKs by label [l] or by .vmdk name [n] l
Please enter the label that you wish to use for the checksum test: Hard disk 3
Is Hard disk 3 the label of the VMDK you wish to test checksum on? [y/n] y

从屏幕中,您可以看到校验和错误数为零。

Enter以继续

 

 

测试对象校验和 - 已启用

 

ESXi 主机的所有密码都为 VMware1!

Do you want to enable it for the duration of this test? [y/n] y
Are you sure you want to inject the bad data on a component on host esx-02a.corp.local? [y/n] y

在此屏幕暂停片刻。我们需要确认数据已写入磁盘。我们现在将转到 Photon-01a 虚拟机。

 

 

测试对象校验和 - 已启用

 

返回您已为 Photon-01a虚拟机打开的 putty 会话。

确认模式返回值仍为零:

hexdump -C /dev/sdc

在此处,我们可以看到数据模式仍都为零。

返回您的 ESXi 主机 putty会话

 

 

测试对象校验和 - 已启用

 

Enter以继续。

系统可能需要您接受RSA key fingerprint(RSA 密钥指纹),如果要求,则请选择Yes(是)。

在此处,我们可以看到 VMkernel.log文件记录了一些校验和错误。

2016-02-23T18:14:44.725Z cpu0:33221)LSOM: RCDomCompletion:6706: Throttled: Checksum error detected on component 327fcc56-171f-f096-9732-005056012210 (computed CRC 0x6e4179d7 != saved CRC 0x0)
2016-02-23T18:14:44.729Z cpu0:33221)LSOM: LSOMScrubReadComplete:1958: Throttled: Checksum error detected on component 327fcc56-171f-f096-9732-005056012210, data offset 524288 (computed CRC 0x6e4179d7 != saved CRC 0x0)

这是我们启用了对象校验和的磁盘。我们在此处还可看到 Virtual SAN 检测到已修复错误。

2016-02-23T18:14:44.739Z cpu0:33101)WARNING: DOM: DOMScrubberAddCompErrorFixedVob:327: Virtual SAN detected and fixed a medium or checksum error for component 327fcc56-171f-f096-9732-005056012210 on disk group 5241a003-cbe6-2af1-8855-887eddaa580e

本示例说明对象校验和有效。此脚本完全不受 VMware 支持,此处是为了演示功能特性。

 

 

 

第 3 单元 - 小结

在本单元中,我们演示了 Virtual SAN 6.2 版中包含的一些新虚拟机存储策略。

我们首先演示了容错方法,其中我们可指定数据复制方法是针对性能还是容量优化。如果您选择性能,则 Virtual SAN 将使用更多磁盘空间来放置对象的组件,但可提供更好的对象访问能。如果选择容量,Virtual SAN 将使用较少的磁盘空间,但会降低性能。

对象校验和完全受所有新功能特性(如 RAID-5/RAID-6、重复数据删除和压缩以及配置(如 Virtual SAN 延伸集群))的支持。如前所述,默认情况下它处于启用状态,使客户无需配置即可获得好处。如果您发现出于某种原因,您不再需要对象校验和,只需按上面所述在虚拟机存储策略中禁用即可。利用此功能特性,Virtual SAN 客户能够检测到因潜在扇区错误(通常由物理驱动器问题导致)造成的数据损坏或其他无提示数据损坏。

 

第 4 单元 - 稀疏虚拟机交换对象

新的稀疏虚拟机交换对象


此阶段已熟悉 Virtual SAN 的用户将知道部署在 Virtual SAN 数据存储上的虚拟机是作为一组对象而不是一组文件(传统数据存储上部署 VM 的方式)部署的。这些对象包括虚拟机主目录命名空间、VMDK,当然还有虚拟机交换文件。

虚拟机交换文件很有趣,它仅在虚拟机处于打开状态时存在,但在 Virtual SAN 上,过去它始终使用 100% 对象空间预留进行调配。

这具有一些缺点,因为它会占用大量容量。例如,如果部署了 100 个虚拟机(每个虚拟机具有 8 GB 内存),则需要为虚拟机交换文件调配 800 GB的磁盘。

如果虚拟机没有遇到资源问题,这种预留空间可能永远都不需要使用。


 

新的稀疏虚拟机交换对象

 

为了说明此示例,我们需要在环境中打开的唯一 VM 是我们之前创建的名为 FTT=1-Raid5的虚拟机。

如果您有其他正在运行的虚拟机,请立即将其关闭

在名为 FTT=1-Raid5的虚拟机中,我们可看到我们已分配 64 MB 内存

请注意,运行虚拟机的 ESXi 主机可能不同于此处显示的主机。

 

 

新的稀疏虚拟机交换对象

 

现在切换到Capacity View(容量视图)。

选择Cluster Site A(集群站点 A)-Monitor(监控)-Virtual SAN-Capacity(容量)

滚动至Capacity View(容量视图)底部的Used Capacity Breakdown(已使用容量明细)部分。

在此处,我们可以看到交换对象占用的容量约为 140 MB

 

 

新的稀疏虚拟机交换对象

 

关闭名为 FTT=1-Raid5的虚拟机

按照预期,Virtual SAN 数据存储中没有占用空间的虚拟机交换对象

 

 

 

新的稀疏虚拟机交换对象

 

打开针对运行 FTT=1-Raid5虚拟机的 ESXi 主机的 puTTY会话。

首先需注意的是,Virtual SAN 集群中的每个 ESXi 主机上需要设置此高级设置。在我们的环境中,我们仅在将运行虚拟机的 ESXi 主机上设置此高级设置。

注意:您可复制手册中的命令,然后采用send text(发送文本)选项。

此设置名为 SwapThickProvisionDisabled,并且在默认情况下处于禁用状态:

esxcfg-advcfg -g /VSAN/SwapThickProvisionDisabled

启用此设置:

esxcfg-advcfg -s 1 /VSAN/SwapThickProvisionDisabled

 

 

 

新的稀疏虚拟机交换对象

 

再次打开名为 FTT=1-Raid5的虚拟机。

返回Capacity View(容量视图)屏幕。

现在我们可看到交换对象目前仅使用 12.00 MB而不是原来的 140 MB磁盘空间

此新功能特性可大大节省所使用的容量空间。

具体则取决于您部署的虚拟机的数量以及虚拟机交换空间的大小(实际上就是分配给虚拟机的未预留内存的大小)。

 

 

 

性能图 - 虚拟机使用情况

 

下面我们回过头来看看性能图,现在我们已生成一些 I/O。

选择名为 FTT=1-Raid5的虚拟机

选择Monitor(监控)

选择Performance(性能)

选择Virtual SAN - Virtual Machine Consumption(Virtual SAN - 虚拟机使用情况)

您应看到性能图中现在显示了一些数据。请记住,这是一个虚拟化练习环境,并且我们运用的数据集是受限的。

5 分钟单击一次性能图以获取值。

 

 

性能图 - 集群使用

 

下面我们回过头来看看性能图,现在我们已生成一些 I/O。

选择名为Cluster Site A(集群站点 A)的集群

选择Monitor(监控)

选择Performance(性能)

选择Virtual SAN - Virtual Machine Consumption(Virtual SAN - 虚拟机使用情况)

您应看到性能图中现在显示了一些数据。请记住,这是一个虚拟化练习环境,并且我们运用的数据集是受限的。

5 分钟单击一次性能图以获取值。

 

 

 

第 4 单元 - 小结

在本单元中,我们在 Virtual SAN 6.2 中演示了一种以精简形式部署虚拟机交换对象的方式。

在虚拟机依赖过量分配的内存的环境中,建议不要禁用稀疏虚拟机交换对象。在此方案中,当没有可用的内存页时,虚拟机将需要其交换文件。

 

第 5 单元 - Virtual SAN 延伸集群 (ROBO)

Virtual SAN 延伸集群 (ROBO)


延伸集群将 Virtual SAN 集群从一个站点延伸到两个站点,以实现更高级别的可用性和站点间负载均衡。通常,延伸集群部署在各数据中心之间的距离有限的环境中,如大都市或校园环境。

您可使用延伸集群管理计划内维护并避免灾难场景,因为维护或丢失一个站点不会影响集群的整体运行。在延伸集群配置中,两个站点都是活动站点。如果一个站点出现故障,Virtual SAN 将使用另一站点上的存储。vSphere HA 将重新启动必须在剩余活动站点上重新启动的任何虚拟机。

您必须指定一个站点作为首选站点。另一个站点将成为辅助或非首选站点。仅当两个活动站点之间的网络连接丢失时,此系统才使用首选站点,因此指定为首选站点的站点仍可运行。

Virtual SAN 延伸集群一次可容忍一个链路故障,而数据不会变得不可用。链路故障意指两个站点之间或一个站点和一个见证主机之间的网络连接丢失。在站点故障或网络连接丢失期间,Virtual SAN 将自动切换到正常运行的站点。


 

配置 Virtual SAN 延伸集群

 

现在,Virtual SAN 引入了 Virtual SAN for Remote Office Branch Office (ROBO),它是一种为满足小型 ROBO 环境和适用用例的需求而专门设计和包装的受支持解决方案。

Virtual SAN for ROBO 基于故障域而构建,此时所需的故障区域基于 3 个节点(2 个物理节点和 1 个见证虚拟设备)。见证虚拟设备采用独特设计,专用于在故障事件期间提供集群仲裁服务,以及存储见证对象和集群元数据信息。

使用见证虚拟设备可消除对第 3 个物理节点的需求。这是 ROBO 客户所期待的,因为低成本是 ROBO 用例的基础之一。

有关 Virtual SAN 见证虚拟设备的一些实际情况:

我们在此环境中为您部署了此 Virtual SAN 见证主机。ESXi 主机注册为 esx-07a.corp.local

注意:用淡蓝色表示见证主机来帮助您在 vSphere 环境中识别它。

 

 

配置 Virtual SAN 延伸集群

 

选择名为 esx-07a.corp.local的 ESXi 主机

选择Manage(管理)

选择Storage(存储)

选择Storage Devices(存储设备)

Virtual SAN 见证主机具有一个闪存(缓存)和一个 HDD(容量)。

我们将使用它们为 Virtual SAN 见证主机创建磁盘组

 

 

配置 Virtual SAN 延伸集群

 

我们现在将配置延伸集群或 2 个主机 Virtual SAN 集群。

选择ROBO Cluster(ROBO 集群)

选择Manage(管理)

选择Settings(设置)

选择General(常规)

单击Configure(配置)

 

 

 

配置 Virtual SAN 延伸集群

 

对于Disk Claiming(磁盘申领),选择Add disks to Storage(将磁盘添加到存储)作为Manual(手动)

在Fault Domains and Stretched Cluster(故障域和延伸集群)部分中,选择Configure two host Virtual SAN cluster(配置 2 个主机 Virtual SAN 集群)

单击Next(下一步)

 

 

配置 Virtual SAN 延伸集群

 

确认 VMkernel端口已启用 Virtual SAN 流量

单击Next(下一步)

 

 

配置 Virtual SAN 延伸集群

 

选择 Virtual SAN 集群中应为缓存层容量层申领的磁盘。

磁盘可按型号/大小主机分组。

已根据您的环境中可用的设备提供建议的选择。

对于每台主机,申领的容量磁盘的数量必须大于或等于缓存磁盘的数量。

单击Next(下一步)

 

 

 

配置 Virtual SAN 延伸集群

 

选择esx-07a.corp.local作为 Virtual SAN 见证主机。

屏幕上列出了见证主机的要求

单击Next(下一步)

 

 

配置 Virtual SAN 延伸集群

 

选择 10 GB的磁盘作为缓存层

选择 15 GB的磁盘作为容量层

单击Next(下一步)

 

 

配置 Virtual SAN 延伸集群

 

检查这些设置,然后单击Finish(完成)。

 

 

 

配置 Virtual SAN 延伸集群

 

查看Recent Tasks(近期任务)窗格。

 

 

配置 Virtual SAN 延伸集群

 

在完成任务后,您的 Virtual SAN 延伸集群将形成。

我们看到Stretched Cluster(延伸集群)已启用,Preferred fault domain(首选故障域)已命名为 Preferred,并且 Virtual SAN 见证主机为 esx-07a.corp.local

在屏幕下部,我们可看到已创建的 2 个故障域,每个故障域包含 1 个 ESXi 主机。

 

 

Virtual SAN 对象运行状况

 

选择ROBO Cluster(ROBO 集群)

选择Monitor(监控)

选择Virtual SAN

选择Health(运行状况)

我们在延伸集群的运行状况检查中有一个新区域。

 

 

验证延伸集群运行状况

 

展开Stretched Cluster(延伸集群)运行状况检查。

您将在此处看到与 Virtual SAN 延伸集群相关的运行状况检查。

 

 

 

Virtual SAN 延伸集群的 vSphere High Availability (HA) 和 Distributed Resource Scheduler (DRS) 设置

要为 Virtual SAN 延伸集群中的虚拟机提供可用性,需要配置 vSphere High Availability (HA)。

这使得能够在出现主机故障时在相同的站点(具有关联性规则)上重新启动虚拟机,或当出现完全站点故障时能够在远程站点上重新启动虚拟机。但是,某些设置需要通过特定方式配置,它们是在 Virtual SAN 延伸集群中实现高可用性的基础。

在此任务中,我们将介绍 VMware 建议的设置,并说明为何建议在 Virtual SAN 延伸集群上以此方式配置 vSphere HA。

通过遵循此指南,您可确保当一个站点上存在组件/主机故障时在相同站点上重新启动您的虚拟机(保留读取位置)。还将确保在出现彻底的站点故障时虚拟机进行故障转移并在剩余站点上重新启动。

 

 

将虚拟机克隆到主站点

 

在我们构建 Virtual SAN 延伸集群后,首先会将一些虚拟机部署到 Virtual SAN 集群。我们将通过克隆 linux-micro-01a虚拟机来实现这一点。

右键单击 linux-micro-01a VM,并依次选择Clone(克隆)和Clone to Virtual Machine(克隆到虚拟机)

 

 

 

将虚拟机克隆到主站点

 

为虚拟机指定一个名称,我们将它命名为 VM-Primary,此 VM 将驻留在主站点上。

VM Name: VM-Primary

单击Next(下一步)

 

 

将虚拟机克隆到主站点

 

选择ROBO Cluster(ROBO 集群),这是我们最初放置虚拟机的位置。

单击Next(下一步)

 

 

 

将虚拟机克隆到主站点

 

我们在此处将为虚拟机应用虚拟机存储策略。我们会将虚拟机放置在 Virtual SAN 数据存储上。

选择以下虚拟机存储策略:

VM Storage Policy : Virtual SAN Default Storage Policy

单击Next(下一步)

 

 

 

将虚拟机克隆到主站点

 

单击Select Clone options(选择克隆选项)上的Next(下一步)

 

 

将虚拟机克隆到主站点

 

查看您的设置,然后单击Finish(完成)

 

 

将虚拟机克隆到主站点

 

我们有了第一个可用的虚拟机,下面我们重复相同的过程来创建另一个虚拟机(名为 VM-Secondary)。

 

 

将虚拟机克隆到辅助站点

 

这次我们将克隆 VM-Primary 虚拟机。

右键单击 VM-Primary 虚拟机,并依次选择Clone(克隆)和Clone to Virtual Machine(克隆到虚拟机)

 

 

将虚拟机克隆到辅助站点

 

为虚拟机指定一个名称,我们将它命名为 VM-Secondary,此 VM 将驻留在辅助站点上。

VM Name : VM-Seondary

单击Next(下一步)

 

 

将虚拟机克隆到辅助站点

 

选择ROBO Cluster(ROBO 集群),这是我们最初放置虚拟机的位置。

单击Next(下一步)

 

 

将虚拟机克隆到辅助站点

 

我们在此处将为虚拟机应用虚拟机存储策略。我们会将虚拟机放置在 Virtual SAN 数据存储上。

选择以下虚拟机存储策略:

VM Storage Policy : Virtual SAN Default Storage Policy

单击Next(下一步)

 

 

将虚拟机克隆到辅助站点

 

单击Select Clone options(选择克隆选项)上的Next(下一步)

 

 

将虚拟机克隆到辅助站点

 

查看您的设置,然后单击Finish(完成)

 

 

Virtual SAN 延伸集群的 vSphere HA 和 DRS 设置

 

现在我们已在环境中部署 2 台虚拟机。

 

 

vSphere DRS 设置

 

我们已配置 Virtual SAN 延伸集群所需的大部分 HADRS设置,但我们在这里将介绍它们以便为您显示要配置的设置。

DRS 可通过完全自动化部分自动化模式来设置。

选择ROBO Cluster(ROBO 集群)

选择Manage(管理)

选择Settings(设置)

选择vSphere DRS

vSphere DRS 已打开且处于全自动模式。

 

 

 

虚拟机/主机组

 

现在我们来考虑 Virtual SAN 延伸集群中的 DRS

第一个 DRS 注意事项是虚拟机/主机关联性规则的关系。

虚拟机/主机关联性规则需要 DRS 才能生效。如果未启用 DRS,应忽略should规则。如果您要使用虚拟机/主机关联性should规则,则需要 DRS。

选择名为ROBO Cluster(ROBO 集群)的集群

选择Manage(管理)

选择Settings(设置)

选择VM/Host Groups(虚拟机/主机组)

选择Primary(主)

主主机组包含名为 esx-05a.corp.local的 ESXi 主机

单击Secondary(次)

次主机组包含名为 esx-06a.corp.local的 ESXi 主机

 

 

虚拟机/主机组

 

现在让我们看看虚拟机组

选择Primary-VM Group(主虚拟机组)。

此时,我们未向虚拟机组分配任何虚拟机。

注意:这里要记住一点,如果您在 Virtual SAN 延伸集群中部署其他虚拟机,请记住将这些虚拟机添加到虚拟机组以便它们可由 DRS 处理。

在VM/Host Group Members(虚拟机/主机组成员)中,选择Add(添加)

 

 

 

虚拟机/主机组

 

选择名为 VM-Primary的虚拟机并单击OK(确定)

 

 

虚拟机/主机组

 

选择Secondary-VM Group(Secondary-VM 组)。

此时我们未向虚拟机组分配任何虚拟机

在VM/Host Group Members(虚拟机/主机组成员)中,选择Add(添加)

 

 

虚拟机/主机组

 

选择名为 VM-Secondary的虚拟机并单击OK(确定)

 

 

虚拟机/主机组

 

确认 VM-Secondary虚拟机位于 Secondary-VM虚拟机组中。

 

 

VM-Host 规则

 

我们来看看虚拟机/主机规则.

选择 PrimaryVMHosts规则。

此处有两条重要信息,第一条是虚拟机/主机规则详细信息 - 作为虚拟机组成员的虚拟机应在作为主机组成员的主机上运行。

第二条是组成员,我们在此处可看到 VM-Primary虚拟机在名为 esxi-05a.corp.local的主机上运行

选择 SeondaryVMHosts规则

我们在此处可看到 VM-Secondary虚拟机在名为 esxi-06a.corp.local的主机上运行

 

 

在 Virtual SAN 延伸集群中启用 HA

 

要为 Virtual SAN 延伸集群中的虚拟机提供可用性,需要配置 vSphere HA。这使得能够在出现主机故障时在相同的站点(具有关联性规则)上重新启动虚拟机,或当出现完全站点故障时能够在远程站点上重新启动虚拟机。但是,某些设置需要通过特定方式配置,它们是在 Virtual SAN 延伸集群中实现高可用性的基础。

选择ROBO Cluster(ROBO 集群)

选择Manage(管理)

选择Settings(设置)

选择vSphere HA

vSphere HA当前已禁用,请单击Edit(编辑)

 

 

在 Virtual SAN 延伸集群中启用 HA

 

选择Turn On vSphere HA(打开 vSphere HA)

展开Failure conditions and VM response(故障情况和虚拟机响应)

 

 

在 Virtual SAN 延伸集群中启用 HA

 

对于主机隔离响应,确认已选择Power off and restart VMs(关闭并重新启动虚拟机)。

展开Admission Control(接入控制)

 

 

在 Virtual SAN 延伸集群中启用 HA

 

如果我们具有站点故障,则所有虚拟机可能都必须在单个站点上运行,其效率是整个集群的效率的一半。为了确保能够满足预留要求,我们需要将 HA 配置为预留 50% 的资源(即,1 个站点)。

在Admission Control(接入控制)部分中选择:

Define failover capacity by reserving a percentage of the cluster resources(通过按百分比预留集群资源来定义故障转移容量):

Reserved failover CPU capacity : 50%
Reserved failover Memory capacity : 50%

 

 

 

配置 HA 以遵循虚拟机到主机的关联性规则

 

有一个需要在VM/Host Rules(虚拟机/主机规则)上设置的最终设置。此设置再次定义在出现完全站点故障时 vSphere HA 的行为。

在此部分中,名为vSphere HA Rule Settings(vSphere HA 规则设置)。

其中一个设置适用于VM to Host Affinity rules(虚拟机/主机关联性规则)。

确认VM to Host Affinity rules(虚拟机到主机的关联性规则)已设置为vSphere HA should respect rules during failover(vSphere HA 应在故障转移期间遵循规则)

此设置可解释为:

如果任一站点上有多台主机,并且一台主机失败,则 vSphere HA 将尝试在该站点上的其他主机上重新启动虚拟机并保留读关联性。

如果整个站点出现故障,则 vSphere HA 将尝试在另一站点的主机上重新启动虚拟机。如果选择了上面显示的必须遵循选项,则 vSphere HA 将无法在另一个站点上重新启动虚拟机,因为这样做将违反规则。使用应该规则可允许它这样做。

 

 

启动虚拟机

 

启动两台分别名为VM-Primary和VM-Secondary的虚拟机。

您应注意的是,VM-Primaryesxi-05a.corp.local上运行,而 VM-Secondaryesxi-06a.corp.local上运行。

我们创建的虚拟机/主机规则决定了这一点。

 

 

查看 VM-01 的组件分配

 

选择VM-Primary

选择Monitor(监控)

选择Policies(策略)

选择Hard disk 1(硬盘 1)

此布局显示,虚拟机已正确部署,其中每个故障域(站点)有一个组件,见证组件位于见证主机 (esx-07a.corp.local) 上。

我们可以清楚地看到,一个数据副本驻留在站点 1中的存储上,另一个数据副本驻留在站点 2中的存储上,而见证组件驻留在见证站点上的见证主机和存储上。

 

 

 

Virtual SAN 运行状况检查

 

在尝试任何故障场景之前,确认已通过所有运行状况检查

忽略任何硬件兼容性运行状况警告,因为我们正在虚拟环境中运行,并且未在此集群中启用 Virtual SAN 性能服务。

 

 

故障场景 - 重新启动单台主机

 

在这里,我们将模拟一个故障场景,重新启动具有某个虚拟机组件的单台主机。

选择名为 esx-05a.corp.local的 ESXi 主机并重新启动该主机。

选择esx-05a.corp.local,右键单击并选择Power(电源)-Reboot(重新启动)

 

 

故障场景 - 重新启动单台主机

 

选择OK(确定)以重新启动 ESXi 主机。

 

 

缺失组件

 

选择名为 VM-Primary的虚拟机

选择Monitor(监控)

选择Policies(策略)

选择Hard disk 1(硬盘 1)

选择Physical Disk Placement(物理磁盘布局)

稍后,在 ESXi 主机重新启动后,此主机上的 Virtual SAN 对象缺失

 

 

Virtual SAN 运行状况检查

 

选择ROBO Cluster(ROBO 集群)

选择Monitor(监控)-Virtual SAN-Health(运行状况)

等待运行状况检查完成。

展开Data(数据)运行状况部分并监控错误。

展开Network(网络)运行状况并监控错误。

展开物理磁盘(Physical disk)运行状况并监控错误。

 

 

在其他主机上重新启动的 VM-Primary

 

返回到名为 VM-Primary的虚拟机的Summary(摘要)视图

请注意,已在名为 esx-06a.corp.local的另一台 ESXi 主机上启动此虚拟机

 

 

vSphere 任务

 

选择Home(主页)

选择Tasks(任务)

一旦名为 esxi-05a.corp.local的主机恢复联机状态,我们便可看到将虚拟机从辅助站点迁移回主站点的迁移任务

 

 

已迁移到其他主机的 VM-Primary

 

现在,在迁移任务完成后,名为 VM-Primary的虚拟机在名为 esxi-05a.corp.local的 ESXi 主机上运行

 

 

Virtual SAN 运行状况检查

 

再次重新运行运行状况检查,它应显示测试已通过

 

 

第 5 单元 - 小结

在本单元中,我们向您介绍了如何使用 Virtual SAN 见证主机创建双节点 Virtual SAN 延伸集群。见证主机决定了是否创建此 3 节点 Virtual SAN 集群。

我们介绍了 Virtual SAN 延伸集群所需的 vSphere High Availability (HA) 和 Distributed Resource Scheduler (DRS) 配置。最后,我们在 Virtual SAN 延伸集群中模拟了一个节点故障,并看到虚拟机在集群中的另一节点上重新启动了。在原始节点再次恢复联机后,我们看到虚拟机已迁移回该主机。

 

Conclusion

Thank you for participating in the VMware Hands-on Labs. Be sure to visit http://hol.vmware.com/ to continue your lab experience online.

Lab SKU: HOL-SDC-1608-SpringRelease

Version: 20160418-042925