VMware 动手练习 - HOL-1908-01-HCI


实验室概述 - HOL-1908-01-HCI - vSAN 6.7 入门

实验指导


注意:本实验的练习总时长可能会超过 90 分钟。体验期间,您最好只完成 2 到 3 个单元。这些单元彼此独立,因此您可以从任一单元开始学起。您可以使用目录访问所选择的任何单元。

目录可以从实验手册的右上角访问。

通过简化的 VMware vSphere 原生体验,vSAN 可为您所有的关键虚拟化工作负载提供经过闪存优化的安全共享存储。了解如何设定 vSAN 环境的规模,以及如何使该环境通过内置的 vRealize Operations for vCenter 仪表盘来监控 vCenter 内 vSAN 的运行状况、容量和性能。探索全新、直观的 vSAN HTML5 用户界面,了解如何利用该界面执行后续运维、维护虚拟机可用性、启用 vSAN 加密以及发现与 vRealize Log Insight、iSCSI 集成和 CLI 界面的互操作性。

实验单元列表:

- 在本单元中,我们将介绍 VMware vSAN。我们将探讨 vSAN 的功能特性,并向您展示如何使用全新的 vSphere Client (HTML5 UI) 启用 vSAN。

- 在本单元中,我们将向您展示如何在 vCenter Server 内启用 vRealize Operations。我们将介绍 vSAN 运行状况检查以及如何监控 vSAN 环境。

- 在本单元中,我们将介绍基于存储的策略管理以及如何维护 vSAN 环境。我们还将演示如何扩展 vSAN 数据存储的容量。

- 在本单元中,我们将介绍 vSAN 可用性和故障域。我们将演示如何创建 vSAN Stretched Cluster。

- 在本单元中,我们将介绍 vRealize Log Insight 与 vSAN。我们将讲解 vSAN iSCSI 集成,并演示如何使用 vSAN iSCSI 和 Windows Server 故障转移集群。我们还将介绍如何使用 ESXCLI 和 PowerCLI 之类的命令行工具监控 vSAN 环境。

- 在本单元中,我们将介绍 vSAN 加密功能。我们将启用密钥管理服务器,并演示如何配置 vSAN 加密。

实验负责人:

  • John Browne,爱尔兰科克市技术支持主管专家
  • Ken Osborn,美国明尼苏达州 vSAN/HCI 解决方案主管工程师

特别感谢以下人员的指导和协助:

  • Cormac Hogan,存储产品市场推广总监兼首席技术专家
  • Jeff Hunter,vSAN 技术市场推广团队经理
  • Pete Flecha,高级技术市场推广架构师
  • Myles Gray,高级技术市场推广架构师
  • GS Khalsa,高级技术市场推广架构师
  • Jase McCarty,技术市场推广主管架构师
  • John Nicholson,高级技术市场推广架构师
  • Pete Koehler高级技术市场推广架构师

本实验手册可以从动手实验文档站点下载,网址为:

http://docs.hol.vmware.com

本实验可能提供其他语言版本。要设置语言首选项并在实验中部署本地化手册,可以在以下文档的帮助指导下完成:

http://docs.hol.vmware.com/announcements/nee-default-language.pdf


 

主控制台的位置

 

  1. 红框区域包含主控制台。实验手册位于主控制台右侧的选项卡上。
  2. 个别实验可能会用到左上角独立选项卡上的其他控制台。如有需要,系统将引导您打开其他的特定控制台。
  3. 实验时间为 90 分钟,由计时器计时。实验结果无法保存。所有操作都必须在实验课程中完成。但是您可以单击“EXTEND”(延长)延长时间。在 VMware 活动期间,您可以将实验时间延长两次,最多可延长 30 分钟。每单击一次可延长 15 分钟。非 VMware 活动期间,最多可将实验时间延长至 9 小时 30 分钟。每单击一次可延长一小时。

 

 

键盘数据输入的替代方法

在本单元中,您将向主控制台中输入文本。除直接输入外,还有两种非常有用的数据输入方法,可简化输入复杂数据的过程。

 

 

单击实验手册内容并拖放到控制台的活动窗口

 
 

您也可以单击实验手册中的文本和命令行界面 (CLI) 命令,并将其直接拖放到主控制台中的活动窗口。 

 

 

访问在线国际键盘

 

您还可以使用主控制台中的在线国际键盘。

  1. 单击 Windows 快速启动任务栏上的键盘图标。

 

 

在活动的控制台窗口中单击一下

 

在本例中,您将使用在线键盘输入电子邮件地址中所使用的“@”符号。在美式键盘布局中,输入“@”符号需要按住 Shift 并按 2。

  1. 在活动的控制台窗口中单击一下。
  2. 单击 Shift 键。

 

 

单击 @ 键

 

  1. 单击 @ 键。

您会发现,“@”符号已在活动控制台窗口中输入。

 

 

激活提示或水印

 

首次启动实验时,您可能会注意到桌面上有一个水印,提示 Windows 尚未激活。 

虚拟化的一个主要优势在于,可以在任意平台上移动和运行虚拟机。本动手实验利用了这一优势,我们可以运行多个数据中心内的实验。但是,这些数据中心的处理器可能不同,这就需要通过 Internet 进行 Microsoft 激活检查。

请放心,VMware 和本动手实验完全符合 Microsoft 的许可要求。您使用的实验是一个独立的单元,不具备对 Internet 的完全访问权限,而 Windows 需要该权限才能验证激活。如果没有对 Internet 的完全访问权限,此自动化过程会失败,并且显示此水印。

这一表面问题不会影响到您的实验。 

 

 

查看屏幕右下部分

 

请检查是否已完成实验的所有启动例程,以及是否已准备好启动实验。如果您看到的内容并非“Ready”(准备就绪),请等待几分钟。如果 5 分钟后,您的实验仍未变为“Ready”(准备就绪),请寻求帮助。

 

第 1 单元 - vSAN 6.7 规模设定、设置和启用(30 分钟)

简介


通过简化的 VMware vSphere 原生体验,vSAN 可为您所有的关键虚拟化工作负载提供经过闪存优化的安全共享存储。vSAN 基于行业标准 x86 服务器和组件运行,相较于传统存储,可帮助降低多达 50% 的总体拥有成本 (TCO)。它提供一套全面的软件解决方案,可轻松敏捷地扩展 IT,并提供首个基于软件并经 FIPS 140-2 验证的原生 HCI 加密。

vSAN 6.7 提供专为混合云构建的全新 HCI 体验和高效运维,通过全新的直观用户界面缩短价值实现时间,并通过高级自我修复和主动式支持洞察分析提供一致的应用性能与可用性。它与 VMware 的整个 Software-Defined Data Center (SDDC) 体系和领先的混合云产品无缝集成,是最全面的虚拟机平台,可以运行关键业务数据库、虚拟桌面或新一代应用。


vSAN 6.7 的新功能特性和使用情形


在进入实验之前,我们先花点时间来了解一下 vSAN 6.7 的新功能特性和用于 vSAN 的使用情形。


 

vSAN 6.7 的新功能特性

vSAN 6.7 提供全新的 HCI 体验并提高了运维效率,使用户能够更快掌握专业技能并加快决策制定速度。此版本提供更加一致、恢复能力更强且更安全的应用体验,并利用人员、技术和分析功能通过更简单、更快速的解决方案提供增强的支持体验。与其他任何 HCI 解决方案相比,更多企业通过 VMware vSAN 建立其从边缘网关到核心再过渡到云环境的数字化基础。

 

 

产品增强功能

vSAN 6.7 最重要的新增功能和更新内容包括:

完全重新设计的用户界面可提供现代管理体验。新界面使用与其他 VMware 产品相同的框架构建而成,因此您可以通过统一、直观的方式来管理我们最完善的 SDDC 体系。此外,新的 UI 还提供优化的工作流,以在执行许多功能时减少点击次数。

客户可以通过两种方式使用 vRealize Operations 管理他们的 vSAN 环境:通过 vCenter 中的全局运维概览,以及使用 vRealize Operations 进行高级监控、故障排除和容量管理。客户可以使用单一窗口直接在 vCenter 内通过 vRealize Operations Insight 监控和控制他们的 HCI 环境,以大致了解 vSAN 和 vSphere 环境,并显示关键警报和运维洞察力。

vSAN ReadyCare 支持重视 VMware 对 vSAN 客户的承诺,并通过人员、分析和技术提供全面的支持。通过 vSAN Support Insight 中的预测建模,VMware 可分析来自数千名 vSAN 客户的匿名数据,并在问题出现之前向客户推送警报。

vSAN 为静态数据提供了第一个原生 HCI 加密解决方案(现在已发布 vSAN 6.7)。vSAN 加密符合美国联邦政府的严格要求,是首个经过 FIPS 140-2 验证的软件解决方案。

vSAN 为终端用户提供更加一致的应用体验,同时具备智能的自我修复功能,包括自适应重新同步和副本整合。自适应重新同步功能能够以智能方式管理 IO 流量,以尽可能在执行重新同步操作期间不中断应用运行。副本整合功能可缩短主机进入维护模式的时间并减少相关人员的工作量。

延伸集群部署功能通过智能见证流量分离、主站点覆盖和高效的重新同步得到进一步增强。见证流量分离和高效的重新同步可优化每条链路上传输的数据的路径和大小,使应用终端用户的故障转移变得透明。主站点覆盖功能可在站点出现故障时通过更好的逻辑提高工作负载的可用性。

vSAN 现在可通过 Windows Server 故障转移集群 (WSFC) 支持为更多关键任务应用部署提供支持,从而降低这些工作负载的存储管理复杂性,并帮助客户加快实现统一 SDDC 体验的步伐。

主动支持可在基础架构出现问题之前发出警报以提高 vSAN 的可靠性,并通过定期收集数据来缩短被动支持时间。此功能特性需要注册客户体验改进计划。

自适应核心转储支持可自动配置用于加速支持的有价值数据的方向和大小,从而缩短 vSAN 支持时间,解决更多部署类型的问题。

vSAN 现在支持 4Kn 磁盘驱动器、面向未来的 vSAN 部署,并为您创造降低存储总体拥有成本 (TCO) 的机会。

 

 

vSAN 为客户提供的优势及其使用情形

安全发展

安全、集成的超融合解决方案与使用现有管理工具、技能组合和所选硬件平台的 VMware 环境轻松兼容,可将虚拟化无缝延展到存储领域。

降低总体拥有成本 (TCO)

通过将核心数据中心功能整合到种类最丰富的行业标准 x86 硬件以及最成熟的 hypervisor 上,将有限的预算用到刀刃上,并将总体拥有成本降低 50%。

满足未来的规模需要

借助软件定义的基础架构,为迎接未来跨云时代的 IT 需求做好准备。该基础架构利用最新硬件技术,支持新一代应用,是通往云计算的重要阶梯。

 

 

为何选择 vSAN?

 

 

 

vSAN 使用情形

 

 

 

vSAN 客户示例

 

 

启用 vSAN


要使用 vSAN,必须创建一个主机集群,并在集群上启用 vSAN。

一个 vSAN 集群中可以包含具有容量的主机和没有容量的主机。

在创建 vSAN 集群时,请遵循以下指导原则。

启用 vSAN 后,vSAN 存储提供程序将自动在 vCenter Server 中注册,同时也将创建 vSAN 数据存储。


 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

  1. 在 Windows 快速启动任务栏上,单击 Chrome 图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Client 登录屏幕上,选中“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

vSphere Client 主页

 

您将看到 vSphere Client 主页。

要将“Recent Tasks”(近期任务)或“Alarms”(警报)窗格最小化或最大化,请单击相应箭头图标。

如果主页不是显示的初始屏幕,则从 vSphere Client 的顶部菜单中选择“Home”(主页)

  1. 选择“Hosts and Clusters”(主机和集群)

 

 

启用 vSAN

 

在实验室环境中,vSAN 当前处于关闭状态。在本课中,我们将向您展示如何通过几个简单的步骤启用或开启 vSAN。

有关实验室环境的简要说明:集群 RegionA01-COMP01 当前包含 3 台 ESXi 主机,它们将以缓存和容量形式提供存储,从而形成 vSAN 数据存储。

  1. 选择“RegionA01-COMP01”
  2. 选择“Configure”(配置)
  3. 依次选择“vSAN”>“Services”(服务)
  4. 选择“Configure”(配置)

 

 

配置 vSAN

 

作为基本配置的一部分,保留默认选择“Single site cluster”(单一站点集群)

单击“NEXT”(下一步)

 

 

配置 vSAN

 

使用全闪存配置时,您可以选择启用重复数据消除和压缩。我们将在后面的单元中介绍 vSAN 加密

  1. 启用“Deduplication and Compression”(重复数据消除和压缩)
  2. 选择“Allow Reduced Redundancy”(允许缩减的冗余)

选择“Allow Reduced Redundancy”(允许缩减的冗余)后,vSAN 将能够在启用“Deduplication and Compression”(重复数据消除和压缩)期间根据需要降低虚拟机的保护级别。仅当您的设置达到由特定虚拟机的存储策略配置的保护级别限制时,此选项才可用。

单击“NEXT”(下一步)

 

 

按磁盘型号/大小申领磁盘

 

重要提示:我们的每台主机都有 6 个存储设备。在本课中,我们仅为每台主机申领其中的 3 个设备(1 个缓存设备和 2 个容量设备)。

  1. 单击可展开“Cache Device”(缓存设备)视图
  2. 针对每台主机,将一个缓存设备设置为“Do not claim”(不申领)(完成后,每台主机将有 1 个缓存设备)
  3. 单击可最小化“Cache Device”(缓存设备)视图(未显示)

现在,请勿单击“Next”(下一步)。转到此实验室手册的下一步。

 

 

按磁盘型号/大小申领磁盘

 

重要提示:我们的每台主机都有 6 个存储设备。在本课中,我们仅为每台主机申领其中的 3 个设备(1 个缓存设备和 2 个容量设备)。

  1. 单击展开“Capacity Device”(容量设备)视图
  2. 针对每台主机,将两个容量设备设置为“Do not claim”(不申领)
  3. 使用键盘上的向下箭头,对其余两台主机重复执行第 2 步(完成后,每台主机将有 2 个容量设备)

现在,请勿单击“Next”(下一步)。转到此实验室手册的下一步。

 

 

按主机申领磁盘

 

  1. 从“Group by:”(分组依据:)下拉列表中,选择“Host”(主机)

这使您可以从主机角度查看存储。在本练习中,我们将在每台 ESXi 主机上创建一个磁盘组。

磁盘组将包含 1 个 5 GB 缓存磁盘和 2 个 10 GB 容量磁盘。

2. 确认您正在申领 60.00 GB 的容量和 15.00 GB 的缓存,总共 75.00 GB

3. 单击“NEXT”(下一步)

 

 

 

创建故障域

 

我们现在不会创建故障域。默认情况下,每台 ESXi 主机本身就是一个故障域。

  1. 单击“NEXT”(下一步)

 

 

即将完成

 

查看并确认您的选择。

1. 在这里,我们可以确定我们将创建一个包含 60.00 GB 容量和 15.00 GB 缓存的 vSAN 数据存储。

这是一个全闪存 vSAN 集群,其中缓存和容量磁盘均为固态硬盘/闪存磁盘。

2. 单击“FINISH”(完成)

 

 

监控进度

 

  1. 选择左下角的“Recent Tasks”(近期任务)
  2. 通过下拉选择器选择“Running”(正在运行)
  3. 最小化“Recent Tasks”(近期任务)视图(未显示)

监控进度直到所有任务完成

 

 

vSAN 已启用

 

配置流程完成后,

  1. 选择“Configure”(配置)
  2. 依次选择“vSAN”>“Services”(服务)

集群可能需要几分钟才能完成所有更新,在 vSAN 稳定之前您可能会看到 vCenter 中的一些警报。

之后,您会发现运行状况服务和性能服务已默认启用。

 

 

总结

启用 vSAN 会创建 vSAN 数据存储并注册 vSAN 存储提供程序。vSAN 存储提供程序是内置的软件组件,用于将数据存储的存储功能传递给 vCenter Server。

 

vSAN 规模设定


在上一节课中,我们启用了实验 vSAN 集群。在环境中启用 vSAN 之前,您如何确定根据必要的计算、内存和本地存储正确设定 vSAN 集群规模的方式?在本部分中,我们将探讨如何利用由 Live Optics 提供支持的 HCI 评估来捕获性能指标,然后将这些指标输入我们的 vSAN Online Sizer,从而提出 vSAN 内部版本建议。有了这些内部版本信息,您就可以通过我们的《VMware vSAN 兼容性指南》自由选择最符合您标准的 vSAN Ready Node 供应商。 


 

基于 Live Optics 的 HCI 评估

 

Live Optics 是一款业界广泛采用的工具,用于捕获工作负载指标,使客户能够评估他们当前的环境。VMware HCI 评估将捕获设计 HCI 解决方案以及设定其规模所需的指标,并让您能够将数据转换为 vSAN ReadyNode Sizer,从而构建自定义 vSAN 解决方案。

在接下来几页中,我们将了解 Live Optics 的实际研究结果,然后将这些信息输入到 ReadNode Sizer,以提出 vSAN 内部版本建议。请注意,进行 VMware HCI 评估不需要任何财务费用。

 

 

环境视图

 

“Environment”(环境)视图显示需要考虑的重要高级特征,例如:

  1. 在 95% 的情况下,IOPS 为 10,790
  2. 容量信息(已用容量、可用容量和总容量)

还会显示其他高级指标(CPU、内存、网络等)

 

 

性能视图

 

进一步深入了解,我们可以查看:

  1. “Read/Write Ratios”(读/写比率)(这些数据尤为重要,因为它们可以帮助我们正确设定 vSAN 缓存层的大小)。

 

 

Hypervisor

 

Live Optics 还会提供其他有用信息,例如客户虚拟机总数、虚拟 CPU 总数、已调配与已使用的客户虚拟机内存总量、已调配的客户虚拟机磁盘空间总量、每台客户虚拟机的平均虚拟 CPU 数、每台客户虚拟机的平均已用内存量、虚拟 CPU 与 Server Core 的比率等。

 

 

虚拟机信息

 

Live Optics 还可以捕获单独的虚拟机信息,这些信息可帮助我们制定 vSAN 内部版本决策。

让我们将收集的 Live Optics 数据输入到在线 vSAN ReadyNode Sizer,然后提出 vSAN 建议!

 

动手实验交互式模拟:vSAN 规模设定


本部分的实验以动手实验交互式模拟的形式呈现。这样,您便可以在实验环境中实际体验需要消耗大量时间或资源的步骤。在此模拟中,您可以像与实际环境进行交互一样使用软件界面。

橙色框显示单击位置,您也可以使用向左和向右箭头键以左右两个方向进行模拟。

  1. 单击此处打开交互式模拟。它将在新的浏览器窗口或标签页中打开。
  2. 完成后,单击“Return to the lab”(返回实验)链接以继续本实验。

实验将继续在后台运行。如果实验进入待机模式,您可以在完成本单元后将其恢复。


总结


在本单元中,我们向您展示了如何通过几次单击启用 vSAN。此外,我们还查看了 vSAN 6.7 的新功能特性,包括客户使用情形。


 

您已完成第 1 单元的学习

祝贺您!您已经完成了第 1 单元的学习。

如果您想了解有关该主题的其他信息,请查看以下内容:

继续学习以下您最感兴趣的任意一个未完成单元。

第 2 单元将演示如何利用 vCenter 和 vRealize Operations Manager 监控 vSAN 环境的运行状况、容量和性能。

第 3 单元将介绍如何在 vSAN 集群上执行后续活动,例如使用 Storage Policy-Based Management、确定维护模式选项以及添加更多容量。

第 4 单元将讨论 vSAN 故障域、配备 vSAN Stretched Cluster 的双活数据中心以及 vSAN 灾难恢复场景。

第 5 单元将说明如何利用 vRealize Log Insight 查看集中式 vSAN 日志、vSAN iSCSI 集成和 vSAN CLI 界面。

第 6 单元将讨论 vSAN 安全参数,例如 FIPS 104-2 验证和 vSAN 静态数据加密。

 

 

如何结束实验

 

要结束实验,请单击“END”(结束)按钮。

 

第 2 单元 - 监控 vSAN 6.7 的运行状况、容量和性能(45 分钟)

简介


启用 vSAN 数据存储的一个重要方面是验证环境的运行状况。vSAN 具有超过一百个即时可用的运行状况检查,不仅可以验证初始运行状况,还可以报告日常运行时运行状况。vSAN 6.7 引入了令人振奋的新方法,可通过 vCenter 内的 vRealize Operations 监控集群的运行状况、容量和性能,所有这些操作都在 VI 管理员当前使用的用户界面内执行。


启用 vCenter 内的 vRealize Operations


在我们的实验环境中启用 vRealize Operations for vCenter 大约需要 30 分钟。

在后续步骤中,我们将要求您完成启用 vRealize Operations for vCenter 所需的步骤,我们稍后会在本单元中返回该产品。


 

实验准备

我们将使用 Module Switcher PowerCLI 应用来准备环境。

 

 

Module Switcher

 

双击名为“HOL-1908 HCI”的 Module Switcher 桌面快捷方式

 

 

第 2 单元启动

 

  1. 单击第 2 单元对应的“Start”(启动)按钮

完成此启动例程可能需要几分钟,感谢您耐心等待!

 

 

监控进度

 

监控进度直到完成。

  • Enter 键继续(并关闭 PowerCLI 窗口)

 

 

实验准备完成

 

第 2 单元的实验已成功准备完毕!

1. 单击关闭图标,安全地停止 Module Switcher

请注意:您不能“返回”并启动目前所在单元之前的单元,除非您结束实验并重新启动(例如:如果您从第 4 单元开始,则不能使用 Module Switcher 启动第 1、第 2 或第 3 单元实验)。

 

 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

  1. 在 Windows 快速启动任务栏上,单击 Chrome 图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Client 登录屏幕上,选中“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

vRealize Operations

 

  1. 选择“Menu”(菜单)
  2. 单击“vRealize Operations”

请注意,您会收到一条消息,指出 vRealize Operations 不存在。接下来,我们将更正该状况。

 

 

配置现有实例

 

  1. 滚动
  2. 单击“Configure Existing Instance”(配置现有实例)

注意,您可以选择安装新的 vRealize Operations 实例或配置现有实例。我们的实验中已经安装了 vRealize Operations,这是我们将关联的实例。

 

 

实例详细信息

 

  1. 输入参数:
INSTANCE FQDN:vrops-01a.corp.local
USERNAME:admin
PASSWORD:VMware1!

2. 选择“Test Connection”(测试连接)验证凭证(如有必要,请重新输入)

3. 单击“Next”(下一步)

 

 

vCenter 详细信息

 

  1. 输入参数:
INSTANCE FQDN:vcsa-01a.corp.local
USERNAME:administrator@corp.local
PASSWORD:VMware1!

2. 选择“Test Connection”(测试连接)验证凭证(如有必要,请重新输入)

3. 单击“Next”(下一步)

 

 

摘要

 

  1. 单击“Configure”(配置)

我们的实验需要几分钟才能完成配置。在等待的同时,我们先来查看一下 vSAN 运行状况以及 vCenter 容量和性能监控,然后再使用 vRealize Operations for vCenter。

 

vSAN 运行状况检查验证


监控 vSAN 环境的方法之一是执行 vSAN 运行状况检查。

vSAN 运行状况将对 vSAN 环境执行全面的运行状况检查以确认其运行正常,并将在发现不一致的情况下向您发出警报并提供修复问题的选项。


 

vSAN 运行状况检查

将各条命令从一台主机运行到集群中的所有其他主机既单调乏味又浪费时间。幸运的是,自 vSAN 6.0 推出以来,vSAN 便拥有一个运行状况检查系统,该系统的一部分会测试集群中所有主机之间的网络连接。设置任意 vSAN 集群之后,要进行的首要任务之一是执行 vSAN 运行状况检查。这会减少检测和解决任何网络连接问题或集群中的任何其他 vSAN 问题所用的时间。

 

 

执行运行状况检查以验证 vSAN 功能

 

要执行 vSAN 运行状况检查,请执行以下操作

  1. 选择名为“RegionA01-COMP01”的 vSAN 集群
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Health”(运行状况)

您将看到可以执行的运行状况检查类别及其状态

  1. 随时可单击“RETEST”(重新测试)按钮以运行测试。

注意,某些运行状况检查处于警告状态。这是因为我们在嵌套虚拟化环境中运行 vSAN 集群。

 

 

网络运行状况检查

 

查看可以从 vSAN 运行状况类别中运行的各个测试。

  1. 展开“Network”(网络)运行状况类别。

 

 

 

获取有关网络运行状况检查的详细信息

 

要获取有关运行状况检查项的更多信息,请选择相应的检查,并查看右侧的详细信息窗格,获取有关如何解决问题的信息。

  1. 选择“All hosts have matching subnets”(所有主机均有匹配的子网)

这里会提供有关所执行的运行状况检查的详细信息和结果,在本例中,我们可以看到 vSAN 集群中的所有 ESXi 主机均有匹配的子网。

 

 

引发 vSAN 运行状况检查故障

 

我们现在引发 vSAN 运行状况检查故障,以测试运行状况检查。

  1. 右键单击名为“esx-01a.corp.local”的 ESXi 主机
  2. 选择“Connection”(连接)
  3. 选择“Disconnect”(断开连接)

回答“OK”(确定)断开所选主机的连接。

 

 

引发 vSAN 运行状况检查故障

 

让我们返回 vSAN 运行状况检查

  1. 选择名为“RegionA01-COMP01”的 vSAN 集群
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Health”(运行状况)

在这里,我们将看到出现故障的 vSAN 网络运行状况检查(如果您没有看到此警报,则单击右上角的“RETEST”[重新测试])。

 

 

引发 vSAN 运行状况检查故障

 

  1. 单击“Hosts Disconnected from VC”(主机与 VC 断开连接)获取更多信息

在这里,我们可以看到名为“esxi-01a.corp.local”的 ESXi 主机显示为“Disconnected”(断开连接)

 

 

引发 vSAN 运行状况检查故障

 

“Info”(信息)选项卡下的每个详细信息视图都在适当的地方包含一个“Ask VMware”(询问 VMware)按钮,此按钮可将您转到 VMware 知识库文章,该文章给出了问题的详细信息,以及如何排除故障并解决问题。

  1. 选择“Info”(信息)  

 

 

解决 vSAN 运行状况检查故障

 

我们现在解决 vSAN 运行状况检查故障。

  1. 右键单击名为“esx-01a.corp.local”的 ESXi 主机
  2. 选择“Connection”(连接)
  3. 选择“Connect”(连接)

回答“OK”(确定)以重新连接所选主机。

 

 

解决 vSAN 运行状况检查故障

 

让我们返回 vSAN 运行状况检查

  1. 选择名为“RegionA01-COMP01”的 vSAN 集群
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Health”(运行状况)
  4. vSAN 集群中的所有 ESXi 主机均已连接,因此“Hosts disconnect from VC”(主机与 VC 断开连接)测试重新通过。

 

 

 

总结

您可以使用 vSAN 运行状况检查监控集群组件的状态、诊断问题以及对问题进行故障排除。运行状况检查包括硬件兼容性、网络配置和运维、高级 vSAN 配置选项、存储设备运行状况和虚拟机对象。

 

监控 vSAN 容量


您可以从 vSphere Client 内的多个位置监控 vSAN 数据存储的容量。首先,您可以选择数据存储视图,然后查看 vSAN 数据存储的“Summary”(摘要)选项卡。您将看到容量、已用空间和可用空间。


 

数据存储视图

 

  1. 选择“Storage”(存储)
  2. 选择“vsanDatastore”
  3. 单击“Summary”(摘要)
  4. 注意已用容量可用容量信息

 

 

容量概述

 

  1. 选择“Hosts and Clusters”(主机和集群)
  2. 选择“RegionA01-COMP01”
  3. 选择“Monitor”(监控)
  4. 向下滚动,然后依次单击“vSAN”和“Capacity”(容量)
  5. 注意“Capacity Overview”(容量概述)和“Deduplication and Compression Overview”(重复数据消除和压缩概述)信息

“容量概述”部分显示 vSAN 数据存储的存储容量,包括已用空间和可用空间。“重复数据消除和压缩概述”部分显示应用空间节省前后的存储使用情况,包括比率指示符。

 

 

已用容量对象类型

 

  1. 向下滚动以查看“Used Capacity Breakdown”(已用容量明细)
  2. 注意“Object types”(对象类型)使用量

这些是可能在 vSAN 数据存储上找到的所有不同对象类型。我们有 VMDK、虚拟机主目录命名空间以及虚拟机交换对象。启用 vSAN 性能日志记录服务后,还会有性能管理对象。此外,还具有与磁盘格式文件系统相关的开销以及校验和开销。其他对象(未显示)是指模板和 ISO 映像等对象,以及不符合上述类别的任何其他对象。

请务必注意,显示的百分比基于当前已用的 vSAN 数据存储空间。随着更多虚拟机存储在 vSAN 内,这些百分比将发生变化(例如,文件系统开销百分比将降低)。

 

 

已用容量数据类型

 

  1. 从“Group by:”(分组依据:)下拉列表中选择“Data Types”(数据类型)
  2. 注意“Data types”(数据类型)使用量

在此视图中,我们可以看到虚拟机数据占比,然后根据策略,我们可以看到用于创建数据副本、见证组件或 RAID-5/RAID-6 奇偶校验组件的容量。

 

 

物理磁盘容量

 

  1. 选择“Physical Disks”(物理磁盘)
  2. 滚动至右侧
  3. 注意“Capacity”(容量)和”Used Capacity“(已用容量)

在这里,我们可以看到每个物理磁盘的已用容量。

 

监控 vSAN 性能


健康的 vSAN 环境就是运行良好的环境。vSAN 包含大量图表,可提供集群、主机、网络适配器、虚拟机和虚拟磁盘级别的性能信息。有许多可查看的数据点,例如 IOPS、吞吐量、延迟、丢包率、写入缓冲区可用百分比、缓存转储速率和拥塞。可修改时间范围以显示最近 1 到 24 小时或自定义日期和时间范围的信息。还可以保存性能数据,以供以后查看。


 

性能服务

使用 vSAN 6.7 时,会在集群级别自动启用性能服务。性能服务负责针对基于 vSAN 的环境收集和显示与集群、主机和虚拟机性能相关的指标。性能服务集成于 ESXi 中、在每台主机上运行,并收集数据库(vSAN 数据存储中的一个对象)中的数据。性能服务数据库存储为一个独立于 vCenter Server 的 vSAN 对象。系统会向该对象分配一个存储策略,以控制它的空间使用和可用性。当该对象变得不可用时,将无法查看集群的性能历史记录,直到该对象恢复为可访问时为止。

性能指标将存储 90 天,并且每隔 5 分钟捕获一次。

 

 

验证性能服务

 

  1. 选择“RegionA01-COMP01”
  2. 选择“Configure”(配置)
  3. 依次选择“vSAN”和“Services”(服务)
  4. 选择“Performance Service”(性能服务)
  5. 注意,性能统计信息数据库对象报告为“Healthy”(运行状况良好)
  6. 注意,统计信息数据库使用“vSAN Default Storage Policy”(vSAN 默认存储策略)(RAID-1、容许的故障数 = 1)并报告“Compliant”(合规)状态

接下来,我们在集群、主机和虚拟机级别查看各种性能视图。

 

 

集群性能

 

  1. 选择“RegionA01-COMP01”
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”和“Performance”(性能)
  4. 注意,我们可以选择在集群级别查看“VM”(虚拟机)、“Backend”(后端)和“iSCSI”性能视图(如果需要,您还可以自定义“Time Range”[时间范围])
  5. 向下滚动以查看收集的各种指标(IOPS吞吐量延迟等)

“前端”虚拟机流量定义为虚拟机自身生成的存储流量类型(它们请求的读取内容以及它们提交的写入内容)。“后端”vSAN 流量涵盖副本流量((I/O,旨在使数据冗余/高度可用),以及同步流量。这两种流量类型均发生在每台 vSphere 主机的专用 vSAN VMkernel 接口上。

 

 

主机性能

 

  1. 选择“esx-01a.corp.local”
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”和“Performance”(性能)
  4. 注意,我们可以选择在主机级别查看“VM”(虚拟机)、“Backend”(后端)、“Disks”(磁盘)、“Physical Adapters”(物理适配器)、“Host Network”(主机网络)和“iSCSI”性能视图(如有需要,您还可以自定义“Time Range”[时间范围])
  5. 向下滚动以查看收集的各种指标(IOPS吞吐量延迟等)

在此视图中,我们可以在主机级别与集群级别查看更多性能相关指标。请随意查看第 4 步中指出的各个类别,大致了解可用信息。

 

 

虚拟机性能

 

  1. 选择“vSAN-VM”
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”和“Performance”(性能)
  4. 注意,我们可以选择在虚拟机级别查看“VM”(虚拟机)和“Virtual Disk”(虚拟磁盘)性能视图(如果需要,您还可以自定义“Time Range”[时间范围])
  5. 向下滚动以查看收集的各种指标(IOPS吞吐量延迟等)

接下来,我们将查看可通过新内置的 vRealize Operations for vCenter 仪表盘访问的 vSAN 信息,以及可在 vRealize Operations 本身内访问的 vSAN 信息。

 

通过 vCenter 内的 vRealize Operations 进行监控


vSphere 和 vSAN 6.7 现在包含 vCenter 内的 vRealize Operations。借助这一新功能,vSphere 客户可通过单一 vCenter 用户界面查看 vRealize Operations (vR Ops) 提供的部分智能信息。vSphere 和 vSAN 均包含轻量级专用仪表盘。易于部署、提供多集群可见性,并且不需要任何其他许可。


 

Chrome 浏览器缩放

 

在我们的 VMware Learning Platform(实验)环境中,我们的屏幕空间有限 (1024x768)。现在我们来减少 Chrome 浏览器缩放比例,以便在屏幕上查看更多内容:

  1. 选择 Chrome 浏览器右上角的垂直省略号
  2. 单击“-”符号将“Zoom”(缩放)减少到“80%”

 

 

vRealize Operations

 

  1. 选择“Menu”(菜单)
  2. 单击“vRealize Operations”

 

 

集成式仪表盘

 

我们有三个用于 vSphere/vCenter 的仪表盘,以及三个专门为 vSAN 构建的仪表盘。这些仪表盘不会替换完整 vR Ops 产品中的仪表盘,而是直接在 vCenter 内放置一部分最重要的信息,从而实现一个统一的可见性窗格。这些仪表盘包含旨在保持清晰度和简易性的小部件,并且与完整的 vR Ops UI 不同,它只提供极少量的自定义选项。“vCenter Overview”(vCenter 概述)仪表盘提供一个聚合视图,显示整个 vCenter 内代管的集群的活动和状态。

让我们来查看一下 vSAN 仪表盘:

  1. 选择“Quick Links”(快速链接)
  2. 依次单击“vSAN”和“Overview”(概述)

注意:如果您收到“您没有任何 vSAN 集群”或“很遗憾,您没有配置集群!”之类的消息,这是因为 vR Ops for vCenter 尚未全面配置,您需要等待更长时间才能完成此过程。感谢您耐心等待。

 

 

vSAN 概述

 

“vSAN Overview”(vSAN 概述)仪表盘提供集群活动和状态的聚合视图,但仅针对运行 vSAN 的集群。管理员可以查看主机、虚拟机、警报、容量、性能指标等方面的汇总统计信息。

  1. 注意,所有 vSAN 集群的信息都聚合在顶部显示面板中
  2. 向下滚动以查看显示的其他仪表盘信息

接下来,我们将查看“Cluster View”(集群视图)仪表盘

 

 

快速链接

 

  1. 选择“Quick Links”(快速链接)
  2. 依次单击“vSAN”和“Cluster View”(集群视图)

 

 

vSAN 集群视图

 

vSAN 集群视图仪表盘提供特定于所选 vSAN 集群的更多详细信息。

  1. 注意,您可以通过“Change Cluster”(更改集群)下拉菜单选择其他 vSAN 集群(我们的实验环境仅包含一个 vSAN 集群)
  2. 向下滚动以查看 vSAN 相关指标,例如所选集群的剩余容量、组件限制、IOPS、吞吐量读取/写入延迟

接下来,了解一下 vCenter 内的 vRealize Operations 中最后一个 vSAN 相关仪表盘。

 

 

快速链接

 

  1. 选择“Quick Links”(快速链接)
  2. 依次单击“vSAN”和“Alerts”(警报)

 

 

警报列表

 

  1. 警报列表将显示严重警报、紧急警报、警告和信息警报(如果需要,可进一步详细查看这些警报)。

注意:实验中的问题可能与屏幕截图中显示的问题不同。

在本单元的最后一节课中,我们将直接登录 vRealize Operations 来查看可用的 vSAN 相关仪表盘。

 

 

快速链接

 

  1. 选择“Quick Links”(快速链接)
  2. 单击“Open vRealize Operations”(打开 vRealize Operations)

 

 

登录

 

  1. 输入参数:
admin
VMware1!

2. 单击“LOG IN”(登录)

 

 

vRealize Operations 概述

vSAN 集成现已完全内置到 vRealize Operations 6.6 及更高版本中,这意味着 vSphere 的相同级别监控和分析可轻松延展到 vSAN 中。vSAN 中的 API 得到了显著增强,允许 vR Ops 直接从 vSAN 获取数据。这为 vR Ops 提供了更详细的信息,以进行分析并使其可见。vR Ops 即时可用并提供以下功能:

  • 四个预构建的 vSAN 仪表盘,具有多集群可见性和分析功能。
  • 仪表盘同时显示 vSAN 指标和非 vSAN 指标,以说明各种资源之间的关键相关性。
  • 原生集成到 vR Ops 意味着无需安装其他管理包。
  • 仪表盘可克隆,并且可完全自定义。

vRealize Operations 使用 vSAN 的一组增强型 API 来获取 vSAN 运行状况和性能服务收集的数据。vSAN 运行状况和性能服务已引入 vSAN 6.2 中,使 vSAN 管理员能够直接在 vCenter 中查看 vSAN 的基本性能指标。与其他指标不同,vSAN 性能指标并不存储在 vCenter 中。它作为驻留在 vSAN 数据存储上的对象来存放。随着 vSAN 的每个后续版本推出,性能服务中已公开其他指标。但是,性能服务中的指标不可自定义,并且对可查看数据的时段有限制(1 小时到 24 小时),保留时间也有限制(90 天)。vR Ops 可获取此 vSAN 性能数据,并在数据操作和保留方面为用户提供更高灵活性。vR Ops 需要启用 vSAN 运行状况和性能服务,才能正确收集 vSAN 相关指标。

 

 

仪表盘

 

  1. 选择“Home”(主页)下拉菜单
  2. 单击“Dashboards”(仪表盘)

 

 

所有仪表盘

 

vRealize Operations 按活动类型轻松对即时可用的仪表盘进行分组,包括“Operations”(运维)、“Capacity & Utilization”(容量和利用率)以及“Performance Troubleshooting”(性能故障排除)。  

我们先来查看 vSAN 运维:

  1. 选择“Dashboards”(仪表盘)
  2. 选择“All Dashboards”(所有仪表盘)下拉菜单
  3. 将鼠标悬停在“Operations”(运维)
  4. 单击“vSAN Operations Overview”(vSAN 运维概述)

 

 

vSAN 运维概述

 

“vSAN Operations Overview”(vSAN 运维概述)仪表盘旨在概要介绍环境中一个或多个基于 vSAN 的集群的状态。借助此仪表盘,管理员可以查看聚合集群统计信息以及特定于集群的衡量指标。此仪表盘不仅包含存储的一些关键指标(如 IOPS、吞吐量和延迟),还提供其他有助于集群实现良好运行状况和健康状况的衡量指标(如主机数、CPU 和内存利用率以及警报量)。

  1. 单击“<<”V 形图标释放更多屏幕空间
  2. 向下滚动可查看更多信息

 

 

 

所有仪表盘

 

 

  1. 选择“All Dashboards”(所有仪表盘)下拉菜单
  2. 将鼠标悬停在“Capacity & Utilization”(容量和利用率)
  3. 单击“vSAN Capacity Overview”(vSAN 容量概述)

 

 

vSAN 容量概述

 

“vSAN Capacity Overview”(vSAN 容量概述)仪表盘提供大量 vSAN 容量信息,而 vCenter 中的时间点存储容量统计信息中未提供这些信息。此仪表盘利用 vR Ops 在一段时间内捕获容量利用率的功能,提供对过去容量使用趋势的广泛洞察信息。容量不仅与存储资源的使用相关,还与 CPU 和内存容量相关。此仪表盘显示一个关于 vSAN 集群中剩余 CPU 和内存容量的窗口。结合查看这些数据和存储使用率数据,管理员可以更好地了解纵向扩展(向每台主机添加更多存储)或横向扩展(添加更多主机)是否为适用于环境的最佳方法。

  1. 向下滚动可查看更多信息

 

 

 

所有仪表盘

 

 

  1. 选择“All Dashboards”(所有仪表盘)下拉菜单
  2. 将鼠标悬停在“Performance Troubleshooting”(性能故障排除)
  3. 单击“Troubleshoot vSAN”(vSAN 故障排除)

 

 

vSAN 故障排除

 

“Troubleshoot vSAN”(vSAN 故障排除)仪表盘汇集了一系列警报、指标和趋势结果,可帮助确定环境中发生变化的原因以及发生变化的时间。它以系统化的分层方法汇集这些内容,从而协助对环境进行故障排除和根本原因分析。

该仪表盘以小组件开始,显示所选集群的所有活动警报,并识别发出警报的主机。此外还显示了集群级别的关键绩效指标。突出显示所需集群将展示集群相关资源(CPU 工作负载、内存工作负载、剩余容量等)在过去 12 个小时内的趋势。虚拟机读写延迟小组件显示过去 24 小时的存储性能历史记录。

  1. 向下滚动可查看更多信息

 

 

 

vSAN 故障排除(续)

 

  1. 单击向下 V 形图标可展开“Capacity Disks”(容量磁盘)

 

 

 

vSAN 故障排除(续)

 

  1. 将鼠标悬停在“Capacity Disks”(容量磁盘)工具栏上,然后单击显示工具栏图标
  2. 展开“1-Bus Resets”(1-总线重置)下拉菜单

“Troubleshoot vSAN”(vSAN 故障排除)仪表盘还会查看所选 vSAN 集群的缓存与容量磁盘的运行状况和性能。借助这些小部件,您可以从七种定义的数据类型中选择一种,然后在热图中呈现活动量。可查看的数据类型包括总线重置、每秒中止的命令以及五种 SMART 数据衡量指标。

 

 

 

所有仪表盘

 

 

  1. 选择“All Dashboards”(所有仪表盘)下拉菜单
  2. 将鼠标悬停在“Operations”(运维)
  3. 单击“Migrate to vSAN”(迁移到 vSAN)

 

 

迁移到 vSAN

 

“Migrate to vSAN”(迁移到 vSAN)仪表盘旨在协助执行迁移到 vSAN 的工作。该仪表盘提供在数据存储(在传统存储上运行)上运行的虚拟机与由 vSAN 提供支持的虚拟机的关键存储指标的对比情况。该仪表盘会识别过渡到新存储系统时可能发生的分阶段方法,旨在监控过渡过程中最重要的方面:应用或虚拟机看到的存储系统之间的有效性能行为。

虽然每台虚拟机的工作负载都是独特的,并非其他虚拟机工作负载的按时刻精确镜像,但您可以有效地对比类似的系统。例如,应用服务器群(如 SQL 集群、ERP 系统、SharePoint 服务器或其他一些多层应用)使用虚拟机集群提供后端、中间层或前端服务。这些示例中的任何一个都是理想的对比场景,因为应用服务器群中的一个系统可以迁移到 vSAN,并与在传统存储上运行的类似系统进行比较。

  1. 注意,我们的实验中有一个非 vSAN 数据存储(freeNAS 设备:RegionA01-ISCSI01-...
  2. 向下滚动以比较非 vSAN 虚拟机 IOPS 和延迟与 vSAN 虚拟机 IOPS 和延迟
  • 非 vSAN 虚拟机小组件将显示在传统数据存储上运行的所选虚拟机的虚拟磁盘 IOPS、读取延迟和写入延迟的聚合信息。vSAN 虚拟机小组件将显示在基于 vSAN 的数据存储上运行的所选虚拟机的相同指标。
  • 凭借强大的自定义功能,您可能想要简化此仪表盘。简化后,您便可以将屏幕上的更大空间用于显示关键指标,还可以简化运维或缩短观察时段。

 

总结


在本单元中,我们向您展示了如何验证 vSAN 运行状况、监控 vSAN 容量和性能以及使用 vRealize Operations for vCenter 和 vRealize Operations 仪表盘。


 

您已完成第 2 单元的学习

祝贺您!您已经完成了第 2 单元的学习。

如果您想了解有关该主题的其他信息,请查看以下内容:

继续学习以下您最感兴趣的任意一个未完成单元。

第 3 单元将介绍如何在 vSAN 集群上执行后续活动,例如使用 Storage Policy-Based Management、确定维护模式选项以及添加更多容量。

第 4 单元将讨论 vSAN 故障域、配备 vSAN Stretched Cluster 的双活数据中心以及 vSAN 灾难恢复场景。

第 5 单元将说明如何利用 vRealize Log Insight 查看集中式 vSAN 日志、vSAN iSCSI 集成和 vSAN CLI 界面。

第 6 单元将讨论 vSAN 安全参数,例如 FIPS 104-2 验证和 vSAN 静态数据加密。

 

 

如何结束实验

 

要结束实验,请单击“END”(结束)按钮。

 

第 3 单元 - vSAN 6.7 后续运维(30 分钟)

简介


成功启用 vSAN 集群后会发生什么? 

现在,是时候开始了解如何使用基于存储策略的管理的后续功能,以及执行维护活动、增加更多容量和更新 vSAN 时可能会发生的情况了。


增加 vSAN 容量


vSAN 简单易用的横向扩展特性确实是一项不错的功能特性。如果您需要集群中有更多计算或存储资源,只需将另一台主机添加到集群即可。


 

实验准备

如果您已经完成之前单元中的所列步骤并结束了实验,则可以跳过用以准备本课程环境的下列步骤。

单击以进入课程。

如果您跳至本单元,我们将使用 Module Switcher PowerCLI 应用来准备环境。

 

 

Module Switcher

 

双击名为“HOL-1908 HCI”的 Module Switcher 桌面快捷方式

 

 

第 3 单元启动

 

  1. 单击第 3 单元对应的“Start”(启动)按钮

完成此启动例程可能需要几分钟,感谢您耐心等待!

 

 

监控进度

 

监控进度直到完成。

  • Enter 键继续(并关闭 PowerCLI 窗口)

 

 

实验准备完成

 

第 3 单元的实验已成功准备完毕!

1. 单击关闭图标,安全地停止 Module Switcher

请注意:您不能“返回”并启动目前所在单元之前的单元,除非您结束实验并重新启动(例如:如果您从第 4 单元开始,则不能使用 Module Switcher 启动第 1、第 2 或第 3 单元实验)。

 

 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

  1. 在 Windows 快速启动任务栏上,单击 Chrome 图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Client 登录屏幕上,选中“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

查看默认的存储策略

 

  1. 从 vSphere Client 的“Menu”(菜单)页面
  2. 选择“Hosts and Clusters”(主机和集群)

 

 

实验环境检查 - 容量

 

我们现在查看集群容量情况。

  1. 选择名为“RegionA01-COMP01”的 vSAN 集群
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Capacity”(容量)

vSAN 数据存储的大小约为 59.98 GB,其中可用容量约为 54.16 GB。

 

 

实验环境检查 - 计算

 

我们现在查看集群的当前情况。

目前,集群中有三台主机,在集群外还有其他主机。

  1. 选择名为“esx-04a.corp.local”的 ESXi 主机
  2. 选择“Configure”(配置)
  3. 依次选择“Storage”(存储)>“Storage Devices”(存储设备)

在 ESXi 主机上,您可以看到我们有一些设备可用于扩展 vSAN 数据存储(有多个 5 GB 闪存和 10 GB 闪存设备)。

 

 

 

向集群添加更多节点

 

现在,我们打算将“esx-04a.corp.local”添加到 vSAN 集群。

将“esx-04a.corp.local”拖放到“RegionA01-COMP01”集群中

如果拖放操作无效,右键单击名为“esx-04a.corp.local”的 ESXi 主机,然后选择“Move to...”(移至...)。选择名为“RegionA01-COMP01”的集群。

 

 

将主机移入集群

 

  1. 如果系统出现提示,则单击“OK”(确定)

 

 

让主机退出维护模式

 

ESXi 主机仍处于维护模式。

  1. 右键单击名为“esx-04a.corp.local”的 ESXi 主机
  2. 选择“Maintenance Mode”(维护模式)
  3. 选择“Exit Maintenance Mode”(退出维护模式)

如果“Exit Maintenance Mode”(退出维护模式)选项不可用,请刷新 vSphere Client 并重新操作。

 

 

配置 vSAN 网络连接

 

现在主机已退出维护模式,我们可以在“Summary”(摘要)屏幕上看到一些信息消息。

  1. 选择名为“esx-04a.corp.local”的 ESXi 主机
  2. 选择“Summary”(摘要)

这些消息告诉我们,vSAN 集群中的主机无法通过 vSAN 网络相互通信。

 

 

配置 vSAN 网络连接

 

我们来查看一下 ESXi 主机上网络连接的当前状态。

  1. 选择名为“esx-04a.corp.local”的 ESXi 主机
  2. 选择“Configure”(配置)
  3. 依次选择“Networking”(网络连接)>“VMkernel adapters”(VMkernel 适配器)

共配置了 3 个 VMkernel 适配器:一个用于管理流量,一个用于传统存储流量,一个用于 vMotion 流量。

现在,我们将为这台主机的 vSAN 网络流量配置 VMkernel 适配器。

  1. 选择“Add Networking”(添加网络连接)

 

 

配置 vSAN 网络连接

 

  1. 选择“VMkernel Network Adapter”(VMkernel 网络适配器)

单击“NEXT”(下一步)

 

 

配置 vSAN 网络连接

 

  1. 单击“Browse”(浏览)按钮
  2. 选择名为“vSAN-RegionA01-vDS-COMP”的 VMkernel 适配器

单击“NEXT”(下一步)

 

 

配置 vSAN 网络连接

 

  1. 启用“vSAN”服务

单击“NEXT”(下一步)

 

 

配置 vSAN 网络连接

 

  1. 选择“Use static IPv4 settings”(使用静态 IPv4 设置)

针对网络配置输入以下信息:

IPv4 address(IPv4 地址):192.168.130.54
Subnet mask(子网掩码):255.255.255.0
Override defaultgateway for this adapter(覆盖该适配器的默认网关):启用
Default gateway(默认网关):192.168.130.1

单击“NEXT”(下一步)

 

 

配置 vSAN 网络连接

 

查看配置设置

单击“FINISH”(完成)

 

 

验证 vSAN 网络连接

 

选择名为“vSAN-RegionA01-vDS-COMP”的 VMkernel 适配器

查看 VMkernel 适配器的属性。

稍后,警报应该会从主机上消失。

 

 

在新的主机上创建磁盘组

 

现在网络连接已配置完毕,我们将使用 ESXi 主机上的本地存储扩展 vSAN 数据存储。

  1. 选择名为“RegionA01-COMP01”的 vSAN 集群
  2. 选择“Configure”(配置)
  3. 依次选择“vSAN”>“Disk Management”(磁盘管理)
  4. 选择“esx-04a.corp.local”(不要直接单击主机名超链接,而是单击名称旁边的位置)

名为“esx-04a.corp.local”的 ESXi 主机现在是 vSAN 集群的一部分,但尚未向磁盘组提供任何存储。

  1. 单击“Create a new Disk Group”(创建新磁盘组)

 

 

在新的主机上创建磁盘组

 

与之前一样,我们选择一个闪存设备作为缓存磁盘,以及三个闪存设备作为容量磁盘。这样,集群中的所有主机都将保持统一配置。

  1. 缓存层选择一个 5 GB 闪存驱动器
  2. 容量层选择 2 个 10 GB 闪存

单击“CREATE”(创建)

 

 

在新的主机上验证磁盘组

 

创建磁盘组后,应重新访问磁盘管理视图,

验证以下内容:

  1. vSAN 运行状况状态良好
  2. 所有磁盘组均在同一网络分区组中
  3. 所有磁盘组上的磁盘格式版本均相同

 

 

确认新的 vSAN 数据存储容量

 

最后一步是确保 vSAN 数据存储现在随着刚添加到第四台主机的磁盘组中容量设备的增加而增长。返回“Capacity”(容量)视图,查看总容量和可用容量字段。

  1. 选择名为“RegionA01-COMP01”的 vSAN 集群
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Capacity”(容量)

vSAN 数据存储现已扩展到约 79.98 GB,其中可用容量约为 72.24 GB。

 

 

总结

在本单元中,我们向您展示了如何通过添加更多 ESXi 主机来扩展 vSAN 集群的容量。

虽然仅限计算的主机可以存在于 vSAN 环境中,并可使用集群中其他主机提供的容量,但请添加统一配置的主机以实现平稳运行。为获得最佳效果,请添加已配置缓存和容量设备的主机。

 

基于存储策略的管理


作为抽象层,SPBM 可对 Virtual Volumes、vSAN、I/O 筛选器或其他存储实体提供的存储服务进行抽象处理。

多个合作伙伴和供应商可以提供 Virtual Volumes、vSAN 或 I/O 筛选器支持。SPBM 不是与每个单独的供应商或单一类型的存储和数据服务集成,而是为许多类型的存储实体提供一个通用框架。

SPBM 提供以下机制:

  • 存储阵列和其他实体(如 I/O 筛选器)提供的存储功能和数据服务的通告。
  • 在分别位于两端的 ESXi 和 vCenter Server 与存储阵列和实体间的双向通信。
  • 基于虚拟机存储策略的虚拟机调配。

 

查看默认存储策略

vSAN 要求为 vSAN 数据存储上部署的虚拟机至少分配一个存储策略。在调配虚拟机时,如果没有为虚拟机明确分配一个存储策略,则会将 vSAN 默认存储策略分配给虚拟机。

默认策略包含 vSAN 规则集和一组基本存储功能,通常用于安置部署在 vSAN 数据存储上的虚拟机。

 

 

vSAN 默认存储策略规范

 

以下特征适用于 vSAN 默认存储策略

  • 如果在调配虚拟机时未分配任何其他的 vSAN 策略,则会将 vSAN 默认存储策略分配给所有虚拟机对象。
  • vSAN 默认策略仅适用于 vSAN 数据存储。您不能将默认存储策略应用于非 vSAN 的数据存储,如 NFS 或 VMFS 数据存储。
  • 您可以克隆默认策略,并将其用作模板来创建用户定义的存储策略。
  • 您不能删除默认策略。

 

 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Client 登录屏幕上,选择“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

查看默认存储策略

 

  1. 在 vSphere Client 的“Menu”(菜单)页面上
  2. 选择“Policies and Profiles”(策略和配置文件)

 

 

查看默认存储策略

 

  1. 选择“VM Storage Policies”(虚拟机存储策略)
  2. 选择名为“vSAN Default Storage Policy”(vSAN 默认存储策略)的虚拟机存储策略。
  3. 选择“Rules”(规则)

系统会显示存储策略的默认规则。

 

 

查看默认存储策略

 

  1. 选择名为“vSAN Default Storage Policy”(vSAN 默认存储策略)的虚拟机存储策略。
  2. 选择“Storage Compatibility”(存储兼容性)

在此,我们可以看到“vsanDatastore”(vSAN 数据存储)与此存储策略兼容。

 

 

使用默认策略部署虚拟机

 

现在,我们将克隆虚拟机并应用默认存储策略

  1. 选择“Menu”(菜单)
  2. 选择“Hosts and Clusters”(主机和集群)

 

 

使用默认策略部署虚拟机

 

我们将名为 CORE-A(当前驻留在本地 VMFS 数据存储上)的虚拟机克隆到 vSAN 数据存储,并应用默认存储策略。

  1. 展开名为“esx-07a.corp.local”的 ESXI 主机,然后右键单击名为“CORE-A”的虚拟机
  2. 选择“Clone”(克隆)
  3. 选择“Clone to Virtual Machine”(克隆到虚拟机)

 

 

使用默认策略部署虚拟机

 

为虚拟机命名:

vSAN 默认存储策略

单击“NEXT”(下一步)

 

 

使用默认策略部署虚拟机

 

  1. 展开名为“RegionA01-COMP01”的计算资源
  2. 选择名为“esx-01a.corp.local”的 ESXi 主机

单击“NEXT”(下一步)

 

 

使用默认策略部署虚拟机

 

1. 对于虚拟机存储策略,选择“vSAN Default Storage Policy”(vSAN 默认存储策略)

系统将显示最终的可兼容数据存储列表,在我们的示例中,即“vsanDatastore”(vSAN 数据存储)。在屏幕的下部,我们可看到“vSAN storage consumption would be 200.00 MB disk space and 0.00 B reserved Flash space“(vSAN 存储使用量为 200.00 MB 磁盘空间和 0.00 B 预留闪存空间)。

由于我们具有一台配备 100 MB 磁盘和默认存储策略的虚拟机,因此 vSAN 磁盘使用量将为 200.00 MB。

单击“NEXT”(下一步)

单击”Select clone options“(选择克隆选项)页面上的”NEXT“(下一步)

 

 

使用默认策略部署虚拟机

 

单击“FINISH”(完成)

等待克隆操作完成。

查看“Recent Tasks”(近期任务),了解“Clone virtual machine”(克隆虚拟机)任务是否有状态更新。

 

 

验证虚拟机是否具备默认存储策略

 

在克隆操作完成后,

  1. 选择名为“vSAN Default Storage Policy”(vSAN 默认存储策略)的虚拟机
  2. 选择“Summary”(摘要)
  3. 选择“Related Objects”(相关对象)

此虚拟机现在驻留在“vsanDatastore”(vSAN 数据存储)

  1. 选择“VM Storage Policies”(虚拟机存储策略)

在这里,我们可看到此虚拟机的虚拟机存储策略设置为“vSAN Default Storage Policy”(vSAN 默认存储策略),且策略“compliant”(合规)

 

 

虚拟机磁盘策略

 

  1. 选择名为“vSan Default Storage Policy”(vSAN 默认存储策略)的虚拟机
  2. 选择“Configure”(配置)
  3. 选择“Policies”(策略)
  4. 选择“Hard Disk 1”(硬盘 1)

在这里,我们可以看到应用于“VM Home Object”(虚拟机主目录对象)和“Hard Disk Object”(硬盘对象)的虚拟机存储策略。

 

 

虚拟机磁盘策略

 

1. 选择“RegionA01-COMP01”

2. 选择“Monitor”(监控)

3. 选择“vSAN”>“Virtual Objects”(虚拟对象)

4. 选择“vSAN Default Storage Policy“(vSAN 默认存储策略)>”Hard Disk 1”(硬盘 1)

验证安置和可用性是否“Healthy”(正常),以及是否应用“vSAN Default Storag Policy”(vSAN 默认存储策略)

  1. 单击“View Placement Details”(查看布局详细信息)

 

 

虚拟机磁盘策略

 

在此,我们可以看到硬盘的组件布局。

  1. 有 2 个组件分布在 2 个不同的 ESXi 主机上
  2. 见证组件在另一个 ESXi 主机上。

单击“CLOSE”(关闭)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

请注意,在 vSAN 上实施 RAID-5 或 RAID-6 配置时,所需的主机数量需要满足一定的要求。

对于 RAID-5,最少需要 4 台主机;对于 RAID-6,最少需要 6 台主机。

随后,将跨每台主机上的存储部署对象,并进行奇偶校验计算。此配置使用分布式奇偶校验,因此没有专用的奇偶校验磁盘。当集群中出现故障并且故障影响使用 RAID-5 或 RAID-6 部署的对象时,数据仍然可用且可使用剩余的数据和奇偶校验进行计算(如有必要)。

已引入新的策略设置来适应新的 RAID-5/RAID-6 配置。

这个新策略设置称为“Failure tolerance method”(容错方法)。此策略设置有两个值:性能和容量。当此策略设置为默认值“性能”时,将继续使用 RAID-1/镜像配置部署对象以实现最佳性能。如果将设置更改为“容量”,则将使用 RAID-5 或 RAID-6 配置部署对象。

“Number of failures to tolerate”(容许的故障数)设置将确定是使用 RAID-5 还是 RAID-6 配置。如果此设置设为 1,则采用 RAID-5 配置。如果此设置设为 2,则采用 RAID-6 配置。

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

首先,我们需要创建一个虚拟机存储策略,将用于定义 Raid 5/6 容错方法。

  1. 在 vSphere Client 的“Menu”(菜单)页面上
  2. 选择“Policies and Profiles”(策略和配置文件)

 

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

  1. 选择“VM Storage Policies”(虚拟机存储策略)
  2. 选择“Create VM Storage policy”(创建虚拟机存储策略)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

使用以下名称新建虚拟机存储策略:

PFTT=1-Raid5

单击“NEXT”(下一步)

 

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

选择“Enable rules for "vSAN" storage”(为“vSAN”存储启用规则)

单击“NEXT”(下一步)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

  1. 选择以下选项:
站点灾难容错:无(标准集群)
容许的故障数:1 次故障 - Raid-5(纠删码)
  1. 单击“Advanced Policy Rules”(高级策略规则)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

查看此处提供的选项,但保留选项的默认设置。

单击“NEXT”(下一步)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

验证 vSAN 数据存储是否与虚拟机存储策略兼容。

单击“NEXT”(下一步)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

查看设置,然后单击“FINISH”(完成)

 

 

新的虚拟机存储策略(Raid 5/6 - 纠删码)

 

在这里,我们可以看到组成虚拟机存储策略的规则。

 

 

将虚拟机存储策略分配给现有的虚拟机

 

这样就创建了一条新的虚拟机存储策略,现在,让我们将这条策略分配给 vSAN 数据存储上的一个现有虚拟机。

  1. 选择 vSphere Client 上的“Menu”(菜单)
  2. 选择“Hosts and Clusters”(主机和集群)

 

 

将虚拟机存储策略分配给现有的虚拟机

 

  1. 选择名为“vSAN Default Storage Policy”(vSAN 默认存储策略)的虚拟机
  2. 选择“Configure”(配置)
  3. 选择“More”(更多)>“Policies”(策略)

在此,我们可以看到已将“vSAN Default Storage Policy”(vSAN 默认存储策略)分配给此虚拟机。

  1. 选择“EDIT VM STORAGE POLICY”(编辑虚拟机存储策略)

 

 

将虚拟机存储策略分配给现有的虚拟机

 

  1. 通过下拉列表将虚拟机存储策略更改为“PFTT=1-Raid5”

单击“OK”(确定)

 

 

将虚拟机存储策略分配给现有的虚拟机

 

验证虚拟机存储策略是否已更改,以及虚拟机是否符合新存储策略。

 

 

将虚拟机存储策略分配给现有的虚拟机

 

  1. 选择名为“RegionA01-COMP01”的集群
  2. 选择“Monitor”(监控)
  3. 选择“vSAN”>“Virtual Objects”(虚拟对象)
  4. 选择“View Placement Details”(查看布局详细信息)

 

 

将虚拟机存储策略分配给现有的虚拟机

 

在这里,我们可以看到具有“Raid-5 Storage Policy”(Raid-5 存储策略)的虚拟机的新修订组件布局。

我们现在有一个组件分布在 4 个 ESXi 主机上。

单击“CLOSE”(关闭)

 

 

修改现有的虚拟机存储策略

 

  1. 在 vSphere Client 的“Home”(主页)
  2. 选择“Policies and Profiles”(策略和配置文件)

 

 

修改现有的虚拟机存储策略

 

  1. 选择“VM Storage Policies”(虚拟机存储策略)
  2. 选择名为“PFTT=1-Raid5”的虚拟机存储策略
  3. 选择“Edit Settings”(编辑设置)

 

 

修改现有的虚拟机存储策略

 

在“Name and Description”(名称和描述)对话框中,单击“NEXT”(下一步)

 

 

修改现有的虚拟机存储策略

 

在“Policy structure”(策略结构)对话框中,单击“NEXT”(下一步)

 

 

修改现有的虚拟机存储策略

 

  1. 在“vSAN”对话框中,选择“Advanced Policy Rules”(高级策略规则)
  2. 将“Number of disk stripes per object”(每个对象的磁盘条带数)修改为“2”

单击“NEXT”(下一步)

 

 

修改现有的虚拟机存储策略

 

在“Storage compatibility”(存储兼容性)对话框中,单击“NEXT”(下一步)

 

 

修改现有的虚拟机存储策略

 

在“Review and Finish”(检查和完成)对话框中,单击“FINISH”(完成)

 

 

修改现有的虚拟机存储策略

 

虚拟机存储策略正由 1 台虚拟机使用。更改虚拟机存储策略将使其与这 1 台虚拟机不同步。

  1. 选择“Manually later”(稍后手动同步)
  2. 选择“Yes”(是)

 

 

修改现有的虚拟机存储策略

 

  1. 选择“VM Compliance”(虚拟机合规性)
  2. 由于我们更改了虚拟机一直在用的虚拟机存储策略,您将看到虚拟机的“Compliance Status”(合规性状态)现已变为“Out of Date”(已过期)
  3. 单击“Reapply VM Storage Policy”(重新应用虚拟机存储策略)

 

 

修改现有的虚拟机存储策略

 

重新应用选定的虚拟机存储策略可能会占用大量时间和系统资源,因为它将影响 1 台虚拟机,并将移动驻留在 vSAN 数据存储上的 88 MB 数据。

  1. 单击“Show predicted storage impact”(显示预测的存储影响)

 

 

修改现有的虚拟机存储策略

 

虚拟机存储策略的更改将导致某些数据存储上的存储使用量发生变化。只能针对 vSAN 数据存储预测存储影响,但其他类型的数据存储也可能受到影响。 

重新应用虚拟机存储策略后,将显示受影响的数据存储使用量。

单击“CLOSE”(关闭)

 

 

修改现有的虚拟机存储策略

 

单击“OK”(确定)以重新应用虚拟机存储策略。

 

 

修改现有的虚拟机存储策略

 

重新应用虚拟机存储策略后,再次使用虚拟机存储策略验证虚拟机是否处于“Compliant”(合规)状态。

 

 

修改现有的虚拟机存储策略

 

1. 在 vSphere Client 的“Home”(主页)

2. 选择“Hosts and Clusters”(主机和集群)

 

 

修改现有的虚拟机存储策略

 

  1. 选择名为“RegionA01-COMP01”的集群
  2. 选择“Monitor”(监控)
  3. 选择“vSAN”>“Virtual Objects”(虚拟对象)
  4. 选择“View Placement Details”(查看布局详细信息)

 

 

修改现有的虚拟机存储策略

 

在这里,我们可以看到具有“Raid-5 Storage Policy”(Raid-5 存储策略)的虚拟机的新修订组件布局。

我们现在有一个组件分布在具有 Raid-0 的 4 个 ESXi 主机上。

单击“CLOSE”(关闭)

 

 

小结

基于存储策略的管理 (SPBM) 是软件定义的存储环境的主要元素。它是一种存储策略框架,可在各种数据服务和存储解决方案中提供单一的统一控制面板。 

该框架有助于根据虚拟机的应用需求调整存储。

 

vSAN 维护


在对作为 vSAN 集群成员的主机进行关机、重新引导或断开连接之前,您必须将该主机置于维护模式。将主机置于维护模式时,您必须选择数据撤出模式,例如“Full data migration”(迁移全部数据)到其他主机、“Ensure data accessibility from other hosts”(确保自其他主机的数据可访问性)或“No data migration”(不迁移数据)。在本课中,我们将了解各种维护模式选项,并讨论不同方法的应用场合。


 

虚拟对象

 

让我们查看一下虚拟机“vSAN-VM”的整个 vSAN 数据存储的组件布局:

  1. 选择“RegionA01-COMP01”
  2. 选择“Monitor”(监控)
  3. 选择 vSAN\“Virtual Objects”(虚拟对象)
  4. 选中“Hard disk 1”(硬盘 1)的复选框
  5. 单击“View Placement Details”(查看布局详细信息)

 

 

物理布局

 

此虚拟机正在使用默认的 vSAN 存储策略(容许的主要故障 = 1)(PFTT)。 

  1. PFTT=1 表示虚拟机的两个 vSAN 组件位于不同 vSphere 主机的 RAID-1 镜像中,所示的两个“Component replicas”(组件副本)可为证。还存在第三个“Witness”(见证)组件。此外,我们可以看到所有三个组件都报告了“Active”(活动)(绿色)状态。

请注意:您的实验与屏幕截图示例中的虚拟机对象布局可能不同

 

 

维护模式

 

  1. 右键单击“esx-01a.corp.local”
  2. 选择“Maintenance Mode\Enter Maintenance Mode”(维护模式\进入维护模式)

 

 

维护模式(续)

 

注意,有三个”vSAN data migration“(vSAN 数据迁移)选项:

  1. Full data migration(迁移全部数据)
  2. Ensure accessibility(确保可访问性)
  3. No data migration(不迁移数据)

我们来更详细地了解一下这几个选项。

 

 

Full data migration(迁移全部数据)

 

此选项将所有 vSAN 组件从进入维护模式的主机移动到 vSAN 集群中的其他主机。当主机长时间处于离线状态或永久停用时,通常会使用此选项。

注意:为了维护 PFTT=1,我们的集群中必须有第 4 个主机,才能迁移所有受影响的组件。在我们当前的 3 节点集群中,没有足够的主机来满足此维护模式选择。

 

 

Ensure accessibility(确保可访问性)

 

  1. vSAN 将验证虚拟机的大多数对象是否仍然可访问,即使因为主机进入维护模式将缺少一个或多个组件。
  2. 如果虚拟机的大多数对象仍然可访问,vSAN 将不会迁移受影响的组件。

如果虚拟机的对象无法访问,vSAN 会将必要数量的组件迁移到其他主机,以确保对象可访问性。此选项是默认选项,通常在主机将短时间离线时使用,例如主机重新启动。它可以最大限度地减少迁移的数据量,同时确保所有对象仍可以访问。但是,在主机退出维护模式之前,某些对象的容错级别可能会降低。

注意:如果您使用的是三主机集群或配置了三个故障域的 vSAN 集群,则这是唯一可用的“evacuation”(撤出)模式。

 

 

No data migration(不迁移数据)

 

进入维护模式时,不会从主机迁移数据。当主机将暂时离线时,也可以使用此选项。所有对象都将保持可访问状态,只要它们已分配有存储策略,其中“容许的主要故障级别”设置为 1 或更高。

  1. 当主机进入维护模式时,您将无法访问此虚拟机(使用 PFTT = 0 策略),因为它的存储组件不会迁移,因此会处于离线状态。

 

 

进入维护模式

 

  1. 验证是否已选定“Ensure accessibility”(确保可访问性)
  2. 单击“See full results”(查看完整结果)

 

 

预检查撤出

 

  1. 选择“Ensure data accessibility from other hosts”(确保能够访问来自其他主机的数据)。注意,不会移动任何数据。
  2. 注意,虚拟机对象将变得与其存储策略“non-compliant”(不合规)

正如我们之前所了解的那样,只要集群中的其他地方有足够的剩余组件,则仍可访问虚拟机存储。在这种情况下,不合规并不意味着虚拟机不可用。

3. 单击“CLOSE”(关闭)

 

 

进入维护模式(续)

 

  1. 验证“Ensure accessibility”(确保可访问性)是否仍处于选定状态
  2. 单击“OK”(确定)进入维护模式
  3. 单击“OK”(确定)确认警告信息(未显示)

 

 

进入维护模式(续)

 

  1. 选择“Recent Tasks”(近期任务)(左下角)
  2. 监控“Enter Maintenance Mode”(进入维护模式)进度直至完成

 

 

虚拟对象

 

  1. 请注意,我们的“vSAN-VM”仍然在线,绿色播放图标可为证(您也可以执行 ping 测试,但我们现在先跳过它)
  2. 选择“RegionA01-COMP01”
  3. 选择“Monitor”(监控)
  4. 选择 vSAN\“Virtual Objects”(虚拟对象)
  5. 注意,虚拟机当前处于“Reduced availability with no rebuild”(可用性降低,无重建)状态此外,延迟计时器正在倒计时(稍后详细讲解)
  6. 选择“Hard disk 1”(硬盘 1)
  7. 单击“View Placement Details”(查看布局详细信息)

 

 

物理布局

 

1. 注意,其中一个虚拟机对象现在处于“Absent”(缺失)状态

vSAN 会等待 60 分钟再重建位于不可用主机上的任何对象(从出现我们之前看到的“rebuild timer”(重建计时器)通知起开始计时)。如果主机在 60 分钟内未返回,则 vSAN 会将受影响的对象标记为“Degraded”(已降级),并尝试在集群中的另一台主机上重建它们(假设有可用的主机,在我们当前的 3 节点集群中没有)。

(计时器长度是可配置的,您可以在此单元的小结部分找到指向知识库文章的链接,其中包含更多详细信息)。

2.  单击“Close”(关闭)

 

 

退出维护模式

 

  1. 右键单击“esx-01a.corp.local”
  2. 将鼠标悬停在“Maintenance Mode”(维护模式)
  3. 单击“Exit Maintenance Mode”(退出维护模式)

 

 

正常运行

 

请注意,虚拟机再次报告“Healthy”(正常运行)(绿色)状态。在使主机恢复服务的过程中,vSAN 已自动“捕获”维护模式主机上的对象。

(您可能需要刷新 vSphere Client 才能确认是否处于正常运行状态)

 

更新 vSAN


随着 vSAN 6.6.1 及更高版本的发布,vSphere Update Manager (VUM) 会自动生成升级建议,以确保 vSAN 集群运行受支持的最新 vSphere 和 vSAN 版本。

VUM 会自动提取《VMware 兼容性指南》和《vSAN 版本目录》中的信息并将其与有关当前安装的 ESXi 版本的信息结合。

托管在 VMware Cloud 上的《vSAN 版本目录》维护着有关可用版本、版本的优先顺序以及每个版本所需的关键补丁程序的信息。此外,VUM 还标识了需要为特定硬件供应商安装的,新的、异步发布的驱动程序。使用此信息和对底层硬件配置的了解自动生成有关升级、补丁程序和驱动程序的建议。

利用 VUM 这一新的增强功能,可以更轻松地确定适用于某个环境的最新受支持的 vSphere 和 vSAN 版本。


 

VUM 如何为 vSAN 创建建议

vSAN 会自动生成只读系统基准和基准组,以供 vSphere Update Manager 使用。为此,需要从 my.vmware.com 下载 vSAN HCL 数据库和 vSAN 版本数据库,并创建必要的建议。

系统基准是根据 VMware Cloud 中的最新数据创建和维护的。

系统基准是 vSAN VUM 上现在提供的新型基准。此基准是只读的,因此无法编辑。每个 vSAN 集群生成一个基准。

我们可以有 3 个系统基准

  • 升级/更新基准(主要版本和更新版本)
  • 补丁程序基准(关键补丁程序)
  • 驱动程序基准(来自 HCL 数据库的驱动程序)

vSAN 系统基准不会影响用户定义基准。vSAN 系统基准每 24 小时自动刷新,但以下事件也可以触发 VUM 的 vSAN 更新:

  • 向启用 vSAN 的集群添加主机/从中删除主机
  • vSAN(vSAN 运行状况服务)管理服务重新启动。
  • vSAN 检测到对 vSAN 版本目录的更新。
  • vSAN 检测到对 vSAN HCL 的更新。

在 vSAN 6.2 (vSphere 6.0 U2) 之前的版本上不会检查 vSAN HCL 数据库。控制器固件不通过 VUM 进行修复。如果 vSAN 节点或集群控制器硬件不在 vSAN HCL 上,VUM 仍会推荐最新版本。

 

 

vSAN 运行状况检查

 

  1. 选择“RegionA01-COMP01”集群
  2. 选择“Monitor”(监控)
  3. 单击 vSAN\“Health”(运行状况)

 

 

vSAN 运行状况检查(续)

 

在 vSAN 运行状况检查中,“vSAN Build Recommendation”(vSAN 内部版本建议)可用于 vSAN VUM 集成,其中包括两个运行状况测试:

  1. “vSAN Build Recommendation Engine Health”(vSAN 内部版本建议引擎运行状况)

检查 vSAN VUM 内部版本引擎是否满足所有依赖关系,例如 Internet 访问、登录 my.vmware.com、元数据更新。

2. vSAN 内部版本建议

针对适用于 vSAN 集群的 vSAN 内部版本建议,基于 vSAN 版本列表和 vSAN HCL 数据库的现有硬件执行测试。

3. (可选)单击其中一个运行状况测试并选择“Info”(信息)(未显示),检查关于测试的详细信息。

注意:我们的动手实验没有必要的互联网连接,因此我们无法在实验中配置此功能。

 

 

修复

VMware Update Manager (VUM) 的修复不是自动的,必须由管理员发起。根据管理员的意愿,不强制其遵循已自动创建的系统基准建议。

可以修复给定 vSAN 集群中的单个主机,也可以一次修复整个 vSAN 集群。

 

小结


在本单元中,我们向您展示了如何利用功能强大的基于存储策略的管理,在执行 vSAN 集群维护时检查维护模式注意事项,轻松添加额外 vSAN 容量并探索用于更新 vSAN 的内置 VMware Update Manager 功能。


 

您已完成第 3 单元的学习

祝贺您!您已经完成了第 3 单元的学习。

如果您想了解有关该主题的其他信息,请查看以下内容:

继续学习以下您最感兴趣的任意一个未完成单元。

第 4 单元将讨论 vSAN 故障域、配备 vSAN Stretched Cluster 的双活数据中心以及 vSAN 灾难恢复场景。

第 5 单元将说明如何利用 vRealize Log Insight 查看集中式 vSAN 日志、vSAN iSCSI 集成和 vSAN CLI 界面。

第 6 单元将讨论 vSAN 安全参数,例如 FIPS 104-2 验证和 vSAN 静态数据加密。

 

 

如何结束实验

 

要结束实验,请单击“END”(结束)按钮。

 

第 4 单元 - vSAN 6.7 可用性(30 分钟)

简介


了解 vSAN 可用性是运行 vSAN 环境的一个关键方面。学习何时引入 vSAN 作为灾难恢复解决方案以及如何启用 vSAN Stretched Cluster 同样重要。


vSAN 可用性和故障域


vSAN 具有内置的可用性功能,可以保护您在使用 vSAN 超融合基础架构时免受磁盘、主机或网络层可能发生的硬件故障的影响。 

在本课时中,我们将定义适用于 vSAN 的故障域以及审查不同的可用性机制。我们还会要求您配置故障域以隔离机架(防止单个机架故障)。最后,我们将以一场讨论结束本课程,讨论不同的故障场景以及设计建议,以帮助缓解或减轻这些情况。


 

实验准备

如果您已经完成之前单元中的所列步骤并结束了该单元的学习,则可以跳过用以准备本课程环境的下列步骤。

单击进入课程。

如果您跳至本单元,我们将使用 Module Switcher PowerCLI 应用来准备环境。

 

 

Module Switcher

 

双击名为“HOL-1908 HCI”的 Module Switcher 桌面快捷方式

 

 

第 4 单元启动

 

  1. 单击“Module 4 - Start”(第 4 单元 - 启动)按钮

完成此启动例程可能需要几分钟 - 感谢您耐心等待!

 

 

监控进度

 

监控进度直到完成。

  • Enter 键继续(并关闭 PowerCLI 窗口)

 

 

实验准备完成

 

第 4 单元的实验已成功准备完毕!

1. 单击“Close”(关闭)图标,安全地停止 Module Switcher

请注意:您不能“返回”并启动目前所在单元之前的单元,除非您结束实验并重新启动(例如:如果您从第 4 单元开始,则不能使用 Module Switcher 启动第 1、第 2 或第 3 单元实验)。

 

 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Client 登录屏幕上,选择“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

故障域

“故障域”是讨论可用性时经常用到的一个术语。在 IT 领域,故障域通常是指集体受故障影响的一组服务器、存储和/或网络连接组件。故障域的常见示例是服务器机架。如果架顶式交换机或服务器机架的配电装置出现故障,则该机架中的所有服务器会离线,即使服务器硬件正常运行也是如此。该服务器机架可视为一个故障域。

vSAN 集群中的每台主机都是一个隐性故障域。vSAN 根据已分配存储策略中的“Number of Failures to Tolerate”(容许的故障数)规则自动在集群的故障域之间分发 vSAN 对象的组件。

 

 

故障域(续)

 

我们的屏幕截图显示了在主机(故障域)之间进行组件分布的简单示例。两个较大的组件为对象的镜像副本,较小的组件表示见证组件。

确定集群包含多少台主机(即故障域)时,务必要记住以下几点:

  • 对于利用镜像进行保护的 vSAN 对象,必须有 2n+1 台主机(即故障域)才能提供所选级别的保护。
    • 防御 1 次故障需要 (2x1+1) 台(即 3 台)主机
    • 防御 2 次故障需要 (2x2+1) 台(即 5 台)主机
    • 防御 3 次故障需要 (2x3+1) 台(即 7 台)主机
  • 对于利用纠删码进行保护的 vSAN 对象,必须有 2n+2 台主机(即故障域)才能提供所选级别的保护。
    • RAID5 (3+1) 需要 (2x1+2) 台(即 4 台)主机
    • RAID6 (4+2) 需要 (2x2+2) 台(即 6 台)主机

另请注意,如果缺少故障域(或者在未配置故障域的情况下,缺少主机)可能会导致没有位置可用于立即开始重新构建。VMware 建议配置一台额外主机(即故障域),以便在出现故障时能够重新构建。

 

 

使用故障域隔离机架

 

我们的屏幕截图显示了在主机(故障域)之间进行组件分布的简单示例。两个较大的组件为对象的镜像副本,较小的组件表示见证组件。

确定集群包含多少台主机(即故障域)时,务必要记住以下几点:

  • 对于利用镜像进行保护的 vSAN 对象,必须有 2n+1 台主机(即故障域)才能提供所选级别的保护。
    • 防御 1 次故障需要 (2x1+1) 台(即 3 台)主机
    • 防御 2 次故障需要 (2x2+1) 台(即 5 台)主机
    • 防御 3 次故障需要 (2x3+1) 台(即 7 台)主机
  • 对于利用纠删码进行保护的 vSAN 对象,必须有 2n+2 台主机(即故障域)才能提供所选级别的保护。
    • RAID5 (3+1) 需要 (2x1+2) 台(即 4 台)主机
    • RAID6 (4+2) 需要 (2x2+2) 台(即 6 台)主机

另请注意,如果缺少故障域(或者在未配置故障域的情况下,缺少主机)可能会导致没有位置可用于立即开始重新构建。VMware 建议配置一台额外主机(即故障域),以便在出现故障时能够重新构建。

 

 

使用故障域隔离机架(续)

 

在之前讨论的场景中,可以容许一个磁盘或整台主机出现故障。但是,这并不会针对诸如整个服务器机架等更大故障域的故障提供保护。请考虑我们的下一个示例,它是一个 12 节点 vSAN 集群。组成一个对象的多个组件可能会驻留在同一个服务器机架中。如果机架出现故障,该对象会离线。

 

 

使用故障域隔离机架(续)

 

为降低该风险,可将服务器安置于跨服务器机架的 vSAN 集群中,并在 vCenter\vSAN UI 中配置每个机架的故障域。这会指示 vSAN 将组件分布到多个服务器机架中,以消除因一个机架出现故障使多个对象离线带来的风险。此功能通常称为“机架感知”。该屏幕截图显示了每个机架中的三个服务器配置为单独的 vSAN 故障域时的组件安置情况。

我们的实验中没有 12 个 vSphere 服务器,但我们接下来仍然可以向您展示如何使用我们的 3 个主机配置故障域。

 

 

配置故障域

 

  1. 选择“RegionA01-COMP01”
  2. 选择“Configure”(配置)
  3. 选择“Fault Domains”(故障域)
  4. 单击“Create a new fault domain...”(创建新的故障域...)图标

 

 

新故障域

 

  1. 输入名称:“Rack 1”(机架 1)
  2. 选择“esx-01a.corp.local”
  3. 单击“OK”(确定)

 

 

新故障域(续)

 

  1. 请注意,我们已创建包含“esx-01a.corp.local”的“Rack 1”(机架 1)故障域
  2. 单击“Create a new fault domain...”(创建新的故障域...)图标

 

 

新故障域(续)

 

  1. 输入名称:“Rack 2”(机架 2)
  2. 选择“esx-02a.corp.local”
  3. 单击“OK”(确定)

(未显示)重复这些步骤以创建第三个故障域:

  1. 输入名称:“Rack 3”(机架 3)
  2. 选择“esx-03a.corp.local”
  3. 单击“OK”(确定)

 

 

新故障域(续)

 

我们现在拥有使用 vSphere 主机填充的所需最低数量的机架 (3)。vSAN 将确保组件分布在机架之间,以便在单机架故障事件中实现所期望的容许故障。

接下来,我们将研究不同的故障场景,并提供有关如何缓解和/或减少故障的建议。

 

 

 

如果 vSAN 主机中的存储设备出现故障会怎么样?

虚拟机受包含容错的存储策略的保护。例如,利用 RAID-1 镜像将容许的主要故障级别 (PFTT) 规则设置为 1 的存储策略将创建一个对象的两个副本,每个副本位于单独的主机上。这意味着分配了此策略的虚拟机可以承受一个磁盘或整个主机的故障,而不会丢失数据。

当设备降级并且被 vSAN 检测到错误代码时,受影响的驱动器上的所有 vSAN 组件都会标记“降级”,并且重建过程会立即启动以恢复冗余。如果设备在没有警告的情况下发生故障(未从设备收到错误代码),则 vSAN 将默认等待 60 分钟,然后在集群中的其他磁盘上重建受影响的数据。60 分钟的计时器已准备就绪,以避免不必要的大量数据移动。例如,磁盘无意中从服务器机架中拉出,并在大约 10 分钟后重新安装。当磁盘暂时离线时,开始重建几 GB 的数据将低效并且占用大量资源。

当由于多个持续的高延迟时段而预期设备发生故障时,vSAN 会评估该设备上的数据。如果集群中的其他设备上有该数据的副本,则 vSAN 会将这些组件标记为“缺失”。不会立即重新构建“缺失”组件,因为造成问题的原因可能只是暂时存在。默认情况下,vSAN 会等待 60 分钟,然后再启动重新构建过程。这不会影响虚拟机的可用性,因为仍然可以使用集群中的一个或多个其他副本访问该数据。如果数据的唯一副本位于可疑设备上,则 vSAN 会立即开始将该数据撤出到其他正常运行的存储设备上。

注意:缓存层设备的故障将导致整个磁盘组离线。另一个类似的场景是启用了重复数据消除和压缩的集群。由于已消除重复的数据在磁盘上的分布方式,任何磁盘(缓存或容量)的故障都将导致整个磁盘组离线。

建议:考虑启用了重复数据消除和压缩的集群中磁盘组的数量和大小。虽然较大的磁盘组可能会提高重复数据消除效率,但这也会增加磁盘发生故障时对集群的影响。每个组织的要求都不同,因此没有对磁盘组大小设置规则。

 

 

如果 vSAN 集群中的主机出现故障会怎么样?

默认情况下,vSAN 将等待 60 分钟,然后在集群中的其他主机上重建受影响的数据。60 分钟的计时器已准备就绪,以避免不必要的大量数据移动。例如,重新启动会使主机离线大约 10 分钟。当主机暂时离线时,开始重建几 GB 或 TB 的数据将低效并且占用大量资源。

vSphere HA 与 vSAN 紧密集成。在故障主机上运行的虚拟机在几分钟内会在集群中的其他正常运行的主机上重新启动。

建议:为 vSAN 集群启用 vSphere HA。

 

 

vSAN 如何处理网络分区?

vSAN 使用仲裁投票算法来帮助防止“裂脑”场景并确保数据完整性。只要可以访问超过 50% 的组件,就可以使用对象进行读写操作。

例如,虚拟机在主机 1 上具有带数据组件的虚拟磁盘,在主机 2 上具有第二镜像数据组件,以及在主机 3 上具有见证组件。主机 1 和主机 2 及主机 3 分离。主机 2 和主机 3 仍然通过网络连接。由于主机 2 和主机 3 具有超过 50% 的组件(数据组件和见证组件),因此可以访问虚拟机的虚拟磁盘。

但是,如果上面示例中的所有三个主机彼此隔离,则没有一个主机可以访问超过 50% 的组件。vSAN 使对象无法访问,直到主机能够通过网络进行通信。这有助于确保数据完整性。

建议:以与任何其他存储结构相同的恢复能力级别构建您的 vSAN 网络。

 

 

如果 vCenter Server 离线,vSAN 会受到何种影响?

vCenter Server 离线时,vSAN 将继续正常运行。虚拟机继续运行,并且应用程序可用性不受影响。管理功能(如更改存储策略、监控性能和添加磁盘组)不可用。

vSAN 有一个高可用性控制平面,即使 vCenter Server 处于离线状态,也可以使用 VMware Host Client 进行运行状况检查。vSAN 集群中的主机在分散状态下进行协作,检查整个集群的运行状况。集群中的任何主机都可用于查看 vSAN 的运行状况。这提供了 vSAN 运行状况数据的冗余性,有助于确保管理员始终可以获得此信息。

 

双活 vSAN Stretched Cluster


在深入探讨 vSAN Stretched Cluster 的安装之前,我们需要着重了解一些特定于延伸集群环境的重要功能特性。


 

启动 vSphere Client

 

如果尚未在之前的实验单元中打开,请使用 Windows 任务栏中的 Google Chrome 图标启动 vSphere Web Client。

  1. 选中“Use Windows session authentication”(使用 Windows 会话身份验证)复选框
  2. 单击“Login”(登录)

 

 

vSAN 集群中不能包含见证主机

 

配置 vSAN Stretched Cluster 时,只有数据主机必须位于 vCenter 的集群对象中。

  1. vSAN 见证主机必须保留在集群外部,且任何时候都不得添加至集群。在您的实验环境中,我们已部署了 vSAN 见证主机。

因此对于 1(主机)+1(主机)+1(见证)配置,每个站点一台 ESXi 主机,并部署一台 ESXi 见证主机。

 

 

网络连接

 

vSAN 见证虚拟设备包含两个连接至单独的 vSphere Standard Switch (VSS) 的网络适配器。

vSAN 见证虚拟设备管理 VMkernel 与一个 VSS 挂接,而 WitnessPG 与另一个 VSS 挂接。管理 VMkernel (vmk0) 用于与 vCenter Server 通信以进行设备管理。WitnessPG VMkernel 接口 (vmk1) 用于与 vSAN 网络通信。此为推荐的配置。这些网络适配器可连接至不同或相同的网络,前提是它们已与相应的服务连接。

管理 VMkernel 接口可以进行标记以包括 vSAN 网络流量和管理流量。在此情况下,vmk0 将要求连接至 vCenter Server 和 vSAN 网络。在很多嵌套 ESXi 环境(例如 VMware 用于此动手实验的平台)中,系统会建议启用混杂模式以允许所有以太网帧传递至挂接到端口组的所有虚拟机(即便不适用于该特定虚拟机)。在很多嵌套环境中启用混杂模式的目的在于,阻止虚拟交换机在嵌套 ESXi 主机上因未知的(嵌套)vmnic 而丢弃数据包。

见证拥有一个名为 witnessPg 的预定义端口组。在这里可以看到用于 vSAN 流量的 VMkernel 端口。如果 vSAN 网络上不存在 DHCP 服务器(可能),则 VMkernel 适配器将不会拥有一个有效的 IP 地址。

  1. 选择名为“esx-08a.corp.local”的 ESXi 主机
  2. 选择“Configure”(配置)
  3. 依次选择“Networking”(网络连接)->“VMkernel adapters”(VMkernel 适配器)
  4. 选择“vmk1”以查看“witnessPg”的属性。
  5. 验证“vSAN”是否为已启用的服务,如屏幕截图中所示。

 

 

新建 vSAN - 双节点 Stretched Cluster

基于未配置 vSAN 的一组主机创建 vSAN Stretched Cluster 相对比较简单。借助新的 vSAN 集群向导可轻松完成这一流程。

在本课中,我们将引导您完成每个步骤。

  • 创建 vSphere 集群
  • 向 vSphere 集群添加 ESXi 主机
  • 为见证流量分离 (WTS) 准备 ESXi 主机
  • 形成双节点 vSAN 集群

 

 

新建 vSphere 集群

 

第一步是,为我们要用于形成双节点 vSAN Stretched Cluster 的 2 台 ESXi 主机创建 vSphere 集群。

  1. 右键单击名为“RegionA01”的数据中心
  2. 选择“New Cluster...”(新建集群...)

 

 

创建 vSphere 集群

 

  1. 将 vSphere 集群命名为:
2-Node-Stretched-Cluster

单击“OK”(确定)

 

 

将主机移入集群

 

创建好 vSphere 集群后,将名为“esx-05a.corp.local”和“esx-06a.corp.local”的 2 台 ESXi 主机移入 vSphere 集群。

可以通过以下两种方式之一来做到这一点:

将 ESXi 主机拖放到名为“2-Node-Stretched-Cluster”的 vSphere 集群的顶部

右键单击 ESXi 主机并选择“Move To...”(移至...),然后选择名为“2-Node-Stretched-Cluster”的 vSphere 集群并单击“OK”(确定)

 

 

将主机退出维护模式

 

将 ESXi 主机“esx-05a.corp.local”和“esx-06a.corp.local”退出维护模式。

  1. 右键单击 ESXi 主机“esx-05a.corp.local”
  2. 选择“Maintenance Mode”(维护模式)
  3. 选择“Exit Maintenance Mode”(退出维护模式)

对名为“esx-06a.corp.local”的另一台 ESXi 主机重复执行上述步骤

 

 

验证 vSphere 环境

 

在继续操作之前,确认 2-Node-Stretched-Cluster 与屏幕截图类似。

确认您的 vSphere 集群包含 2 台 ESXi 主机,并且它们不处于维护模式。

 

 

验证网络连接

 

确认每台 ESXi 主机都配置了一个适用于 vSAN 的 VMkernel 端口,并且已启用 vSAN 流量服务。

  1. 选择名为“esx-05a.corp.local”的 ESXi 主机
  2. 选择“Configure”(配置)
  3. 选择“Networking”(网络连接)->“VMkernel Adapters”(VMkernel 适配器)
  4. 选择“vmk3”(已启用 vSAN 的端口组)
  5. 确认该端口组上已启用“vSAN”服务

 

 

验证存储

 

确认每台 ESXi 主机都有可用的存储设备,可创建 vSAN 磁盘组并支持创建 vSAN 数据存储。

如屏幕截图所示,在创建 vSAN 磁盘组时,我们将 1 个 5 GB 的磁盘用作缓存层,将 2 个 10 GB 的磁盘用作容量层。

  1. 选择名为“esx-05a.corp.local”的 ESXi 主机
  2. 选择“Configure”(配置)
  3. 依次选择“Storage”(存储)->“Storage Devices”(存储设备)

 

 

见证流量分离

 

VMware vSAN 6.5 及更高版本支持直接使用一条或多条交叉电缆连接两个 vSAN 数据节点。

要实现这一点,需要将备用 VMkernel 端口的流量类型标记为“见证”,然后便可以立即分离数据和元数据通信路径了。流向见证 vSAN VMkernel 接口的元数据流量可以通过备用 VMkernel 端口来实现。此过程称为“见证流量分离”(又称为 WTS)。

可以跨主机直接连接 vSAN 数据网络,并通过备用路由发送见证流量,因此该设计中的数据网络不需要使用高速交换机。

这可以降低部署双节点 vSAN 的基础架构总成本。在大规模部署双节点 vSAN 时,这可以大幅节约成本。

 

 

使 ESXi 主机准备好进行见证流量分离 (WTS)

 

要使 ESXi 主机为双节点 vSAN Stretched Cluster 做好准备,请打开一个连接以下主机的 Putty 会话。

您可以在主控制台的任务栏中找到 PuTTY 应用。

esx-05a.corp.local
esx-06a.corp.local

单击“esx-05a.corp.local”,单击加载按钮,然后单击“Open”(打开)

单击“esx-06a.corp.local”,单击加载按钮,然后单击“Open”(打开)

 

 

使 ESXi 主机准备好进行见证流量分离 (WTS)

 

我们先来看一下主机上配置了哪些流量类型。

  1. 在主机“esx-05a.corp.local”和“esx-06a.corp.local”上运行以下命令:
esxcli vsan network list
  1. 此处,您会看到每个主机上都配置了“Traffic Type : vsan”(流量类型:vsan)

 

 

使 ESXi 主机准备好进行见证流量分离 (WTS)

 

要使用适用于 vSAN 的端口,必须对 VMkernel 端口进行标记,使其具有“vsan”流量。这可以在 vSphere Web Client 中轻松实现。

要将 VMkernel 接口标记为“见证”流量,目前必须在命令行中完成。

要添加采用见证流量类型的新接口,需要执行的命令为:

esxcli vsan network ipv4 add -i vmk0 -T=witness
  1. 在“esx-05a.corp.local”和“esx-06a.corp.local”上运行此命令

注意:请记住,见证流量将使用管理网络进行传输,该网络在我们的环境中为 vmk0

 

 

使 ESXi 主机准备好进行见证流量分离 (WTS)

 

我们来看一下现在配置了哪些流量类型。

  1. 在主机“esx-05a.corp.local”和“esx-06a.corp.local”上运行以下命令:
esxcli vsan network list

在这里,您将看到每台主机上的配置分别为“Traffic Type : vsan”(流量类型:vsan)和“Traffic Type : witness”(流量类型:见证)

现在我们已经配置了网络连接,接下来我们来创建双节点 vSAN Stretched Cluster。

 

 

创建双节点 vSAN 集群

 

应该按照以下步骤安装新的 vSAN Stretched Cluster。本示例采用 1+1+1 部署,即在首选站点配置一台 ESXi 主机,在辅助站点配置另一台 ESXi 主机,外加一台见证主机。

要设置 vSAN 并配置延伸集群,请导航至

  1. 名为“2-Node-Stretched-Cluster”的集群
  2. 选择“Configure”(配置)
  3. 依次选择“vSAN”->“Services”(服务)
  4. 单击“Configure”(配置)启动 vSAN 向导。

 

 

将 vSAN 配置为延伸集群

 

初始向导允许选择申明磁盘用途方法等各种选项,支持重复数据消除和压缩(全闪存架构仅提供高级或需要更高许可),以及配置故障域或延伸集群。

  1. 选择“Two host vSAN cluster”(两个主机 vSAN 集群)

单击“NEXT”(下一步)

 

 

将 vSAN 配置为延伸集群

 

保留默认服务

单击“NEXT”(下一步)

 

 

将 vSAN 配置为延伸集群

 

我们将在 vSAN 集群中针对相应的角色(缓存和容量)选择磁盘。

如屏幕截图所示,每台 ESXi 主机的 5 GB 磁盘已被选为“Cache tier”(缓存层),10 GB 磁盘则已被选为“Capacity tier”(容量层)。

单击“NEXT”(下一步)

 

 

将 vSAN 配置为延伸集群

 

必须选择前文详述的见证主机作为对两个故障域的见证。

  1. 展开数据中心“RegionA01”,然后选择“esx-08a.corp.local”

单击“NEXT”(下一步)

 

 

将 vSAN 配置为延伸集群

 

和物理 vSAN 主机一样,见证主机也需要缓存层和容量层。

注意:见证主机实际上不需要固态硬盘支持,并且可以驻留在传统机械驱动器上。

  1. 选择“cache tier”(缓存层)磁盘
  2. 选择“capacity tier”(容量层)磁盘

单击“NEXT”(下一步)

 

 

即将完成

 

检查 vSAN Stretched Cluster 配置的准确性。

选择“FINISH”(完成)

 

 

监控任务

 

您可以在“Recent Tasks”(近期任务)窗口中监控任务。

您将看到“Reconfigure vSAN cluster”(重新配置 vSAN 集群)、“Creating disk groups”(创建磁盘组)、“Converting to Stretched Cluster”(转换为延伸集群)和“Adding disks to the Disk groups”(将磁盘添加到磁盘组)等任务。

 

 

已创建 vSAN 集群

 

现在我们来确认一下是否已创建 vSAN Stretched Cluster。

  1. 选择“2-Node-Stretched Cluster”
  2. 选择“Configure”(配置)
  3. 依次选择“vSAN”>“Services”(服务)

 

 

 

磁盘管理

 

现在我们来看一下已创建的磁盘组。

  1. 依次选择“vSAN”>“Disk Management”(磁盘管理)

我们可以看到,名为“esx-05a.corp.local”和“esx-06a.corp.local”的 ESXi 主机上有磁盘组。在我们的 Stretched Cluster 配置中的 vSAN 见证主机“esx-08a.corp.local”上也有一个磁盘组。

 

 

故障域和延伸集群

 

现在我们来看一下“Fault Domains and Stretched Cluster”(故障域和延伸集群)配置。

  1. 依次选择“vSAN”>“Fault Domains”(故障域)
  2. vSAN Stretched Cluster 已启用见证主机“esx-08a.corp.local”
  3. 我们还可以看到已创建“2 Fault Domains”(2 个故障域),并可以看到它们各自的 ESXi 主机。

 

 

小结

关于创建具有见证流量分离功能的 vSAN 6.7 双节点 Stretched Cluster 的课程到此结束。

 

 

监控 vSAN Stretched Cluster

监控 vSAN 环境的方法之一是执行 vSAN 运行状况检查。

vSAN 运行状况将对 vSAN 环境执行全面的运行状况检查以确认其运行正常,并将在发现不一致的情况下向您发出警报并提供修复问题的选项。

 

 

vSAN 运行状况检查

 

我们来看一下运行状况检查的工作原理以及我们可以报告的内容。

  1. 选择“2-Node-Stretched-Cluster”(双节点 Stretched Cluster)
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Health”(运行状况)

在这里,您将看到可以执行的 vSAN 运行状况检查的概要列表。

  1. 展开“Stretched Cluster”(延伸集群)运行状况检查

 

 

vSAN 运行状况检查

 

我们来更深入地了解一下各项测试。

  1. 选择“Site latency health”(站点延迟运行状况)
  2. 在屏幕右边,您会看到这些测试结果。

请花些时间看一下其他测试以及从测试中返回的数据。

 

 

小结

vSAN 运行状况检查非常有助于更深入地了解 vSAN 安装实例的测试性能和运行状况检查情况。监控 vSAN 环境时,应首先执行 vSAN 运行状况检查。

重新运行 vSAN 运行状况检查以检索环境的当前状态是一个不错的做法。

 

使用 vSAN 进行灾难恢复


vSAN 通过 VMware Site Recovery Manager (SRM) 实现自动化,可以成功用于多种不同的灾难恢复场景,例如我们在前面讨论过的“双活”延伸集群配置和/或经济实惠的灾难恢复目标站点(通过 vSphere Replication 等功能启用)。 

在本实验/课程范围之外,VMware 还为 VMware Cloud on AWS (VMC) 启用了名为 VMware Site Recovery(灾难恢复即服务)的附加模块,可以快速部署全新灾难恢复计划或将现有的本地 VMware 部署无缝扩展到 VMware Cloud on AWS,所有这些操作均利用 vSAN 超融合基础架构完成。


 

将 vSAN 用作目标灾难恢复站点

在主站点中使用传统存储时,vSAN 的常见使用情形是将较低成本的超融合基础架构用作灾难恢复目标。这两个位置运行的都是 VMware vSphere 基础架构,因此这两个位置之间不需要更改虚拟机容器配置,并且 vSphere Replication 可用作复制引擎来保护从主站点到基于 vSAN 的灾难恢复集群的虚拟机。

凭借“基于软件策略的管理”策略的灵活性,您还可以选择在灾难恢复站点使用不太严格的“容许的故障数 (FTT)”策略。例如,这种灵活性可减少容量消耗,从而大大降低保护关键系统的成本。

 

 

vSAN 和通过 vSphere Replication 和 SRM 进行灾难恢复

 

使用 vSAN 延伸集群的双活数据中心非常适合需要恢复点目标 (RPO) 为零的情况。

延伸集群本质上是在两个位置之间利用同步复制功能,因此 RPO 可以为零。这意味着即使延伸集群中的其中一个位置处于脱机状态,也不会丢失数据。vSphere HA 可自动恢复受延伸群集中任一位置的故障影响的虚拟机。这些虚拟机的恢复时间通常以分钟为单位。

如果存在其他数据中心需求(例如故障转移到其他远程站点),除了延伸集群安排(或者直接代替延伸集群安排),vSAN 还可以利用 vSphere Replication 提供的功能以及 SRM 来保护之外,还可以保护站点。所有这些工具都是软件定义的,并不依赖于任何特定于硬件的功能。这些功能是创建敏捷数据中心的关键要素。

 

总结


在本课中,我们探讨了 vSAN 可用性特征和故障域。我们探索了 vSAN Stretched Cluster 并了解了如何配置双节点 vSAN Stretched Cluster。在这个过程中,我们向您介绍了配置延伸 vSAN 集群环境之前需要了解的一些背景知识和重要功能特性。在本单元的最后,我们讨论了 vSAN 中的 vSAN 灾难恢复选项。


 

您已完成第 4 单元的学习

祝贺您!您已经完成了第 4 单元的学习。

如果您想了解有关该主题的其他信息,请查看以下内容:

继续学习以下您最感兴趣的任意一个单元。

第 5 单元将说明如何利用 vRealize Log Insight 查看集中式 vSAN 日志、vSAN iSCSI 集成和 vSAN CLI 界面。

第 6 单元将讨论 vSAN 安全参数,例如 FIPS 104-2 验证和 vSAN 静态数据加密。

 

 

如何结束实验

 

如果您要结束实验,请单击“END”(结束)按钮。

 

第 5 单元 - vSAN 6.7 互操作性(45 分钟)

简介


vSAN 与其他现有的 VMware 技术以及行业功能具有深入的互操作性,例如 iSCSI 集成和通过命令行界面进行管理。


vSAN 中的 vRealize Network Log Insight


VMware vRealize Log Insight 是一种日志聚合、管理和分析解决方案,为数据中心管理员提供了一种简单的方法,透过模糊的日志内容了解其背后的上下文、关联和含义。Log Insight 可以聚合来自各种来源的日志数据,并且可以使用它的内容包框架扩展到 40 多个应用。如果使用得当并且借助合适的工具,日志数据就能让我们了解数据中心内不断变化的情况并提供上下文。

Log Insight 与 vSAN 配合使用,不仅可以轻松为 vSAN 提供一定程度的可见性和运维智能,还可以为整个环境带来相同的益处。


 

实验准备

本实验需要运行 Module Switcher,请完成以下步骤。

 

 

Module Switcher

 

双击名为“HOL-1908 HCI”的 Module Switcher 桌面快捷方式

 

 

第 5 单元启动

 

  1. 单击第 5 单元对应的“Start”(启动)按钮

完成此启动例程可能需要几分钟,感谢您耐心等待!

 

 

监控进度

 

监控进度直到完成。

  • 按“Enter”键继续(并关闭 PowerCLI 窗口)

 

 

实验准备完成

 

第 5 单元的实验已成功准备完毕!

1. 单击“Close”(关闭),安全地停止 Module Switcher

请注意:您不能“返回”并启动目前所在单元之前的单元,除非您结束实验并重新启动(例如:如果您启动了第 4 单元,则不能使用 Module Switcher 启动第 1、第 2 或第 3 单元实验)。

 

 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Client 登录屏幕上,选中“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

新的浏览器选项卡

 

  1. 单击“New Tab”(新选项卡)图标

 

 

书签栏

 

  1. 通过书签栏选择“HOL Admin”
  2. 单击“log-01a”

 

 

登录

 

  1. 输入以下用户名密码参数(密码区分大小写)
admin
VMware1!

2. 单击“LOGIN”(登录)

 

 

交互式分析

 

  1. 单击“Interactive Analytics”(交互式分析)
  2. 输入 vsan(注意,与这个关键词相关的结果有数千个)

除了我们刚刚查看过的即时可用的仪表盘之外,Log Insight 还可让用户通过交互式分析功能在多个日志文件中进行快速搜索。 

接下来我们搜索 vSAN 集群上可能存在的配置错误,并试着确定这项更改发生的时间。

 

 

vSAN 配置一致性

 

  1. 输入 vsan configuration
  2. 将下拉菜单更改为“All time”(所有时间)
  3. 注意,vCente (vcsa-01a.corp.local) 已转发一个日志条目,表明“vSAN extended configuration in sync”(vSAN 扩展配置同步中)已进入红色状态。
  4. 我们还可以看到事件以图表形式显示在顶部的图表

 

 

设置筛选条件

 

  1. 单击筛选小组件,获取包含“灰色到红色”(或“绿色到红色”,任意一种均可)的事件
  2. 选择“Events Like This”(这种类型的事件),仅筛选这些事件(未显示)

 

 

创建警报

 

  1. 单击“Create Alert from Query...”(通过查询创建警报...)图标

 

 

新的警报

 

  1. 注意,我们可以为警报提供“Name”(名称),并为可选的“Description”(描述)和“Recommendation”(建议操作)步骤提供内容
  2. 注意,我们可以通过“Email”(电子邮件)或“Webhook”发送警报
  3. 注意,我们可以为如何处理警报指定更多逻辑
  4. (也可以配置为将警报发送到 vRealize Operations,以采取进一步行动)
  5. 单击“Cancel”(取消)

最后,我们先在 vCenter 中查看该配置不一致性并更正条件,然后再继续查看 Log Insight 中内置的 vSAN 仪表盘。

 

 

vSphere Client

 

  1. 选择“RegionA01-COMP01”
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”和“Health”(运行状况)
  4. 依次选择“Cluster”(集群)和“Advanced vSAN Configuration in sync”(高级 vSAN 配置同步中)警报
  5. 注意,其中一台主机针对“VSAN.ClomRepairDelay”设置的超时值有所不同(90 分钟与 60 分钟)。
  6. 单击“esx-01a.corp.local”

vSAN ClomRepairDelay 高级设置指定在主机处于故障状态或维护模式后,vSAN 在重建磁盘对象之前等待的时间。默认情况下,修复延迟值设置为 60 分钟;这意味着,如果主机发生故障,vSAN 会先等待 60 分钟,然后再重建位于该特定主机上的所有磁盘对象。这是因为 vSAN 还不能确定此故障是暂时性的还是永久性的。您可以增加这个值(而且不用记着将其恢复原来的设置,也不用确保该设置在整个集群中都是统一的)。

 

 

esx-01a.corp.local

 

  1. 向下滚动到“System”(系统)
  2. 依次选择“System”(系统)和“Advanced System Settings”(高级系统设置)
  3. 单击“EDIT...”(编辑...)

 

 

编辑高级系统设置

 

  1. 输入 vsan.clomrepair
  2. 双击“Value”(值),然后更改为 60
  3. 单击“OK”(确定)

 

 

vSAN 运行状况

 

  1. 选择“RegionA01-COMP01”
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”和“Health”(运行状况)
  4. 单击“RETEST”(重新测试)
  5. 展开“Cluster”(集群)
  6. 注意,“vSAN cluster configuration consistency”(vSAN 集群配置一致性)现在报告运行状况良好(绿色)状态

在本示例中使用 Log Insight 不仅可以帮助我们识别出存在的配置不一致性,而且还可以确定这一更改的确切日期/时间;此外,如果我们做出相应选择,还可以创建电子邮件警报。

接下来,我们将查看内置的 vSAN Log Insight 仪表盘。

 

 

vSAN 仪表盘

 

  1. 单击“VMware - vSAN”以展开 vSAN 仪表盘

Log Insight 仍然使用之前版本的内容包框架,但现在在安装时包含了 vSAN 仪表盘,从而可以轻松在基于 vSAN 的环境中部署和使用。

vRealize Log Insight 可即时提供以下内容:

  • 十个预先构建的 vSAN 仪表盘,用于传达关键的日志数据条目。无需精通日志语法。
  • 捕获并智能传达所有的 vSAN 紧急跟踪信息。
  • 用户界面中提供所有方便用户使用的深入筛选功能。
  • 公开后端 vSAN 活动,以更好地了解历史条件以及与错误无关的活动。
  • 具有预定义筛选条件的仪表盘小组件,可用于识别各种主机和对象状态。
  • 仪表盘可以克隆,也可以完全自定义,是实现更多自定义选项的良好阶梯。

接下来,我们将查看 vSAN 仪表盘。如果您在小组件中看到大量的“无结果”,不必惊慌,毕竟我们是在最近才组建的 vSAN 数据存储!

一般来说,如果您在 vSAN 相关小组件中没有看到太多活动,不必过度担心。很多时候,Log Insight 可能并不总是在仪表盘中显示大量信息。对于没有太多活动、具有完全可操作的硬件或不消耗大量容量的环境来说,这种情况很常见。Log Insight 中缺少数据并不是一件坏事,随着容量和工作负载的增加,一旦环境中出现更多活动,它可能会报告更多事件。

 

 

主机状态信息

 

  1. 单击“Host State Information”(主机状态信息)
  2. 向下滚动以查看更多小组件

主机状态信息仪表盘很好地概述了 vSAN 如何处理主机成员资格和角色。其主要关注点是与主机本身有关的活动,例如向 vSAN 集群添加或更改主机成员。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘由七个小组件组成,用于捕获进入和退出维护模式的主机的日志条目,即 vSAN 主机发现事件。它还将捕获主机重新加入集群的时间以及角色初始化的时间。此仪表盘最有助于我们了解是否正确识别了 vSAN 主机。

 

 

磁盘组故障

 

  1. 单击“Diskgroup Failures”(磁盘组故障)
  2. 向下滚动以查看更多小组件

磁盘组故障仪表盘是一组用来查看磁盘组活动的小组件。磁盘组是 vSAN 的重要构造,此仪表盘可让我们了解 vCenter 记录的但不易查看的磁盘组故障事件。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘中的所有七个小组件都将报告与 vSAN 集群中每台主机的一个或多个磁盘组相关的所有事件活动。注意底部附近的“组件创建故障”小组件。这些小组件能帮助我们了解对象由于剩余容量不足或超出主机的组件最大值而无法满足特定策略合规性的原因。

 

 

网络连接

 

  1. 单击“Networking”(网络连接)

网络连接仪表盘筛选显示集群中 vSAN 网络创建事件的日志事件。当主机上线时,或者在集群中的主机上启用 vSAN 时,通常会在此仪表盘中看到事件。这些事件不是错误,只是确认 vSAN 现在在特定主机上使用特定 VMkernel NIC 来处理 vSAN 流量。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

网络连接仪表盘包含两个小组件,但可以与“主机状态信息”仪表盘很好地协同工作,也可以与 vSphere 内容包中的其他网络相关仪表盘很好地协同工作。东西向主机连接对于 vSAN 的运维至关重要,将此仪表盘与 vSAN 和 vSphere 内容包中的其他仪表盘一起使用,可让我们了解东西向连接是否存在任何问题。

 

 

拥塞

 

  1. 单击“Congestion”(拥塞)
  2. 向下滚动以查看更多小组件

“Congestion”(拥塞)仪表盘旨在让我们更好地了解拥塞所产生的事件。拥塞是 vSAN 中引入的独特测量指标。它表明 vSAN 如何测量整个体系的压力,并根据这些测量指标引入流量控制,从而让流量平稳流畅,以便虚拟机有足够的资源来满足客户虚拟机存储需求。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘有五个小组件,用于捕获与拥塞相关的日志事件。与 vSAN 性能服务中提供的拥塞指标一起查看时,此仪表盘可提供最大帮助。拥塞指标的值不是为了有意义地诠释绝对值,而是用于识别一段时间内的更改。捕获与拥塞相关的日志事件可以提供更多 vSAN 性能服务中发现的任何峰值或其他统计异常值背后的上下文。

 

 

对象配置

 

  1. 单击“Object Configurations”(对象配置)
  2. 向下滚动以查看更多小组件

对象配置仪表盘提供对象活动的概要视图。此仪表盘通常会在 vSAN 发现某个对象不符合为其分配的存储策略时报告活动,或者可能会报告某些其他活动(例如将策略分配给新的虚拟机或现有虚拟机)。此仪表盘和对象事件仪表盘结合使用时,通常是 vSAN 内容包中最有用的两个仪表盘。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘中的七个小组件可捕获创建(安置)、更改和修复配置,以及重新平衡、停用、清理和投票重新平衡配置等事件。与 vSAN 内容包内的仪表盘中的许多其他小组件一样,日志事件(例如对象配置更改)不一定是对未按预期运行的事件的警报。这些日志事件捕获的日志条目可以提供其他运维活动的上下文。

 

 

停用

 

  1. 单击“Decommission”(停用)
  2. 向下滚动以查看更多小组件

停用仪表盘主要关注进入维护模式的主机。进入维护模式可能是为了进行计划内的维护活动,也可能是为停用主机或磁盘组做好准备。所有这些条件下的事件活动都将被捕获。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘中的六个小组件通常在一个或多个 vSAN 集群执行滚动升级时很有用,因为您可以看到主机完成升级过程的顺序。“磁盘停用失败”小组件可以协助解决无法从磁盘组停用磁盘或无法成功停用整个磁盘组的情况。

 

 

配置故障

 

  1. 单击“Configuration Failures”(配置故障)
  2. 向下滚动以查看更多小组件

配置故障仪表盘提供的小组件侧重于尝试基于特定策略来配置对象。如果根据环境条件(例如集群规模和磁盘布局),该环境无法接受虚拟机的特定性能或保护级别,则 vSAN 会阻止应用该策略,并将生成事件。这些类型的事件将显示在配置故障仪表盘中。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘中的六个小组件专门显示配置更改中的特定故障事件。出现这些故障事件的最常见原因是试图对虚拟机进行策略更改,但集群不具备提供这种支持的条件。例如,“故障域不足”错误可能是由于在使用 RAID-1 镜像的容错方法 (FTM) 时,尝试将虚拟机容许的主要故障数 (FTT) 级别更改为 3,但却低于支持 FTT = 3 所需的最低主机级别 (7)。

 

 

运维故障

 

  1. 单击“Operation Failures”(运维故障)
  2. 向下滚动以查看更多小组件

显示的运维故障仪表盘是一种基于故障的仪表盘,主要关注与 vSAN 相关的运维以及这些运维是否成功完成。此处捕获的故障事件类型侧重于对象和组件的创建与配置。它还涉及某些级别的拥塞和重新同步操作。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

运维故障仪表盘包含五个小组件。其中两个小组件用于捕获有关重新同步启动事件和传入拥塞的活动。这些活动包含在此仪表盘中,因为这些类型的事件通常会相互关联。例如,此仪表盘中监控的对象组件创建故障事件可能是由网络连接或分区问题导致的。因此,在同一仪表盘中显示重新同步操作启动事件可以让我们进一步了解可能的原因。

 

 

运行状况

 

  1. 单击“Health”(运行状况)

运行状况仪表盘很好地概述了对象组件、容量设备和缓存层设备的运行状况状态更改。特别值得一提的是,磁盘运行状况更改可能与 vCenter 内的 vSAN UI 中所示的降级设备处理事件相关。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

这个包含三个小组件的仪表盘是确定设备是否具有历史性问题的有效方法,因为随着时间推移该问题在 vCenter UI 中将会变得不明显。永久设备丢失 (PDL) 事件可能是由故障设备或支持性设备(例如存储控制器)导致的。有时,磁盘运行状况更改小组件可能会报告组件“缺失”消息,这些消息可能是其他操作的一部分。

 

 

对象事件

 

  1. 单击“Object Events”(对象事件)
  2. 向下滚动以查看更多小组件

显示的对象事件仪表盘报告组件状态更改。此仪表盘提供了一种简单方法,用来跟踪某个组件进入非所需状态(降级、缺失、过期)的时间以及查看一段时间内的潜在相关活动。

我们的 vRealize Log Insight 课程到此结束。

可选(阅读更多详细信息或单击“>”进入下一个“实验手册”页面):

此仪表盘由五个小组件组成,可能是集成到 vSAN 内容包的最有用仪表盘。状态更改可为一系列可能会被忽视的事件提供上下文。例如,此仪表盘会立即报告哪些对象失去了“活动状态”。对于对象组件的降级、缺失或过期状态,也是如此。根据发生的故障类型,“对象组件状态 - 重新同步”小组件会不时捕获后续重新同步事件。如果 vSAN 接收到将设备置于降级状态的感知代码,则可以立即开始执行组件重新同步操作,或者可以在对象组件缺失一段时间之后的 60 分钟内开始执行重新同步操作。

 

vSAN iSCSI 集成


在 vSAN 6.7 中,添加了当 vSAN 数据存储上使用 iSCSI 目标时,对 Windows Server 故障转移集群 (WSFC) 的支持。对此功能的支持包括虚拟机工作负载,而在之前,这些工作负载在连接到 vSAN iSCSI 目标时并不受支持。

在本实验中,我们将指导您设置 iSCSI 服务、创建具有 LUN 的 iSCSI 目标,这些 iSCSI 目标将由已组成集群的一对 Microsoft 服务器使用。

我们还将在 Windows 服务器中进行一些基本配置,以便您了解 WSFC 的基本要求。

通常,Windows Server 故障转移集群需要多个 LUN,用于仲裁和数据磁盘。在本实验任务中,我们将创建一个 iSCSI 目标,与 Windows 集群一起使用,并在目标上配置 2 个 LUN。


 

启用 vSAN iSCSI 服务

 

要启用 vSAN iSCSI 服务,我们首先需要启用该服务

  1. 在清单窗格中选择名为“RegionA01-COMP01”的集群。
  2. 选择“Configure”(配置)选项卡。
  3. 依次单击“vSAN”>“Services”(服务)
  4. 单击“EDIT”(编辑)

 

 

启用 vSAN iSCSI 服务

 

  1. 启用 vSAN iSCSI 目标服务

将其余选项保留为默认值。

用于主目录对象的存储策略将是 vSAN 默认存储策略

单击“APPLY”(应用)

 

 

确认 vSAN iSCSI 服务

 

  1. 展开 vSAN iSCSI 目标服务

确认设置是正确的、我们具有合规状态,并且主目录对象的运行状况是良好。

 

 

添加 iSCSI 目标

 

启用 iSCSI 目标服务后,我们现在将创建 iSCSI 目标

  1. 依次选择“vSAN”>“iSCSI Target Service”(iSCSI 目标服务)
  2. 选择“iSCSI Targets”(iSCSI 目标)
  3. 单击“Add”(添加)

 

 

 

添加 iSCSI 目标

 

  1. 提供可以标识此目标及其用途的别名。输入 WSFC Target

完成向导后,ESXi 将自动生成 IQN。

单击“OK”(确定)

 

 

确认 iSCSI 目标已创建

 

确认 iSCSI 目标已创建。

  1. 注意,系统已自动为您创建 iSCSI 目标 IQN。

现在我们已创建了 iSCSI 目标,接下来创建一些 iSCSI LUN

  1. 在“vSAN iSCSI LUNS”面板中,单击“Add”(添加)

 

 

创建第一个 iSCSI LUN

 

输入以下值,创建第一个 vSAN iSCSI LUN:

ID:10
Alias(别名):LUN-10
Storage Policy(存储策略):vSAN Default Storage Policy
Size(规模):5 GB

单击“ADD”(添加)

 

 

创建第二个 iSCSI LUN

在“vSAN iSCSI LUNS”面板中,单击“Add”(添加)

输入以下值,创建第二个 vSAN iSCSI LUN:

ID:11
Alias(别名):LUN-11
Storage Policy(存储策略):vSAN Default Storage Policy
Size(规模):5 GB

单击“ADD”(添加)

 

 

确认 iSCSI LUN 已创建

 

确认 iSCSI LUN 已创建并且它们的运行状况良好且合规。

 

 

创建启动器组

 

在这部分,我们将创建一个启动器组,以限制仅通过 Windows 服务器访问 iSCSI 目标。

  1. 依次选择“vSAN”>“iSCSI Target Service”(iSCSI 目标服务)
  2. 选择“INITIATOR GROUP”(启动器组)
  3. 单击“Add”(添加)

 

 

创建启动器组

 

  1. 在“Group Name”(组名称)字段中输入值 WSFC_Cluster。(注意,不允许出现空格)

稍后,我们会将成员启动器添加到该组。

单击“Create”(创建)

 

 

确认启动器组创建

 

确认 vSAN iSCSI 启动器组已创建。

 

 

将启动器组添加到 iSCSI 目标

 

  1. 选择“ISCSI TARGETS”(ISCSI 目标)选项卡。
  2. 单击“Allowed Initiators”(允许的启动器)面板中的“Add”(添加)链接。

 

 

将启动器组添加到 iSCSI 目标

 

  1. 选择“Initiator Group”(启动器组)单选按钮
  2. 选择“WSFC_Cluster”组。

单击“Create”(创建)

 

 

将启动器组添加到 iSCSI 目标

 

为给下一个任务做好准备,我们需要记录目标 IQN。

  1. 如图所示,突出显示 WSFC 目标的 IQN 名称,右键单击并选择“Copy”(复制)。

将 IQN 粘贴到记事本或记事本++,以供日后使用。

  1. 此外,还要注意,目标有一个分配的 I/O 所有者主机。记下环境中的当前所有者主机(可能与显示的主机不同)。

 

 

配置 Windows 服务器以访问 iSCSI 目标

 

打开指向 WSFC-01a 服务器的“Remote Desktop Manager”应用

 

 

配置 Windows 服务器以访问 iSCSI 目标

 

您将自动登录 Windows 主机。

在 Windows 任务栏上打开 Server Manager

 

 

配置 Windows 服务器以访问 iSCSI 目标

 

  1. 单击“Tools”(工具)。

需要启用三种服务才能允许 WSFC 支持,这三种服务如图中所示:Failover Cluster Manager(故障转移集群管理器)、iSCSI Initiator(iSCSI 启动器)和 MPIO。

默认情况下,Windows 服务器仅默认安装了 iSCSI 启动器服务。使用“添加角色和功能特性”向导添加其他服务。在我们的实验中,我们已预先安装了这些服务。

  1. 依次单击“Tools”(工具)>“MPIO”。

 

 

在 Windows 服务器上配置 MPIO

 

在本实验环境中,我们已配置了 MPIO。

  1. 在“MPIO Properties”(MPIO 属性)对话框中,选择“Discover Multi-Paths”(发现多路径)选项卡。

确认“Add support for iSCSI devices”(添加对 iSCSI 设备的支持)已启用。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

依次单击“Tools”(工具)>“iSCSI Initiator”(iSCSI 启动器)

  1. 在“iSCSI Initiator Properties”(iSCSI 启动器属性)对话框中,选择“Discover”(发现)选项卡。
  2. 单击“Discover Portal”(发现门户)以添加目标 IP 地址。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

为主机 esx-01a 添加为 iSCSI(在我们的例子中是 vmk3)配置的 VMkernel 端口的 IP 地址。保留“Port”(端口)的默认值 (3260)。

重复执行此步骤,为每台 ESXi 主机的 vmk3 IP 地址添加内容

esx-01a 192.168.130.51
esx-02a 192.168.130.52
esx-03a 192.168.130.53
esx-04a 192.168.130.54

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

  1. 选择“Targets”(目标)选项卡。
  2. 您会看到 vSAN iSCSI 目标 IQN 显示在“Discovered Targets”(已发现的目标)列表中。
  3. 您可以对照检查这个 IQN 与复制到记事本中的值。其状态应显示为“Inactive”(非活动)
  4. 突出显示 vSAN iSCSI 目标 IQN,然后单击“Connect”(连接)

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

  1. 在“Connect To Target”(连接到目标)对话框中,选中“Enable Multi-path”(启用多路径)选项。
  2. 单击“OK”(确定)

您将收到授权失败的消息。单击“OK”(确定),并将“iSCSI Initiator Properties”(iSCSI 启动器属性)对话框保持在打开状态。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

返回到 vSphere Client。

  1. 选择名为“RegionA01-COMP01”的集群
  2. 选择“Configure”(配置)选项卡。
  3. 依次选择“vSAN”>“iSCSI Target Service”(iSCSI 目标服务)
  4. 选择“Initiator Groups”(启动器组)选项卡。
  5. 单击“Initiators”(启动器)面板中的“Add”(添加)链接

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

在“Member initiator name”(成员启动器名称)字段中输入以下 IQN,然后单击“Add”(添加)

iqn.1991-05.com.microsoft:wsfc-01a.corp.local
iqn.1991-05.com.microsoft:wsfc-02a.corp.local

单击“FINISH”(完成)

 

 

确认已添加启动器

 

确认已添加 2 个启动器。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

“iSCSI Initiator Properties”(iSCSI 启动器属性)对话框仍应处于打开状态。如果此对话框未打开,请打开它。

在“Targets”(目标)选项卡中,选择 vSAN 目标 IQN,然后单击“Connect”(连接)

在“Connect To Target”(连接到目标)对话框中,确保选中“Enable Multi-path”(启用多路径)

单击“OK”(确定)

 

 

配置其他 Windows Server

在接下来的几个步骤中,我们将配置其他 Windows Server。

 

 

 

配置 Windows 服务器以访问 iSCSI 目标

 

打开指向 WSFC-02a 服务器的“Remote Desktop Manager”应用

 

 

配置 Windows 服务器以访问 iSCSI 目标

 

您将自动登录 Windows 主机。

在 Windows 任务栏上打开 Server Manager

 

 

配置 Windows 服务器以访问 iSCSI 目标

 

  1. 单击“Tools”(工具)。

需要启用三种服务才能允许 WSFC 支持,这三种服务如图中所示:Failover Cluster Manager(故障转移集群管理器)、iSCSI Initiator(iSCSI 启动器)和 MPIO。

默认情况下,Windows 服务器仅默认安装了 iSCSI 启动器服务。使用“添加角色和功能特性”向导添加其他服务。在我们的实验中,我们已预先安装了这些服务。

  1. 依次单击“Tools”(工具)>“MPIO”。

 

 

在 Windows 服务器上配置 MPIO

 

在本实验环境中,我们已配置了 MPIO。

  1. 在“MPIO Properties”(MPIO 属性)对话框中,选择“Discover Multi-Paths”(发现多路径)选项卡。

确认“Add support for iSCSI devices”(添加对 iSCSI 设备的支持)已启用。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

依次单击“Tools”(工具)>“iSCSI Initiator”(iSCSI 启动器)

  1. 在“iSCSI Initiator Properties”(iSCSI 启动器属性)对话框中,选择“Discover”(发现)选项卡。
  2. 单击“Discover Portal”(发现门户)以添加目标 IP 地址。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

为主机 esx-01a 添加为 iSCSI(在我们的例子中是 vmk3)配置的 VMkernel 端口的 IP 地址。保留“Port”(端口)的默认值 (3260)。

重复执行此步骤,为每台 ESXi 主机的 vmk3 IP 地址添加内容

esx-01a 192.168.130.51
esx-02a 192.168.130.52
esx-03a 192.168.130.53
esx-04a 192.168.130.54

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

  1. 选择“Targets”(目标)选项卡
  2. 您会看到 vSAN iSCSI 目标 IQN 显示在“Discovered Targets”(已发现的目标)列表中。
  3. 您可以对照检查这个 IQN 与复制到记事本中的值。其状态应显示为“Inactive”(非活动)
  4. 突出显示 vSAN iSCSI 目标 IQN,然后单击“Connect”(连接)

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

  1. 在“Connect To Target”(连接到目标)对话框中,选中“Enable Multi-path”(启用多路径)选项。
  2. 单击“OK”(确定)

您将收到授权失败的消息。单击“OK”(确定),并将“iSCSI Initiator Properties”(iSCSI 启动器属性)对话框保持在打开状态。

 

 

配置 Windows iSCSI 启动器以连接 vSAN iSCSI 目标

 

“iSCSI Initiator Properties”(iSCSI 启动器属性)对话框仍应处于打开状态。如果此对话框未打开,请打开它。

在“Targets”(目标)选项卡中,选择 vSAN 目标 IQN,然后单击“Connect”(连接)

在“Connect To Target”(连接到目标)对话框中,确保选中“Enable Multi-path”(启用多路径)

单击“OK”(确定)

 

 

设置 Windows Server 故障转移集群

如果您已正确完成上一个任务,那么两个 Windows 服务器都应该能够访问 iSCSI 目标,并且应该已经发现了两个 LUN。确保 vSAN iSCSI 目标启动器组包含两个 Windows iSCSI 启动器 IQN。

如果不符合上述陈述中的任何一个,请查看上一个任务,并解决问题。问题解决之前请勿继续。

我们已选择包含 Windows Server 故障转移集群配置,从而帮助您熟悉从 Microsoft 角度设置此集群所需的步骤。虽然您不必修复 Microsoft 端的任何问题,但我们认为了解设置是有好处的,这样可以正确了解 vSphere 端发生的情况。

 

 

格式化 LUN

 

如果您尚未打开指向 WSFC-01a 服务器 的 RDP 连接,请执行此操作。

右键单击开始菜单图标,然后选择“Disk Management”(磁盘管理)您将看到我们为此 Windows 主机提供的 2 个 5 GB vSAN iSCSI LUN。

右键单击这两个脱机磁盘,然后单击“Online”(联机)。(您需要单击显示磁盘编号的灰色区域)

 

 

格式化 LUN

 

  1. 右键单击第一个磁盘上显示“Not Initialized”(未初始化)的左侧灰色区域(应该是“Disk 1”[磁盘 1]),然后选择“Initialize Disk”(初始化磁盘)(再次点击左侧的灰色区域)
  2. 在“Initialize Disk”(初始化磁盘)对话框中,依次选中“Disk 1”(磁盘 1)和“Disk 2”(磁盘 2)确保已选中“GPT”选项。
  3. 单击“OK”(确定)

 

 

格式化 LUN

 

  1. 右键单击“Disk 1”(磁盘 1)上的“Unallocated”(未分配)框,然后单击“New Simple Volume...”(新建简单卷...)
  2. 连续单击三个“Next”(下一步)。将卷标签值更改为 Data。依次单击“Next”(下一步)和“Finish”(完成)完成向导。

对第二个磁盘重复执行前两个步骤,并指定卷标签为 Quorum

 

 

测试集群

 

  1. 通过开始菜单打开 Server Manager
  2. 选择“Tools”(工具)
  3. 选择“Failover Cluster Manager”(故障转移集群管理器)。

 

 

验证集群

 

  1. 在“Failover Cluster Manager”(故障转移集群管理器)对话框的“Management”(管理)面板中,选择“Validate Configuration”(验证配置)

单击“Before you begin”(开始之前)页面上的“Next”(下一步)

 

 

验证集群

 

在“Enter name”(输入名称)字段中分别输入两个 Windows 服务器的域名全称 (FQDN),然后单击“Add”(添加)

wsfc-01a.corp.local
wsfc-02a.corp.local

单击“Next”(下一步)

 

 

验证集群

 

  1. 将“Run all tests”(运行所有测试)选项保留为选中状态,然后单击“Next”(下一步)

单击“下一步”开始测试

 

 

验证集群

 

等待测试完成

  1. 单击“View report”(查看报告)按钮,这将打开 HTML 报告文件。所有测试都应成功完成,但“存储 > 验证基于 Microsoft MPIO 的磁盘”测试除外。因为只有一条可用路径,这项测试会失败。还需完成其他步骤,这样在该路径失败时,vSAN 将分配新的 I/O 所有者主机,而 Windows 也会自动通过故障转移切换到新的可用目标。
  2. 选中“Create the cluster now using the validated nodes”(现在使用已验证的节点创建集群)

单击“Finish”(完成)

 

 

创建集群

 

在向导的下一部分中,我们将创建可用于连接到集群的虚拟 IP。与集群的任何连接都将通过此 IP/主机名进行,这样一来,即使在故障转移后用户也可继续连接。集群主机名和 IP 的 DNS 条目已创建。

  1. 在“Cluster Name”(集群名称)字段中输入 wsfc-cluster。(我们不需要在此处输入 FQDN,因为该服务器已加入域,向导只查找 NetBIOS 或短名称)
  2. 在“Networks”(网络)字段中输入以下信息(两个 Windows 服务器已静态分配了 192.168.110.101/192.168.130.101 和 192.168.110.102/192.168.130.102 地址)。这将用作集群的虚拟 IP。
192.168.110.0/24 : 192.168.110.103
192.168.130.0/24 : 192.168.130.103

单击“Next”(下一步)

 

 

创建集群

 

检查详细信息以创建集群。

单击“Next”(下一步)

等待集群完成创建

 

 

创建集群

 

查看“Summary”(摘要)页面。您还可以查看向导创建的报告。

单击“Finish”(完成)

 

 

验证集群

 

  1. 在故障转移集群管理器窗口的左侧窗格中,依次展开“wsfc-cluster.corp.local”和“Storage”(存储)
  2. 选择“Disks”(磁盘)
  3. 注意磁盘的所有者节点。这是集群的主节点,也是用户连接到 wsfc-cluster.corp.local 时要连接的服务器。

在所有者节点服务器上打开文件资源管理器,然后单击此 PC。您会看到 C: 驱动器和 CD-ROM 驱动器,以及集群的数据驱动器和仲裁驱动器。

在另一个节点上执行相同操作,您将只看到 C: 和 CD-ROM 驱动器。

 

 

总结

Windows Server 故障转移集群的基本设置到此就完成了。在 WSFC 上运行的特定应用或服务需要执行更多步骤,但在本实验中,当前的配置足以测试和验证 vSAN iSCSI 配置。

 

vSAN CLI 界面



 

ESXCLI 增强功能

VMware vSAN 具有一些记录的 ESXCLI 命令,可用于探究和配置各 ESXi 主机。

在本课中,我们将提供一些用于 vSAN 的有用命令。请遵照下面的说明随意尝试。请注意,如果您运行的是本课程范围之外的任何命令,有可能会对本实验造成不利影响,从而可能无法继续学习任意剩余的单元或本单元的剩余内容。因为我们还将在本单元后面的部分使用其中的某些命令。

 

 

启动 PuTTY

 

从 Windows 任务栏启动 PuTTy 应用。

 

 

选择“esx-01a.corp.local”

 

  1. 选择名为“esx-01a.corp.local”的 ESXi 主机
  2. 选择“Load”(加载)
  3. 选择“Open”(打开)

 

 

ESXCLI vSAN 命令

 

输入:

esxcli vsan

这会显示与 vSAN 相关的所有可用 esxcli 命令的列表,每个命令附带一段简短描述。

 

 

esxcli vsan cluster 命令

 

  1. 要查看有关 vSAN 集群的详细信息,例如其运行状况亦或是主节点或备用节点,则可以输入以下命令:
esxcli vsan cluster get

请注意,通常用于引用 vSAN 集群的 UUID 列为“Sub-Cluster UUID”。

如果您要发出相应的“esxcli vsan cluster join”命令,则需要为 UUID 提供此值。

 

 

esxcli vsan network 命令

 

要查看网络连接的详细信息,可以执行以下命令:

esxcli vsan network list

在这里,我们可以看到“Network VmkNic”为“vmk3”,而此 VMKernel 端口上的“Traffic Type”(流量类型)为“vsan”。

另外,如果您运行 esxcli vsan network list,则多播信息仍会显示,即便可能不会用到也是如此。

 

 

esxcli vsan storage 命令

 

要查看此主机上构成 vSAN 集群的物理存储设备的详细信息,可以使用以下命令:

esxcli vsan storage list

请注意,此命令不会列出 ESXi 主机中可用的存储设备,它只会报告已作为 vSAN 磁盘组的一部分分配给 vSAN 的存储设备。如果没有为 ESXi 主机上的 vSAN 配置任何磁盘,则此命令的输出将为空。

我们可从此命令中获知大量信息。

  1. 硬盘为固态硬盘还是旋转磁盘。
  2. 是否已启用 vSAN 重复数据消除和压缩功能。
  3. 磁盘用于缓存还是容量。
  4. 磁盘格式是什么。
  5. 是否已启用 vSAN 加密功能。

 

 

 

esxcli vsan policy 命令

 

要查看当前使用的策略(例如 vSAN 可以容许的故障数),可执行以下命令:

esxcli vsan policy getdefault

请注意,该策略可能包含不同 Virtual SAN 对象类型的不同功能,此处反映为针对 vmswap 对象以独占方式指定“ForceProvisioning”(强制调配)的附加功能。这也适用于 vmswap 对象类型,因为它并不是虚拟机的一个永久属性,并且当虚拟机需要迁移到集群中的另一台主机时(vMotion 和 DRS 等),将对其重新进行创建

 

 

esxcli vsan health 命令

 

为了在单台 ESXi 主机上支持 vSAN 运行状况检查,我们添加了以下两个 ESXCLI 命令:

  • vsan.health.cluster get
  • vsan.health.cluster list
  1. 要获取所有 vSAN 运行状况检查的摘要视图,可以运行以下命令:
esxcli vsan health cluster list

 

 

esxcli vsan health 命令(续)

 

  1. 要检查主机 vSAN 运行状况服务的安装情况,请运行以下命令
esxcli vsan health cluster get -t "ESXi vSAN Health service installation"
  1. 要检查未配置 vSAN vmknic 的主机,请运行以下命令
esxcli vsan health cluster get -t "All hosts have a vSAN vmknic configured"

 

 

esxcli vsan cluster unicastagent 命令

 

以下新 esxcli 命令将指明哪些主机正在使用单播(但不会列出运行命令的主机):

esxcli vsan cluster unicastagent list

 

PowerCLI vSAN 命令



 

PowerCLI 概述

VMware PowerCLI 是一款基于 Windows Powershell 的命令行和脚本编写工具,可提供 500 多个 cmdlet,用于管理 vSphere、vSAN、Site Recovery Manager、vRealize Operations Manager、vSphere Automation SDK、vCloud Director、vCloud Air、vSphere Update Manager 和 VMware Horizon 环境并实现自动化操作。

在本课中,我们将查看 Lab PowerCLI 环境并执行一些 vSphere 管理任务。

 

 

启动 PowerCLI

 

本实验已预先安装了 PowerCLI。

  1. 单击 Windows 任务栏上的 PowerShell 图标。

 

 

确认版本

 

  1. 输入下面的 cmdlet 名称以检索我们的 PowerCLI 版本信息:
Get-PowerCLIVersion
  1. 您会注意到 get-powercliversion 命令已弃用,因此让我们运行 get-module cmdlet。
Get-Module -ListAvailable -name VMware.PowerCLI

 

 

连接到 vCenter

 

输入以下命令以连接到我们的 Lab vCenter:

Connect-VIServer vcsa-01a.corp.local

Connect-VIServer cmdlet 可用于在多个 vCenter 实例之间进行连接和查询。

 

 

PowerCLI Cmdlet

 

我们在前面使用了“Connect-VIServer”cmdlet。Cmdlet 是经过预编译以供您使用的小程序。

让我们通过输入下面这些命令来使用几个 cmdlet,以便查看我们的 vCenter 环境(请记住,您可以根据需要使用 Tab 键来自动补全命令)。

  1. 检索可用的 vCenter 数据中心:
Get-Datacenter
  1. 检索 vCenter 集群:
Get-Cluster
  1. 检索虚拟机:
Get-VM
  1. 检索可用的 vCenter 数据存储:
Get-Datastore

 

 

Cmdlet(续)

 

您可以通过管道将命令组合在一起,创建命令管道。

命令管道即一系列由管道运算符 | 分隔的命令。命令管道中的每个命令都会接收来自上一个命令的对象、对其执行一些操作,然后将其传递给命令管道中的下一个命令。对象一旦可用,即从命令管道中输出。

1. 输入以下命令,将 Get-VM 的输出通过管道传递给 Format-Table cmdlet,并仅返回“Name”和“PowerState”列:

Get-VM | Format-Table Name, PowerState
  1. 我们也可以将 Get-VM 的结果通过管道传递给 Where-Object cmdlet,以便根据具体信息(如电源状态)进行筛选:
Get-VM | Where-Object {$_.PowerState -eq 'PoweredOn'}

 

 

克隆虚拟机

 

在本课程的最后一步,我们将使用 New-VM cmdlet 克隆现有的虚拟机(后面有关使用“基于存储策略的管理”的自动化课程中将会使用此虚拟机)。

  1. 输入以下命令并监控克隆进度(如果愿意,您也可以简单地在手册中突出显示整条命令,然后将其拖放到 PowerCLI 窗口中):
New-VM -Name PowerCLI-VM -VM core-A -Datastore vsanDatastore -ResourcePool esx-01a.corp.local

 

 

PowerCLI vSAN 命令

以前版本的 PowerCLI 有(6 个)特定的 vSAN cmdlet 可供使用:

• Get-VsanDisk

• Get-VsanDiskGroup

• New-VsanDisk

• New-VsanDiskGroup

• Remove-VsanDisk

• Remove-VsanDiskGroup

 

 

PowerCLI vSAN 命令

 

  1. 使用 Get-Command 查看名称中包含“vsan”的 cmdlet:
Get-Command *vsan*

 

 

vSAN 配置信息

 

  1. 为了简化操作,我们将创建一个名为 $cluster 的变量,并将其设置为与 Get-Cluster cmdlet 具有相同的值:
$cluster = Get-Cluster
  1. 输出变量内容:
$cluster
  1. 将 $cluster 变量传递给新的 Get-VsanClusterConfiguration cmdlet:
Get-VsanClusterConfiguration $cluster

请注意,我们可以看到 vSAN 集群的几项高级属性(vSAN 已启用、Stretched Cluster 未启用,等等)

 

 

Get-VsanClusterConfiguration

 

我们来看看可以通过该 cmdlet 获取的其他信息。

  1. 将名为 $vsanconfig 的变量设置为等于 Get-VsanClusterConfiguration 的结果(您可以单击一次向上箭头,然后单击向左箭头以插入变量名称):
$vsanConfig = Get-VsanClusterConfiguration $cluster
  1. 将 $vsanConfig 通过管道传递给 Get-Member cmdlet,查看所有可用的方法和属性:
$vsanConfig | Get-Member

 

 

Get-VsanClusterConfiguration(续)

 

您可以将单个属性的名称附加到您的 $vsanConfig 变量后面来直接查看这些属性。

  1. 例如,尝试以下一个或多个命令:
$vsanConfig.HealthCheckEnabled
$vsanConfig.PerformanceServiceEnabled
$vsanConfig.VsanDiskClaimMode
  1. 要查看所有的属性及其结果,只需将 $vsanConfig 变量传递给 Format-List cmdlet 即可:
$vsanConfig | Format-List

 

 

Test-VsanVMCreation

 

本测试会在 vSAN 集群中的每台 ESXi 主机上创建一个非常简单的微型虚拟机。

如果创建成功,我们将删除该虚拟机并由此断定 vSAN 的很多方面都可以正常运行(管理体系可以在所有主机上运行、vSAN 网络已检测到并可以正常运行、针对对象的创建、删除和 I/O 操作可以正常执行,等等)。

通过执行此测试,管理员可以发现被动运行状况检查可能无法检测出的问题。通过对整个系统执行此操作,可以轻松确认所有特定的故障主机,然后采取相应措施来修复潜在问题。

  1. 创建一个 $testVM 变量,将 Test-VsanVMCreation cmdlet 的结果指定给它:
$testVM = Test-VsanVMCreation $cluster
  1. 输入 $testVM 变量,然后按“Enter”键输出该测试的结果:
$testVM

请注意,测试结果显示为“Passed”。

 

 

Test-VsanVMCreation(续)

 

  1. 查看 Test-VsanVMCreation 使用 Get-Member cmdlet 识别的属性:
$testVM | Get-Member
  1. 查看 HostResult 属性,方法是将此属性附加到 $testVM 变量后面:
$testVM.HostResult

请注意,已在每台 vSphere 主机上成功创建测试虚拟机。

 

 

Get-VsanSpaceUsage

 

让我们更详细地了解 Get-VsanSpaceUsage cmdlet。

  1. 设置一个名为 $vsanUsage 且等同于 Get-VsanSpaceUsage cmdlet 的结果的变量:
$vsanUsage = Get-VsanSpaceUsage
  1. 通过输入变量名称输出结果:
$vsanUsage

注意:实验环境中的 CapacityGB 大小可能有所不同,具体取决于每台 ESXi 主机上用于创建 vSAN 数据存储的磁盘数。

 

 

Get-VsanSpaceUsage(续)

 

查看可用于 Get-VsanSpaceUsage cmdlet 的属性:

$vsanUsage | Get-Member

 

 

Get-VsanSpaceUsage(续)

 

输入此简单脚本以查看可用磁盘数并做出相应回应。

if ($vsanUsage.FreeSpaceGB -gt 50)
{ write-host -foregroundColor Yellow "You have plenty of disk remaining!" }
elseif ($vsanUsage.FreeSpaceGB -lt 50)
{ write-host -foregroundColor Yellow "Time to order more disk!"}

注意:您可以视需要突出显示上方脚本内容并将其拖放到 PowerCLI 窗口。

 

 

基于存储策略的管理

 

基于存储策略的管理 (SPBM) 可实现存储服务的精确控制。vSAN 提供可用性级别、性能条带化等服务以及限制 IOPS 的能力。可使用 vSphere Web Client 和/或 PowerCLI 创建包含一个或多个规则的策略。

这些策略可以分配给虚拟机和个别对象,例如虚拟磁盘。

应用要求发生变化时,可轻松更改和/或重新分配存储策略。

无需停机,也无需(使用 Storage vMotion)将虚拟机从一个位置迁移至另一个位置即可执行这些更改。

 

 

虚拟机准备

 

如果您需要将新的存储策略手动应用到各个虚拟机,则这一过程可能会非常繁琐。在此部分中,我们将新建一个存储策略,并展示如何轻松地将其应用到多个虚拟机。

新的存储策略会将 IOPS 限制设置为每个虚拟机 500。如果您希望优先处理某个虚拟机,这会非常有用。

要准备好虚拟机,请执行以下步骤:

  1. 在您的环境中创建另一个虚拟机
New-VM -Name PowerCLI-VM-01 -VM core-A -Datastore vsanDatastore -ResourcePool esx-02a.corp.local
  1. 设置一个名为 $vms 且等同于名称以“PowerCLI”开头的所有虚拟机的变量,然后确认变量内容:
$vms = Get-VM -name PowerCLI*
$vms
  1. 启动每个虚拟机:
Start-VM $vms

 

 

New-SpbmStoragePolicy

 

  1. 新建一个存储策略,并将 IOPS 限制设置为 500:
New-SpbmStoragePolicy -Name vSAN-IOPSlimit -RuleSet (New-SpbmRuleSet -Name "vSANIOPSlimit" -AllOfRules @((New-SpbmRule -Capability VSAN.iopslimit 500)))
  1. 查看存储策略:
Get-SpbmStoragePolicy -requirement -namespace "VSAN" | Select Name, Description

 

 

Set-SpbmStoragePolicy

 

  1. 将新建的存储策略应用到多个虚拟机:
foreach ( $vm in $vms ) { $vm, (Get-HardDisk -VM $vm) | Set-SpbmEntityConfiguration -StoragePolicy "vSAN-IOPSlimit" }

注意:在实验环境中,完成此命令可能需要一段时间。在此期间,欢迎您继续学习本课程的最后一部分。

 

 

总结

在本单元中,您已了解了 PowerCLI 以及如何将其用于监控、管理以及自动化 VMware vSAN。

我们希望此信息能够触发有关如何在您自己的环境中利用 PowerCLI 的灵感。

正如您所期待的,我们还提供大量其他可用信息,以助您踏上 PowerCLI 与 vSAN 之旅。

 

总结


在本课中,我们了解了 vRealize Network Log Insight 在 vSAN 环境中可以提供的优势。我们还讨论了 vSAN 6.7 iSCSI 的增强功能,并通过 vSAN 数据存储发布了 iSCSi 目标。最后,我们向高级用户展示了各种 vSAN 命令行界面。


 

您已完成第 5 单元的学习

祝贺您!您已经完成了第 5 单元的学习。

如果您想了解有关该主题的其他信息,请查看以下内容:

继续学习本动手实验中的其余单元。

第 6 单元将讨论 vSAN 安全参数,例如 FIPS 104-2 验证和 vSAN 静态数据加密。

 

 

如何结束实验

 

如果您要结束实验,请单击“END”(结束)按钮。

 

第 6 单元 - vSAN 6.7 安全性(30 分钟)

简介


企业领导者需要确信他们的数据受到妥善保护,还需要保持较低成本。一直以来,企业需要购买额外的安全产品,例如自加密驱动器或第三方安全软件。vSAN 提供业界首个基于软件并经 FIPS 140-2 验证的原生超融合基础架构 (HCI) 静态数据加密。内置于 vSAN 中的 vSAN 加密支持客户选择标准驱动器(固态硬盘和硬盘驱动器),从而避免因为选择自加密驱动器 (SED) 而导致选项有限并产生额外费用。vSAN 针对合规性要求而设计,支持双因素身份验证(SecurID 和 CAC),并为 HCI 提供首个获得 DISA 批准的 STIG。


经过 DISA STIG (FIPS 140-2) 验证


vSAN 为静态数据提供了第一个原生 HCI 加密解决方案(现在已发布 vSAN 6.7)。vSAN 加密符合美国联邦政府的严格要求,是首个经过 FIPS 140-2 验证的软件解决方案。vSAN Encryption 不受硬件限制并简化了密钥管理,因而可降低数据保护成本并提高灵活性。这也是首个具有经 DISA 批准的 STIG 的 HCI 解决方案。


 

FIPS 140-2 验证

 

vSAN 通过了 FIPS 140-2 验证,在 vSphere 6.7 中提高了安全性,借此向前迈出了重要的一步。vSAN 已集成到 hypervisor 中,因此它使用 vSphere 中使用的内核模块,并且从 vSphere 6.7 开始,就已经通过了 FIPS 140-2 验证。 需要此级别验证的组织尽可放心,VMware vSphere 与 VMware vSAN 配合使用,可让他们满足安全要求。

 

vSAN 加密


您可以使用静态数据加密来保护 vSAN 集群中的数据。

vSAN 可以执行静态数据加密。数据的加密发生在所有其他处理(例如重复数据消除)完成后。静态数据加密可以在存储设备从集群中删除时保护设备上的数据。

在 vSAN 集群上使用加密功能需要做一些准备。设置好环境后,您可以在 vSAN 集群上启用加密。

vSAN 加密需要外部密钥管理服务器 (KMS)、vCenter Server 系统以及您的 ESXi 主机。vCenter Server 需要来自外部 KMS 的加密密钥。KMS 生成并存储密钥,而 vCenter Server 通过 KMS 获取密钥 ID 并将它们分发给 ESXi 主机。

vCenter Server 不会存储 KMS 密钥,但会保留密钥 ID 的列表。


 

实验准备

如果您已经完成之前单元中所列的步骤,则可以跳过用以准备本课程环境的下列步骤。

单击进入课程。

如果您是跳至本单元,我们将使用 Module Switcher PowerCLI 应用来准备环境。

 

 

Module Switcher

 

双击名为“HOL-1908 HCI”的 Module Switcher 桌面快捷方式

 

 

第 6 单元启动

 

单击第 6 单元对应的“Start”(启动)按钮

 

 

第 6 单元进度

 

监控进度直到完成。

• 按 Enter 键继续(并关闭 PowerCLI 窗口)

 

 

实验准备完成

 

第 6 单元的实验已成功准备完毕

单击窗口关闭图标,安全地停止 Module Switcher

请注意:您不能“返回”并启动目前所在单元之前的单元,除非您结束实验并重新启动

(例如:如果您启动了第 4 单元,则不能使用 Module Switcher 启动第 1、第 2 或第 3 单元练习)。

 

 

验证 HyTrust KeyControl

 

  1. 打开新的 Chrome 浏览器窗口或标签页,然后输入以下 URL 连接到 HyTrust KeyControl 界面:
https://192.168.110.81 

2. 选择“Advanced”(高级)(未显示)

3. 单击“Proceed to 192.168.110.81 (unsafe)”(转到 192.168.110.81 [不安全])

 

 

验证 HyTrust KeyControl(续)

 

  1. 使用以下凭证进行验证,然后单击“Log In”(登录)
User Name(用户名):secroot
Password(密码):VMware1!

 

 

更改密码

 

注意:如果您收到需要进行系统恢复的警告,请单击解决问题,否则:

  1. 输入以下新密码
Password(密码): !Password123

2. 单击“Update Password”(更新密码)

 

 

KMIP

 

  1. 选择“KMIP”
  2. 注意,KMS 的“State”(状态)为“Enabled”(已启用)

我们已确认 HyTrust KeyControl KMS 实例处于可运行状态。单击开始启用 vSAN 加密。

 

 

 

 

系统恢复选项

 

  1. 打开新的 Chrome 标签页,然后使用以下 URL 连接到 HyTrust KeyControl 界面:
https://192.168.110.81

2. 使用以下凭证进行验证,然后单击“Log In”(登录)

User Name(用户名):secroot
Password(密码):VMware1!

 

 

恢复管理员密钥

 

  1. 单击“Browse”(浏览)

 

 

打开对话框

 

  1. 单击“Browse”(浏览)

 

 

上传文件

 

  1. 单击“Upload File”(上传文件)

允许该过程完成(注意,这可能需要几分钟,感谢您耐心等待)!

 

 

 

恢复成功

 

  1. 单击“Proceed”(继续)

 

 

 

HyTrust 登录

 

  1. 使用以下凭证进行验证,然后单击“Log In”(登录)
User Name(用户名):secroot
Password(密码):VMware1!

 

 

更改密码

 

注意:如果您收到需要进行系统恢复的警告,请单击解决问题,否则:

  1. 输入以下新密码
Password(密码): !Password123

2. 单击“Update Password”(更新密码)

 

 

KMIP

 

  1. 选择“KMIP”
  2. 注意,KMS 的“State”(状态)为“Enabled”(已启用)

我们已确认 HyTrust KeyControl KMS 实例处于可运行状态,现在可以配置 vSAN 加密了。

 

 

 

 

配置密钥管理服务器

密钥管理服务器 (KMS) 集群可提供用于加密 vSAN 数据存储的密钥。

在加密 vSAN 数据存储之前,您必须设置 KMS 集群以支持加密。完成这项任务需要将 KMS 添加到 vCenter Server 并与 KMS 建立信任关系。

vCenter Server 会调配来自 KMS 集群的加密密钥。

KMS 必须支持密钥管理互操作协议 (KMIP) 1.1 标准。

 

 

启动 vSphere Client

 

  1. 如果 Chrome 尚未运行,请单击 Windows 快速启动任务栏上的 Chrome 图标。

 

 

登录 vSphere Client

 

  1. 在 vSphere Web Client 登录屏幕上,选中“Use Windows session authentication”(使用 Windows 会话身份验证)
  2. 单击“Login”(登录)

 

 

选择主机和集群

 

选择“Hosts and Clusters”(主机和集群)

 

 

添加密钥管理服务器设置

 

密钥管理服务器 (KMS) 集群可提供用于加密 vSAN 数据存储的密钥。

在加密 vSAN 数据存储之前,您必须设置 KMS 集群以支持加密。

完成这项任务需要将 KMS 添加到 vCenter Server 并与 KMS 建立信任关系。

vCenter Server 会调配来自 KMS 集群的加密密钥。

  1. 选择名为“vcsa-01a.corp.local”的 vCenter Server
  2. 选择“Configure”(配置)
  3. 依次选择“More”(更多)>“Key Management Servers”(密钥管理服务器)
  4. 单击“ADD”(添加)

 

 

添加密钥管理服务器

 

输入以下信息创建 KMS 集群:

KMS Cluster(KMS 集群): 
Cluster name(集群名称):Hytrust KMS Server
Make this the default cluster(设置此位默认集群):启用
Server alias(服务器别名):kms-01a
Server Address(服务器地址):192.168.110.81
Server port(服务器端口):5696

其余设置可以留空。

单击“ADD”(添加)

 

 

添加密钥管理服务器

 

在“Trust Certificate”(信任证书)对话框中,

单击“TRUST”(信任)

 

 

添加密钥管理服务器

 

  1. 展开刚才添加的 kms-01a,查看更多信息。
  2. 单击“Make KMS TRUST VCENTER”(使 KMS 信任 vCenter)

 

 

添加密钥管理服务器

 

选择“KMS certificate and private key”(KMS 证书和私钥)

单击“NEXT”(下一步)

 

 

添加密钥管理服务器

 

  1. 针对 KMS 证书,单击“UPLOAD A FILE”(上传文件)并浏览到桌面上的“KMIPvSphereCert.pem”,然后单击“Open”(打开)
  2. 针对 KMS 私钥,单击“UPLOAD A FILE”(上传文件)并浏览到桌面上的“KMIPvSphereCert.pem”,然后单击“Open”(打开)

单击“ESTABLISH TRUST”(建立信任关系)

 

 

确认密钥管理服务器

 

确认 HyTrust 密钥管理服务器已添加。

确认连接状态是绿色且证书有效。

 

 

启用 vSAN 加密

自 vSAN 6.6 推出以来,我们引入了用于原生静态数据加密的另一种方案,即 vSAN 加密。

vSAN 加密是业界首个原生 HCI 加密解决方案;它内置于 vSAN 软件中。只需单击几次,即可对 vSAN 数据存储上的所有项启用或禁用 vSAN 加密功能,无需额外步骤。

vSAN 加密在 hypervisor 级别而非虚拟机环境中运行,因此它与虚拟机加密类似,对虚拟机没什么要求。

另外,因为 vSAN 加密不受硬件限制,所以与其他提供加密的 HCI 解决方案不同,它无需使用更昂贵的专用自加密驱动器 (SED)。

 

 

启用 vSAN 加密

 

您可以通过编辑现有 vSAN 集群的配置参数来启用加密。

  1. 选择名为“RegionA01-COMP01”的集群
  2. 选择“Configure”(配置)
  3. 依次选择“vSAN”>“Services”(服务)
  4. 展开“Encryption”(加密)服务
  5. 单击“EDIT”(编辑)

只需选中一个复选框即可轻松启用加密。无论数据存储上是否有虚拟机 (VM),都可以在启用 vSAN 之时或之后启用加密。

请注意,启用加密时需要对磁盘执行滚动重新格式化。

这可能会花费很长时间,尤其是在执行滚动重新格式化的同时必须迁移大量现有数据的情况下。

 

 

启用 vSAN 加密

 

启用 vSAN 加密是一键式操作。

  1. 单击以启用“Encryption”(加密)
  2. 确认 KMS 服务器选择的是“Hytrust KMS Server”(Hytrust KMS 服务器),如果您的环境中有多个 KMS 集群,可以从此处进行选择。
  3. 选中“Allow Reduced Redundancy”(允许缩减的冗余)选项

启用 vSAN 加密会提供“Erase disk before use”(在使用之前擦除磁盘)选项。请勿启用此选项。

单击这些选项的信息按钮 (i) 以了解更多相关信息。

单击“APPLY”(应用)

在使用之前擦除磁盘可以显著降低数据泄露的可能性,同时提高攻击者揭露敏感数据的成本。不过,此选项也会增加与磁盘使用时间相关的成本。

 

 

监控近期任务

 

您可以在“Recent Tasks”(近期任务)窗口中监控 vSAN 加密过程。

要启用 vSAN 加密,需进行以下操作。

  • 从 vSAN 磁盘组中迁移出数据
  • 删除该 vSAN 磁盘组
  • 重新创建 vSAN 磁盘组并启用加密

针对 vSAN 集群中的每个磁盘组重复此过程。

 

 

监控格式化进度

 

  1. 您也可以通过“Configure”(配置)->“vSAN”->“Disk Management screen”(磁盘管理)屏幕来监控 vSAN 加密的过程

启用 vSAN 加密会花点时间。vSAN 集群中的每个磁盘组都需要删除并重新创建。

 

 

启用 vSAN 加密

 

对所有磁盘组完成滚动重新格式化后,就会在 vSAN 集群上启用静态数据加密。

vSAN 会对添加到 vSAN 数据存储的所有数据进行加密。

如果密钥过期或遭到破坏,您可以选择生成新的加密密钥。

 

 

vSAN 加密运行状况检查

 

系统提供了 vSAN 运行状况检查功能,用来确认 vSAN 加密已启用且运行状况良好。

  1. 选择名为“RegionA01-COMP01”的集群
  2. 选择“Monitor”(监控)
  3. 依次选择“vSAN”>“Health”(运行状况)
  4. 展开“Encryption”(加密)运行状况服务

 

 

vSAN 加密运行状况检查

 

 

  1. 选择“vCenter and all hosts are connected to Key Management Servers”(vCenter 和所有主机均已连接到密钥管理服务器)

这项 vSAN 运行状况检查会确认 vCenter Server 是否可以连接到密钥管理服务器

 

 

vSAN 加密运行状况检查

 

  1. 选择“CPU AES-NI is enabled on hosts”(已在主机上启用 CPU AES-NI)

此检查可以确认 vSAN 集群中的 ESXi 主机是否已启用“CPU AES-NI”功能。

高级加密标准指令集(即 Intel 高级加密标准新指令;AES-NI)是对适用于 Intel 和 AMD 微处理器的 x86 指令集体系结构的扩展。此指令集旨在提高应用使用高级加密标准 (AES) 进行加密和解密的速度。

 

 

总结

通过在 vSAN 6.6 中添加 vSAN 加密和在 vSphere 6.5 中引入虚拟机加密,可在由 vSAN 存储或其他任何 vSphere 存储提供支持的超融合基础架构 (HCI) 上轻松完成原生静态数据加密。

尽管 vSAN 加密和虚拟机加密符合类似的要求,但它们的工作方式略有不同,各有擅长的使用情形。

最重要的是,当客户考虑如何为 vSphere 工作负载提供静态数据加密时,它们可以提供相应的选择。

 

总结


在本课中,我们探索了 vSAN 安全参数,包括 DISA STIG (FIPS 104-2) 验证和 vSAN 静态数据加密。


 

您已完成第 6 单元的学习

祝贺您!您已经完成了第 6 单元的学习。

如果您想了解有关该主题的其他信息,请查看以下内容:

 

 

如何结束实验

 

如果您要结束实验,请单击“END”(结束)按钮。

 

总结

感谢您参加 VMware 动手练习。 请务必访问 http://hol.vmware.com/ 继续完成在线练习。

练习 SKU: HOL-1908-01-HCI

版本: 20181114-022436