Error

Unable to initialize the simulation player:

Please reload the page or report this error to:
hol-feedback@vmware.com

This demo file may be incomplete or damaged. Please reload the page or download again from the VMware Demo Library:

For VMware partners:
www.vmware.com/go/partnerdemos

For VMware employees:
www.vmware.com/go/demos

正在加载

Error

Your web browser doesn't support some required capabilities.

This demo works best with the latest version of Chrome, Firefox, Safari, or Internet Explorer.

This simulation works best with the latest version of Chrome, Firefox, Safari, or Internet Explorer.

Error

This demo file is incomplete or damaged. Please reload the page or download again from the VMware Demo Library:

For VMware partners:
www.vmware.com/go/partnerdemos

For VMware employees:
www.vmware.com/go/demos

This simulation did not load correctly. Please reload the page or report this error to:
hol-feedback@vmware.com

Error

Visit the VMware Demo Library
to get more demos!

For VMware partners:
www.vmware.com/go/partnerdemos

For VMware employees:
www.vmware.com/go/demos

The demo will restart in 5 seconds.

Hit Esc to cancel.

X
↩ 返回练习
HOL-1844-01: VMware Cloud Foundation Commissioning and Decommissioning a Host

This is an interactive demo

Drive it with your mouse, your finger, or just use the arrow keys.

Use Learn mode to learn the demo. The orange boxes show where to click.

Use Present mode to hide the orange boxes and notes.

Use Autoplay mode to make it play like a movie. Hit the Esc key to stop.

Click a Shortcut to jump to a specific part of the demo.

X
隐藏备注
恢复备注
打开备注窗口
放大字体
缩小字体

在本模拟中,我们将展示如何处理现有工作负载域中主机发生故障的情况。我们将移除发生故障的主机,并从可用池中添加一台主机。在完成必要的修复后,为发生故障的主机重建映像,并将其返回可用池。

 

主机投入使用与停用

 

本部分的练习以动手练习交互式模拟的形式呈现。这样,您便可以在练习环境中实际体验需要消耗大量时间或资源的步骤。在此模拟练习中,您可以像与实际环境进行交互一样使用软件界面。

橙色框显示点击位置,您也可以使用向左和向右箭头键向上述任一方向移动,进行模拟。

我们的开始位置是 SDDC Manager 仪表盘:

  1. 单击“Status”(状态)
    • 我们可以在“System Status”(系统状态)页面上看到一个严重警报。
  2. 单击警报下的“VIEW DETAILS”(查看详细信息)
    • 我们可以看到“Alert - Server is powere...>”(警报 - 服务器已...>)严重警报以及发生的日期和时间。
  3. 单击“Alert - Server is powere...>”(警报 - 服务器已...>)将其展开,查看其他详细信息
  4. 单击滚动条向下滚动。
    • 在警报详细信息中,我们看到这是主机 R1N5 的 SERVER_DOWN_ALERT。此主机处于关闭状态,可能有电源问题或其他硬件相关问题。这就意味着,此主机所属的 vSAN 集群有陷入降级状态的风险。
    • 我们需要快速应对,替换发生故障的主机。我们将利用 SDDC Manager 的自动化功能完成此任务。
  5. 单击“DASHBOARD”(仪表盘)
  6. 单击“Physical Resources”(物理资源)旁边的“VIEW DETAILS”(查看详细信息)
  7. 单击标有“LASSEN 10 HOSTS”的图标
  8. 单击滚动条向下滚动
    • 在这里,我们看到机架中所有主机的摘要。我们还可以看到主机 R1N5 处于故障状态(状态栏中的红色图标指示)。
  9. 单击主机“R1N5”
    • 我们无法查看此主机的详细信息,因为无法访问。 
    • 让我们开始恢复,首先要从 Cloud Foundation 可用池中向集群添加新的主机,以替换发生故障的主机。
  10. 单击“DASHBOARD”(仪表盘)
    • 让我们首先在 vSphere Web Client 中检查集群的状态。
  11. 单击浏览器中的“vSphere Web Client”标签页
    • 在这里,我们看到主机“r1n5.lassen.demo.vmware.com”未响应,受影响的集群是我们的管理工作负载域。让我们返回 Cloud Foundation,并从管理域中移除此主机。
  12. 单击浏览器中的“VMware Cloud Foundation”标签页
  13. 单击工作负载域旁边的“VIEW DETAILS”(查看详细信息)
  14. 单击滚动条向下滚动
  15. 单击标有“MGMT MANGEMENT Domain”(MGMT 管理域)的图标
    • 这是发生故障的主机所在的工作负载域。
  16. 单击滚动条向下滚动
  17. 单击“VRACK-CLUSTER”链接
  18. 单击滚动条向下滚动
    • 在这里,我们可以看到管理工作负载域中的四台主机。由于 R1N5 发生故障,我们只剩下三台正常运行的主机。我们需要移除 R1N5,并用一台可用的主机替换,将集群还原为四个节点。
  19. 单击“R1N5”
    • 这是我们要从集群中移除的发生故障的主机。移除的方法是停用该主机。
  20. 单击“DECOMMISSION”(停用)
    • 将弹出“Decommission Host”(停用主机)对话框,请您确认是否要停用这台主机。
  21. 单击“CONFIRM”(确认)停用该主机
    • 此时将启动主机停用工作流。我们可以单击“System Status Screen”(系统状态屏幕)链接,监控此工作流的进度。
  22. 单击“System Status Screen”(系统状态屏幕)链接
  23. 单击滚动条向下滚动
  24. 在“Workflow Tasks”(工作流任务)下,单击“VIEW DETAILS”(查看详细信息)
    • 在这里,我们看到处于活动状态的工作流“VI Resource Pool - Decommission of hosts (192.168...”(VI 资源池 - 停用主机 [192.168...)
  25. 单击“VI Resource Pool - Decommission of hosts (192.168...”(VI 资源池 - 停用主机 [192.168...)工作流
  26. 单击滚动条向下滚动
    • 我们可以看到工作流的摘要。目前有 9 项待处理的子任务和 8 项已完成的子任务。
  27. 单击“View Sub Tasks”(查看子任务),查看详细信息
  28. 单击滚动条向下滚动
    • 随着步骤的执行,UI 中的子任务将动态更新。我们可以观察任务的状态从“NEW”(新)变为“RUNNING”(正在运行),再变为“SUCCESSFULL”(成功),来监控进度。所有子任务均成功完成后,工作流也就完成了。
    • 在这里,我们可以看到所有任务已成功完成,主机已从管理工作负载域中移除。
  29. 单击子任务部分的滚动条,滚动查看任务列表
    • 停用工作流中的任务包括:从 vSphere 集群中移除主机,更新 vSAN 数据存储、Virtual Distributed Switch 以及 NSX 配置以反映主机被移除的情况,更新 vCenter 清单。此外,SDDC Manager 还会重新配置架顶式交换机中的交换机端口,以反映主机被移除的情况。
  30. 单击最右侧的滚动条返回页面顶部
  31. 单击“Workflows”(工作流)以返回“Workflow summary”(工作流摘要)页面
    • 现在我们可以看到,停用工作流已成功完成
    • 接下来,我们将验证该主机已从 Cloud Foundation 清单中移除。
  32. 单击“DASHBOARD”(仪表盘)
  33. 单击“Physical Resources”(物理资源)旁边的“VIEW DETAILS”(查看详细信息)
    • 我们可以看到,LASSEN 机架现在包含 9 台主机,因为一台主机已停用
  34. 单击标有“LASSEN 9 HOSTS”的机架图标
  35. 单击滚动条向下滚动
    • 检查机架中的服务器列表,我们可以看到 r1n5 已被移除。 
    • 现在我们可以开始在集群中添加一台替换主机。
  36. 单击“DASHBOARD”(仪表盘)
  37. 单击“Workload Domain”(工作负载域)下的“VIEW DETAILS”(查看详细信息)
  38. 单击滚动条向下滚动
  39. 单击标有“MGMT MANAGEMENT Domain”(MGMT 管理域)的图标
  40. 单击滚动条向下滚动
  41. 单击“VRACK-CLUSTER”链接
  42. 单击滚动条向下滚动
    • 我们可以看到,管理域现在拥有 3 台主机。让我们将第四台主机添加到这个工作负载域中,替换刚刚移除的主机。
  43. 单击滚动条向上滚动
  44. 单击“DOMAIN DETAILS”(域详细信息)导航控件
  45. 单击“EXPAND DOMAIN”(扩展域)
  46. 单击滚动条向下滚动
    • 我们看到,这个域目前分配了三台主机(由复选框指示),还有目前可用的未分配主机。
  47. 单击主机“R1N3”,将它分配给域
  48. 单击滚动条向下滚动
  49. 单击“NEXT”(下一步)
  50. 单击滚动条向下滚动
    • 在这里,我们可以检查域扩展的详细信息。我们看到,添加了一台额外的主机。
  51. 单击“APPLY”(应用)
    • 扩展域验证框即弹出。
  52. 单击“CONFIRM”(确认)
    • 系统通知我们,域扩展工作流已触发。同样,我们可以在状态部分检查此工作流的状态。
  53. 单击“OK”(确定)
  54. 单击“STATUS”(状态)
  55. 单击滚动条向下滚动
  56. 在“Workflow Tasks”(工作流任务)下,单击“VIEW DETAILS”(查看详细信息)
    • 在这里,我们可以看到“VI Resource Pool - Expanding MGMT”(VI 资源池 - 扩展 MGMT)工作流正在运行
  57. 单击“VI Resource Pool - Expand MGMT”(VI 资源池 - 扩展 MGMT)查看该工作流的详细信息。
  58. 单击滚动条向下滚动
    • 我们看到,正在执行添加主机的 23 项子任务。
  59. 单击“View Sub Tasks”(查看子任务)
  60. 单击滚动条向下滚动
    • 在这里,我们看到 SDDC Manager 正在执行的各项独立任务。同样,我们可以滚动查看列表,了解将主机添加到集群需要执行哪些步骤。
    • 在这里,我们看到交换机端口已更新为正确的 VLAN 信息,主机已添加到 vCenter 清单并加入集群,vSAN 数据存储、分布式交换机和 NSX 配置也已相应更新。
  61. 单击滚动条,滚动查看子任务列表
    • 我们可以看到,所有子任务均已成功完成。
  62. 单击滚动条回到页面顶部
  63. 单击“Workflows”(工作流)以返回工作流摘要
    • 我们可以看到“VI Resource Pool - Expanding MGMT”(VI 资源池 - 扩展 MGMT)工作流已成功完成
  64. 单击“DASHBOARD”(仪表盘)
  65. 单击工作负载域旁边的“VIEW DETAILS”(查看详细信息)
  66. 单击滚动条向下滚动
  67. 单击标有“MGMT MANGEMENT Domain”(MGMT 管理域)的图标
  68. 单击滚动条向下滚动
    • 我们可以看到,扩展域后,管理工作负载域再次变为包含四台主机。
  69. 单击“vSphere Web Client”浏览器选项卡
    • 我们可以从 vSphere 中确认主机 R1N3 已添加到集群中,该集群重新变回包含 4 台主机,不再处于警报状态。
    • 我们已成功替换管理工作负载域中发生故障的主机。接下来,我们要将发生故障的主机返回 Cloud Foundation 清单。
  70. 单击浏览器中的“VMware Cloud Foundation”标签页
  71. 单击“DASHBOARD”(仪表盘)
    • 发生故障的主机已修复,我们随时可将它添加回 Cloud Foundation 可用池。为此,我们首先需要使用 VIA 为服务器重建映像。
  72. 单击浏览器中的新标签页按钮,打开新的浏览器窗口
    • 我们在新的浏览器窗口中使用 URL“192.168.100.2:8080/via”连接到 VIA
    • 我们将在这里激活软件捆绑包、在修复的服务器上安装 ESXi,并下载 manifest 文件。
  73. 单击“Bundle”(捆绑包)
  74. 单击“Bundle”(捆绑包)下拉菜单
  75. 选择最新版本“2.3.0-5526927”
  76. 单击“Activate Bundle”(激活捆绑包)
    • 这样 VIA 就会知道应该使用哪个 ESXi 版本来创建主机映像。
  77. 单击“Imaging”(映像创建)选项卡
  78. 在“Name”(名称)框中单击
  79. 键入 Repair Node 5
  80. 在“Description”(描述)框中单击
  81. 键入 Repair Node 5
  82. 单击“Deployment Type”(部署类型)下拉菜单
  83. 选择“Cloud Foundation Individual Deployment”(Cloud Foundation 分别部署)
    • 默认设备类型为“ESXi SERVER”(ESXi 服务器),要创建映像的服务器数量默认为 1;这些正是我们需要的,因此我们接受这些默认值。
  84. 单击“Vendor”(供应商)下拉菜单
  85. 选择“Quanta Computers, Inc.”
  86. 单击“Start Imaging”(开始创建映像)
    • VIA 会实例化一台 DHCP 服务器,并提示您重启物理服务器以开始 PXE 引导。主机会进行 PXE 引导,VIA 则会继续安装 ESXi。
  87. 单击“ESXi SERVER”(ESXi 服务器)框
    • 在创建映像期间,我们可以单击该服务器以查看步骤并监控进度
  88. 单击右上角的“X”以关闭弹出窗口。
    • 主机映像创建完成后,VIA 会验证 ESXi 已成功安装,并提示我们完成映像创建过程。
  89. 单击“Complete”(完成)
    • 主机映像创建完成后,我们需要下载它的 manifest 文件。
  90. 单击“Inventory”(清单)选项卡
    • 最近运行的映像创建将自动被选中,它的运行 ID 是 16,名为“Repair Node 5”(修复节点 5)。
  91. 单击“Download Manifest”(下载 Manifest)链接
    • 主机的 manifest 文件已下载。 
    • 我们现在已做好准备,可以将此主机添加回 SDDC Manager 清单。
  92. 单击“VMware Cloud Foundation”Web 浏览器标签页
  93. 单击“SETTINGS”(设置)
  94. 单击“ADD HOST”(添加主机)
  95. 单击“Select the Rack to add Host”(选择要添加主机的机架)下拉菜单
  96. 选择“LASSEN”
  97. 单击“BROWSE”(浏览)按钮
  98. 选择我们刚刚从 VIA 下载的 manifest 文件“vcf-imaging-details-Repair-Node-5”
  99. 单击“Open”(打开)
  100. 单击“ADD HOST”(添加主机)
    • SDDC Manager 使用 manifest 文件中的信息发现新主机
  101. 单击“CONTINUE”(继续)
    • SDDC Manager 现在将完成主机启动并将该主机添加回清单。
  102. 单击滚动条向下滚动
    • 完成主机启动只需要几分钟时间。完成后,将为该主机配置私有 IP 地址以及必要的 DNS 和 NTP 设置,使它可供 Cloud Foundation 使用。
  103. 单击“OK”(确定)
  104. 单击滚动条向下滚动,查看主机启动期间完成的任务。
    • 现在,我们可以验证主机是否已返回清单中。
  105. 单击“DASHBOARD”(仪表盘)
  106. 单击“Physical Resources”(物理资源)旁边的“VIEW DETAILS”(查看详细信息)
  107. 单击标有“LASSEN 10 HOSTS”的图标
  108. 单击滚动条向下滚动
    • 在这里,我们可以看到主机 R1N5 已返回清单中,运行状况正常
  109. 单击主机“R1N5”
  110. 单击滚动条向下滚动
    • 我们在详细信息屏幕中可以看到,R1N5 现在已成功上线,状态为绿色
  111. 单击“Dashboard”(仪表盘)

有关如何在 Cloud Foundation 环境中替换发生故障的主机的演示到此结束。在此演示中,我们已经看到云管理员如何利用 VMware SDDC Manager 强大的自动化功能快速对硬件故障作出响应并执行恢复步骤,而不会中断业务。 

要返回练习,请单击右上角的链接或关闭此浏览器选项卡

 

 

Copyright © 2017 VMware, Inc. All rights reserved.