VMware Hands-on Labs - HOL-SDC-1610-SpringRelease


练习概述 - HOL-SDC-1610 - 虚拟化基础知识:vSphere with Operations Management 6

练习指导


本入门练习将演示 vSphere with Operations Management 和 vCenter 6.0 的核心特性和功能。本练习是您开启虚拟化之旅的理想起点。

本练习将介绍 vSphere、vSphere with Operations Management 和 vCenter 的核心功能特性,包括存储和网络连接功能。练习分为 8 个单元,可按任意顺序学习这些单元。

注意:如果您的设备采用了非美式键盘布局,您可能会发现难以输入本练习各个单元中的 CLI 命令、用户名和密码。

完成每个单元大约需要 60-90 分钟,但具体时间取决于您的经验。

本练习的各个单元中还包含相关视频。要想充分了解这些视频内容,建议您配备耳机收听。每段视频的标题旁都注明了播放时长。有些视频用于讲解无法在练习环境中演示的任务,有些则用于提供更多详细信息。有些视频可能包含先前版本的 vSphere,但相关步骤和概念基本相同。

本动手练习使用 vRealize Operations Manager 的测试版,此版本仍在开发中,尚未发布最终版本。本练习中包含的产品功能特性随时可能更改,VMware 不承诺在任何正式推出的产品中提供这些功能特性。

练习负责人:Phil Balfanz、Paval Dimitrov、Pierre Grothe、Tom Lusk、Carl Olafson

本练习手册可以从动手练习文档站点下载,网址为:

http://docs.hol.pub/HOL-2016/hol-sdc-1610_pdf_en.pdf

本练习可能提供其他语言版本。要设置语言首选项并在练习中部署本地化手册,可以在本文档的帮助指导下完成:

http://docs.hol.vmware.com/announcements/nee-default-language.pdf


 

激活提示或水印

 

首次开始练习时,您可能会注意到桌面上有一个水印,指示 Windows 尚未激活。 

虚拟化的一个主要优势在于,可以在任意平台上移动和运行虚拟机。本动手练习利用了这一优势,我们可以运行多个数据中心内的练习。但是,这些数据中心的处理器可能不同,导致需要通过 Internet 进行 Microsoft 激活检查。

请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求。您正在使用的练习是一个独立的单元,没有对 Internet 的完全访问权限,而 Windows 验证激活正需要这一权限。如果没有对 Internet 的完全访问权限,此自动化过程会失败,并且显示此水印。

这一表面问题不会影响到您的练习。如果您有任何疑问或顾虑,请随时使用可用的支持选项:您可以通过 VMworld 动手练习部分中由专家主持的研讨会获得支持,也可以通过调查评论获得在线支持。我们一直在寻找各种方式改善您的动手练习体验。 

 

 

免责声明

本次演示可能会涉及当前正在开发的产品功能。

本次新技术演示/概述并不表示 VMware 承诺在任何正式推出的产品中提供这些功能。

产品的功能特性可能会有变更,因此不得在任何类型的合同、订单或销售协议中予以规定。

技术可行性和市场需求都可能影响最终产品的功能。

在本演示中讨论或展示的任何新技术或功能的价格与包装都尚未确定。

 

什么是虚拟化?


如果您尚不熟悉虚拟化,本课程将为您简要介绍这一技术。


 

虚拟化:

 

当前的 x86 计算机硬件是专为运行单个操作系统和单个应用而设计的,因此大部分计算机远未得到充分利用。借助虚拟化,您可以在单台物理机上运行多个虚拟机,每个虚拟机都可以在多个环境之间共享同一台物理机的资源。不同的虚拟机可以在同一台物理机上运行不同的操作系统以及多个应用。

 

 

虚拟化定义

 

虚拟化是指将一个名为虚拟化管理程序的额外软件层放置在您的物理服务器之上。利用该虚拟化管理程序,可以在单个服务器上安装多个操作系统和应用。

 

 

分离

 

通过将操作系统从硬件中分离,您可创建一个基于虚拟化的 x86 平台。基于虚拟化管理程序的 VMware 虚拟化产品和解决方案可为您提供基本的 x86 虚拟化技术。

 

 

分区

 

在此屏幕中,您可以看到分区如何有助于提高使用率。

 

 

隔离

 

您可以通过隔离某个虚拟机来查找并修复错误和故障,而不会影响其他虚拟机和操作系统。一旦修复完错误和故障,一次完整的虚拟机还原操作只需几分钟便可执行完毕。

 

 

封装

 

封装将所有虚拟机作为文件进行复制、移动和还原,因而简化了管理。

 

 

独立于硬件

 

虚拟机不依赖于任何物理硬件或供应商,可帮您提高 IT 的灵活性和可扩展性。

 

 

优势

 

利用虚拟化,可以整合服务器并控制应用,从而使关键应用实现高可用性和可扩展性。

 

 

简化恢复过程

 

有了虚拟化,便不必再执行任何硬件配置、操作系统重装和配置或备份代理等操作。进行一次简单的还原便可恢复整个虚拟机。

 

 

降低存储成本

 

精简配置技术可帮助您优化空间使用率并降低存储成本。利用该技术,可根据需要为虚拟机提供存储,并与其他虚拟机共享空间。

 

 

 

成本规避

 

 

第 1 单元:vSphere with Operations Management 简介(60 分钟)

VMware vSphere with Operations Management 概述


通过将 VMware vSphere 这一全球领先的虚拟化平台与 vRealize Operations Manager 进行组合,VMware vSphere with Operations Management 提供优化的环境,可进行高效的服务器虚拟化管理。此组合增加了关键容量管理和性能监控功能,进而实现了 vSphere 优化,可进行高效的服务器虚拟化管理。它针对各种规模的企业而设计,旨在以高服务级别运行应用并通过更高的容量利用率和整合率最大限度节省硬件开支。 

 


 

简化虚拟基础架构环境的 IT 管理

 

vSphere with Operations Management 提供了比 vCenter Server 更加直观的用户界面,并通过添加预测分析技术增强了监控功能,有助于更快地发现和修复问题,更高效地进行资源管理。

VMware vSphere with Operations Management 的主要功能特性

统一的命令控制台能够以易于识别的彩色徽标显示关键绩效指标,并提供全面的视图,让您了解哪些因素可能导致当前和将来的潜在性能和容量管理问题。

性能监控和容量管理可分析 vCenter Server 性能数据并创建动态阈值,这些阈值可根据环境调整并提供有关运行状况降级、性能瓶颈和容量短缺的智能警报:

通过全新的增强功能提高了关键任务应用的性能和可用性以高服务级别为您的 IT 环境提供更高的敏捷性、效率和恢复能力:

 

 

vSphere Hypervisor:虚拟化简介(5 分 50 秒)

 
 

下面是一个简短的视频,介绍了服务器虚拟化的一些基本概念。

 

 

视频:vSphere with Operations Management - 概述(3 分 13 秒)

 
 

下面是一个简短的视频,介绍了在您的环境中使用 vSphere with Operations Management 的好处。

 

了解用户界面 - vSphere Web Client


随着 VMware vRealize Operations Manager 6.0 的发布,其用户界面已整合为单一界面。 

这一新合并的用户界面提供了一系列可自定义的独立面板,可用于访问整个环境中的所有对象类型。这包括面向 vSphere 和非 vSphere 的对象。该界面还具有高度的可自定义性,可提供经过整合的警报功能及一致的视图和功能特性。


 

使用 vSphere 6.0 Web Client

vSphere Web Client 是系统管理员和终端用户与通过 VMware vSphere 创建的虚拟数据中心环境进行交互的主要途径。vSphere 负责管理构成虚拟数据中心的对象集合,其中包括主机、集群、虚拟机、数据存储和网络资源。

vSphere Web Client 是一款基于 Web 浏览器的应用,可用于管理和监控构成虚拟化数据中心的各种对象。借助 vSphere Web Client,您可以通过下列方式观测和修改 vSphere 环境。

您可以按不同方式对 vSphere 进行延展,以创建适合自己独有的 IT 基础架构的解决方案。为了支持这些新增的功能,还可以在 vSphere Web Client 中增加相应的 GUI 功能特性,并藉此管理和监控您独特的 vSphere 环境。

 

 

登录 vSphere Web Client

 

使用 Firefox Web 浏览器导航到 Web Client 的 URL。在本练习中,可以使用地址栏中的快捷方式。

  1. 单击Site A Web Client(站点 A Web Client)书签
  2. 单击Use Windows session authentication(使用 Windows 会话身份验证)
  3. 单击Login(登录)

或者,您也可以使用这些凭证

  1. 输入用户名administrator
  2. 密码VMware1!(不带引号)

请注意:本练习中使用的所有用户凭证均在桌面上的 README.TXT 文件中列出。

 

 

vSphere Web Client 用户界面概述

 

登录 Web Client 后,将进入Home(主页)屏幕。

vSphere Web Client 分为 6 个主要区域,这些区域也称为窗格。

  1. 导航树或Navigator(导航器)
  2. 主要内容区域
  3. 搜索栏
  4. Alarms(警报)列表
  5. Work in Progress(进行中的任务)列表
  6. Recent Tasks(近期任务)列表

这些窗格的布局可以进行自定义。单击Navigator(导航器)、Recent Tasks(近期任务)、Work in Progress(进行中的任务)或Alarms(警报)窗格中的图钉图标可以将其最小化。如果使用的监视器较小或分辨率较低,此功能可以为主要区域留出更多的空间。还可以通过将各个窗格的标题栏拖动到屏幕的一边来更改窗格的显示位置。

请注意:在本练习中,由于屏幕尺寸有限,因此默认情况下,所有窗格均设置为最小化,以便尽可能将您的屏幕最大化。您可以根据需要打开任意窗格并单击任意窗格中的图钉,以便其停留在屏幕上。

 

 

vCenter 6.0 清单

 

在Home(主页)屏幕上,可以在Navigator(导航器)窗格或主要内容区域中单击vCenter Inventory Lists(vCenter 清单列表)。单击vCenter Inventory Lists(vCenter 清单列表)将转到Inventory(清单)页面,其中会显示与 vCenter Server 系统关联的所有对象,例如数据中心、主机、集群、网络连接、存储和虚拟机。

 

 

 

 

导航到清单项目

 

利用清单列表,您可以查看各 vCenter Server 系统中的对象汇总列表。 

在本例中,我们将导航到虚拟机清单。

  1. 单击Virtual Machines(虚拟机)清单项目。

可以通过导航到Inventory(清单)列表中的相应对象类别查看其他类型的对象。

 

请注意:为帮助用户熟悉如何在 vSphere Web Client 中导航,这里提供了Getting Started(开始体验)页面。熟悉 Web Client 后,可以隐藏这些页面。只需单击Help(帮助)下拉菜单并选择Hide All Getting Started Pages(隐藏所有开始体验页面)选项即可。

 

 

虚拟机清单列表

 

Virtual Machine(虚拟机)清单页面显示与 vCenter Server 系统相关联的虚拟机的列表。

对于给定虚拟机,Summary(摘要)页面会详细介绍该虚拟机的相关信息。

  1. 单击linux-base-01a虚拟机。
  2. 单击该虚拟机的Summary(摘要)选项卡。

 

 

虚拟机摘要

 

在此页面上,您可以看到有关该虚拟机的所有详细信息。我们可以查看该虚拟机的详细信息,并对其进行更改。

此练习的目的是使您熟悉如何在vCenter Inventory List(vCenter 清单列表)中导航。我们将在第 2 单元中进一步了解虚拟机。

 

 

使用标记和搜索功能快速查找对象

vSphere 6.0 Web Client 现在提供一系列强大的搜索选项。本课程将向您介绍不同的搜索选项,您可以使用它们来快速查找自己感兴趣的清单对象。此外,vCenter Inventory Service 还提供一项新功能,用户可使用它来创建自定义标记,还能对标记分类并将其添加到环境中的任何清单对象上。这些标记用作可搜索的元数据,可缩短查找清单对象信息所需的时间。本练习将介绍如何创建标记并使用这些标记进行搜索。

 

 

搜索选项

 

这里有几个不同的搜索选项:New Search(新建搜索)、Saved Searches(保存的搜索)和Quick Search(快速搜索)。我们首先来了解一下New Search(新建搜索)

  1. 在 Web Client 的任意位置,单击Home(主页)图标以显示Home(主页)菜单。
  2. 单击New Search(新建搜索)

 

 

搜索虚拟机

 

在本课中,我们将执行虚拟机搜索。

  1. 让我们执行一次简单的搜索,在搜索框中输入vm。
  2. 单击Search(搜索)
  3. 清单窗格中将返回按对象类型分组的搜索结果。
  4. 还将显示所选对象类型的清单列表。

 

 

环境中的虚拟机

 

该搜索还会创建按对象类型分组的选项卡。

  1. 选择Virtual Machines(虚拟机)选项卡时,将会返回一个列有环境中现有虚拟机的列表。
  2. 现在我们来搜索具体的标记。单击Advanced Search(高级搜索)链接。

 

 

高级搜索

 

使用高级搜索,可以搜索同时满足多个条件的代管对象。

例如,您可以搜索与搜索字符串匹配的虚拟机。这些虚拟机驻留在名称与第二个搜索字符串匹配的主机中。让我们通过搜索虚拟机来检查 VMware Tools 的状态。

  1. 将显示的字段更改为Virtual Machine(虚拟机)。
  2. 对于property(属性)字段,单击Virtual Machine Name(虚拟机名称)
  3. 单击下拉菜单选择Current(当前)条件。
  4. 单击Search(搜索)按钮。
  5. 搜索结果随即会显示在结果屏幕中。
  6. 让我们保存此搜索以供今后使用。单击Save...(保存...)

 

 

命名搜索

 

  1. 搜索会有一个默认名称,但我们将输入Application VMs(应用虚拟机)作为搜索名称。
  2. 单击OK(确定)

 

 

查看保存的搜索

 

  1. 单击屏幕顶部的Home(主页)图标
  2. 单击Saved Searches(保存的搜索)

 

 

保存的搜索结果

 

  1. 单击保存的搜索Application VMs(应用虚拟机)
  2. 此时将在结果窗口中返回名称中包含App(应用)的虚拟机的列表。

 

 

快速搜索

 

  1. 在右上角的Quick Search(快速搜索)字段中输入vm。随即将弹出一个窗口,其中显示筛选出的匹配项。
  2. 单击Distributed Port Group(分布式端口组)标题旁的VM Network(虚拟机网络)。

 

 

虚拟机列表

 

  1. 在屏幕左侧,选择Virtual Machines(虚拟机)。
  2. 选择右侧的Related Objects(相关对象)。随即会显示展开的虚拟机列表。

 

 

近期对象导航器

 

Recent Objects(近期对象)导航器是Navigator(导航器)屏幕中的一个非常有用的工具。只需单击该图标,列表中便会显示近期访问的对象。

 

 

近期历史记录导航器

 

通过近期历史记录导航器功能,您可以在近期处理的项目中前后导航。

 

 

标记 - 用户定义的标签

 

通过标记可为清单对象添加元数据。您可以将有关清单对象的信息记录在标记中,然后在搜索中使用标记。

  1. 单击Home(主页)菜单
  2. 选择Tags(标记)创建标记类别和标记。

 

 

创建标记类别

 

类别可用于对标记进行分组,并定义将标记应用至对象的方式。

每个标记必须且只能属于一个类别。创建标记之前,必须先至少创建一个类别。

1.单击New Category(新建类别)

 

 

新建标记类别

 

可关联的对象类型:我们将使用默认设置,即此类别中的新标记可以分配给所有对象。另一个选项是指定具体对象,例如虚拟机或数据存储。

  1. 在Category Name(类别名称)中输入web tier。
  2. 保留默认设置One tag per object(每个对象一个标记)
  3. 单击OK(确定)

 

 

创建新标记

 

单击New Tag(新建标记)创建新标记。

 

 

创建标记并分配给类别

 

  1. 要创建新标记,请输入Web Server version 2
  2. 从下拉框中单击标记类别web tier。
  3. 选择OK(确定)

要查看所创建的类别和标记,请选择Items(项目)选项卡。在此屏幕中,您既可以查看和编辑类别与标记,又能创建新的类别与标记。

 

 

列出所创建的标记

 

  1. 选择Items(项目)选项卡后,将会返回一个列有已创建标记的列表。请注意,还有一个Categories(类别)选项卡,它会列出已创建的类别。

 

 

将标记分配给虚拟机

 

  1. 单击Home(主页)菜单
  2. 单击VMs and Templates(虚拟机和模板)

 

 

选择虚拟机

 

  1. 右键单击虚拟机linux-base-01a。可能需要展开左侧的导航树以显示虚拟机。
  2. 找到Tags  Custom Attributes(标记和自定义属性)
  3. 单击Assign Tag(分配标记)

 

 

将标记分配给虚拟机

 

  1. 单击Web Server Version 2标记
  2. 单击Assign(分配)。此时将创建一项任务并分配该标记。

 

 

使用标记执行搜索

 

  1. 在Quick Search(快速搜索)字段中输入we
  2. 选择Web Server Version 2标记

 

 

搜索结果

 

  1. 单击Related Objects(相关对象)选项卡查找已分得Web Server Version 2标记的对象的列表

 

了解用户界面 - vRealize Operations Manager



 

用户界面概述

VMware vRealize Operations Manager 中新用户界面的主要优势之一是,内容面板不仅具有高度的一致性,同时还能保持上下文相关性。在本部分中,我们将重点介绍几个主要的界面组件,以便您轻松了解如何导航到感兴趣的对象。

 

 

登录 vRealize Operations Manager

 

要登录 vRealize Operations Manager (vROPs),请打开桌面上的 Firefox 浏览器,

  1. 单击书签vROPs-01a
  2. 输入用户名admin
  3. 密码VMware1!(不带引号)

 

 

导航面板

 

登录后,屏幕中随即出现主页。在屏幕左侧,我们始终可以看到导航面板。您可以使用该面板快速导航屏幕上当前显示的任何信息,也可以非常快速地定位到不同级别。

 

 

内容面板

 

在屏幕右侧,我们可以看到内容面板,其中将显示导航面板中当前选择的任何上下文信息。该面板将自动更改以显示最新相关信息。

 

 

快速链接

 

默认情况下,导航面板将显示用于访问各个内容页的主要链接,顶部也将以便捷的快速链接格式显示这些链接。这五个链接可用于转到 vRealize Operations Manager 6.0 中的各个控制面板。

还要注意Back(后退)按钮,该按钮会智能返回到您之前的工作页面。当您在界面中导航以排除环境中的性能问题时,这可以节省大量时间!

 

 

主页

 

主页是 vRealize Operations Manager 6.0 的登录页面。这是管理员可浏览并查看可用仪表盘的主要视图。创建了仪表盘的任何第三方或附加解决方案都将使其显示在此处,因此该屏幕是快速了解您环境的绝佳方式。

我们可以使用适当的选项卡(如果可见)快速访问仪表盘,也可以使用便捷的Dashboard List(仪表盘列表)下拉选择器直接选择。

 

 

警报页面

 

警报页面显示环境中需要注意的最新警报列表,其中的警报均按时间顺序排列。警报按其严重程度、状态以及对运行状况、风险或能效的影响进行分类。

您可以从导航窗格中选择适当的徽标类别,以按徽标类型对警报进行快速筛选;也可以在Quick Filter(快速筛选)框中输入搜索词,以进行快速筛选。

 

 

环境页面

 

环境页面利用清单树及一系列衡量指标和对象关系来帮助我们了解环境情况。

清单树有多种不同类型,可以通过适配器进行添加。清单树可以有不同的类型(即,存储、主机和集群、网络连接等),也可以有不同的实例(即,每个 vCenter 都会创建一个主机和集群实例)。

每个清单树将显示一系列对象和这些对象之间的关系。各个对象可以属于多个不同的清单树。

清单树可帮助您快速浏览环境并直观显示父关系和子关系之间的联系。

环境页面分为一系列子选项卡:

您可以使用每个子选项卡快速访问感兴趣的信息,从而帮助您更快速、更准确地对当前问题进行故障排除。

 

 

内容页面

 

该页面是一个极为强大的工具,管理员可以利用该工具为 vRealize Operations Manager 6.0 构建内容,包括仪表盘和警报。

我们将在接下来的几个单元中介绍如何创建这些工具。

 

 

报告

 

我们可以从环境页面访问 vRealize Operations Manager 中的报告。报告是按照计划创建的视图快照。您可以创建报告来表示对象和衡量指标。 

借助 vRealize Operations Manager 的报告功能,可以生成报告来记录与现有或预计的资源需求相关的详细信息。您可以下载 PDF 或 CSV 文件格式的报告以供未来和离线状态下使用。此外,可以将报告安排为以用户定义的时间间隔运行,并通过电子邮件发送给收件人。

  1. 单击Environment(环境)快速链接
  2. 在导航面板中向下滚动,并选择vSphere Hosts and Clusters(vSphere 主机和集群)

 

 

导航到对象以运行报告

 

我们可以从Report Templates(报告模板)选项卡运行报告。在Report Templates(报告模板)选项卡上,可以创建、编辑、删除、克隆、运行、调度、导出和导入模板。

从左侧窗格的Environment(环境)选项卡中选择某个对象后,Report Templates(报告模板)图标将可用。

适用于选定对象的所有模板都会在Report Templates(报告模板)选项卡中列出。您可以按报告名称、主题、修改日期、上次运行时间或所有者对其进行排序。

单击Reports(报告)选项卡

  1. 单击vSphere World旁边的小三角形展开vSphere Hosts and Clusters(vSphere 主机和集群)视图。注意内容面板中的可用报告。
  2. 展开树以查看Cluster Site A(集群站点 A)

 

 

 

使用报告筛选器和运行报告

 

通过从面板右侧添加筛选器,可以对模板列表进行筛选。

  1. 单击Cluster Site A(集群站点 A)- 请注意,内容面板中的可用报告将改为适用于此对象的报告。
  2. 在Filter(筛选器)框中输入Stressed,此时将对视图进行筛选以显示包含搜索文本的报告模板。
  3. 突出显示Stressed VMs Report(工作负载过重的虚拟机报告)(请勿单击Generated reports[生成的报告] 或Schedules[调度])
  4. 单击Run Template(运行模板)图标

运行报告时,您将看到Generated Reports(生成的报告)字段从0更改为1,表明报告正在运行。

 

 

查看已完成的报告

 

该报告将显示在Generated Reports(生成的报告)列表中。

  1. 单击Generated Reports(生成的报告)选项卡
  2. 状态应显示为In queue(处于队列中)或Completed(已完成);如果显示为In queue(处于队列中),请定期单击Refresh(刷新)图标,直至状态变为Completed(已完成)
  3. 单击PDF图标打开报告。

 

 

打开报告

 

  1. 选择Google Chrome
  2. 单击OK(确定)

现在即可在 Google Chrome 浏览器中查看刚刚生成的报告。

 

 

查看报告

 

报告将在 Google Chrome 中打开,我们可以查看其内容。

Title(标题)页将显示与报告有关的信息,包括运行报告所针对的对象、运行时间和运行报告的用户。

 

 

了解报告

 

Stressed VMs Report(工作负载过重的虚拟机报告)将显示环境中工作负载过重的虚拟机以及紧张资源。

在本练习中,我们已将虚拟机尽可能调配至最小,从而最大程度地减少在 HOL 环境中使用的资源。

请注意:您也可以导出 CSV 格式的报告,根据报告内容,此格式可能更为有用。

 

 

管理页面

 

管理页面包含所有管理选项,包括Solutions (Adapters)(解决方案 [适配器])、User Management and Support(用户管理和支持)工具。

 

 

 

仪表盘

 

vRealize Operations 仪表盘可提供虚拟基础架构中对象的性能和状态的直观概览。您可使用仪表盘来确定所在环境中现有问题和潜在问题的性质和时间范围。 

首次登录 vRealize Operations Manager 时,将进入主页。可以从此处转到内容窗格并查看提供整个基础架构的统一运维视图的仪表盘。 

访问可用仪表盘

  1. 导航至Home(主页)页面
  2. 单击内容窗格中列出的仪表盘
  3. 单击内容窗格角落处的导航箭头访问其他仪表盘

 

 

启用和禁用仪表盘

 

管理包通常包含仪表盘,添加管理包时可以选择其中可见的仪表盘。

在本练习中,我们已安装存储设备管理包。此管理包附带有预配置的仪表盘,在监控环境方面将非常有用。 

此管理包可以连接到所有具有 VASA 提供程序的存储设备,以及使用 SMI-S 的 SAN/NAS 交换机(来自 Brocade 或 Cisco)。此外,您可以从主机 HBA、网卡、虚拟机和 SAN/NAS 交换机中收集性能数据。

启用 MPSD 的仪表盘

  1. 单击Home(主页)图标
  2. 单击Dashboard List(仪表盘列表)下拉菜单
  3. 将鼠标光标悬停在MPSD上
  4. 选择NFS协议,此时可以看到将显示的仪表盘

 

 

查看 NFS 仪表盘

 

现在即可看到NFS Dashboards(NFS 仪表盘)

  1. 单击图标导航到NFS Dashboards(NFS 仪表盘)
  2. 单击NFS Dashboards(NFS 仪表盘)并查看相应信息。

要深入了解 vRealize Operations 界面,包括仪表盘、视图和报告,请学习练习 HOL-SDC-1601 第 2 单元。

 

如何安装 vSphere with Operations Management


由于动手练习的运行环境有限,而且安装软件会产生大量 I/O,因此我们无法练习此软件的安装过程。请观看以下视频了解这一过程。


 

视频:使用安装程序安装 ESXi(4 分 35 秒)

 
 

以下视频将讲解示范 vSphere 的安装和配置过程。

 

 

视频:ESXi 直接控制台用户界面概述(4 分 58 秒)

 
 

此视频将介绍直接控制台用户界面 (DCUI)

 

 

视频:快速安装和入门指南 - vRealize Operations Manager 6(6 分 40 秒)

 
 

此视频将介绍快速安装 vRealize Operations Manager (vROPs) 的过程

 

其他信息


希望您喜欢学习本单元并更好地了解有关使用 vSphere with Operations Management 的基础知识。请务必在完成课程后填写调查问卷。

如需了解有关 vRealize Operations Management 的详细信息,可以使用下列其他在线资源:

如果您有多余时间,还可以学习本练习的其他所有单元,每个单元都提供有完成学习预计所需的时间。单击目录按钮可快速跳转至手册中的相应单元。

下面列出了全部八个单元:

第 1 单元 - vSphere with Operations Management 简介(60 分钟)

第 2 单元 - 构建和管理虚拟基础架构(90 分钟)

第 3 单元 - 管理未来容量风险和规划(60 分钟)

第 4 单元 - 在保持业务优先事项的同时优化工作负载性能(60 分钟)

第 5 单元 - 确保业务连续性和可用性(60 分钟)

第 6 单元 - 简化的安全性和合规性(60 分钟)

第 7 单元 - 利用 vRealize Log Insight 进行日志管理(60 分钟)

第 8 单元 - PowerCLI(60 分钟)


第 2 单元:构建和管理虚拟基础架构(90 分钟)

虚拟基础架构 - 集群管理


通过 vSphere 集群,您可以聚合各台 vSphere ESXi 主机的硬件资源,但按照资源都位于单台主机上的情况对资源进行管理。现在,当您启动虚拟机时,它可以从集群中的任意位置获取资源,而不会局限在特定的 vSphere ESXi 主机上。将主机添加到集群后,该主机的资源将成为集群资源的一部分。集群可实现 vSphere High Availability (HA) 和 vSphere Distributed Resource Scheduler (DRS) 解决方案。 


 

视频:为 VMware vSphere 创建 vCenter 清单(数据中心、集群、主机)(2 分 51 秒)

 
 

以下视频将介绍使用 vSphere Web Client 创建 VMware vCenter Server 清单的入门基础知识。

 

虚拟基础架构 - 创建和编辑虚拟机


本课将为您介绍如何创建虚拟机并对其设置进行编辑。


 

创建虚拟机

 

可通过多种方式使用 vSphere Web Client 创建新的虚拟机。我们将使用分层结构的顶层,即 vCenter Server。 

  1. 导航到屏幕顶部的Home(主页)图标。请注意,无需单击该图标。
  2. 选择VMs and Templates(虚拟机和模板)

 

 

创建虚拟机

 

  1. 单击箭头展开 vcsa-01a.corp.local 树
  2. 单击DataCenter Site A(数据中心站点 A)
  3. 如有必要,在窗口中向下滚动。
  4. 单击Create a new virtual machine(创建新的虚拟机)

 

 

启动New Virtual Machine(新建虚拟机)向导

 

请注意,有多个选项可用于部署新的虚拟机。在本课中,我们将使用Create a New Virtual Machine(创建新的虚拟机)选项。

  1. 单击Next(下一步)

 

 

命名虚拟机

 

输入新虚拟机的名称

  1. 输入linux-Web-01a
  2. 单击Next(下一步)

 

 

虚拟机安置

 

展开DataCenter Site A(数据中心站点 A)

由于未启用 Distributed Resource Scheduling (DRS),需要选择用于安置新虚拟机的主机。

  1. 展开树,然后选择主机esx-01a
  2. 单击Next(下一步)

 

 

选择数据存储

 

需要选择数据存储来安置新的虚拟机。

  1. 选择数据存储ds-site-a-nfs01
  2. 单击Next(下一步)

 

 

选择硬件兼容性

 

虚拟机构建时所基于的虚拟硬件版本决定了该虚拟机可在哪些主机上运行。如果环境中具有较旧版本的主机 (ESXi 5.x),将需要选择相应版本的虚拟硬件。对于我们的环境,主机为 ESXi 6.0,因此可以使用最新的虚拟硬件版本 11。

  1. 从下拉框中选择ESXi 6.0 and later(ESXi 6.0 及更高版本)。

单击Next(下一步)。

 

 

选择客户操作系统

 

我们需要确定将在新的虚拟机上安装的客户操作系统。这样向导便可以提供适当的默认安装参数。

  1. 从Guest OS Family(客户操作系统系列)下拉菜单中选择Linux
  2. 从Guest OS Version(客户操作系统版本)下拉菜单中选择Other Linux (64-bit)(其他 Linux(64 位))
  3. 单击Next(下一步)

 

 

自定义虚拟机硬件

 

现在,我们可以验证新虚拟机的虚拟硬件并在必要时进行修改。 

  1. 我们可以轻松添加或修改包括 CPU 在内的虚拟机硬件。必要时,可以通过此页上的相应下拉框添加或修改的内存或硬盘空间。 
  2. 单击Next(下一步)

 

 

查看新虚拟机的设置

 

查看新虚拟机的设置,如果您对设置感到满意,单击Finish(完成)启动创建任务。

 

 

启动 linux-Web-01a

 

创建虚拟机后,即可将其启动。

  1. 单击Hosts and Clusters(主机和集群)
  2. 依次展开vcsa-01a.corp.local、DataCenter Site A(数据中心站点 A)和Cluster Site A(集群站点 A)
  3. 右键单击linux-Web-01a
  4. 将鼠标悬停在Power(电源)上以展开菜单
  5. 单击Power On(启动)

 

 

关闭 linux-Web-01a

 

现在我们来关闭虚拟机。

  1. 右键单击linux-Web-01a
  2. 单击Power(电源)
  3. 单击Power Off(关闭),然后在弹出框中选择Yes(是)。

 

 

删除 linux-Web-01a

 

现在我们来删除 linux-Web-01a。

  1. 右键单击linux-Web-01a
  2. 收到弹出框提示时,单击Delete from Disk(从磁盘中删除),然后选择Yes(是)。

 

 

视频:创建虚拟机、安装客户操作系统和安装 VMware Tools(4 分 09 秒)

 
 

我们刚刚完成了虚拟机的创建,但此时尚未安装操作系统。动手练习环境没有足够的资源可供完成客户操作系统和 VMware Tools 的安装流程。以下视频将介绍该流程的剩余部分。

 

 

编辑虚拟机的设置

 

创建虚拟机后,可以更改与其相关联的硬件,就像物理机一样。

  1. 右键单击linux-Base-01a
  2. 单击Edit Settings(编辑设置)为虚拟机添加其他物理资源。

 

 

为虚拟机添加新设备

 

现在,我们可以看到与虚拟机相关联的硬件。在此屏幕中,可以为虚拟机添加额外的硬件。在本例中,我们将再添加一个网络适配器。 

  1. 单击New Device(新设备)下拉列表
  2. 单击Add(添加)按钮添加新的网络适配器。

 

 

配置新硬件

 

我们已添加了新的网络适配器,现在需要对其进行配置。

  1. 单击New Network Adapter(新网络适配器)旁边的箭头以展开并查看其设置。此时,还将选择要将网卡连接到的网络以及希望使用的适配器类型。请注意,此时MAC Address(MAC 地址)为空。添加此网卡后,将生成一个新的 MAC 地址,或者我们也可指定(需遵循一些规则)自己的 MAC 地址。
  2. 取消选择Connect At Power On(启动时连接)
  3. 单击OK(确定)将设备添加至虚拟机。选择OK(确定)后,将启动创建网络适配器的新任务。

 

 

清理 linux-Base-01a

 

现在我们来关闭虚拟机。

  1. 右键单击linux-Base-01a
  2. 单击Power(电源)
  3. 单击Power Off(关闭),然后在弹出框中选择Yes(是)。

 

 

准备删除新硬件

 

我们也可以从虚拟机中删除资源。 

  1. 右键单击linux-Base-01a
  2. 单击Edit Settings(编辑设置)

 

 

删除网络适配器

 

现在我们已经完成了此部分的练习,由于不会使用到新的网络适配器,我们来将它删除。

  1. 将鼠标光标悬停在Network Adapter 2(网络适配器 2)上
  2. 单击窗口右侧显示的X。设备名称将发生更改并显示为Device will be removed(设备将被移除)
  3. 单击OK(确定)

 

虚拟基础架构 - 迁移虚拟机


VMware vMotion 能够将运行中的虚拟机从一台物理服务器实时迁移到另一台物理服务器,而不会对终端用户造成可察觉的影响。vMotion 是一项用于创建动态且完全自动化的数据中心的关键技术。

使用 vMotion,您可以:


 

通过 vMotion 迁移处于开启状态的虚拟机

 

您可以利用 vMotion 技术通过迁移向导将处于开启状态的虚拟机从一台主机迁移到另一台主机。要改变处于开启状态的虚拟机的磁盘位置,请使用 Storage vMotion 迁移虚拟机。

在使用 vMotion 迁移虚拟机前,确保您的主机和虚拟机满足使用 vMotion 执行迁移的要求。

  1. 在 vSphere Web Client 中,单击Home(主页)图标
  2. 单击VMs and Templates(虚拟机和模板)图标
  3. 右键单击虚拟机linux-App-01a。
  4. 从弹出菜单中选择Migrate(迁移)。

 

 

选择迁移类型

 

向导将提示您选择希望执行的迁移类型:计算资源、存储或两者。在本练习中,我们将迁移到Cluster Site A(集群站点 A)中的另一台主机。

  1. 选择Change compute resource only(仅更改计算资源)
  2. 单击Next(下一步)

 

 

选择目标

 

当前,虚拟机正在主机 esx-01a.corp.local 上运行。我们来将它迁移到集群中的另一台主机上。 

  1. 选择主机esx-02a.corp.local
  2. 单击Next(下一步)

 

 

选择网络

 

从下拉框中选择目标网络,为虚拟机提供网络连接。

  1. 从下拉菜单中选择VM Network(虚拟机网络)
  2. 单击Next(下一步)

 

 

 

选择 vMotion 优先级

 

选择 vMotion 操作的优先级,以便保护正在环境中运行的虚拟机的性能。

  1. 选择Schedule vMotion with high priority(为 vMotion 安排高优先级)
  2. 单击Next(下一步)

 

 

完成迁移

 

查看向导中的信息以确保其正确性。

  1. 单击Finish(完成)

现在,迁移任务已完成。可以在 vSphere Web Client 的Recent Tasks(近期任务)窗格中查看迁移任务。正在运行的虚拟机已迁移到集群中的另一台主机上。

现在,已完成在物理硬件之间无中断地移动正在运行的工作负载。

 

虚拟基础架构 - 使用虚拟机快照



 

使用虚拟机快照

快照可保留在您创建快照时虚拟机的状态和数据。如果您需要反复将虚拟机恢复为同一状态,但又不希望创建多个虚拟机,快照即可起到很大作用。您还可以对虚拟机创建多个快照,从而依次创建多个还原点。通过拍摄多个快照,您还可以保存多个位置以适应多种工作流程。vSphere Web Client 中的快照管理器提供一系列操作,可用于创建和管理虚拟机快照和快照树。通过这些操作,您可以创建快照、还原快照层次结构中的任何快照、删除快照以及完成其他任务。

虚拟机快照可保留以下信息:

在本课程中,您要使用 vSphere Web Client 快照管理器创建一个虚拟机快照,更改虚拟机的硬件和配置状态,然后再恢复至虚拟机的原始状态。

 

 

导航到VMs and Templates(虚拟机和模板)管理窗格

 

此步骤会带您进入VMs and Templates(虚拟机和模板)管理窗格。

  1. 导航至 vSphere Web Client 的Home(主页)屏幕。
  2. 选择VMs and Templates(虚拟机和模板)

 

 

展开清单树

 

展开Datacenter Site A(数据中心站点 A)下的清单树,以查看虚拟机清单。从此视图中可以看到,我们的 vSphere 环境中已有多个虚拟机。

启动虚拟机快照向导。

  1. 选择虚拟机linux-Base-01a
  2. 单击Snapshots(快照)
  3. 选择Take Snapshot(拍摄快照)

 

 

完成虚拟机快照向导

 

  1. 在虚拟机快照向导中,输入Snapshot 1作为快照的名称
  2. 为快照提供有实际意义的说明 -Snapshot prior to settings change(更改设置之前拍摄快照)
  3. 单击OK(确定)

在Recent Tasks(近期任务)窗格中将可以看到快照创建。

 

 

查看虚拟机快照

 

我们可以查看虚拟机的快照历史记录。

  1. 选择虚拟机linux-Base-01a
  2. 单击Snapshots(快照)
  3. 选择Manage Snapshots...(管理快照...)

 

 

 

查看虚拟机快照详细信息

 

注意与快照时间线相关的虚拟机运行状态。可以看到虚拟机的当前状态以及存在的快照。在本例中,我们将仅查看快照树。

  1. 查看快照详细信息。
  2. 单击Close(关闭)

 

 

编辑虚拟机设置

 

在此步骤中,我们将调整虚拟机的内存配置

  1. 选择虚拟机linux-Base-01a
  2. 单击Edit Settings...(编辑设置...)

 

 

更改虚拟机设置

 

  1. 在下拉菜单中选择 CPU 设置
  2. 选择2个 CPU
  3. 选择OK(确定)

 

 

使用快照管理器恢复虚拟机设置

 

在此步骤中,您要使用快照管理器将虚拟机的 CPU 配置恢复为原始状态

  1. 选择虚拟机linux-Base-01a
  2. 单击Snapshots(快照)
  3. 选择Manage Snapshots...(管理快照...)

 

 

选择要恢复到的快照

 

  1. 在Manage VM Snapshots(管理虚拟机快照)向导中,从快照树中选择Snapshot 1
  2. 单击Revert to(恢复到)和Yes(是)确认操作。
  3. 单击Yes(是)确认还原为快照
  4. 单击Close(关闭)

 

 

监控任务进度

 

还原为快照操作可将虚拟机恢复到添加额外的 CPU 之前的状态

  1. 展开VM Hardware(虚拟机硬件)详细信息选项卡
  2. 注意 CPU 配置

 

 

删除快照

 

  1. 选择虚拟机linux-Base-01a
  2. 单击Snapshots(快照)
  3. 选择Manage Snapshots...(管理快照...)

 

 

删除快照

 

  1. 选择最高级别的 linux-Base-01a 状态。
  2. 单击Delete All(全部删除)按钮
  3. 在弹出消息提示时选择Yes(是)确认执行删除
  4. 单击Close(关闭)按钮。

最好删除不再需要的虚拟机快照。随着时间推移,快照增量数据会变得非常大,导致整合虚拟机文件时出现问题。

 

 

视频:VMware vSphere 的虚拟机快照(2 分 33 秒)

 
 

在本练习中,快照用于将虚拟机恢复到之前的硬件状态。典型的用例是,在安装软件包之前为虚拟机拍摄快照。如果出现问题,可以恢复到之前的状态并重新尝试安装。以下视频提供了其他洞察信息,可帮助了解虚拟机快照的价值。

 

虚拟基础架构 - 克隆虚拟机和使用模板


VMware 提供了多种调配 vSphere 虚拟机的方法。一种方法是先创建一个虚拟机并为其安装操作系统,然后再将该虚拟机用作克隆其他虚拟机的基础映像。如果要部署大量类似的虚拟机,则克隆虚拟机有助于节省时间。您可以在单个虚拟机中创建、配置和安装软件。您可以多次克隆该虚拟机,而不必分别创建和配置每个虚拟机。

另一种调配方法是将虚拟机克隆为模板。模板是虚拟机的主副本,可用于创建和调配多个虚拟机。如果您希望按照同一基准部署多个虚拟机,又要单独对每个系统进行自定义,则可以采用创建模板这种方式。对于用户而言,使用模板可以节省时间。如果您要频繁克隆某个虚拟机,可将该虚拟机用作模板并基于该模板部署虚拟机。

在本课程中,您要将一个现有虚拟机克隆为模板,再基于该模板部署新的虚拟机。


 

导航到VMs and Templates(虚拟机和模板)管理窗格

 

在Home(主页)屏幕上

  1. 导航到VMs and Templates(虚拟机和模板)

 

 

展开清单树

 

  1. 单击下拉箭头以展开清单树。
  2. 选择虚拟机linux-Base-01a
  3. 选择Clone(克隆)
  4. 选择Clone to Template...(克隆为模板...)

 

 

选择名称和文件夹

 

  1. 在Clone Virtual Machine to Template(将虚拟机克隆为模板)向导中,输入模板名称TinyLinux Template
  2. 将该选项卡的位置保留为Datacenter Site A(数据中心站点 A)。
  3. 单击Next(下一步)

 

 

选择计算资源

 

  1. 展开Cluster Site A(集群站点 A)
  2. 选择esx-02a.corp.local
  3. 单击Next(下一步)

 

 

选择存储

 

系统将自动选择拥有最多可用空间的数据存储。

  1. 保留默认数据存储ds-site-a-nfs01
  2. 单击Next(下一步)按钮。

 

 

检查虚拟机模板设置

 

检查虚拟机模板设置,然后单击Finish(完成)

 

 

监控任务进度

 

注意Recent Tasks(近期任务)窗格中的进度

  1. 新建的TinyLinux Template模板对象将显示在清单窗格中。

 

 

基于模板部署虚拟机

 

  1. 选择模板TinyLinux Template
  2. 选择Getting Started(开始)选项卡
  3. 在操作窗格的Basic Tasks(基本任务)下,单击Deploy to a new virtual machine(部署到新虚拟机)

 

 

选择名称和文件夹

 

  1. 输入TinyLinux-VM作为新虚拟机的名称
  2. 保留默认位置Datacenter Site A(数据中心站点 A)
  3. 单击Next(下一步)

 

 

选择计算资源

 

  1. 展开Cluster Site A(集群站点 A)
  2. 选择主机esx-02a.corp.local
  3. 单击Next(下一步)

 

 

选择存储

 

  1. 保留默认数据存储ds-site-a-nfs01
  2. 单击Next(下一步)

 

 

选择克隆选项

 

  1. 选中Power on virtual machine after creation(创建后启动虚拟机)复选框
  2. 单击Next(下一步)

为了控制完成本单元所需的时间,您无法自定义已安装的TinyLinux-01 Template操作系统,因此也不能自定义客户机设置。

 

 

即将完成

 

检查新建虚拟机的部署选项,然后单击Finish(完成)

 

 

监控任务进度

 

  1. 注意清单窗格中的新建虚拟机TinyLinux-VM

 

 

关闭 TinyLinux-VM

 

为保持练习顺利进行,我们需要移除刚刚创建的虚拟机。

  1. 单击TinyLinux-VM
  2. 单击Power(电源)
  3. 单击Power Off(关闭)

 

 

删除 TinyLInux-VM

 

现在从环境中删除该虚拟机。

  1. 单击TinyLinux-VM
  2. 收到弹出框提示时,单击Delete from Disk(从磁盘中删除),然后选择Yes(是)。

 

 

视频:VMware vSphere 的虚拟机克隆和模板(4 分 03 秒)

 
 

有关 vSphere 克隆和模板的更多功能特性,请观看以下视频。

 

虚拟基础架构 - 虚拟机监控和修复



 

简介和环境概述

在本次练习中,我们将查看与使用 vRealize Operations Manager 管理 vSphere 环境有关的一些功能特性。我们将在环境中生成一个难题,然后使用 vRealize Operations 中内置的修复功能快速解决此问题。

 

 

 

vRealize Operations Manager 中的一键式任务修复功能

在本课中,我们模拟了一个导致高 CPU 利用率的应用服务器问题。在这种情况下,我们通常会因为性能受到影响而觉察到问题。借助 vROPs,我们能够确定存在 CPU 利用率问题并快速修复该问题。

 

 

在虚拟机 (VM) 上启动 CPU 负载模拟

 

最小化 Firefox。无需关闭 Web Client,因为我们还会用到它。然后,从桌面或快速启动栏加载 PuTTY

 

 

通过 PuTTY 连接到 linux-App-01a 虚拟机

 

  1. 选择linux-App-01a。
  2. 单击Load(加载)。
  3. 单击Open(打开)。

 

 

为 linux-App-01a 启动 CPU 负载模拟

 

  1. 在系统提示登录时,输入 root,然后按 Enter 键。无需密码。
  2. 在 linux 提示符下,输入 /opt/CPULoad.sh 1,然后按 Enter 键。
  3. 若显示Starting CPU load(启动 CPU 负载)选项,则表明 CPU 负载模拟正在进行。

脚本开始运行后,CPU 负载会立即增加。

注意:确保准确输入所示 linux 命令,注意区分大小写。

 

 

确认虚拟机的 CPU 使用率

 

在本课开头最小化的 Firefox 会话中,打开 vSphere Web Client。

  1. 在Search(搜索)框中输入App。
  2. 从搜索结果中选择linux-App-01a

 

 

确认虚拟机的 CPU 使用率

 

  1. 突出显示linux-App-01a。
  2. 不定期单击Refresh(刷新)图标以加快屏幕更新速度。
  3. 确认 CPU 使用率在 2 GHz 以上。

请注意:根据您完成最后几个步骤的速度,此值在屏幕刷新之前可能始终为零或极低。

 

 

登录 vRealize Operations Manager

 

要登录 vRealize Operations Manager (vROPs),请从 Firefox 浏览器中再打开一个选项卡。

  1. 单击书签vROPs-01a
  2. 输入用户名admin
  3. 密码VMware1!(不带引号)

 

 

在 vRealize Operations Manager 中的集群站点 A 上监控应用

 

由于我们的应用虚拟机正在集群站点 A 上运行,我们将在 vRealize Operations Manager 中导航到该对象

在 Firefox 浏览器中,使用vROPs-01a书签打开 vROPs。

  1. 找到 vRealize Operations Manager UI 右上角的搜索栏,然后在其中输入Site A
  2. 选择Cluster Site A(集群站点 A)

 

 

检查有关集群站点 A 的警报

 

  1. 系统将为您转到集群站点 A 对象并显示Summary(摘要)页面,可以看到已有一些针对此集群资源对象的警报。
  2. 在Health(运行状况)选项卡下查看警报时,可以看到针对各种问题的警报。
  3. 由于不存在有关集群站点 A 的任何警报,请单击箭头以最小化Top Alerts(首要警报)窗口。

 

 

检查 CPU 警报

 

在Health(运行状况)选项卡中,可以看到有关Top Health Alerts For Descendants(子节点级别最高的运行状况警报)的警报

  1. 如果没有看到子节级别最高的运行状况警报Virtual machine has unexpected high CPU workload(虚拟机的 CPU 工作负载过高),则请不定期单击Refresh(刷新)图标,以加快屏幕更新速度。
  2. 单击Virtual machine has unexpected high CPU workload(虚拟机的 CPU 工作负载过高)警报。

 

 

选择针对 linux-App-01a 的 CPU 警报

 

我们可以看到与发出的警报相对应的所有对象。在本例中,由于 linux-App-01a 是唯一一个已触发该警报的虚拟机,我们将直接转到该虚拟机。

  1. 我们可以看到已触发警报的详细信息,例如触发该警报的资源、警报类型及其对相关对象的影响。
  2. 此处可以看到可能会触发该警报的衡量指标,这有助于了解可能的原因。在本例中,您可以看到虚拟机工作负载已达到 100%。
  3. 此处可以看到有助于解决该虚拟机问题的建议。
  4. 单击Other Recommendations(其他建议)旁边的图标,查看可帮助我们解决问题的其他建议。

 

 

向虚拟机添加 CPU

 

我们将遵从Recommended Action(建议的操作),向该虚拟机添加 CPU 资源

  1. 单击Set CPU Count for VM(设置虚拟机的 CPU 数量)
  2. 此时将打开Set CPU Count for VM(设置虚拟机的 CPU 数量)向导。在New CPU Count(新的 CPU 数量)框中,可以看到当前的 CPU 数量为1,请设置CPU Count(CPU 数量),让虚拟机拥有 2 个 CPU。
  3. 单击Begin Action(开始操作)

 

 

查看任务

 

开始修复后,我们会立即收到任务已创建的确认消息。

单击Recent Tasks(近期任务)以查看操作。

 

 

查看近期任务

 

此处可以看到所执行操作的详细信息(注意 - 完成本步骤最多需要 2 分钟)

  1. 单击列表顶部的任务。
  2. 在Details of Task Selected(选定任务的详细信息)窗格中可以看到,向虚拟机添加更多 CPU 的任务已经完成。单击linux-App-01a

注意:进入此阶段后,如果任务显示为Failed(失败),则可能是动手练习环境中存在的负载所致。因为此练习运行环境中的主机具有 2 个 CPU,如果自动修复任务尝试向虚拟机添加 2 个以上的虚拟 CPU,则此任务将失败。

 

 

检查 linux-App-01a 上的 CPU 负载

 

  1. 单击Analysis(分析)选项卡
  2. 如果工作负载仍显示为Warning(警告)或Critical(危险),请单击Refresh(刷新)图标
  3. 在查看虚拟机时,可以看到当前 CPU 容量已达 6 GHz,而且工作负载也已稳定下来。

虚拟机现已具备充足的 CPU 资源来运行可接受的工作负载。

 

 

清理 linux-App-01a

 

现在,我们已经完成了此部分的练习,我们将停止 linux-App-01a 上的 CPU 负载。

  1. 恢复 linux-App-01a 备份的 PuTTY 会话,并按 Enter 键来停止 CPULoad.sh 脚本。
  2. 关闭 linux-App-01a 的 PuTTY 会话。

 

 

vRealize Operations Manager 中的完全自动化任务修复功能

在刚刚完成的一课中,您已了解如何手动解决问题,以及如何在 vROPs 中使用一键修复功能执行引导式修复操作。尽管这项任务非常简单,但在有些情况下,您仍然希望能够自动完成修复。在将环境投入运行的过程中,您也许希望自动执行其中一些此类操作。接下来,我们将逐步介绍 vROPs 如何通过自动执行这些任务来为您提供帮助。

 

 

简介和环境概述

在此练习单元中,我们将查看 vRealize Operations 的一项新功能 - 自动化任务修复。在我们的环境中,我们拥有一个将在其上创建 CPU 负载的虚拟机。 我们将创建一个可识别此 CPU 负载的自动化任务,而且此 CPU 负载将触发一个自动修复任务,该任务通过向虚拟机添加 CPU 资源来解决问题。 

 

 

访问自定义组

 

为了在 vRealize Operations Manager 中执行自动化任务,我们需要创建一个组,以针对其执行操作。在本例中,我们已创建了一个自定义组,其配置已接近完成。 

  1. 在 vRealize Operations Manager 中,导航到Environments(环境)页面
  2. 单击Custom Groups(自定义组)
  3. 突出显示linux-App-02a自定义组
  4. 单击Edit(编辑)图标

 

 

配置自定义组

 

此时将打开Edit Group(编辑组)向导

  1. 从Policy(策略)下拉菜单中选择linux-App-02a。
  2. 输入Virtual Machine(虚拟机)作为Object Type(对象类型)。
  3. 从第一个下拉菜单中,选择Properties(属性)。
  4. 从第二个下拉菜单中,选择Configuration | Name(配置 | 名称)。
  5. 从第三个下拉菜单中,选择is作为条件。
  6. 在第四个下拉菜单中输入linux-App-02a。
  7. 单击OK(确定)

请注意:在本练习中,我们已为您完成了部分任务。我们创建了一项策略,该策略可触发有关 CPU 工作负载的警报。完成此组的配置后,表示组成员的 CPU 工作负载高的警报会引发该策略启动自动修复操作。

 

 

打开连接到 linux-App-02a 虚拟机的 PuTTY 会话

 

虚拟机 linux-App-02a 将充当存在问题的应用服务器。我们需要登录此虚拟机,然后生成可在 vROPs 中触发警报的 CPU 负载。

从屏幕下方的快捷方式单击PuTTY。

  1. 选择linux-App-02a。
  2. 单击Load(加载)。
  3. 单击Open(打开)。

 

 

启动 linux-App-02a 的 CPU 负载

 

登录 linux-App-02a

  1. 在系统提示登录时,输入 root,然后按 Enter 键。无需密码。
  2. 在 linux 提示符下,输入 /opt/CPULoad.sh 1,然后按 Enter 键。
  3. 若显示Starting CPU load(启动 CPU 负载)选项,则表明 CPU 负载模拟正在进行。

脚本开始运行后,CPU 负载会立即增加。

请注意:确保准确输入所示 linux 命令,注意区分大小写。

 

 

导航到Recent Tasks(近期任务)窗格

 

当在 linux-App-02a 上启动 CPU 负载后,我们可能需要等待几分钟时间,此后负载才能达到警报阈值。一旦负载达到阈值,自动修复流程将确认虚拟机正面临高 CPU 工作负载,并将自动向虚拟机添加更多 CPU 资源。 

  1. 单击Administration(管理)图标
  2. 单击Recent Tasks(近期任务)

 

 

查看任务

 

查看任务是否已完成。您可能需要刷新屏幕以查看任务是否已经完成。   

  1. 突出显示此任务
  2. 单击对象名称linux-App-02a

这样便可转至 linux-App-02a 对象。

请注意:如果您收到了失败的任务状态,这是由于与 HOL 练习环境中分配的资源相比,完全自动化的修复操作需要更多的资源。我们的 ESXi 主机只有两个物理 CPU,而自动修复操作需要两个以上的 CPU,所以操作会失败。这是本练习环境的构件,不属于自动修复操作的功能。

 

 

检查 Linux-App-02a 上的 CPU 负载

 

  1. 单击Analysis(分析)选项卡
  2. 如果工作负载仍显示为Warning(警告)或Critical(危险),请单击Refresh(刷新)图标
  3. 在查看虚拟机时,可以看到当前 CPU 容量已达 6 GHz,而且工作负载也已稳定下来。

虚拟机现已具备充足的 CPU 资源来运行可接受的工作负载。创建完此自动修复任务后,我们可以按需将其应用于其他虚拟机。

 

 

清理 linux-App-02a

 

现在我们已经完成了此部分的练习,我们将停止 linux-App-02a 上的 CPU 负载。

  1. 恢复 linux-App-02a 备份的 PuTTY 会话,并按 Enter 键来停止 CPULoad.sh 脚本。
  2. 关闭 linux-App-02a 的 PuTTY 会话。

 

虚拟基础架构 - 使用虚拟标准交换机


以下课程将指导您完成 vSphere 标准交换机的创建和配置过程


 

通过 vSphere Web Client 添加虚拟机端口组

 

如果您尚未登录,请从桌面启动 Firefox 浏览器,然后登录 vSphere Web Client。从书签工具栏选择Site A Web Client(站点 A Web Client)。

  1. 单击Use Windows session authentication(使用 Windows 会话身份验证)复选框。
  2. 单击Login(登录)。

 

 

选择Hosts and Clusters(主机和集群)

 

在左侧窗格中,单击Hosts and Clusters(主机和集群)对象。

 

 

添加网络连接

 

现在,我们需要向主机 esx-02a.corp.local 添加虚拟标准交换机。

  1. 在vcsa-01.corp.local下,依次展开Datacenter Site A(数据中心站点 A)和Cluster Site A(集群站点 A)。
  2. 在导航器中,右键单击主机esx-02a.corp.local,然后选择Add Networking(添加网络连接)

 

 

Connection Type(连接类型)

 

选择要创建的连接类型。

  1. 选择Virtual Machine Port Group for a Standard Switch(适用于标准交换机的虚拟机端口组)。
  2. 单击Next(下一步)。

 

 

目标设备

 

现在,您需要为新连接选择目标设备。

  1. 选择New Standard Switch(新建标准交换机)。
  2. 单击Next(下一步)。

 

 

Create a Standard Switch(创建标准交换机)

 

现在,您需要向正在创建的标准交换机分配一个物理网络适配器。

  1. 选择Unused Adapters(未用适配器)。
  2. 单击绿色+按钮。

 

 

添加物理适配器

 

现在,您需要向标准交换机添加一个物理网络适配器。

  1. 选择vmnic3。
  2. 单击确定。

 

 

添加物理适配器

 

可以看到物理适配器 vmnic3 已成功添加至标准交换机。 

单击Next(下一步)。

 

 

连接设置

 

现在,您可以使用一个易于识别的名称作为标准交换机的标签。在本例中,我们将名称更改为VM Network 2。

请勿更改 VLAN ID:请将此设置保留为None (0)(无[0])。

单击Next(下一步)。

 

 

完成向导

 

标准交换机的配置流程现已完成。 

查看端口组设置并单击Finish(完成)。

 

 

可选视频 - 如何配置 vSphere 标准交换机 (VSS)(时间 mm:ss)

 

 

 

在 vSphere Web Client 中编辑标准虚拟交换机

 

在本课程中,我们将对在主机 esx-02a 上创建的标准交换机进行修改。vSphere 标准交换机的设置负责控制交换机级默认值和交换机属性,如上行链路配置。

在本课程中,我们将对主机 esxi-02a.corp.local 上的标准交换机进行修改。

  1. 在 vSphere Web Client 的对象导航器中,浏览至 esx-02a.corp.local。
  2. 单击Manage(管理)选项卡。
  3. 选择Networking(网络连接)。
  4. 选择Virtual switches(虚拟交换机)。
  5. 从列表中选择vSwitch0。
  6. 单击铅笔图标以编辑 vSwitch0。

 

 

更改 vSwitch0 的 MTU 设置

 

如果您的环境中使用了巨型帧,而您想要在 vSphere 标准交换机上利用这种帧,则可以在此处更改 MTU 设置。

您可以更改 vSphere 标准交换机上的最大传输单元 (MTU) 的大小,从而增加使用单个数据包传输的有效负载数据的数量,即启用巨型帧。在对此处进行任何修改之前,请务必咨询网络连接团队。要实现此设置的优势并避免出现性能问题,则需要在所有虚拟交换机、物理交换机和终端设备(如主机和存储阵列)之间实施兼容的 MTU 设置。您还需注意Security(安全)、Traffic shaping(流量调整)和Teaming and Failover(绑定和故障转移)选项。虚拟交换机默认设置正是基于这些选项设置而成。稍后您将看到,可以按需在端口组级别覆盖这些默认设置。

单击Cancel(取消)以继续。

 

 

在 vSphere Web Client 中更改上行链路适配器的速度

 

如果上行链路适配器的速度与网络流量速度不相符,那么上行链路适配器就可能成为网络流量的瓶颈。您可以更改上行链路适配器的连接速度和双工设置,以匹配附加物理交换机端口上所配置的速度。

  1. 单击Physical adapters(物理适配器)。
  2. 选择vmnic2。
  3. 单击铅笔图标以编辑 vmnic2 的属性。

 

 

配置的速度和双工

 

此处列出了所有可用的速度和双工设置。您可以将配置的速度和/或双工更改为适用设置。 

单击Cancel(取消)以继续。

 

 

在 vSphere Web Client 中添加上行链路适配器

 

您可以将多个物理网络适配器与一个 vSphere 标准交换机关联起来,从而提高吞吐量并在链路发生故障时提供后备的物理网络适配器。这一过程称为网卡绑定。

要向 vSwitch0 添加物理上行链路,请执行以下操作:

  1. 单击Networking(网络连接)选项卡。
  2. 选择Virtual switches(虚拟交换机)。
  3. 选择vSwitch0。
  4. 单击Manage physical adapters(管理物理适配器)图标。

 

 

分配给 vSwitch0 的适配器

 

您将看到分配给 vSwitch0 的适配器。 

单击绿色加号可添加一个额外的适配器。

 

 

向 vSwitch0 添加设配器

 

Network Adapters(网络适配器)框中将列出可用 vmnic 的列表。

  1. 单击vmnic2。
  2. 在Failover order group(故障转移顺序组)中,选择Active Adapters(活动适配器)。
  3. 单击OK(确定)。

 

 

查看适配器

 

选定的适配器将作为Active Adapter(活动适配器)显示在Assigned Adapters(分配的适配器)列表中。

单击OK(确定)保存更改。

 

 

编辑标准交换机端口组

 

完成虚拟交换机配置并为其设置了默认值后,即可配置端口组。端口组是连接到虚拟机网卡的结构,一般以 VLAN 或物理网络分区形式呈现,如生产、开发、生产前调试或DMZ。

要编辑标准交换机的端口组,请执行以下操作:

  1. 选择Virtual switches(虚拟交换机)。
  2. 选择vSwitch0。
  3. 单击铅笔图标以编辑端口组。

 

 

 

端口组属性

 

利用Properties(属性)设置,可以修改端口组的名称或 VLAN ID(如适用)。

当前无需更改,可继续执行下一步。

 

 

端口组安全

 

在左侧窗格中,单击Security(安全)。通过勾选Override(覆盖)框,您可以覆盖仅针对此端口组的虚拟交换机默认设置。

在此部分,您可以配置以下各项:

Promiscuous Mode(混杂模式)

MAC Address Changes(MAC 地址更改)

Forged Transmits(伪信号)

当前无需更改,可继续执行下一步。

 

 

流量调整

 

在左侧窗格中,单击Traffic shaping(流量调整)。通过勾选Override(覆盖)框,您可以覆盖在交换机级别设置的默认策略,使其仅应用于此端口组。流量调整策略是根据平均带宽、峰值带宽以及突发大小定义的。您可以为每个端口组制定一项流量调整策略。ESXi 可调整标准交换机上的出站网络流量。流量调整功能用于限制端口的可用网络带宽,但也可配置为允许突发流量以更高的速度进行传输。

Average Bandwidth(平均带宽)

Peak Bandwidth(峰值带宽)

Burst Size(突发大小)

当前无需更改,可继续执行下一步。

 

 

绑定和故障转移

 

在左侧窗格中,单击Teaming and failover(绑定和故障转移)。再次说明,我们可以选择覆盖默认的虚拟交换机设置。

Load Balancing Policy(负载均衡策略)- 负载均衡策略决定了如何在同一网卡绑定中的网络适配器之间分配网络流量。vSphere 虚拟交换机仅对出站流量执行负载平衡。入站流量则由物理交换机上的负载平衡策略控制。

Network Failure Detection(网络故障检测)- 虚拟交换机进行故障转移检测所采用的方法。

Notify Switches(通知交换机)- 指定虚拟交换机是否应在发生故障转移时通知物理交换机。

Failback(故障恢复)- 指定当物理适配器从故障中恢复后是否返回活动状态。

当前无需更改,可继续执行下一步。

 

 

取消对端口组的更改

 

由于我们不希望对端口组进行任何修改,请单击Cancel(取消)按钮。

vSphere 标准交换机是在主机级别配置和管理的简单虚拟交换机。通过允许将多个物理适配器绑定到各个虚拟交换机,此交换机可提供访问、流量聚合和容错功能。VMware vSphere Distributed Switch 基于 VMware Standard Switch (vSS) 的功能构建而成,以跨多台关联主机的单个交换机的形式呈现,可简化大型部署中的管理。在这种结构中,所有修改都可以一次完成并传递到交换机的各成员主机。

 

对存储进行抽象化以实现更有效的管理和更好的控制



 

vSphere 存储概述

以下课程简要介绍了 vSphere 中的各种存储。vSphere Hypervisor (ESXi) 可提供主机级别的存储虚拟化,进而从虚拟机中以逻辑方式提取物理存储层。

vSphere 虚拟机使用虚拟磁盘来存储操作系统、程序文件以及其他与其活动相关联的数据。虚拟磁盘是一个大型物理文件或一组文件,您可以像对任何其他文件一样轻松地对其进行复制、移动、存档和备份。您可以为虚拟机配置多个虚拟磁盘。

虚拟机使用虚拟 SCSI 控制器来访问虚拟磁盘。这些虚拟控制器包括 BusLogic Parallel、LSI Logic Parallel、LSI Logic SAS 和 VMware Paravirtual。它们是虚拟机可以发现并访问的为数不多的几种 SCSI 控制器。

每个虚拟磁盘都位于部署在物理存储上的 vSphere Virtual Machine File System (VMFS) 数据存储或基于 NFS 的数据存储中。对于虚拟机而言,每个虚拟磁盘都显示为连接至 SCSI 控制器的 SCSI 驱动器。无论是否通过并行 SCSI 访问实际物理存储设备,主机上的 iSCSI、网络、光纤通道或 FCoE 适配器都对虚拟机上运行的客户操作系统和应用保持透明。

vSphere 存储管理流程的第一步是,存储管理员在进行 vSphere ESXi 分配之前为不同存储系统分配存储空间。vSphere 支持两种类型的存储:本地存储和网络存储。接下来的几个课程将逐个详细介绍这些类型。

 

 

本地存储

 

下图显示的虚拟机使用的是与单个 ESXi 主机直接连接的本地 VMFS 存储。

本地存储可以是 ESXi 主机的内部硬盘,也可以是通过 SAS 或 SATA 等协议直接连接到主机的外部存储系统。

 

 

网络存储

 

下图显示的虚拟机使用的是可供多个 ESXi 主机使用的网络 VMFS 存储。

网络存储由 ESXi 主机用于远程存储虚拟机文件的多个外部存储系统组成。通常情况下,主机通过高速存储网络访问这些系统。网络存储设备一般处于共享状态。网络存储设备上的数据存储可由多个主机并发访问,因而支持 High Availability 主机集群、Distributed Resource Scheduling、vMotion 和配有 Fault Tolerance 的虚拟机等其他 vSphere 技术。ESXi 支持多种网络存储技术 - 光纤通道、iSCSI、NFS 和共享 SAS。

 

 

虚拟机磁盘

 

下图显示的虚拟机对共享 VMFS 数据存储使用了不同类型的虚拟磁盘格式。

在执行某些特定的虚拟机管理操作时,如创建虚拟磁盘、将虚拟机克隆为模板或迁移虚拟机,您可以指定虚拟磁盘文件格式的调配策略。虚拟磁盘格式分为三种类型:

精简配置

使用此格式可节省存储空间。对于精简磁盘,系统将基于您输入的磁盘大小值来调配磁盘需要的数据存储空间。然而,精简磁盘最初比较小,并且只使用磁盘完成初始操作所需的数据存储空间。

厚配置延迟清零

以默认厚格式创建虚拟磁盘。虚拟磁盘所需的空间在创建虚拟磁盘时分配。创建时不会擦除物理设备上保留的任何数据,但过后首次从虚拟机执行写操作时会按需要将其清零。采用厚配置(延迟清零)格式时,并不意味着无法恢复删除的文件或还原此分配空间中可能存在的旧数据。厚配置(延迟清零)磁盘不能转换为精简磁盘。

厚配置立即清零

这种类型的厚虚拟磁盘支持 Fault Tolerance 等集群功能。虚拟磁盘所需的空间在创建虚拟磁盘时分配。与厚配置(延迟清零)格式不同,创建这种格式的虚拟磁盘时,将对物理设备上保留的数据进行清零。一般而言,以这种格式创建磁盘所需的时间要显著长于创建其他类型的磁盘。

 

 

创建和配置 vSphere 数据存储

此练习将介绍如何创建和配置可供 vSphere 主机使用的 NFS 数据存储。

 

 

登录 vSphere Web Client

 

如果您尚未登录 vSphere Web Client,请启动 Mozilla Firefox Web 浏览器,然后导航到Site A Web Client(站点 A Web Client)书签

  1. 单击Use Windows session authentication(使用 Windows 会话身份验证)复选框
  2. 单击Login(登录)

 

 

在Home(主页)屏幕上

 

  1. 从清单窗格中选择Storage(存储)

 

 

存储详细信息

 

现在,您将看到环境中调配的数据存储。 

  1. 选择ds-site-a-nfs01数据存储
  2. 单击Summary(摘要)选项卡以了解有关数据存储的更多信息

 

 

创建 vSphere NFS 数据存储

 

现在,我们将使用预先调配的 NFS 挂载创建一个新的 vSphere NFS 数据存储。

我们只需完成向导即可调配新的数据存储。

  1. 选择Datacenter Site A(数据中心站点 A)
  2. 单击Actions(操作)下拉菜单
  3. 选择Storage(存储)
  4. 选择New Datastore(新建数据存储)

 

 

新建数据存储 - 类型

 

此向导会显示新数据存储的位置。选择Next(下一步)以进入向导中的Type(类型)步骤。

  1. 选择NFS作为类型
  2. 单击Next(下一步)

请注意:您只能使用一个 NFS 版本访问给定数据存储。使用不同的 NFS 版本将一个或多个主机挂载到同一数据存储会导致数据损坏。

 

 

新建数据存储 - NFS 版本

 

  1. 确认已选中NFS 3
  2. 单击Next(下一步)

 

 

新建数据存储 - 名称和配置

 

  1. 在Datastore name(数据存储名称)字段输入ds-site-a-nfs02
  2. 在Folder(文件夹)字段输入/mnt/NFSA2
  3. 在Server(服务器)字段输入10.10.20.60
  4. 单击Next(下一步)

 

 

新建数据存储 - 主机的可访问性

 

  1. 选中此复选框以包含所有主机
  2. 单击Next(下一步)

 

 

新建数据存储 - 即将完成

 

数据存储即将可供使用。请检查此页面上显示的设置,以确保设置的准确性。如果感到满意,请单击Finish(完成)

 

 

监控数据存储的创建过程

 

现在,您可以查看创建数据存储这一任务。

  1. 数据存储创建将显示在Recent Tasks(近期任务)窗格中
  2. 单击Refresh(刷新)图标以更新显示内容
  3. 选择ds-site-a-nfs02
  4. 选择Summary(摘要)以查看您刚刚创建的数据存储的详细信息。

 

 

 

Storage vMotion

计划内停机时间通常占数据中心停机时间的 80% 以上。硬件维护、服务器迁移和固件更新全都需要物理服务器停机。为将这一停机造成的影响降至最低,各组织机构不得不推迟维护,最终导致停机时段极不方便、难于安排。

利用 vSphere 中的 vMotion和 Storage vMotion 功能,组织可以将 VMware 环境中的工作负载动态迁移至其他物理服务器或底层存储上,而无需中断服务,因此可缩短计划内的停机时间。管理员可更快地执行完全透明的维护操作,而不必将维护工作安排在不方便的时段执行。借助 vSphere vMotion 和 Storage vMotion,组织可以:

通过此练习,我们将了解如何使用 vMotion 将虚拟机移到集群中不同的主机上。

 

 

Storage(存储)视图

 

如果您尚未登录 vSphere Web Client,请执行以下操作:

在 Control Center 桌面上,单击Mozilla Firefox图标

单击Use Windows session authentication(使用 Windows 会话身份验证)复选框

单击Login(登录)

  1. 单击Home(主页)图标转至 vSphere Web Client 的Home(主页)屏幕。
  2. 单击Storage(存储)图标。

 

 

列出指定数据存储上的虚拟机

 

  1. 导航到由 vcsa-01a.corp.local vCenter 管理的Datacenter Site A(数据中心站点 A)数据中心的ds-site-a-nfs01数据中心对象,并单击此对象。
  2. 单击Related Objects(相关对象)。
  3. 单击Virtual Machines(虚拟机)选项卡。此时会出现一个包含所选数据中心上所有虚拟机的列表。

请注意:根据您已完成的课程,可用的数据存储与虚拟机可能会与上面的图片所示内容有所不同。

 

 

拖放 Storage vMotion

 

虚拟机 linux-App-01a 位于 ds-site-a-nfs01 上,需要迁移到 ds-site-a-nfs02上。

1.单击linux-App-01a虚拟机,然后按住鼠标左键将虚拟机拖至ds-site-a-nfs02数据存储对象。如果鼠标光标指向的对象适合作为所移动对象的目标,则鼠标光标旁边会显示一个绿色的+(如图所示)。释放鼠标按钮,将linux-App-01a虚拟机拖放到ds-site-a-nfs02对象。此时将启动迁移向导以完成该流程。

 

 

迁移数据存储

 

  1. 选中Change storage only(仅更改存储)单选按钮。
  2. 单击Next(下一步)

注意:在 vSphere 6.0 中,我们能够通过同一 vMotion 操作更改计算、网络和存储。

 

 

选择存储

 

  1. 注意:ds-site-a-nfs02 数据存储已选定,因为在开始向导之前我们已将虚拟机拖放到该数据存储。
  2. 单击Next(下一步)接受用于执行存储移动的设置。

在下一个屏幕上,单击Finish(完成)以开始迁移。

此操作需要几分钟时间。可在Recent Tasks(近期任务)窗格中监控操作,或直接转到下一个步骤。

 

 

确认 Storage vMotion

 

您可以在Recent Tasks(近期任务)窗格中监控 Storage vMotion 的进度

  1. 完成迁移后,请单击ds-site-a-nfs02数据存储。此外,还需注意 Linux-micro-01a 虚拟机现已列在Related Objects(相关对象)下方。

虚拟机的存储已从 ds-site-a-nfs01 迁移到 ds-site-a-nfs02 存储,在此过程中,无需将虚拟机置于脱机状态。

 

 

数据存储集群

vSphere 数据存储集群可跨一组 vSphere 数据存储平衡 I/O 和存储容量。根据所需的自动化级别,Storage Dynamic Resource Scheduler 会安置并迁移虚拟机,以平衡整个数据存储集群的数据存储利用率。

 

 

新建数据存储集群

 

  1. 导航到Datacenter Site A(数据中心站点 A)
  2. 选择Storage(存储)
  3. 选择New Datastore Cluster(新建数据存储集群)

 

 

新建数据存储集群 - 名称和位置

 

  1. 输入DatastoreCluster-01作为名称
  2. 单击Next(下一步)

 

 

新建数据存储集群 - Storage DRS 自动化

 

考虑到 VMware 动手练习环境的 I/O 特征,我们禁用了 Storage DRS。

  1. 保留默认设置,然后单击Next(下一步)

 

 

新建数据存储集群 - Storage DRS 运行时设置

 

Storage DRS 提供了多个用于调节存储集群均衡敏感度的选项。

  1. 保留默认值,然后单击Next(下一步)。

 

 

新建数据存储集群 - 选择集群和主机

 

  1. 选择Cluster Site A(集群站点 A)
  2. 单击Next(下一步)

 

 

新建数据存储集群 - 选择数据存储

 

选择要包含在集群中的数据存储。

  1. 选择ds-site-a-nfs01和ds-site-a-nfs02
  2. 单击Next(下一步)

请注意:如果在本单元并未创建数据存储ds-site-a-nfs02,则只能在屏幕上看到数据存储ds-site-a-nfs01。

 

 

新建数据存储集群 - 即将完成

 

检查存储 DRS 设置,然后单击Finish(完成)

 

 

vSphere Replication 概述

VMware vSphere Replication 是 VMware 专有复制引擎,通过在同一站点内以及跨站点复制虚拟机

为 vSphere 平台提供数据保护和灾难恢复。它与 vSphere 紧密集成,可使用 vSphere Web Client 进行管理。它随 vSphere Essentials Plus Kit 以及更高版本的 vSphere 一起提供。可以启用多个时间点恢复,从而为已复制的虚拟机提供多达 24 个恢复点。vSphere Replication 用作独立解决方案以及 VMware Site Recovery Manager 和 VMware vCloud Air Disaster Recovery 的复制引擎。

恢复点目标 (RPO) 可以按每个虚拟机进行设置,范围从 15 分钟到 24 小时不等。源位置和目标位置之间完成初始同步后,只需复制虚拟机的变更内容,从而使 vSphere Replication 最大限度地减少网络带宽使用量。vSphere 6.0 中 vSphere Replication 的新选项可进一步提高效率,当复制的数据在网络中传输时会对其进行压缩。它现在可轻松地隔离与 vSphere Replication 相关的网络流量。这使 vSphere 管理员可通过在 vSphere Replication 虚拟设备中配置多个网卡并使用 vSphere Network I/O Control 分隔网络流量来控制带宽。最终,性能和安全都得以提高。

vSphere Replication 执行完整同步的方式已经得到增强。以前版本的 vSphere Replication 会请求远程校验和,并将远程校验和与本地校验和进行比较以确定需要复制的虚拟磁盘的区域。借助一些存储平台和 vSphere 6.0,vSphere Replication 可向 vSphere 查询存储分配信息,以便减少执行完整同步所需的时间和网络带宽。

vSphere Replication 在源位置和目标位置与 VMware vSphere Storage vMotion 完全兼容。在 vSphere 6.0 之前,移动目标位置的复制副本需要 vSphere Replication 执行完整同步。借助 vSphere 6.0,使用 vSphere Storage vMotion 迁移复制副本不再需要执行完整同步。这样,便可以使用 vSphere Storage vMotion 和 VMware vSphere Storage DRS 更轻松地均衡存储利用率,同时避免 RPO 违规。适用于 Linux 虚拟机的 VMware Tools 也已改进。在一些 Linux 操作系统中,VMware Tools 提供了在复制和备份操作时将客户操作系统置于静默状态的功能。vSphere Replication 可借助这一新功能实现 Linux 虚拟机的文件系统一致恢复。

 

 

Virtual Volumes 概述

 

Virtual Volumes (VVOL) 是一个全新的集成和管理框架,可对 SAN/NAS 阵列进行虚拟化,从而实现更加高效的运维模式。该模式针对虚拟化环境进行了优化,并且以应用而不是存储基础架构为中心。当前,存储管理一般以 LUN 为中心,或以卷为中心。借助 VVOL,我们可以根据应用的需求来管理存储。

Virtual Volumes 可通过策略驱动的自动化功能简化运维,使您能够更灵活地控制虚拟机的存储使用量,并实时进行动态调整。它可以更精细地控制可按虚拟机精确度实例化的硬件资源和基于本机阵列的数据服务,从而简化向各个应用提供存储服务级别的过程。

 

简化存储操作

Virtual Volumes 可自动执行手动任务并消除 VI 管理员和存储管理员之间的操作依赖性(这通常会增加复杂性),从而简化存储操作。这种新的操作模式基于策略驱动的自动化功能构建,因此调配更加快速,变更管理也更加简单。

简化存储服务级别的交付

通过使管理员能够在虚拟机级别对可动态实例化和实时控制的存储资源及数据服务进行更加精细的控制,Virtual Volumes 可以简化向应用提供存储服务级别的过程。

提高资源利用率

Virtual Volumes 能够根据需要以更高的精确度更加灵活地利用存储资源,从而提高资源利用率。精确利用存储资源消除了超额配置现象。

 

存储抽象化 - 管理存储


vRealize Operations Manager 提供了多种工具,可帮助您管理存储。可确定环境中存在的问题的警报;使您能够主动监控环境的仪表板;可全面自定义的即时可用的报告。


 

 

 

 

登录 vRealize Operations Manager

 

如果您尚未登录 vRealize Operations Manager (vROPs),请从 Firefox 浏览器中再打开一个选项卡。

  1. 单击书签vROPs-01a
  2. 输入用户名admin
  3. 密码VMware1!(不带引号)

 

 

导航到主页

 

确保您位于主页屏幕上。如果不是,请单击Home(主页)图标

 

 

虚拟机磁盘空间不足

 

在Top Health Alerts For Descendants(子节点级别最高的运行状况警报)中,可以看到一个正在运行的虚拟机的磁盘空间不足。

  1. 导航到Recommendations(建议)仪表盘
  2. 如有必要,向下滚动查看Alerts(警报)。
  3. 单击One or more virtual machine guest file systems are running out of disk space(一个或多个虚拟机客户机文件系统的磁盘空间不足)警报。

 

 

查看建议

 

您将转到受影响的虚拟机的Summary(摘要)页面。

  1. 我们可以看到已触发警报的详细信息,
  2. 还可以看到触发该警报的指标。
  3. 此处可以看到有助于解决虚拟机问题的建议。在本例中,系统提示我们添加一个新的虚拟硬盘,或扩展虚拟机的现有磁盘。

请注意:要扩展或添加额外的虚拟硬盘,我们需要按照虚拟基础架构 - 创建和编辑虚拟机练习部分介绍的步骤操作

 

 

vSphere 数据存储仪表盘

 

vRealize Operations 具有多个用于管理存储的仪表盘。

  1. 单击Dashboard List(仪表盘列表)下拉菜单
  2. 确保已选中vSphere Dashboards(vSphere 仪表盘)
  3. 单击vSphere Datastores(vSphere 数据存储)

 

 

了解 vSphere 数据存储仪表盘

 

打开 vSphere 数据存储仪表盘后,我们将看到数据存储数据的多种不同视图。

此仪表盘有两个不同的热图

  1. 尺寸表示总磁盘空间、颜色表示工作负载的数据存储热图
  2. 尺寸表示每秒读写操作次数、颜色表示延迟的数据存储热图
  3. 历史视图 - 如果单击热图中的数据存储对象,则会在下方生成一个历史视图图表。
  4. 前 25图表 - 按 IOPs 利用率排序的前 25 个数据存储
  5. 前 25图表 - 按平均延迟排序的前 25 个数据存储

 

 

vRealize Operations Management 存储设备管理包

要加强对存储环境的了解,可将 vRealize Operations Management 存储设备管理包 (MPSD) 安装到任何 Advanced 或 Enterprise 版 vRealize Operations Manager。此管理包可以连接到所有具有 VASA 提供程序的存储设备,以及使用 SMI-S 的 SAN/NAS 交换机(来自 Brocade 或 Cisco)。此外,您可以从主机 HBA、网卡、虚拟机和 SAN/NAS 交换机中收集性能数据。

MPSD 6.0.1 有助于您深入了解自己的存储环境。利用常见协议,您可以从存储设备收集性能和运行状况数据。通过预定义的仪表盘,您可以遵循从虚拟机到存储卷的路径,并识别此路径中可能存在的任何问题。

 

 

vSphere 虚拟机磁盘(和网络)仪表盘

 

使用Dashboard(仪表盘)下拉菜单,导航到vSphere VMs Disk (and Network) Dashboard(vSphere 虚拟机磁盘 [和网络] 仪表盘)。

  1. 尺寸表示每秒读写操作次数、颜色表示延迟的虚拟机热图。
  2. 尺寸表示网络利用率、颜色表示放弃的数据包百分比的虚拟机热图。
  3. 尺寸表示调配的虚拟机、颜色表示快照利用率的虚拟机热图。
  4. 前 25图表 - 按磁盘 IOPs 排序的虚拟机
  5. 前 25图表 - 按放弃的数据包百分比排序的虚拟机
  6. 前 25图表 - 按网络利用率排序的虚拟机

 

Update Manager 入门


VMware vSphere Update Manager 是一种工具,可以自动对 VMware vSphere 补丁程序和版本进行集中管理并简化这种管理,还可以为 VMware ESXi 主机、虚拟机和虚拟设备提供支持。 

借助 Update Manager,您可以执行下列任务:

  1. 升级和修补 ESXi 主机。
  2. 在主机上安装和更新第三方软件。
  3. 升级虚拟机硬件、VMware Tools 和虚拟设备。

Update Manager 需要与 VMware vCenter Server 建立网络连接。每个 Update Manager 安装实例都必须与单个 vCenter Server 实例关联(在其中注册)。如果您拥有多个 vCenter Server 系统,而且希望将 Update Manager 与每个系统配合使用,则必须在每个 vCenter Server 系统中安装和注册一个 Update Manager 实例。

您可以在无法访问 Internet 的安全网络中部署 Update Manager。在这种情况下,您可以使用 VMware vSphere Update Manager 下载服务 (UMDS) 来下载更新。

Update Manager 模块包含一个服务器组件(可以与 vCenter Server 系统 [适用于基于 Windows 的 vCenter] 安装在同一计算机上,也可以安装在不同计算机上)和多个客户端组件(在两个不同的 vSphere Client 上运行)。

Update Manager Client 的组件:

  1. 适用于 vSphere Client 的 Update Manager Client 插件 - 对 vSphere 清单的补丁程序和版本进行管理。
  2. 适用于 vSphere Web Client 的 Update Manager Web 客户端 - 可查看扫描结果和 vSphere 清单的合规性状态。

本课将向您介绍 VMware Update Manager 安装之后的使用基础知识。


 

登录 vSphere Web Client

 

使用 Firefox Web 浏览器导航到 Web Client 的 URL。在本练习中,可以使用地址栏中的快捷方式。

  1. 单击Site A Web Client(站点 A Web Client)书签
  2. 单击Use Windows session authentication(使用 Windows 会话身份验证)
  3. 单击Login(登录)

或者,您也可以使用以下凭证

  1. 输入用户名administrator
  2. 密码VMware1!(不带引号)

请注意:本练习中使用的所有用户凭证均在桌面上的 README.TXT 文件中列出。

 

 

导航至 Update Manager

 

现在,我们需要导航至Update Manager图标。

  1. 在主要内容区域中向下滚动至Update Manager图标。
  2. 单击Update Manager图标。

 

 

导航至Update Manager服务器

 

  1. 从Navigator(导航器)窗格中选择updatemgr.corp.local。

 

 

基准和基准组

 

基准可分为升级基准、扩展模块基准或补丁程序基准。基准包含由一个或多个补丁程序、扩展模块或升级程序组成的程序集。 

基准组由多个现有基准组合而成,可能包含每种类型的升级基准各一个以及一个或多个补丁程序和扩展模块基准。扫描主机、虚拟机和虚拟设备时,您可以根据基准和基准组对其进行评估,以确定它们的合规性级别。

默认情况下,Update Manager 包含两个预定义的动态补丁程序基准和三个预定义的升级基准。

 

 

创建补丁程序基准

 

现在,我们将创建适用于我们 ESXi 主机的补丁程序基准。

  1. 确保已选中Manage(管理)选项卡。
  2. 在Host Baseline(主机基准)下,单击绿色加号以创建新的基准。

 

 

新建基准

 

  1. 输入基准的名称HOL Host Baseline和描述。
  2. 在Baseline Type(基准类型)下,选择Host Patch(主机补丁程序)
  3. 单击Next(下一步)

 

 

Baseline Type(基准类型)

 

选择基准类型:Fixed(固定)或Dynamic(动态)。

  1. 在本例中,我们将选择Fixed Baseline(固定基准)
  2. 单击Next(下一步)

 

 

选择补丁程序

 

将补丁程序添加到基准中

  1. 在筛选框中,输入 5.5
  2. 选择名为Updates esx-base的补丁程序
  3. 单击Next(下一步)

如果创建的是动态补丁程序基准,我们会指定用于定义要包含的补丁程序的标准。

 

 

完成补丁程序基准

 

完成向导之前,检查您创建的补丁程序基准的设置

  1. 单击Finish(完成)以完成补丁程序基准

 

 

向主机附加补丁程序基准

 

向主机附加基准

  1. 请确保选中主机esx-01a.corp.local。
  2. 选择Attach Baseline(附加基准)
  3. 此时将打开一个新的窗口,单击HOL Baseline
  4. 单击OK(确定)

 

 

选择要在 vSphere Web Client 中扫描的对象

 

修复之前,应对相应的对象执行附加基准和基准组扫描。为了便于您完成本练习,我们选择只扫描一个主机。我们也可以扫描一个数据中心或集群.

  1. 选择Home/Hosts and Clusters(主页/主机和集群)
  2. 从清单对象导航器中,展开树,然后选择主机esx-01a.corp.local

 

 

在 vSphere Web Client 中扫描主机

 

启动对主机的扫描

  1. 选择Update Manager
  2. 选择Scan for Updates(扫描更新)
  3. 此时会显示一个弹出框,选择扫描Patches and Extensions(补丁程序和扩展模块)和/或Upgrades(升级)。
  4. 单击OK(确定)
  5. 开始扫描,您可以在Recent Tasks(近期任务)窗格中跟进。

 

 

修复主机

 

现在已经对我们之前附加到主机上的补丁程序基准进行了扫描。我们现在可以修复主机了。突出显示esx-01a.corp.local

  1. 单击Remediate(修复),注意是否已附加HOL Host Baseline基准组。

这时将打开一个向导,您将注意到HOL Baseline补丁程序基准现已可用。要完成修补,您需要按照向导操作,完成流程并应用补丁程序。

请注意:为了便于您完成本练习,我们不想修补 ESXi 主机(正因如此,我们之前选择了不会应用到主机的补丁程序)。

 

 

视频:使用 vSphere Update Manager 升级 VMware Tools(5 分 14 秒)

 
 

vSphere Update Manager 还可用于更新虚拟机上的 VMware Tools。下面的视频概述了此流程。

 

构建和管理虚拟基础架构 - 横向扩展


vSphere with Operations Manager 适用于小型环境,并可通过扩展满足大型企业的需求。通过对体系结构进行纵向扩展和横向扩展,vSphere with Operations Manager 可随着您的环境而增长。灵活的体系结构支持在各个地理位置进行部署。


 

vCenter Server

 

 

 

 

vRealize Operations - 体系结构概述 - 视频

 

 

vRealize Operations Manager

 

 

 

 

 

vRealize Operations - 可扩展性

 
 

 

 

安装 vRealize Operations Manager

vRealize Operations Manager 由已部署的虚拟设备组成。您可以部署更多节点来实现高可用性并横向扩展环境。由于练习时间的限制,我们已经制作了视频来展示如何构建 vRealize Operations Manager 集群。此视频将向您介绍部署 vRealize Operations Manager 的基础知识。

 

 

其他信息


希望您喜欢学习本单元并更好地了解有关使用 vSphere with Operations Management 的基础知识。请务必在完成课程后填写调查问卷。

如需了解有关 vRealize Operations Management 的详细信息,可以使用下列其他在线资源:

如果您有多余时间,还可以学习本练习的其他所有单元,每个单元都提供有完成学习预计所需的时间。单击目录按钮可快速跳转至手册中的相应单元。

下面列出了全部八个单元:

第 1 单元 - vSphere with Operations Management 简介(60 分钟)

第 2 单元 - 构建和管理虚拟基础架构(90 分钟)

第 3 单元 - 管理、优化和规划基础架构容量(60 分钟)

第 4 单元 - 在保持业务优先事项的同时优化工作负载性能(60 分钟)

第 5 单元 - 确保业务连续性和可用性(60 分钟)

第 6 单元 - 简化的安全性和合规性(60 分钟)

第 7 单元 - 利用 vRealize Log Insight 进行日志管理(60 分钟)

第 8 单元 - PowerCLI(60 分钟)


第 3 单元:管理容量风险并规划未来(60 分钟)

管理容量和风险


在虚拟化环境中,很难直观了解虚拟基础架构的容量。此外,鉴于超额分配、透明页共享 (TPS) 和精简配置等情况的存在,要想了解环境的真正容量几乎是不可能的。vCenter 提供了一些工具来帮助确定环境的容量,但在虚拟机数量较多,规模较大的环境中,这一任务不仅耗时而且难以管理。

vRealize Operations Manager 可使用解决方案提供的数据来跟踪环境的容量使用情况。它可以收集有关虚拟机、主机、网络和存储的原始数据,以便确定环境中的容量使用趋势。Capacity Remaining(剩余容量)徽标的计算方法是剩余容量占所选对象总容量的百分比。通过预测并基于 vRealize Operations Manager 定义的策略,当出现容量不足并可能会演变为运行状况或性能问题的情况时,管理员用户将收到通知。这样有助于管理员及早发现问题,防微杜渐。随着容量水平的下降,风险也会随之而来。

Risk(风险)徽标是根据Capacity Remaining(剩余容量)、Time Remaining(剩余时间)和Stress(压力)中的警报决定的。风险是指那些如果近期不能得到解决就可能会演变为运行状况问题的情况。

在开始本练习之前,最好先大致了解一下 vRealize Operations Manager 中的容量规划术语。本视频提供了简要概览。


 

vRealize Operations - 容量规划基础知识

 
 

 

 

容量管理策略

在如今软件定义的数据中心中,了解容量情况并能够快速评估任何环境中的容量和容量风险是至关重要的。vRealize Operations Manager 可在对包含任意类型对象的虚拟和云计算环境进行容量管理的同时,帮助您应用需求与分配容量规划原则。
最棒的是,借助 vRealize Operations Manager,您可以通过分配到工作负载容器或资源组的策略来利用这两种容量模型。通过设置策略,您能够以最佳方式管理环境,从而提高性能(例如,生产)和/或获得更高的密度和利用率(例如测试/开发)。
下面是一个有关如何在 vRealize Operations Manager 中实现所有这些目标的视频。

 

 

容量规划术语

 
 

 

 

登录 vRealize Operations Manager 控制台

 

  1. 从工具栏中启动 Firefox
  2. 单击 vROPs-HVM 的快捷方式
  3. 使用管理员凭证登录
    身份验证源:Local User(本地用户),用户名:admin
    密码:VMware1!
  4. 单击Login(登录)

注意:vROPs-HVM 已处于历史视图模式 (HVM),用于展示已使用实际数据运行一段时间的环境的状态以及如何查看该环境。

 

 

导航至 vSphere World

 

  1. 单击地球图标转至左侧窗格中的环境屏幕
  2. 向下滚动,然后选择vSphere Hosts and Clusters(vSphere 主机和集群)部分

该部分将显示环境中连接至 vRealize Operations 实例的所有 vCenter、主机和集群。

 

 

查看 vSphere World 的剩余容量

 

  1. 选择顶部的Analysis(分析)选项卡。
  2. 选择Capacity Remaining(剩余容量)选项卡。

右侧窗格将加载剩余容量徽标。徽标数字是对象内可用容量的百分比,在此示例中,该对象是 vSphere World。徽标颜色由策略决定。默认策略设置为 0、25、50、75。其中 0 是红色,高于 75 是绿色。策略可以针对每个对象进行调整。此外,系统还会在徽标右侧显示一个图表。默认情况下,图表显示的是该对象在 30 天内的容量使用趋势。该图表也可以针对环境进行调整。

 

 

相关对象的容量

 

向下滚动,在Related Objects(相关对象)视图中,您将看到Capacity Remaining(剩余容量)。它可以用来确定环境中是否也存在容量较低的相关对象。

 

 

查看集群剩余容量徽标和趋势

 

  1. 进一步转到east-mgmt。

当您查看详细信息时,vRealize Operations Manager 将使您一直留在Capacity Remaining(剩余容量)徽标上。在这里,我们可以看到集群的剩余容量徽标。请注意,形状都是相同的。Capacity Remaining(剩余容量)徽标始终都是六角形。我们还可以看到过去 30 天的Capacity Remaining Trend(剩余容量趋势)。再次说明,该图表是通过策略设置的。每个对象类型都可以拥有自己的数据范围策略。

 

 

查看集群剩余容量

 

剩余容量明细:本部分将确定集群内还能再部署多少台虚拟机。共有四种虚拟机类别:小型、中型、大型和平均型。平均型基于环境内已经部署的虚拟机的平均大小。您也可以选择考虑或不考虑已提交项目。借助该选项,您可以将任何已经预留了资源的进行中项目考虑在内。除了 vRealize Operations 策略设置中定义的预留缓冲区外,这些数字还考虑了 HA 的使用及其设置。

 

 

 

 

了解增长趋势和消耗率

 

  1. 选择Details(详细信息)选项卡
  2. 选择Views(视图)
  3. 输入trend,然后单击键盘上的 Enter 键
  4. 选择Cluster CPU Demand Forecast Trend(集群 CPU 需求预测趋势)
  5. 单击窗格边缘上的箭头以缩小左侧窗格。

 

 

集群 CPU 需求预测趋势

 

在此图表中,我们可以使用实线来表示集群的 CPU 需求。虚线表示 CPU 需求预测。这样,我们可以确定是否将需要更多主机来满足未来的需求。

  1. 可使用日历图标来调整日期范围,以查看更多历史数据。
  2. 可单击时钟图标来调整预测时间。可使用该图标预测更远时间的情况(默认范围为 30 天)。

选择其他趋势图:

(查看完之后,单击上一步第 5 点中窗格边缘上的小箭头,恢复左侧的导航器窗口)

 

 

vSphere 风险仪表盘

 

  1. 单击Home(主页)图标
  2. 选择Recommendations(建议)选项卡
  3. 查看Risk(风险)面板

风险是指鉴于对象当前的压力、容量和剩余时间,产生消极结果的可能性。例如,如果一个数据存储以每周 100 GB 的速度填充,我们就知道该存储可能具有在 x 天内出现空间不足的风险。我们可以触发关于这一情况的警报,并主动修复潜在问题。以前,我们可能会等待显示已经使用了 95% 空间的 vCenter 警报或等待管理员的通知,然后再解决问题。此类问题很可能不会通知,直到数据存储已满,所有虚拟机停止工作,并因此造成中断。

风险面板可显示有关环境的警报并可显示选定对象在层次结构中的子节点。

 

 

 

虚拟机的 CPU 使用率一直很高

 

  1. 滚动至Top Risk Alerts for Descendants(子节点级别最高的风险警报)的底部,然后选择Virtual machine has continuous high CPU usage causing stress(虚拟机的 CPU 使用率一直很高,造成压力)。

在这里,我们可以看到整个环境的所有风险警报。单击任何警报将转至该警报,可了解警报的更多信息。

 

 

风险问题

 

在这里,我们可以看到所有出现此问题的虚拟机的摘要。

  1. 单击bna-west条目旁边的View Details(查看详细信息)链接。

 

 

存储池超额预定警报

 

借助于此,我们可以了解以下内容:

  1. 有关警报的更多详细信息。我们能够看到情况说明以及出现警报的原因。
  2. 处理建议,另提供简单的一键修复按钮选项。
  3. 产生问题的原因以及有关在本例中添加多少 CPU 的建议。

 

 

vSphere World 详细信息

 

  1. 选择Environment(环境)图标
  2. 在左侧窗格中,选择vSphere Hosts and Clusters(vSphere 主机和集群)

该视图将为我们显示 vSphere World 的Health(运行状况)、Risk(风险)和Efficiency(能效)。vSphere World 是所有 vCenter 及其集群的组合。

 

 

集群容量和风险

 

  1. 单击Details(详细信息)选项卡
  2. 在搜索栏中输入Cluster,然后按 Enter 键
  3. 选择Cluster Capacity Risk Forecast(集群容量风险预测)视图

该报告将会提供一份有关未来 30、60 或 90 天内的集群、运行虚拟机数量和剩余容量的列表。通过该列表,用户可以轻松确定集群当前是否存在资源不足的情况。

 

 

 

数据存储磁盘 I/O 诊断列表

 

  1. 清除Cluster筛选器
  2. 输入Datastore,然后按键盘上的 Enter 键
  3. 选择Datastore Disk I/O Diagnose List(数据存储磁盘 I/O 诊断列表)视图

该视图将提供列有数据存储及其工作负载、压力和 I/O 信息的列表。该报告可用来确定数据存储是否被过度使用或存在潜在的性能问题。

 

 

运行状况警报面板

 

导航到Recommendations(建议)仪表盘

  1. 单击Home(主页)图标
  2. 选择Recommendations(建议)仪表盘

在这里,我们可以看到Health(运行状况)列。运行状况分值代表的是整个环境的运行状况。Health(运行状况)徽标的颜色将根据警报发生相应变化。如果设置为影响整体环境运行状况的警报被触发,颜色就将发生变化。Health(运行状况)警报是指当前可能造成性能影响或中断的警报。比如虚拟机客户机文件系统的磁盘空间不足。如果不修复,该问题可能会导致立即中断。

 

 

级别最高的运行状况警报

 

在运行状况徽标下,选择One or more virtual machine guest file systems are running out of disk space(一个或多个虚拟机客户机文件系统的磁盘空间即将耗尽)。

 

 

客户机文件系统运行状况警报

 

单击vrbe-01a旁边的View Details(查看详细信息)

 

 

虚拟机客户机文件系统运行状况警报

 

  1. 展开What is Causing this Issue(出现此问题的原因)部分

在这里,我们可看到此特定虚拟机的警报页面。警报页面由一组症状和建议组成。针对一条警报可以有多个建议,您可以针对您组织的特定需求对这些建议进行自定义。症状部分包含了构成该警报的所有症状。当操作系统中某个驱动器的容量使用率超过 85% 时,客户机文件系统警告警报将被触发。

  1. 查看完警报后,单击Home(主页)图标。

 

 

vSphere 数据存储仪表盘

 

1. 单击Dashboard List(仪表盘列表)下拉箭头

2. 选择vSphere Dashboards(vSphere 仪表盘)

3. 选择vSphere Datastores(vSphere 数据存储)。

我们可以在此处快速获得显示数据存储的热图。热图以图形方式显示信息,方便用户快速确定兴趣点。该仪表盘按容量显示数据存储,使用方框的大小来显示数据存储的总容量。颜色将根据数据存储工作负载进行显示。随着数据存储工作负载的增加,颜色将从绿色变成红色。

 

 

总结

Capacity Remaining(剩余容量)将向管理员提供环境可用容量的相关信息。过去,编译和跟踪该信息需要花费数个小时,但现在几乎可以做到实时监控,这方便了管理员快速向管理层提供容量趋势和未来容量不足的相关数据。可在多个级别对Capacity Remaining(剩余容量)进行跟踪,以确保精确度。了解对象关系可以提供更多有关容量不足范围的详细信息。Risk(风险)警报可以用来查看潜在的容量不足问题。Health(运行状况)警报可提供有关可能导致性能或可用性问题的即时问题的信息。

 

提高运维效率


在虚拟环境中,人们可以方便、快捷地实例化虚拟机或扩展虚拟机资源。然而,这可能会造成虚拟机超额配置和利用率低下。这样不仅会影响效率,还会造成巨大的成本,这些成本表现为购买额外硬件所产生的 CAPEX 以及管理这些硬件所产生的 OPEX。回收这些过量分配的资源可区别或避免购买额外硬件,从而降低运维开销。通过了解潜在的密度比率,我们可以确定整合集群的机会。


 

能效警报

 

  1. 选择Recommendations(建议)仪表盘

Efficiency(能效)面板使您可以一目了然地了解环境中可用资源的使用情况。Efficiency(能效)面板使管理员可以充分利用已经购买的资源,这样就可以推迟购买新硬件。Efficiency(能效)警报不需要立即关注;这些警报旨在帮助改善环境。

 

 

环境 - vSphere 主机和集群

 

  1. 单击Environment(环境)选项卡(地球图标)
  2. 从左侧导航窗格中,选择vSphere Hosts and Clusters(vSphere 主机和集群)。

 

 

报告

 

报告是使用能效信息的绝佳方式,因为通常不需要立即对该信息做出反应。报告可以在任意级别生成。根据所选对象类型的不同,Reports(报告)选项卡下将有不同报告。

  1. 选择Reports(报告)选项卡。

 

 

容量过大的虚拟机报告

 

  1. 在筛选框中,搜索oversized
  2. 选择Oversized VMs Report(容量过大的虚拟机报告)
  3. 单击Run Template(运行模板)按钮
  4. Generated Reports(生成的报告)数字将更新为 1。

 

 

查看报告

 

  1. 选择Generated Reports(生成的报告)部分
  2. 您将会看到这里列出了刚刚生成的报告

报告可以采用 PDF 或 CSV 格式查看。

与能效有关的其他报告:

 

 

 

打开 PDF 文件

 

  1. 状态显示Completed(已完成)后,单击报告旁边的 PDF 图标
  2. 选择Open with Google Chrome(使用 Google Chrome 打开)
  3. 单击OK(确定)

报告将在 Google Chrome 中打开。要利用 vRealize Operations 与另一个团队或经理共享信息,报告是一种很不错的方式。报告是在运行报告模板的对象级别生成的。例如,如果您拥有一个包含所有财务方面的虚拟机的 vCenter 文件夹,则可以只针对这些对象生成一个报告。将报告与该特定组关联。

查看完之后,关闭报告。

 

 

vSphere World 上的可回收容量

 

  1. 选择Analysis(分析)选项卡
  2. 选择Reclaimable Capacity(可回收的容量)部分。(可能需要滚动至右侧)

可回收容量徽标指示是否有可回收的资源。顶级徽标适用于整个环境,指示资源的整体利用情况。通过回收容量,可将资源重新分配给其他虚拟机。评定为关键级别的对象有大量的资源可供回收。

 

 

未来分析

 

在Further Analysis(进一步分析)窗格中,选择Virtual Machine Reclaimable Capacity(虚拟机可回收容量)。

 

 

虚拟机可回收容量

 

此时您将转至Details(详细信息)选项卡,其中的表格显示了环境中所有虚拟机的可回收 CPU/内存/文件系统以及旧快照。在这里,您可以看到从环境中特定虚拟机回收可用资源的机会。可以选择Export(导出)图标将此列表导出为 CSV 文件。这些数字应用于帮助确定实际所需的资源。

 

 

集群上的可回收容量

 

  1. 在左侧窗格中,展开vSphere World, vc east,然后展开msbu-east
  2. 从列表中选择集群east-apps
  3. 选择Analysis(分析)选项卡
  4. 选择Reclaimable Capacity(可回收的容量)部分(可能需要滚动至右侧)

集群级别将显示该集群中所有虚拟机的可回收容量。此衡量指标会将 vCenter 中的 HA 故障转移设置考虑在内。例如,如果使用的是 N+1 故障转移,计算可回收的容量时,vRealize Operations 将增加一个用于故障转移的额外主机。它还会将 vRealize Operations 策略中定义的所有容量预留缓冲区都考虑在内。默认策略为 25%,您可以根据具体环境将此值调整为容量回收的激进或保守值,直到贵组织感到满意为止。

 

 

闲置和关闭的虚拟机

 

向下滚动至Child Objects with Reclaimable Capacity(具有可回收容量的子对象)窗格。

在此处,我们将获得容量过大、闲置和关闭的虚拟机的明细。

容量过大的虚拟机是指超额配置且含有可回收资源的虚拟机。

闲置虚拟机是指看起来不执行任何操作且其所有资源均视为可回收资源的虚拟机。

顾名思义,关闭的虚拟机就是指此时已关闭电源并因此存在可回收的存储以及已分配的 CPU 和内存的虚拟机。

 

 

集群仪表盘

 

  1. 单击左侧窗格中的Home(主页)
  2. 单击Dashboard List(仪表盘列表)旁边的箭头,选择vSphere Dashboards(vSphere 仪表盘)下的vSphere Clusters(vSphere 集群)仪表盘。

系统提供了多种预先配置的仪表盘。vSphere 集群仪表盘提供了一个位置来按 CPU 需求和内存使用情况比较集群利用率。还存在一些其他预先配置的仪表盘,用于查看环境中的特定数据。

  1. 单击Top 25 Clusters by CPU Demand(%) (24h)(CPU 需求最高的前 25 个集群 [%] [24 小时])小组件中的west-mgmt。请注意,以下小组件中将填充迷你图信息。

 

 

打开west-mgmt

 

我们来详细了解一下 west-mgmt 集群。

双击west-mgmt。

 

 

密度视图

 

  1. 选择Analysis(分析)选项卡
  2. 选择Density(密度)徽标(可能需要滚动至右侧)
  3. 展开CPU部分
  4. 展开Demand(需求)部分

该表显示了此集群中虚拟机 CPU 资源使用量的平均值与最优值之间的比率。这意味着虚拟 CPU(在虚拟机中使用)与物理 CPU(安装在 ESXi 主机中)的平均数量比值接近 vRealize Operations 计算出的最优值。

 

 

登录 vROPs-01a

 

导航并登录 vRealize Operations 虚拟设备 vROPS-01a。

  1. 单击vROPS-01a书签
  2. 使用用户名admin和密码VMware1!登录
  3. 单击Login(登录)

 

 

自定义数据中心

 

  1. 单击Environment(环境)地球图标
  2. 然后,在左侧导航窗格中,单击Custom Datacenters(自定义数据中心)链接。

 

 

自定义数据中心视图

 

  1. 展开Shared(共享)仪表盘,单击Cluster Site A(集群站点 A)
  2. 选择Analysis(分析)选项卡
  3. 选择Reclaimable Capacity(可回收的容量)

自定义数据中心是 vRealize Operations 中的一个新对象容器。自定义数据中心可用于将主机、集群以及来自多个 vCenter 的虚拟数据中心放置到一个组中。例如,已获得 SQL 许可的一组集群可放置在一个自定义数据中心内,以便在一个视图中提供有关所有 SQL 虚拟机和主机的数据。

 

 

总结

Efficiency(能效)徽标表示资源的使用情况。该徽标受与Capacity(容量)相关的分析徽标影响。能效问题一般不需要立即关注,但可借此了解环境中有哪些尚待优化的领域。可回收容量是环境总容量的一项关键指标。找出可回收的容量有助于延迟或直接避免成本花费,从而节约 CAPEX。可利用报告查找蕴含机会的领域以及制定从环境回收容量的计划。密度可用于确定容量提供对象是否满足其最佳密度目标(虚拟机与主机的最佳比率)。

 

通过容量建模确保未来容量



 

登录 vROPs-01a

 

如果您还未登录 vROPS-01a,请导航并登录 vRealize Operations 虚拟设备 vROPS-01a。否则,请继续执行下一步。

  1. 单击vROPS-01a书签
  2. 使用用户名admin和密码VMware1!登录
  3. 单击Login(登录)

 

 

导航到Custom Profile(自定义配置文件)

 

  1. 单击左侧窗格顶部的Content(内容)图标(注意:您可能需要使用才能看到该图标)。
  2. 选择Custom Profiles(自定义配置文件)
  3. 单击绿色加号创建配置文件。

 

 

自定义配置文件

 

  1. 输入配置文件名称Web-Server-P2。
  2. 从下拉列表中选择Virtual Machine(虚拟机)对象类型。(提示 - 输入Virtual[虚拟],搜索结果将显示可用选项 - 从选项列表中选择Virtual Machine[虚拟机])
  3. 输入虚拟 CPU (1)、内存 (512 MB)以及磁盘空间分配 (5 GB)(如上所示)。

此配置文件以分配为基础。您还可以通过Populate metrics from...(填充指标...)按钮使用参考机。此外,您可以从筛选器中删除Allocation(分配)并创建一个更具体的工作负载。

 

 

剩余容量

 

导航到Environment(环境)下的Cluster Site A(集群站点 A)

  1. 单击名为Environment(环境)的地球图标
  2. 依次导航到vSphere Hosts and Clusters(vSphere 主机和集群)、vSphere World、vCenter-Monitor、DataCenter Site A(数据中心站点 A)、Cluster Site A(集群站点 A)
  3. 从顶部选择Analysis(分析)选项卡。
  4. 选择Capacity Remaining(剩余容量)
  5. 查看Custom Profiles(自定义配置文件)

还可添加多少个 Web 服务器?

自定义配置文件会计算环境可处理的特定配置的额外工作负载数。这基于当前使用情况以及已提交的项目。可以通过单击Web-Server-P2配置文件旁边的加号创建其他配置文件。

注意:如果您看到的是一个问号而非数字,则说明尚未进行计算。此环境中的计算已加速为每分钟执行一次,但是数字需要 5 分钟或更长时间才会显示。通常,这些计算是在 24 小时内执行的,因此在您的环境中数字可能需要更长的时间才会显示。如果不显示数字,请继续操作,稍后再来检查。

 

 

项目创建

 

客户不断在其环境中添加和删除虚拟机,但跟踪正在进行的所有项目及其对虚拟基础架构容量的影响并非总是那么容易。接下来,让我们创建一个项目,了解添加额外虚拟机和主机对集群资源的影响。

  1. 选择页面顶部的Projects(项目)选项卡。
    从图中可以看到,如果以当前的速度发展,在绿线和蓝线相交的区域,也就是 8 月 18 日,CPU 将耗尽。这是根据当前 CPU 需求趋势得出的结论。如果虚拟机使用的分配 CPU 与此或多或少有所不同,日期可能会发生变化。
  2. 当前选择的Capacity Container(容量容器)为Most Constrained(最受限制),您可以更改此设置,以便查看其他资源的使用情况。
  3. 单击绿色加号创建项目。

注意:本练习手册中的屏幕截图可能与您练习环境中的图表有所不同。

 

 

创建项目

 

  1. 为项目命名Add 2 VMs(添加 2 个虚拟机)并作出说明。
  2. 选择Scenarios(方案)部分

 

 

添加虚拟机项目

 

  1. 将Add Virtual Machine(添加虚拟机)拖到显示Drop scenarios here(将方案拖放到此处)的右侧窗格中
  2. 将Implementation Date(实施日期)更改为1 Week Forward(向前 1 周)
  3. 单击向上箭头将服务器数量增加到2个虚拟机
  4. 将Memory - Allocation model(内存 - 分配模式)更改为512MB
    将CPU - Allocation model(CPU - 分配模式)更改为2个虚拟 CPU
  5. 单击Save project and continue editing(保存项目并继续编辑)按钮。
    顶部的图形将改为显示项目的影响。您将看到,项目实施后对最受限制的资源的影响。从上图中可以看到,添加 2 个虚拟机后,我们将耗尽资源。
  6. 单击Save(保存)

 

 

创建一个添加主机项目

 

  1. 单击绿色加号启动新项目
  2. 为项目命名Add 2 Hosts(添加 2 个主机)并作出说明
  3. 选择Scenarios(方案)部分

 

 

添加主机项目

 

  1. 选择Add Host System(添加主机系统)并将其拖到右侧窗格
  2. 单击向上箭头将主机系统的数量增加到2
  3. 单击Populate metrics from...(填充指标...)按钮。选择esx-01a.corp.local
  4. 单击Save(保存)

 

 

 

直观显示Add 2 VMs(添加 2 个虚拟机)项目

 

  1. 将Add 2 VM's(添加 2 个虚拟机)拖到图形下方的部分
  2. (如果您没有看到Memory Allocation[内存分配],请从下拉列表中选择)

从图中可以看到,现在我们在内存分配方面存在容量不足问题。屏幕可能会将 CPU 需求或其他资源显示为最受限制的资源。您可以调整Capacity Container(容量容器),查看添加 2 个虚拟机后对其他资源的影响。红色表示容量不足。

 

 

同时查看两个项目

 

既然我们的容量不足,那么就让我们通过添加额外容量资源来解决这个问题。

  1. 选择Add 2 Hosts(添加 2 个主机)并将其拖到图形下Add 2 VM's(添加 2 个虚拟机)项目旁边的部分。
  2. 更改Capacity Container(容量容器),查看该设置对其他资源的影响。

绿线表示添加的资源,蓝线表示正在消耗的资源。上图显示,在需求超过绿线之前,我们已添加 2 个额外主机,因此将不存在容量不足问题。

 

 

编辑项目

 

  1. 选择Add 2 VM's(添加 2 个虚拟机)
  2. 单击铅笔图标编辑项目

 

 

提交更改

 

  1. 选择Committed - badges affected(已提交 - 受影响的徽标)
  2. 单击Save(保存)

 

 

查看图形

 

提交项目将影响Capacity Remaining(剩余容量)和Time Remaining(剩余时间)徽标,就好像 2 个虚拟机实际上已立即添加到集群一样。

 

 

导航到Custom Datacenters(自定义数据中心)

 

  1. 选择Environment(环境)图标
  2. 单击Custom Datacenters(自定义数据中心)
  3. 展开Shared(共享)

自定义数据中心是 vRealize Operations 中的一个新对象容器结构。自定义数据中心可用于将主机、集群以及来自多个 vCenter 的虚拟数据中心组织到一个组中,以便利用容量管理和规划功能。这些自定义数据中心可用于将获得 SQL 许可的多个集群组合在一起。这样就可以看到项目对这组集群的影响。我们可以使用已创建的项目。还可以尝试创建其他方案,并查看其对自定义数据中心的影响。

 

 

总结

Capacity Remaining(剩余容量)可用于确定还可向集群中添加多少个虚拟机。借助自定义配置文件,用户可以指定特定于其环境的特定配置文件,从而轻松确定还能添加多少个虚拟机。借助项目,您可以规划出要添加的资源以及需求,以确定何时需要添加额外资源以及哪些资源将受限制。可以将项目安排到日后执行,也可以将其提交,以显示对剩余时间和容量的实际影响。

 

第 4 单元:在保持业务优先级的同时优化工作负载性能(60 分钟)

单元准备


在本单元中,我们将介绍 SDRS (Storage Distributed Resource Scheduler)、SPBM(基于存储策略的管理)、合理调整、DRS (Distributed Resource Scheduler) 和工作负载安置。其中多个主题都需要负载,此负载需要持续存在一段时间,以帮助确保本单元的顺利进行。接下来的几个步骤将带您生成此负载。


 

在虚拟机(linux-CPU-Load-01a 和 02a)上启动 CPU 负载模拟

 

将任何正在运行的应用的窗口最小化。然后,从桌面或快速启动栏加载 PuTTY。

 

 

通过 PuTTY 连接到 linux-CPU-Load-01a 虚拟机

 

  1. 选择linux-CPU-Load-01a。
  2. 单击Load(加载)
  3. 单击Open(打开)

 

 

为 linux-CPU-Load-01a 启动 CPU 负载模拟

 

  1. 在系统提示登录时,输入 root,然后按 Enter 键。无需输入密码
  2. 在 Linux 提示符下,输入 /opt/CPULoad.sh 4,然后按 Enter 键
  3. 若显示Starting CPU load(启动 CPU 负载)选项,则表明 CPU 负载模拟正在进行

注意:若显示ash -lt: argument expected(ash -lt: 预期参数),则说明您未在命令结尾处输入4。如果得到的消息以not found(未找到)结尾,则说明您输入的命令的大小写不正确。只需按 Enter键,然后重新输入 /opt/CPULoad.sh 4,务必以4结尾并采用相应的大小写字母输入该命令。也可从桌面上的 README.txt文件复制该命令,该文件提供了有关该命令的示例。

 

 

启动第二个 PuTTY 会话

 

要启动第二个 PuTTY 会话,只需:

  1. 右键单击linux-CPU-Load-01a
  2. 然后选择PuTTY

 

 

通过 PuTTY 连接到 linux-CPU-Load-02a 虚拟机

 

  1. 使用滚动条向下滚动至 linux-CPU-Load-02a
  2. 选择linux-CPU-Load-02a
  3. 单击Load(加载)
  4. 单击Open(打开)

注意:若显示ash -lt: argument expected(ash -lt: 预期参数),则说明您未在命令结尾处输入4。如果得到的消息以not found结尾,则说明您之前输入的命令的大小写不正确。只需按 Enter键,然后重新输入 /opt/CPULoad.sh 4,务必要加上4并采用如此处所示的大小写格式。也可从桌面上的 README.txt文件复制该命令,该文件提供了有关该命令的示例。

 

 

为 linux-CPU-Load-02a 启动 CPU 负载模拟

 

  1. 在系统提示登录时,输入 root,然后按 Enter 键。无需输入密码
  2. 在 Linux 提示符下,输入 /opt/CPULoad.sh 4,然后按 Enter 键
  3. 若显示Starting CPU load(启动 CPU 负载)选项,则表明 CPU 负载模拟正在进行

 

 

确认两个 PuTTY 会话

 

完成后,您应看到:

  1. linux-CPU-Load-01a.corp.local 会话在后台运行
  2. linux-CPU-Load-02a.corp.local 会话在前台运行
  3. linux-CPU-Load-02a 负载模拟器正在运行
  4. 最小化两个 PuTTY 会话并使其保持运行状态

 

 

打开 Firefox

 

  1. 从桌面或快速启动栏打开 Mozilla Firefox。

 

 

登录 vSphere Web Client

 

  1. 确保您已登录 vSphere Web Client
  2. 输入用户名:administrator@corp.local
  3. 输入密码:VMware1!
  4. 单击Login(登录)

 

 

导航到Hosts and Clusters(主机和集群)视图

 

  1. 在Home(主页)选项卡的导航窗格上,单击Hosts and Clusters(主机和集群)

 

 

调整虚拟机资源设置 - linux-CPU-Load-01a

 

  1. 展开折叠项,以便显示 esx-01a.corp.local、esx-02a.corp.local和虚拟机
  2. 右键单击linux-CPU-Load-01a
  3. 单击Edit Resource Settings...(编辑资源设置...)

 

 

调整虚拟机资源设置 - linux-CPU-Load-01a(续)...

 

  1. 单击下拉菜单,选择Custom(自定义)
  2. 输入 1250作为Custom Shares(自定义份额)
  3. 输入 1800作为Reservations(预留)(MHz)
  4. 单击OK(确定)以保存对linux-CPU-Load-01a所做的更改

 

 

调整虚拟机资源设置 - linux-CPU-Load-02a

 

  1. 右键单击linux-CPU-Load-02a
  2. 单击Edit Resource Settings...(编辑资源设置...)

 

 

调整虚拟机资源设置 - linux-CPU-Load-02a(续)...

 

  1. 单击下拉菜单,选择Custom(自定义)
  2. 输入 1250作为Custom Shares(自定义份额)
  3. 输入 1800作为Reservations(预留)(MHz)
  4. 单击OK(确定)以保存对linux-CPU-Load-02a所做的更改

 

 

需要谨记/注意的事项

为了获得良好的练习体验,请注意以下一些事项。

 

 

清除警报

 

用于练习的 ESXi 主机有 2 个 CPU。而实际工作中的 ESXi 主机可能有 80 多个核心!这很容易给练习带来过大压力并触发重要警报,为了达到学习目标,我们特意使之达到了这种状态。本手册提醒您在稍后的部分中清除它们,但如果您在运行 vSphere Client,则无论何时弹出这些警报,您都可以通过单击Reset to Green(重设为绿色)链接将其清除。它位于Cluster Site A(集群站点 A)的Summary(摘要)选项卡以及每个单独虚拟机的Summary(摘要)选项卡上。在本单元中,应仅有 linux-CPU-Load-01alinux-CPU-Load-02a虚拟机出现警报。

 

 

使用Refresh(刷新)按钮

 

vSphere Web Client 和 vRealize Operations Manager 的Refresh(刷新)按钮将帮助清除过期数据并限制等待数据刷新的时间。本练习中的大部分项目均已加速,因此,通常 1 到 5 分钟即可获得预期结果。本手册对可能出现的计时/刷新问题介绍的非常详细,同时还针对您会看到的画面提供了清晰的屏幕截图,因此,您不必等到更新周期执行,即可继续下一课/步骤。您还可以借助 Firefox 刷新功能进行刷新。

 

 

关闭 Firefox

 

  1. 单击 Firefoxx关闭浏览器

 

 

准备部分的总结

您已成功启动 CPU 负载模拟器。继续下一课,尽情学习本单元的内容吧。

 

Storage DRS


Storage DRS (SDRS) 是一种自动磁盘安置功能,用于均衡虚拟环境的 I/O 和磁盘空间要求。对于那些熟悉 DRS 的用户而言,SDRS 之于 VMDK(虚拟磁盘)就像是 DRS 之于 VM(虚拟机)。像 DRS 使用集群结构来针对已池化的计算资源聚合主机一样,数据存储集群结构用于将数据存储聚合到 Storage DRS已池化的存储资源中。


 

直观显示 Storage DRS (SDRS)

 

该图像是 SDRS 的图形表示形式。相似的数据存储会组合成一个数据存储集群。在图像中,数据存储集群中引入了 8 个 VMDK(在中间位置圈出),这些 VMDK 已基于数据存储集群中三个数据存储的磁盘空间进行了均衡。在最右侧的图像中,中间的数据存储(红色,已圈出)占用了大量 I/O,因此 SDRS 会使用 Storage vMotion 重新均衡负载,以维持磁盘容量和性能。Storage DRS 用于处理实时高峰/拥堵现象。

 

 

什么是 VMware vSphere Storage DRS?(5:08)

 
 

这是一个极棒的视频短片,其中介绍了 SDRS 的所有概念,例如,数据存储集群、负载均衡、关联性规则和数据存储维护模式。

注意:请记得按播放按钮(左下角的向右箭头)开始播放视频。

 

 

在提高存储使用率的同时维护服务级别协议 (SLA)

存储空间是超额配置最严重的资源之一。许多磁盘分得的容量是其所用容量的两倍以上。在厚配置环境中,这会导致资源浪费。vSphere v4 中推出的精简配置可解决此浪费现象,但不能在物理数据存储空间降低时自动迁移存储工作负载。要提高存储资源利用率,同时自动维护所有 SLA,将 Storage DRS 与精简配置结合使用是一种绝佳的方式。对于那些不熟悉精简配置的用户,可通过向虚拟机提供配置的存储(假设为 1 TB)并在特定数据存储中只分配使用的存储(假设为 512 GB)来分配超额配置的存储。

这一功能可以与 vRealize Operations 的Capacity Management(容量管理)功能结合使用,以便预测何时需要更多存储容量。

 

 

使用 Storage DRS 创建数据存储集群(3 分 23 秒)

 
 

本视频演示了数据存储集群的创建过程以及 SDRS 的特定设置。

注意:请记得按播放按钮(左下角的向右箭头)开始播放视频。

 

 

总结

Storage DRS课程到此结束。

 

基于存储策略的管理 (SPBM)


基于存储策略的管理 (SPBM) 是用于软件定义的存储 (SDS) 的控制平面。vSphere 介于存储使用者(虚拟机/应用)与存储提供者(存储阵列/磁盘)之间。这使得 vSphere 能够充当应用要求与存储功能之间的控制平面。SPBM 是一种策略驱动型控制平面,它能够集成 vRealize Automation、vSphere API、PowerShell 甚至 OpenStack。


 

了解虚拟机存储策略

 

虚拟机存储策略是从虚拟机存储配置文件演变而来的。存储策略用于保证将虚拟机放置在满足特定级别的性能、容量、可用性以及其他基于存储的功能的存储中。如上图所示,借助存储策略管理控制平面,虚拟机能够自动、一致地匹配正确的存储。尽管可以将存储策略应用于传统存储,但是将存储配置文件应用于软件定义的存储(如 Virtual SANVirtual Volumes)会具有很强的优势并能够实现自动化。

 

 

VMware 培训的其他培训

 

VMware 培训提供了付费和免费培训。指向本地语言版免费(付费)自控进度网上课程的链接为 https://mylearn.vmware.com/mgrReg/plan.cfm?plan=33611&ui=www_edu。上面的屏幕截图显示了可用的培训(采用多种授课语言)。突出显示的是软件定义的存储自控进度培训,时长为 2 小时,涵盖的内容包括配置文件驱动的存储以及大量其他软件定义的存储 (SDS) 基础知识。屏幕截图还显示了其他可用培训。

 

 

通过动手练习 (HOL) 更深入地了解基于存储策略的管理(和 SDS)

如果您有兴趣了解有关 SPBM 的更多内容,请进行 HOL-SDC-1627 练习,以便更深入地了解 SDS/SPBM。

基于存储策略的管理课程到此结束。

 

合理调整


规模优化调整是一种技术,可最大限度地提高资源利用率,同时将资源争用降至最低并维护 SLA。vSphere 仍然是管理基本争用的最佳方式,但不会收集执行长期分析所需的必要数据。vRealize Operations 具有一些专用于在环境中降低风险和提高能效的特殊功能。

在本课中,我们将使用 vRealize Operations (vR Ops) 分析虚拟机,以便进行规模优化调整

作为参照点,vRealize Operations 每晚(默认时间是晚上 9 点)都会计算特定的动态阈值 (DT)、衡量指标和徽标,这对于单元完成时间少于 90 分钟的练习并无益处。出于练习的目的,这些值已加速,但在生产环境中并不支持此做法。


 

查看Summary(摘要)选项卡(概述)

在本节中,我们将介绍如何使用Summary(摘要)和Analysis(分析)选项卡合理调整虚拟机 (VM) 规模。

 

 

打开 Firefox。

 

将任何正在运行的应用的窗口最小化,然后从桌面或快速启动栏加载 Firefox

 

 

登录 vRealize Operations (vROPs-01a)

 

  1. 从书签中选择vROPs-01a。
  2. 确保 URL 指向 vrops-01a.corp.local
  3. 确认Authentication Source(身份验证源)设置为Local Users(本地用户)。
  4. 在User Name(用户名)字段中,输入 admin
  5. 在Password(密码)字段中,输入 VMware1!
  6. 单击Login(登录)按钮。

注意:本练习使用的身份验证源是Local Users(本地用户)。其他身份验证源可来自 LDAP 源。

 

 

导航至Environment Overview(环境概述)

 

在导航窗格中单击Environment(环境)图标,或在导航树中单击Environment(环境)。

注意:Home(主页)、Alerts(警报)、Environment(环境)、Content(内容)和Administration(管理)图标(位于导航窗格的顶部)始终可见,但导航树将根据您已经导航到的位置而有所不同。

 

 

导航至vSphere Hosts and Clusters(vSphere 主机和集群)

 

  1. 在导航窗格中,单击vSphere Hosts and Clusters(vSphere 主机和集群)。

注意:本练习仅介绍部分分组结构,但 vRealize Operations 可提供多种方法来分组/查看对象和衡量指标。第 2 单元已经简要介绍了自定义组,本单元的最后一课将介绍自定义数据中心。这是一个有用的练习,因此,如果时间允许,可随意浏览Environment Overview(环境概述)下各个不同的分组结构。

 

 

Summary(摘要)选项卡

 

单击折叠项展开vSphere World、vCenter-Monitor、Datacenter Site A(数据中心站点 A)和Cluster Site A(集群站点 A),并保持选中Cluster Site A(集群站点 A)。系统应该会自动选择Summary(摘要)选项卡。如果没有,请选择Summary(摘要)选项卡。

  1. 首先请注意每个主要徽标(Health[运行状况]、Risk[风险] 和Efficiency[能效])的两个警报框。顶部的方框适用于在导航窗格中突出显示的对象(在此示例中是Cluster Site A[集群站点 A])。下面的警报框适用于所选对象的所有子级。Health(运行状况)徽标的颜色可能会有所不同。在上面的示例中,生成了足够的负载,从而导致Health(运行状况)徽标的颜色变成了红色。这是一个练习,因此,您看到的警报可能也会略有不同。vRealize Operations 中的警报是智能警报,系统将多个症状和间隔组合起来判断是否触发这些警报。vCenter 警报仍应在出现紧急问题时触发,例如网络链路中断、ESXi 主机故障、HA 事件以及类似的紧急问题。vR Ops 警报以每 5 分钟(默认设置,只有在极少数情况下才可以修改)收集一次的数据为基础,它们能够关联一段时间内的问题(如工作负载 [压力] 在长时间内较高),因而可以增强 vSphere 的功能。尽管我们的重点是规模优化调整,但下面还是要简单介绍一下主要徽标和相关警报。
  2. Health(运行状况)警报与 vSphere 最密切相关。对于此徽标,vR Ops 能够关联相应的问题(例如,工作负载较重以及表明虚拟机行为异常的异常现象较多),因而可以增强 vSphere 的功能。Health(运行状况)及相关警报更适用于日常运维管理活动,而不是规模优化调整活动。与Health(运行状况)相关联的辅助徽标是Workload(工作负载)、Anomalies(异常)和Faults(故障)。
  3. 对于任何以容量不足的虚拟机为重点对象的规模优化调整活动而言,从Risk(风险)警报着手都是非常好的做法。与Risk(风险)相关联的辅助徽标包括Capacity Remaining(剩余容量)、Time Remaining(剩余时间)和Stress(压力)。Capacity Remaining(剩余容量)和Time Remaining(剩余时间)属于容量管理功能。如果 vR Ops 监控的对象容量不足,需进行规模优化调整,Stress(压力)辅助徽标可以很好地反映出来。如果您是 vRealize Operations 的新用户,首先在您的虚拟化环境中对容量不足的虚拟机(与容量过大的虚拟机)进行规模优化调整是非常不错的做法。
  4. Efficiency(能效)警报侧重于优化。对于任何以容量过大的虚拟机为重点对象的规模优化调整练习,利用Efficiency(能效)都不失为一个好办法。与Efficiency(能效)相关联的辅助徽标包括Reclaimable Capacity(可回收的容量)、Density(密度)和Compliance(合规性)。重点关注Reclaimable Capacity(可回收的容量)辅助徽标将有助于识别以下可回收的虚拟机容量:容量过大的虚拟机的容量、已关闭的虚拟机的容量和闲置虚拟机的容量。

 

 

查看压力警报

 

现在,在本单元开始时生成的 CPU 负载的持续时间应已足够长,可以触发持续的高 CPU 使用率警报。您收到的警报应该类似于上方屏幕截图中所显示的警报。单击该警报可深入查看详细信息。如果由于某种原因未收到该警报,您可以打开任何已生成的警报来了解如何查看警报详细信息。

 

 

压力警报(Summary[摘要] 屏幕)

 

仅当有多个对象触发了特定警报时,Summary(摘要)屏幕才会显示。如果您选择的警报并没有涉及多个对象,请在下一步骤中了解该屏幕的相关介绍。在此示例中,Summary(摘要)窗格中显示了 CPU 使用率持续处于高水平的所有虚拟机警报。在本课中,我们将针对linux-CPU-Load-01a单击View Details(查看详细信息)。

注意:如果您选择的警报只涉及一个对象,请继续执行下一步骤。

 

 

压力警报(详细信息)

 

Alerts Details(警报详细信息)页面功能非常强大,并且含有大量数据。

  1. 导航窗格中提供了Alerts Details(警报详细信息)和Impacted Object(受影响的对象)。
  2. 右侧提供了警报的详细信息
  3. 在中间,Summary(摘要)选项卡提供了导致触发警报的症状
  4. 如果针对该警报创建了Recommendations(建议),这些建议也会显示,并且,如果有相关联的操作,还会同时显示一键式修复按钮。
  5. 在最后一步中,您可以单击Impacted Object Symptoms(受影响对象的症状)、Timeline(时间表)和Relationships(关系)选项卡。Metric Charts(衡量指标图表)选项卡可用于深入了解受影响对象的衡量指标详情,Notes(备注)选项卡将包含已经为该特定警报添加的所有备注。

 

 

导航回到Cluster(集群)视图

 

  1. 在导航窗格中,单击Go Back(后退)按钮回到Cluster(集群)视图。

 

 

使用Reports(报告)执行规模优化调整

 

  1. 确认已突出显示Cluster Site A(集群站点 A)
  2. 注意:设计本文档时,您可以看到集群运行状况警报取消,集群运行状况恢复为绿色。
  3. 单击Reports(报告)选项卡。

 

 

Reports(报告)选项卡

 

  1. 在Reports(报告)选项卡中,使用滚动条显示虚拟机报告Stressed VMs Report(工作负载过重的虚拟机报告)。这些报告按字母顺序排列。
  2. 单击Stressed VMs Report(工作负载过重的虚拟机报告),但不要单击Generate Reports(生成报告)或Scheduled(已调度)链接。如果您单击这两者中任意一个,就会导航回到Report Templates(报告模板)选项卡。
  3. 单击Run Template(运行模板)按钮。这样将会开始生成报告。
  4. 单击Generated Reports(生成的报告)链接。您也可以单击Generated Reports(生成的报告)选项卡(位于屏幕顶部),但这不会将报告筛选为仅显示Stressed VMs Report(工作负载过重的虚拟机报告)。在本练习中,这并不是至关重要的,但当生成的报告有几十个时,应通过执行筛选来缩短查找特定报告所花费的时间,这十分重要。

注意:在本练习中,我们只会查看一个报告。如您所见,集群级别的报告有几十个。这些报告将根据您在导航栏中所导航到的位置而有所不同,但您可以在 vSphere World级别运行该报告,以捕获 vR Ops 中识别的所有压力过重的虚拟机。我们只有一个含两台 ESXi 主机的集群,因此,我们会在集群级别运行报告。

 

 

Generated Reports(生成的报告)选项卡

 

现在,您应该已经打开Generated Reports(生成的报告)选项卡。

  1. 如果报告未显示Completed(已完成),请按Refresh(刷新)按钮。
  2. 由于我们是从特定报告中选择的Generated Reports(生成的报告)链接,因而已经设置了筛选条件。如果想查看该集群内的其他报告,可以单击展开图标来删除筛选条件。
  3. 每个报告的详细信息行都将包含与生成的特定报告有关的信息。
  4. 单击PDF图标以查看报告。

注意:可以采用 PDF 或 CSV 格式输出报告。

 

 

打开报告

 

  1. 选择Open with(打开方式)单选按钮。
  2. 请确认下拉框中包含Google Chrome。
  3. 单击OK(确定)在 Chrome 中打开 PDF 文件。

注意:为了保持练习的简洁性,我们将使用 Chrome 查看 PDF 文件,而不是安装一个功能更加丰富的 PDF 查看器。

 

 

查看报告

 

  1. 使用滚动条向下滚动至详细信息页面
  2. 找到标题为1. Virtual machine Recommended CPU and Memory Size(1. 建议的虚拟机 CPU 和内存大小)的页面
  3. 尽管报告中可能包含其他虚拟机,但您应该能够找到 linux-CPU-Load-01a 和 02a

注意:我们不会尝试进行修复本练习的第 2 单元对此功能进行了演示。您的报告应显示两台虚拟机都因我们生成的负载而发生了容量不足的情况,它们将从额外添加的一台虚拟 CPU 获取容量。

 

 

关闭 Chrome 和报告

 

  1. 单击x将 Google Chrome 和报告关闭

注意:有 30 多个 OOTB(即时可用的)报告。尽管本练习中数据有限,但大部分报告仍会填充一定的内容。如果时间允许,欢迎您利用 vRealize Operations 生成和查看其他报告。

 

 

查看Analysis(分析)选项卡和Stress(压力)子选项卡(概述)

在此部分,我们将查看在Analysis(分析)选项卡内的Stress(压力)辅助徽标中查看规模优化调整情况时可以使用的内容。

 

 

导航至Analysis(分析)/Stress(压力)选项卡

 

返回到 Firefox 并确保您位于以下位置:

  1. Cluster Site A(集群站点 A)集群。
  2. Analysis(分析)选项卡。
  3. Analysis(分析)选项卡中的Stress(压力)选项卡。

 

 

Analysis(分析)选项卡和Stress(压力)子选项卡概述

 

Analysis(分析)选项卡中包含Health(运行状况)、Risk(风险)和Efficiency(能效)的所有辅助徽标。在本课中,我们将重点介绍Analysis(分析)选项卡中的Stress(压力)选项卡。Stress(压力)选项卡中井井有条,包含丰富的信息:

  1. 在顶部,显示的是压力最大的资源。在许多情况下,对象的压力级别都比较低,Stress(压力)辅助徽标是绿色。自我们生成 CPU 负载之时起,此框中将显示 CPU 需求。
  2. 值得注意的是What is Stress?(什么是压力)链接和See video(观看视频)链接。单击What is Stress?(什么是压力)链接可更好地了解此辅助徽标。阅读完压力的定义后,可单击X关闭信息窗口。无需单击上隅角处的See video(观看视频)链接,也无需单击What is Stress?(什么是压力)链接。由于本练习环境的配置,这些链接将无法正常使用。
  3. Workload Graph(工作负载图)以图形形式很好地表示出了需求高峰的出现时间。由于本练习环境中没有历史数据,我们不需要处理随时间流逝而生成的图形负载,这些负载将会在数周/数月以来都在收集数据的生产部署中显示。
  4. Further Analysis(进一步分析)中的链接会将您导航至Details(详细信息)选项卡及所选择的特定视图。您可以单击任何链接来查看Details(详细信息)视图。完成操作后,导航回到Analysis(分析)/Stress(压力)选项卡。

注意:在上面的屏幕截图中,您会注意到Stress(压力)辅助徽标是红色的且数值为 235,但在您的练习中,它有可能是绿色的。正如您在顶部框(带圆圈)中看到的,压力趋势是以 30 天为基础而变化的。由于没有设置练习的日期/时间或没有调整压力趋势,系统没有足够的时间针对持续多天的问题进行相应的计算和更新,分析引擎也没有足够的时间来确定压力分值,因而将其显示为零。本课旨在演示可用内容,而不是特定值。

 

 

Analysis(分析)选项卡和Stress(压力)子选项卡概述(续)

 

  1. 使用滚动条显示Stress Breakdown(压力明细)和Cluster Compute Resource Resources(集群计算资源的资源)。
  2. Cluster Compute Resource Resources(集群计算资源的资源)提供有关正在运行的 ESXi 主机虚拟机数量以及压力策略设置的详细信息。
  3. Stress Breakdown(压力明细)框中显示了计算资源(CPU内存),并用红色显示所有具有压力的项。默认情况下,网络和磁盘压力均处于禁用状态。这是一项策略设置,所以可以启用磁盘和网络压力计算。请记住,这将增加 vROps 分析集群上的负载,并监控集群中是否有足够的资源。

注意:再次说明,在练习环境中,受多种因素的影响,您可能看不到压力。

 

 

Analysis(分析)选项卡和Stress(压力)子选项卡概述(续)

 

  1. 使用滚动条显示Child Objects with Stress(具有压力的子对象)。
  2. Child Objects with Stress(具有压力的子对象)框显示了子对象的压力明细。应查看父对象和子对象之间的压力关系以了解其中一个对象的压力是否会影响另一个对象的压力,能够做到这一点是十分有价值的。

 

 

Analysis(分析)选项卡和Stress(压力)子选项卡概述(续)

 

  1. 使用滚动条一直滚动到底部,直到显示Stress in Related Objects(相关对象的压力)。
  2. Stress in Related Objects(相关对象的压力)框将提供有关对等对象是否具有压力的详细信息。在本示例中,我们可以看到父集群中的两个子对象(ESXi 主机)都具有压力。这还可能因练习中所有虚拟机的当前驻留位置的不同而有所不同。
  3. 将鼠标光标悬停在得分柱上,所有的辅助徽标(以及对象名称)都将显示。

注意:尽管我们没有介绍所有的辅助徽标选项卡,但值得注意的是,我们进行了大量工作来确保每个辅助徽标的窗格保持一致。例如,每个辅助徽标都有What is ??(什么是?)和See video(观看视频)链接(但在本练习中无法播放视频)。关系着徽标值大小的对象将始终在顶部显示。这些类型的设计有助于您浏览不同的辅助徽标,从而最大限度地缩短学习曲线。

 

 

总结

Alerts(警报)、Reports(报告)和Analysis(分析)/Stress(压力)选项卡的强大功能与压力和规模优化调整有关,本课对其进行了演示。

本课中有关规模优化调整的内容到此结束。

 

演示用于确保合理分配资源的自动负载均衡功能


可自动对集群计算资源执行负载均衡的 VMware vSphere 功能是 DRS (Dynamic Resource Scheduler)。配置 DRS 后,它可以跨已启用 DRS 的集群中聚合的硬件资源动态均衡计算(CPU/内存)容量。DRS 会持续监控整个集群中的利用率,并根据资源池及反映业务需求和不断变化的优先级的预定义规则,在多个虚拟机之间智能分配可用资源。如果某虚拟机的负载增加,VMware DRS 会在聚合池中的各台物理服务器之间重新分配虚拟机,从而自动提供额外的资源。

利用 VMware DRS,IT 组织可以执行以下操作:


 

DRS 演示预先检查

 

本课假设您已经完成了单元准备工作,即,准备好使用 Linux 服务器打开 CPU 负载。此任务的目的是为了确保两个负载生成器都在 esx-01a 上运行。如果您没有启动 CPULoad.sh 脚本,请返回至本单元的第一课并完成启动操作。

如果 Firefox 尚未运行,请双击 ControlCenter 桌面上的 Firefox图标或单击快速启动栏上的 Firefox 图标。

 

 

登录 VMware vSphere Web Client

 

  1. 从 Firefox 书签中,单击Site A Web Client(站点 A Web Client)
  2. 输入用户名:Administrator@corp.local
  3. 输入密码:VMware1!
  4. 单击Login(登录)

 

 

导航到Hosts and Clusters(主机和集群)

 

  1. 在导航窗格中单击Hosts and Clusters(主机和集群),或在Home(主页)选项卡上单击Hosts and Clusters(主机和集群)图标

 

 

确认虚拟机都在同一 ESXi 主机上运行

 

  1. 导航至 esx-02a.corp.local。您可能需要展开折叠项才能看到 esx-02a.corp.local
  2. 单击Related Objects(相关对象)选项卡。
  3. 单击Virtual Machines(虚拟机)选项卡。
  4. 确认两台虚拟机(linux-CPU-Load-01alinux-CPU-Load-02a)都位于该主机上。
  5. 确认两台虚拟机都处于Powered On(已启动)状态。

注意:另一个单元可能已经迁移了一台虚拟机。如果两台虚拟机都位于 esx-01a-corp.local上也是可以的,但我们需要将两台虚拟机置于一台主机上,以演示自动化 DRS。如果两台虚拟机都位于同一主机上,请跳至启用 Distributed Resource Scheduler (DRS)步骤。否则,请继续执行下一步。如果您从未执行过手动 vMotion(迁移),则可以继续执行后续步骤,查看向导中显示的屏幕和选项。

 

 

虚拟机没有位于同一 ESXi 主机上

 

在本示例中,linux-CPU-Load-02a 位于 esx-01a.corp.local 上

  1. 单击esx-01a.corp.local
  2. 单击 esxi-01a 的Related Objects(相关对象)和Virtual Machines(虚拟机)选项卡。右键单击列表中的虚拟机(在本示例中是 linux-CPU-Load-02a)。
  3. 单击Migrate...(迁移...)链接启动迁移过程。

注意:您最有可能看到其他虚拟机。其位置不应该影响本课程的目标。

 

 

迁移向导(第 1 步)

 

  1. 确认Change compute resource only(仅更改计算资源)单选按钮处于选中状态。
  2. 单击Next(下一步)。

注意:为了供您参考,迁移向导中将介绍 vMotion(仅更改计算资源)和 Storage vMotion(仅更改存储)。您也可以选择执行这两种迁移。

 

 

迁移向导(第 2 步)

 

  1. 确认Filter(筛选条件)涉及的是Host(主机)。
  2. 确认esx-02a.corp.local单选按钮处于选中状态。
  3. 确认您已经收到Compatibility checks succeeded(已通过兼容性检查)消息。
  4. 单击Next(下一步)。

注意:现在,利用 vMotion,可以跨Cluster(集群)、Resource Pools(资源池)和vApps(vApp)执行迁移操作。向导通过选择相应的筛选条件来支持这一功能。这些类型的增强功能支持不限工作负载,不限位置

 

 

迁移向导(第 3 步)

 

  1. 确认VM Network(虚拟机网络)处于选中状态。
  2. 确认您已经收到Compatibility checks succeeded(已通过兼容性检查)消息。与第 2 步不同,此兼容性检查针对的是网络连接,而不是计算资源
  3. 单击Next(下一步)。

 

 

迁移向导(第 4 步)

 

  1. 确认Schedule vMotion with high priority (recommended)(为 vMotion 安排高优先级[推荐])单选按钮处于选中状态。
  2. 单击Next(下一步)。

 

 

迁移向导(第 5 步)

 

  1. 确认设置。
  2. 单击Finish(完成)。

 

 

迁移向导(确认)

 

  1. 确认esx-01a.corp.local仍然突出显示
  2. 确认Virtual Machine(虚拟机)选项卡不再显示 linux-CPU-Load-01a 或 linux-CPU-Load-02a
  3. 您还可以在Recent Tasks(近期任务)中确认 vMotion 已成功完成。可通过单击Recent Tasks(近期任务)选项卡完成此操作

 

 

启用 Distributed Resource Scheduler (DRS)

本节将讲解示范启用 DRS 来自动均衡计算工作负载所需执行的步骤。

 

 

导航至集群的Manage(管理)选项卡

 

  1. 如果尚未展开,请单击折叠项,然后突出显示Cluster Site A(集群站点 A)。
  2. 单击Manage(管理)选项卡。
  3. 然后单击Settings(设置)选项卡。
  4. 最后单击vSphere DRS选项。
  5. 各个值应该会灰显,这意味着 DRS 未启用。

 

 

资源池

 

假设已针对Cluster Site A(集群站点 A)启用 DRS,请选择Actions(操作)下拉菜单,您会发现New Resource Pool(新建资源池)选项灰显。这是因为资源池要求启用 DRS。资源池只是可以对资源进行优先级划分的功能强大的结构之一。单击下拉选项之外的任何位置,此时将关闭Actions(操作)下拉菜单。

 

 

编辑 DRS (Distributed Resource Scheduler) 设置

 

确保突出显示了Cluster Site A(集群站点 A)Manage(管理)选项卡、Settings(设置)选项卡(Manage(管理)选项卡内)以及vSphere DRS。

  1. 单击Edit(编辑)

 

 

编辑 DRS (Distributed Resource Scheduler) 设置

 

  1. 单击Turn ON vSphere DRS(打开 vSphere DRS)复选框
  2. 展开DRS Automation(DRS 自动化)折叠项,以展开详细设置
  3. 确保已选中Fully Automated(完全自动化)单选按钮。请花点时间阅读每个自动化级别,以了解其区别。启用 DRS 的大多数生产集群都在完全自动化级别运行
  4. 利用迁移阈值,可以在 DRS 执行 vMotion 时精确地进行控制。之所以提供这种控制,是由于 vMotion 会发生相关的成本(网络带宽成本和 ESXi 主机计算成本)。在本练习中,为确保自动执行 vMotion,请将滑块滑至Aggressive(激进)。在生产环境中,这会导致发生与 vMotion 相关的成本(开销),因此不建议使用。
  5. 利用 DRS,还可以设置虚拟机级别的精确控制。并且,这种控制可以与关联性反关联性规则结合使用
  6. DRS Detail Settings(DRS 详细设置)包括Power Management (DPM)(电源管理 [DPM])和Advanced Options(高级选项)。DPM 是一项卓越的绿色功能,可将工作负载迁移到集群中的其他 ESXi 主机并将一些主机置于睡眠模式。这可以降低数据中心内的电力散热成本。在生产环境中启用此功能之前,请仔细测试 ESXi 主机能否进入和退出睡眠模式。在极少数情况下,要自定义 DRS 的功能,可能需要使用Advanced Options(高级选项)。只有在极少数情况下才可以自定义 DRS 的功能,并且通常要在全球支持服务 (GSS) 人员的指导下操作。
  7. 单击OK(确定)按钮保存并关闭。

 

 

自动化级别

 

此图显示了 DRS 如何根据Manual(手动)、Partially Automated(半自动)或Fully Automated(全自动)设置进行安置和迁移

 

 

切换到集群的Summary(摘要)页面

 

  1. 确认您仍然位于导航窗格中的Hosts and Clusters(主机和集群)选项卡上
  2. 单击Cluster Site A(集群站点 A)
  3. 单击Summary(摘要)选项卡
  4. 找到vSphere DRS窗格,然后切换窗口大小。为了更好地进行查看,您需要将vSphere DRS窗格最大化。如果您看不到最大化按钮,请将vSphere DRS拖到左侧的列中。这是练习环境中的屏幕尺寸限制
  5. 将鼠标悬停在信息图标上。这样,您便可以了解Current and Target Standard Deviations(当前和目标标准偏差)所设置为的具体值。Migration Threshold(迁移阈值)滑块(我们刚刚已将它移至Aggressive[激进])对此有直接影响。在上图中,您可以看到Aggressive(激进)将Target(目标)的标准偏差设置为 0.050。如果 DRS 处于N/A状态,则各个值将显示为短划线。请继续进行练习
  6. 由于刚刚配置了 DRS,气泡应该在右侧,并如上面的屏幕截图中那样显示Imbalanced(失衡)。DRS 每五分钟检查一次,以根据集群中 ESXi 主机之间的标准和目标偏差确定是否需要执行 vMotion。如果您的练习显示的是N/A或Balanced(均衡),请在本课中稍后的内容中相看相关介绍。
  7. 如果您的集群显示警报,请单击Reset to Green(重设为绿色)将其清除。转至下一页

 

 

调整 vSphere Web Client 中的窗格

由于 DRS 最多可能要花费五分钟时间来配置和重新均衡负载,因此,我们将介绍如何调整 Web Client 窗格来改善视图效果,以便 DRS 有时间来完成它的任务。

 

 

调整 vSphere Web Client 窗格(将窗格拖到外边缘)

 

这一步将演示如何将窗格调整为某个尺寸或移动到顶部/底部,以便以自定义的方式查看。

  1. 您的屏幕极有可能不像上面的屏幕截图一样显示默认窗格。要进行重设,请单击Adminstrator@CORP.LOCAL旁边的向下箭头,然后选择Reset To Factory Defaults(重置为出厂默认值)。
  2. 在Alarms(警报)窗格上单击并按住鼠标按键。
  3. 拖动Alarms(警报)窗格,将光标移动到右侧双箭头图标处,该图标会突出显示。从上方屏幕截图可看出,与右侧双箭头不同,左侧、上方和下方双箭头呈灰色显示。
  4. 当光标位于Work in Progress(进行中的任务)窗格内时,左右上下单箭头也会显示。光标当前不在这些箭头上,所以这些箭头呈灰色显示,没有任何显示效果。释放鼠标按键以完成Alarms(警报)窗格的移动。

 

 

调整 vSphere Web Client 窗格(窗格并排排列)

 

此步骤将演示如何并排排列两个窗格。

  1. 在Alarms(警报)窗格上单击并按住鼠标按键。
  2. 将Alarms(警报)窗格拖动至Recent Tasks(近期任务)窗格内。
  3. 拖动至Recent Tasks(近期任务)窗格后,将会显示箭头按钮。将鼠标悬停在左箭头上,可将Alarms(警报)窗格移动至Recent Tasks(近期任务)窗格旁。释放鼠标按键以完成Alarms(警报)窗格的移动。

 

 

调整 vSphere Web Client 窗格(折叠Work in Progress[进行中的任务] 和Alarms[警报] 窗格)

 

此步骤将向您介绍如何折叠Work in Progress(进行中的任务)、Alarms(警报)以及Recent Tasks(近期任务)窗格,以便最大限度为主显示窗格腾出显示空间。

  1. 通过切换图钉图标,解除锁定Work in Progress(进行中的任务)窗格。
  2. 通过切换图钉图标,解除锁定Alarms(警报)窗格。
  3. 也可以通过切换图钉图标,解除锁定Recent Tasks(近期任务)窗格。

 

 

其他布局选项

 

如果您的布局需要整体调整,您可以将其重置为默认状态。

  1. 选择与登录名 (administrator@CORP.LOCAL) 相关联的下拉菜单
  2. 不要单击Reset To Factory Defaults(重置为出厂默认值),因为该操作将重置所有窗格。但是有需要时,也可以使用该选项。
  3. 另外还有一个Layout Settings(布局设置)选项。利用该选项,您可以完全移除(打开或关闭)Recent Tasks(近期任务)和Alarms(警报)窗格

注意:请根据您的需要自定义 Web Client。该布局十分理想,因为它在实现空间最大化的同时,还能让您了解Alarms(警报)和Work in Progress(进行中的任务)或Recent Tasks(近期任务)的动态。在屏幕截图中,您可以看到我们有一条Alarms(警报)和零个Work in Progress(进行中的任务)及Recent Tasks(近期任务)。您练习中的Alarms(警报)数量和Work in Progress(进行中的任务)或Recent Tasks(近期任务)数量可能与此处显示的数量不同。

 

 

演示如何使用 DRS 实现自动负载均衡

本部分将为您演示如何自动进行负载均衡。 

 

 

主机和集群视图

 

  1. 单击Home(主页)图标
  2. 选择Hosts and Clusters(主机和集群)

 

 

查看 DRS 状态

 

  1. 如有必要,请展开折叠项,然后选中Cluster Site A(集群站点 A)
  2. 单击Summary(摘要)选项卡
  3. 注意:根据完成练习所花费的时间,Alerts(警报)可能会再次显示。如果再次显示警报,请单击Reset to Green(重设为绿色)
  4. 单击vSphere DRS的最大化图标

 

 

从Summary(摘要)选项卡监控 DRS -N/A状态

 

现在,应该已经执行了 vMotion 迁移来尽力均衡集群计算资源。通过Summary(摘要)页面上的vSphere DRS屏幕,您可以了解集群的均衡情况。它将提供三个状态选项,分别是Balanced(均衡)、Imbalanced(失衡)和N/A。此外,它还提供设置、建议和故障的状态。

  1. 如果您的练习中显示N/A(无),您可以尝试使用 Web Client 的Refresh(刷新)按钮进行刷新,或者刷新 Firefox。最终,它将清除自身数据,但需要一些时间(以 5 分钟为周期)。此问题可能由多个练习因素造成。与其等待,不如继续执行下一步。最终,气泡和当前标准偏差应该仍然非常准确。
  2. 注意:值得一提的是,本练习中只有两台 ESXi 主机和适当数量的虚拟机,并且迁移阈值为激进,因此集群可能永远不会处于均衡状态。DRS 足够智能,知道将虚拟机从一台 ESXi 主机迁移到另一台主机只会反过来导致失衡,而不会努力均衡集群,即使设置是aggressive(激进)也是如此。DRS 是一项非常成熟的功能特性,具有许多能够确保它高度准确和高效的增强功能。在上面的示例中,DRS 让 ESXi 主机实现了 0.376 的标准偏差。实际上,这非常适用于只有两台 ESXi 主机的情况,而且,将迁移阈值改为Conservative(保守)并将标准偏差设为 0.3 不会使集群处于均衡状态。

 

 

确认 DRS vMotion(查看 ESX-01a)

 

  1. 单击esx-01a.corp.local
  2. 单击Related Objects(相关对象)选项卡
  3. 单击Virtual Machines(虚拟机)选项卡
  4. 现在,您应该只能看到一个 CPU-Load 虚拟机。在本例中,您能看到的是 linux-CPU-Load-01a

 

 

转到任务控制台

 

  1. 选择Home(主页)图标
  2. 选择Tasks(任务)

 

 

确认 DRS vMotion(查看任务)

 

  1. 如您所见,已执行了多个由 DRS 启动的 vMotions 迁移。

注意:DRS 不会尝试继续对虚拟机执行 vMotion 迁移,即使集群从未达到均衡状态也是如此。您的练习应显示类似的结果。

 

 

禁用 DRS

 

为了确保 DRS 不影响其他单元,您现在将禁用此集群的 DRS。

  1. 请确认已选中Cluster Site A(集群站点 A)。
  2. 单击Manage(管理)选项卡。
  3. 单击Manage(管理)中的Settings(设置)选项卡。
  4. 单击vSphere DRS。
  5. 单击Edit(编辑)。
  6. 取消选中Turn ON vSphere DRS(打开 vSphere DRS)复选框。
  7. 单击OK(确定)按钮。

 

 

重设 linux-CPU-Load-01a 资源设置

 

  1. 右键单击linux-CPU-Load-01a
  2. 单击Edit Resource Settings...(编辑资源设置...)

 

 

重设 linux-CPU-Load-01a 资源设置(续)

 

  1. 单击Shares(份额)下拉菜单,然后将其设置为Normal(正常)
  2. 单击Reservations(预留)下拉菜单,然后将其设置为0 MHz
  3. 单击OK(确定)保存更改

 

 

重设 linux-CPU-Load-01a 资源设置

 

  1. 右键单击linux-CPU-Load-02a
  2. 单击Edit Resource Settings...(编辑资源设置...)

 

 

重设 linux-CPU-Load-02a 资源设置(续)

 

  1. 单击Shares(份额)下拉菜单,然后将其设置为Normal(正常)
  2. 单击Reservations(预留)下拉菜单,然后将其设置为0 MHz
  3. 单击OK(确定)保存更改

 

 

使用 vRealize Operations 集群报告分析 DRS 能效

在本部分,我们将介绍两份 vRealize Operations 报告,它们有助于分析 DRS 的能效,以及内存与 CPU 间的整体均衡。

 

 

登录 vRealize Operations (vROPs-01a)

 

  1. 选择vROPs-01a书签以切换到 vRealize Operations。
  2. 确认Authentication Source(身份验证源)设置为Local Users(本地用户),
  3. 在User Name(用户名)字段输入 admin
  4. 在Password(密码)中输入 VMware1!
  5. 单击Login(登录)按钮。

 

 

选择Environment(环境)概述

 

从导航窗格或者按钮栏中选择Environment(环境)。

 

 

选择vSphere Hosts and Clusters(vSphere 主机和集群)

 

从导航窗格中,选择vSphere Hosts and Clusters(vSphere 主机和集群)。

 

 

集群报告

 

  1. 展开vSphere World、vcsa-01a.corp.local和Datacenter Site A(数据中心站点 A)折叠项。
  2. 突出显示Cluster Site A(集群站点 A),
  3. 选择Reports(报告)选项卡。
  4. 确认已选择Reports Templates(报告模板)选项卡。
  5. 在筛选器栏中输入 Distribution,然后按 Enter 键。
  6. 突出显示Host CPU Demand (%) Distribution Report(主机 CPU 需求 (%) 分布情况报告)。请注意不要选择Generated reports(生成的报告)或Schedules(调度)链接。
  7. 单击Run Template(运行模板)图标。
  8. 突出显示Host Memory Usage (%) Distribution Report(主机内存使用量 (%) 分布情况报告)。同样,请注意不要选择Generated reports(生成的报告)或Schedules(调度)链接。还可以针对此报告单击Run Template(运行模板)图标(重复步骤 7)

注意:您可以前往Generated reports(生成的报告)链接查看报告,但这些报告将包含在下一步骤中的屏幕截图中。本报告显示 7 天的有用数据,而练习仅持续一个小时,所以结果并非完全准确。

 

 

使用主机分布情况报告来分析集群计算均衡

 

  1. 为方便说明,已将两个报告整合在一个屏幕截图中,报告是在练习启动并运行将近一周后生成的。
  2. Y 轴表示 ESXi 主机数量。本练习中有 2 台 ESXi 主机。在实际情况中,该报告很可能显示的是包含 16 个(或更多)节点的集群的分布情况。
  3. X 轴表示以 10% 为增量的使用量。
  4. 我们的小型 Linux 虚拟机具有相同工作负载并达到了这一利用率,所以 ESXi 主机能够轻松拥有同水平的工作负载。在本例中,两台主机的Memory Usage(内存使用量)都为 40-50%,CPU Demand(CPU 需求)都为 40-50%。如果在实际情况中看到这一数值,那么您的 ESXi 主机正使用同样数量的 RAM/CPU,这对生产环境而言并不理想。内存使用量往往表现得更加静态,可以在 70-90% 的使用量范围内运行,而 CPU 需求往往更加动态,最好保持在 40-60% 的范围内。总之,这类报告为您提供了必要的信息,使您可为任意类型的环境制定容量决策。
  5. 在实际应用中,内存使用量更可能呈现出钟形曲线的形状,范围在 60-90%;而 CPU 需求为范围在 10-30% 的钟形曲线。如果您看到类似的集群分布情况,您可以将其作为判断依据,为集群中的服务器添加更多的物理内存。这样一来,集群中便可以有更多的工作负载,从而将 CPU 需求提高至 50%(或更高),同时不会因为超过物理内存容量而引起争用。

注意:vSphere with Operations Manager 使组织/用户可以了解他们需要了解的信息。大多数组织通常都知道何种使用量/需求百分比可以满足其 SLA 和业务优先事项的需求。vRealize Operations 使组织能够制定这类决策,然后监控基础架构以确保该环境不会超出或严重低于目标值。

 

 

单元清理

为了确保虚拟机不会干扰其他单元,请停止 CPU 负载并关闭所有应用。

 

 

关闭 Firefox

 

  1. 从任务栏右键单击Firefox。
  2. 选择Close Window(关闭窗口)。

 

 

关闭 PuTTY 会话

 

  1. 在任务栏上,单击linux-CPU-Load-01a的 PuTTY 会话。
  2. 按下 Enter 键,确保您可以看到四行Terminated(已终止)的消息。这表明四名员工已全部停止工作。
  3. 输入 exit 并按 Enter键。
  4. linux-CPU-Load-02a 重复步骤 1-3。

 

 

总结

DRS 是一项非常成熟且久经考验的功能特性,应该针对集群使用,并设置为完全自动化。基于集群的需求,DRS 可提供精确控制。如上所述,DRS 针对不规则激增情况实时处理集群均衡任务,并确保工作负载在短期内实现均衡。这一功能可通过 vRealize Operations 的集群分析功能得到进一步增强,从而确保在更长时间内实现最佳性能和更高级别的可见性。

演示用于确保合理分配资源的自动负载均衡功能部分到此结束。

 

工作负载安置 (WLP) 重新均衡操作


不限工作负载,不限位置的概念在 IT 行业中变得越来越盛行。VMware 已经将这一概念应用到 vSphere 的功能上,如跨 vCenter、数据中心、集群、存储,甚至是虚拟交换机 vMotion。由于底层基础架构能够延展到集群的界限之外,因此,下一个顺理成章的步骤是突破一个集群的界限执行增强型分析以及自动执行工作负载安置、移动和重新均衡。工作负载安置 (WLP) 是 vRealize Operations v6.1 及更高版本的一个新功能特性,它将这一概念变为现实。伴随 WLP,产生了一种名为自定义数据中心的全新结构。


 

什么是自定义数据中心

自定义数据中心是一种新的逻辑容器(vROps v6.1 中推出),使来自一个或多个 vCenter 的数据中心、集群和主机合并为一个逻辑聚合的数据中心。自定义数据中心结构是 vRealize Operations 的一等公民,为此对象类型提供了容量管理/规划功能。其中包括支持所有相当于数据中心和集群的徽标。

 

 

创建自定义数据中心

本部分将向您讲解示范如何创建自定义数据中心。如果您尚未在 Firefox 中登录 vRealize Operations (vROPs-01a),请启动 Firefox 并登录 vROPs-01a(书签中的第二个图标)。提示:凭证为 Admin(用户名)和 VMware1!(密码)

 

 

导航至Environment Overview(环境概述)

 

在导航窗格中单击Environment(环境)图标,或在导航树中单击Environment(环境)。

注意:Home(主页)、Alerts(警报)、Environment(环境)、Content(内容)和Administration(管理)图标始终可见,但导航树会因您导航到的位置而有所不同。

 

 

自定义数据中心

 

  1. 确认您已打开导航窗格内的Environment Overview(环境概述)。选择Custom Datacenters(自定义数据中心)(参见导航窗格中的箭头),这样,您将前往当前已定义的自定义数据中心进行查看和分析。
  2. 在详细信息窗格中选择Custom Datacenters(自定义数据中心)。您可以使用该窗格Add(添加)、Edit(编辑)、Clone(克隆)或者Delete(删除)自定义数据中心。
  3. 示例中的自定义数据中心名为Shared(共享)。如图所示,Health(运行状况)、Risk(风险)和Efficiency(能效)的三个主要徽标显示了它们当前的颜色状态。
  4. 选择加号图标,创建一个新的自定义数据中心

 

 

新建自定义数据中心向导

 

  1. 输入Name(名称)和Description(描述)。Name(名称)为必填字段,但Description(描述)为选填字段。我们不会在练习以外的地方使用此信息,所以您可以自由命名或者直接在其中一个字段或者两个字段中都输入example(示例)。
  2. 展开折叠项(箭头),您的屏幕会显示与上方屏幕截图相同的内容。唯一不需要展开的折叠项是与 ESXi 主机相关联的折叠项(esx-01a.corp.local和esx-02a.corp.local)。虚拟机驻留在主机下,是使用者而非提供者,因此无法在自定义数据中心内选择虚拟机。
  3. 选中Cluster Site A(集群站点 A)和Cluster Site B(集群站点 B)复选框。如图可见,选中Cluster Site A(集群站点 A),ESXi 主机会自动被选中。您可以直接选择位于最顶层的vSphere World层级,则所有的内容都会被选中。
  4. 单击OK(确定),关闭向导并保存更改。单击OK(确定)后,您会注意到所有的徽标都显示?(问号)。这是正常情况。某些徽标仅在夜间计算/更新。

注意:,最。vSphere World 包含了象。 ESXi 主机也包含虚拟机 (VM)容器。归根底,自定义数结构专于驻中容,并分析在选中置。在中,了Cluster Site A(集群站点 A)(和的esx-01a、esx-02a,以及关虚拟机)和Cluster Site B(集群站点 B),因此所有监控或分析都针对这两个集群进行。由于制,Cluster Site B(集群站点 B)群。在生中,中的象。中,群。许多公司有多个共享集群。一个理想的 WLP 重新均衡用例是,将这些集群合并为单一的自定义数据中心,并允许 vRealize Operations 跨多个集群重新均衡工作负载。

 

 

WLP 补充 DRS

 

在上一个部分演示用于确保合理分配资源的自动负载均衡功能中,我们介绍了 DRS。在该部分我们提到过,DRS 专注于单一集群范围内的实时均衡。WLP 重新均衡功能可突破集群界限安置工作负载,是对 DRS 的补充。重新均衡功能完全可以通过策略进行配置。对于 vRealize Operations v6.1/v6.2,虽然自定义数据中心对象可以延展至多个 vCenter,但重新均衡功能只能在单一 vCenter 上使用。在版本 6.2 中,WLP 与 DRS 全面集成,并可以利用 DRS 在集群中实际安置工作负载。WLP 与 DRS 不冲突并且不会提出/实施单一集群建议/安置。

 

 

工作负载安置(初始安置)

 

虽然不是本部分的重点,但值得注意的是 WLP 拥有一项 API 驱动的初始安置功能。该功能通过 vROps REST API 查询来确定虚拟机工作负载的最佳安置方式,从而帮助简化调配流程。VMware 和第三方产品将可以使用该 API。本示例显示了 vR Ops 如何接受查询,并返回针对新虚拟机工作负载的安置建议

 

 

工作负载安置策略设置

本部分将向您介绍如何修改策略设置,以更改 WLP 执行重新均衡的方式。

 

 

导航至Administration(管理)

 

  1. 在导航窗格中,单击Administration(管理)图标。如果将鼠标悬停在图标上,将以黄色字体显示相应图标名称。根据屏幕分辨率,您可能需要单击才能看到Administration(管理)图标。

注意:由于我们已经导航至了导航树的下层,因此,如果不先选择Home(主页)图标就无法使用导航树。

 

 

导航至Policies(策略)窗格

 

  1. 在导航窗格中,选择Policies(策略)
  2. 选择Policy Library(策略库)选项卡
  3. 突出显示Default Policy(默认策略)
  4. 单击Edit(编辑)图标

注意:我们导航至了Default Policy(默认策略),因为该策略是有效策略。您可以单击Active Policies(有效策略)选项卡来查看有效策略。vRealize Operations 能够根据组和策略精确控制分析和显示对象的方式。策略是一项涉及范围十分广泛的 vROps 功能,通过构建策略分层结构并分配对象之前,应全面考虑相关策略。

 

 

工作负载自动化

 

您的屏幕上可能没有显示出屏幕截图中的所有内容。请使用滚动条查看窗格中的所有项目。

  1. 正如您所看到的,策略向导共分为 8 个部分。本课程不会介绍所有这八个部分。值得一提的是,第 8 部分(Apply Policy to Groups[将策略应用到组])介绍了如何使策略处于有效状态。一旦策略与某个组关联,那么对该策略的作出的改动也会影响到相关联的组
  2. 选择Workload Automation(工作负载自动化)。接下来,我们将重点介绍第 4 部分,Workload Automation(工作负载自动化)。
  3. 首先要介绍的是Lock / Unlock(锁定/解锁)切换。当特定部分处于锁定状态时,无法编辑属性。Balance Workloads(均衡工作负载)已经修改为Aggressive(激进)。对于底部的Virtual Machines selected to move during balance(选中在均衡时移动的虚拟机),将锁定图标切换为解锁状态。现在可选中Virtual Machines with lowest demand(需求最低的虚拟机)单选按钮
  4. 值得注意的是设置的图形表示形式。解锁Consolidate Workloads(整合工作负载)并在Maximum(最大值)附近单击。不能单击并拖动滑块。注意图形表示形式的变化,以及它如何显示撤出的主机(无虚拟机)。现在切换为锁定,它将重置为None(无),图形表示形式也会恢复原样。
  5. 单击Save(保存)按钮以保存更改。

注意:有三个部分可影响工作负载安置,分别为Balance Workloads(均衡工作负载)、Consolidate Workloads(整合工作负载)和Advanced Setting(高级设置)。这几个部分都非常简单易懂。Balance Workloads(均衡工作负载)主要负责均衡跨此策略相关主机的工作负载。Consolidate Workloads(整合工作负载)尝试将主机撤出,使工作负载根据设置在尽可能少的主机上运行。其默认设置为None(无),即不进行整合。最后一个部分是Advanced Settings(高级设置)。其中包括两个选项:Virtual Machine with lowest demand(需求最低的虚拟机)和Virtual Machine with highest demand(需求最高的虚拟机)。由于这是单选按钮,所以您只能选择一项。为了便于您完成此练习,请选择Virtual Machine with lowest demand(需求最低的虚拟机)单选按钮。

 

 

工作负载安置 - 视频(4 分 06 秒)

 
 

此简介练习规模较小,无法正确演示 WLP。VMware 制作了精彩的 WLP 优酷视频供您观看。

注意:请记得按播放按钮(左下角的向右箭头)开始播放视频。

 

 

总结

关于工作负载安置 (WLP) 重新均衡的课程到此结束。

 

第 5 单元:确保业务连续性和可用性(60 分钟)

展示主机故障后的虚拟机自动重启


此练习介绍如何使用 VMware vSphere Web Client 启用和配置 High Availability (HA)。HA 会在主机发生故障时自动进行恢复,从而在停机时提供保护。


 

vSphere High Availability 是什么?

vSphere High Availability (HA) 可以通过监控 vSphere 集群内的主机提高虚拟机的可用性。在主机、存储连接或操作系统发生故障时,虚拟机可在其余正常运行的主机上重新启动。

创建 vSphere HA 集群时,系统将自动选择一台主机作为主控主机。主控主机与 vCenter Server 通信,并监控所有受保护虚拟机和从属主机的状态。可能存在的主机故障有多种不同的类型,主控主机必须检测故障并进行适当的处理。主控主机必须区分哪个是故障主机,哪个是处于网络分区中或已与网络隔离的主机。主控主机使用网络和数据存储检测信号来确定故障类型。另请注意,vSphere HA 是一项主机功能,这意味着,它无需依赖 vCenter 便可高效地将虚拟机故障转移至集群中的其他主机。

 

 

HA 主要组件

 

 

 

主控角色

 

 

 

从属角色

 

 

 

主控主机选择过程

 

 

 

启用和配置 vSphere High Availability (HA)

本课将为您讲解示范启用 vSphere HA 所需的步骤。

 

 

为本单元做准备

如果您已关闭窗口或已从 VMware vSphere Web Client 界面和 VMware vRealize Operations 注销,请执行以下操作来完成练习前的准备。

 

 

从 ControlCenter 桌面启动 Firefox

 

如果 Firefox 尚未运行,请双击 ControlCenter 桌面上的 Firefox图标或单击快速启动栏上的 Firefox 图标

 

 

登录 VMware vSphere Web Client

 

  1. 输入用户名:CORP\Administrator
  2. 输入密码:VMware1!
  3. 单击Login(登录)。

 

 

导航到Hosts and Clusters(主机和集群)

 

  1. 首先,请转到Home(主页)按钮。
  2. 选择Hosts and Clusters(主机和集群)。

 

 

High Availability 设置

 

在vSphere Web Client选项卡上:

  1. 单击Cluster Site A(集群站点 A)。
  2. 单击Actions(操作)以弹出下拉菜单。
  3. 单击Settings(设置)。

 

 

集群设置

 

  1. 单击Services(服务)下的vSphere HA以弹出 High Availability 的设置。请注意,您可能需要滚动到列表顶部。
  2. 单击Edit(编辑)。

 

 

启用 High Availability

 

  1. 选中Turn ON vSphere HA(打开 vSphere HA)框。
  2. 选中Protect against Storage Connectivity Loss(防止存储连接性丢失)框。
  3. 将VM Monitoring(虚拟机监控)部分更改为VM and Application Monitoring(虚拟机和应用监控)。
  4. 选择以展开Admission Control(接入控制)部分。

 

 

接入控制设置

 

向下滚动并选中Define failover capacity by reserving a percentage of the cluster resources(通过按百分比预留集群资源来定义故障转移容量)单选按钮,然后接受25%这一默认设置。

 

 

虚拟机监控与数据存储检测信号

 

  1. 展开Datastore Heartbeating(数据存储检测信号)部分。
  2. 选择Automatically select datastores accessible from the host(自动选择可从主机访问的数据存储)单选按钮。

 

 

Failure conditions and VM response(故障情况和虚拟机响应)

 

  1. 向上滚动并展开Failure condition and VM response(故障情况和虚拟机响应)
  2. 单击Response for Datastore with All Path Down (APD)(针对发生全路径失效[APD]的数据存储的响应)下拉列表,然后选择Power off and restart VMs (aggressive)(关闭并重新启动虚拟机[激进])。
  3. 将Delay for VM failover for APD(针对 APD 虚拟机故障转移的延迟)更改为 1 分钟。
  4. 在Response for APD recovery after APD timeout(针对 APD 超时之后的 APD 恢复的响应)下拉列表中,选择Reset VMs(重置虚拟机)。
  5. 单击OK(确定)。

 

 

使用Summary(摘要)选项卡确认 HA 是否已启用

 

  1. 单击Summary(摘要)选项卡
  2. 在数据区域内查找并展开vSphere HA面板:单击面板名称左侧的以展开该面板。
  3. 请注意,便捷图标可指明 vSphere HA 是否已启用

注意:该栏以蓝色显示资源使用量,以浅灰色显示受保护容量,使用条带显示预留容量。

 

 

展示 HA 对主机故障的响应

本部分将为您介绍 vSphere High Availability 如何响应主机故障。

注意:要使本节课正常进行,虚拟机应连接到虚拟分布式交换机 vds-site-a 上的虚拟机网络端口组。

 

 

 

主机故障类型和检测

vSphere HA 集群的主控主机负责检测从属主机的故障。根据已检测出的故障类型,可能需要对运行在主机上的虚拟机执行故障转移。

在 vSphere HA 集群中,已检测出三种类型的主机故障:

主控主机负责监控集群内从属主机的活动状态。这类通信会通过每秒钟交换一次网络检测信号来完成。当主控主机无法再收到来自从属主机的检测信号时,它将检查从属主机的活动状态,如果从属主机已停止活动,它会声明该主机发生故障。主控主机执行的活动状态检查旨在确定从属主机是否在与其中一个数据存储交换检测信号。请参阅数据存储检测信号。此外,主控主机还能检测主机是否会对发送到其管理 IP 地址的 ICMP ping 做出响应。

如果主控主机不能直接与从属主机上的代理通信,该从属主机不对 ICMP ping 做出响应,代理也不发送检测信号,则该从属主机将被视为出现故障。该主机的虚拟机将在备用主机上重新启动。如果该从属主机正与数据存储交换检测信号,那么主控主机将认为它位于网络分区中或与网络隔离,因此将继续监控该从属主机及其虚拟机。请参阅网络分区部分。

当主机仍在运行,但无法再在管理网络上观察到来自 vSphere HA 代理的流量时,即发生了主机网络隔离。如果主机观察不到这种流量,它将尝试对集群的隔离地址执行 ping 操作。如果这一操作也失败了,那么主机就会声明自己已与网络隔离。

主控主机负责监控运行在隔离主机上的虚拟机,如果它检测到这些虚拟机已关闭,那么该主控主机将负责重新启动它们。

注意:如果您可以确保网络基础架构具有足够的冗余,而且至少有一个网络路径始终可用,则极少会发生主机网络隔离。

在本课中,我们将处理主机故障。

 

 

确认虚拟机的安置

 

  1. 确保您位于Host and Clusters(主机和集群)导航选项卡上。
  2. 向下追溯到并突出显示esx-01a.corp.local。
  3. 选择Related Objects(相关对象)选项卡
  4. 单击Virtual Machines(虚拟机)选项卡
  5. 确认选中的 ESXi 主机托管着至少一个正在运行的虚拟机。

注意:如果出于任何原因,选中的主机上未托管虚拟机,则请选择 esx-02a.corp.local 并至少将一个虚拟机迁移到 esx-01a 这一 ESXi 主机上。

 

 

 

连接到 ESXi 主机

 

  1. 双击 ControlCenter 桌面上的 PuTTY 图标。
  2. 在Saved Sessions(保存的会话)列表中选择esx-01a.corp.local
  3. 单击Load(加载)
  4. 单击Open(打开)

 

 

强制主机重新引导

 

确认您已连接到 esx-01a,输入 reboot,然后按 Enter 键

 

 

观察 vSphere HA 的实际应用

 

  1. 返回 Firefox,在导航窗格中,单击Host and Clusters(主机和集群)选项卡
  2. 选择Cluster Site A(集群站点 A)。
  3. 选择Summary(摘要)选项卡。
  4. 单击刷新图标,直到您开始接收到与 vSphere HA主机状态和已发起的任何故障转移操作有关的信息。

几秒钟之后,您应该会陆续接收到警报,这些警报将向您说明 esx-01a.corp.local 主机的 vSphere HA主机状态。几秒钟之后,vSphere HA故障转移将开始向您提供一些进度状态信息,通知您当前集群中正在重新启动的虚拟机的数量。

注意:根据您在 esx-01a 上运行的虚拟机的数量,警告消息将与屏幕截图有所不同。

 

 

确认已发生故障转移

 

  1. 确保您位于Host and Clusters(主机和集群)导航选项卡上。
  2. 进一步展开并选中esx-02a.corp.local。
  3. 选择Related Objects(相关对象)选项卡
  4. 单击Virtual Machines(虚拟机)选项卡
  5. 确认选中的 ESXi 主机现在托管着所有正在运行的虚拟机。

 

 

打开一个新的 Firefox 选项卡

 

我们现在将查看 vRealize Operations Manager 如何对故障转移情形做出响应。我们应该能够快速看到已更新的虚拟机的安置情况。

单击 Firefox窗口顶部的+图标

 

 

登录 vRealize Operations Manager

 

  1. 单击vROPs-01a收藏夹。
  2. 输入用户名:admin
  3. 输入密码:VMware1!
  4. 单击Login(登录)。

 

 

使用 vROPS 确认虚拟机的安置

 

  1. 在搜索字段中输入 esx-02a
  2. 选择名为esx-02a.corp.local的Host System(主机系统)。

注意:在 vRealize Operations Manager 中,相比于使用Environment(环境)选项卡中的导航树,使用搜索字段通常能够更快地浏览对象。

 

 

使用Analysis(分析)选项卡

 

  1. 单击Analysis(分析)选项卡。
  2. 请注意位于Summary(摘要)|Number of running VMs(正在运行的虚拟机数量)字段右侧的数字。

您现在应该可以看到 vROPs 已经更新信息,该信息表明目前所有虚拟机均运行在 esx-02a上。

注意:vROPs 将始终在任何类型的对象的右侧窗格中显示正在运行的配置的摘要信息。

 

 

展示 vSphere HA 对发生全部路径无效 (APD) 的数据存储的响应

本部分将为您讲解示范 vSphere High Availability 对发生全部路径无效的数据存储的响应。

 

 

虚拟机组件保护

如果启用虚拟机组件保护 (VMCP),vSphere HA 可以检测出数据存储可访问性故障,并自动恢复受影响的虚拟机。

VMCP 可以防止发生数据存储可访问性故障,从而避免在 vSphere HA 集群内的主机上运行的虚拟机受到此类故障的影响。发生数据存储可访问性故障时,受影响的主机无法再访问特定数据存储的存储路径。您可以确定 vSphere HA 对此类故障的响应(从创建事件警报到在其他主机上重新启动虚拟机)。

故障类型

数据存储可访问性故障具有两种类型:

在本课中,我们将处理 APD故障。

 

 

确认虚拟机的安置

 

在vSphere Web Client选项卡上:

  1. 确保您位于Host and Clusters(主机和集群)导航选项卡上。
  2. 进一步展开并选中esx-02a.corp.local。
  3. 选择Related Objects(相关对象)选项卡
  4. 单击Virtual Machines(虚拟机)选项卡
  5. 确认选中的 ESXi 主机托管着至少一个正在运行的虚拟机。

注意:如果出于任何原因,选中的主机上未托管虚拟机,则请选择 esx-01a.corp.local 并至少将一个虚拟机迁移到 esx-02a 这一 ESXi 主机上。

 

 

连接到 ESXi 主机

 

  1. 双击 ControlCenter 桌面上的 PuTTY 图标。
  2. 在Saved Sessions(保存的会话)列表中选择esx-02a.corp.local
  3. 单击Load(加载)
  4. 单击Open(打开)

 

 

中断存储通信

 

在 PuTTY 窗口中,输入

esxcli network ip interface ipv4 set -i vmk1 -t dhcp

 

 

确认全部路径无效事件

 

切换回 vSphere Web Client

  1. 确保您位于Host and Clusters(主机和集群)导航选项卡上。
  2. 向下追溯到并突出显示Cluster Site A(集群站点 A)。
  3. 选择Monitor(监控)选项卡。
  4. 单击vSphere HA子选项卡。
  5. 确认数据存储 ds-site-a-nfs01已被声明为 APD全部路径无效)。

注意:vSphere Web Client 可能需要几秒钟时间才能显示 APD状况。如果尚未显示,请单击Refresh(刷新)直至显示出该状况,然后继续执行下一步。

 

 

确认虚拟机的安置

 

经过之前在 vSphere HA 设置中配置的最低延迟(1 分钟),将关闭主机上发生全部路径无效的虚拟机并在集群内的一个可用主机上重新启动它。

  1. 确保您位于Host and Clusters(主机和集群)导航选项卡上。
  2. 进一步展开并选中esx-01a.corp.local。
  3. 选择Related Objects(相关对象)选项卡。
  4. 单击Virtual Machines(虚拟机)选项卡。
  5. 确认选中的 ESXi 主机托管着至少一个正在运行的虚拟机。

注意:当 esx-02a.corp.local 的存储变为不可访问状态 1 分钟后,其上运行的虚拟机将开始关机并在 esx-01a.corp.local 上重新启动。整个过程将耗时 1 分钟以上。

 

 

还原存储连接

 

切换回 PuTTY 会话。esx-02a.corp.local 重新引导后,PuTTY 将断开连接。为了重新建立与存储的连接,我们需要重新连接。

如果您还没有重新建立连接,请单击OK(确定)。

 

 

重新启动会话

 

从左上角的 PuTTY 菜单中,选择Restart Session(重启会话)。

 

 

重新连接存储

 

发出以下命令,重新建立存储连接:

esxcli network ip interface ipv4 set -i vmk1 -I 10.10.20.52 -N 255.255.255.0 -t static

将 PuTTY 最小化,然后我们来验证一下连接!

 

 

验证是否已连接到存储

 

返回 vSphere Web Client,然后导航到:

  1. 确保您位于esx-02a.corp.local上
  2. 单击Summary(摘要)选项卡
  3. 单击Refresh(刷新)按钮

您应该会看到错误消息All shared datastores failed on the host esx-02a.corp.local(esx-02a.corp.local 主机上的所有共享数据存储均出现故障)已清除。

 

 

展示 vSphere HA 对虚拟机故障的响应

本部分将为您讲解示范 vSphere High Availability 对虚拟机故障的响应。

 

 

虚拟机和应用监控

如果在给定时间内未收到 VMware Tools 检测信号,虚拟机监控功能将重新启动各虚拟机。同样地,如果某个应用正在运行但却收不到它的检测信号,则应用监控功能将重新启动虚拟机。您可以启用这些功能,并配置可使 vSphere HA 监控非响应能力的敏感度。

当您启用虚拟机监控后,该服务(使用 VMware Tools)将检查能否收到来自客户操作系统中运行的 VMware Tools 进程的定期检测信号和 I/O 活动,以此来评估集群中的每个虚拟机是否正在运行。如果没有收到检测信号或 I/O 活动,则很有可能是客户操作系统出现故障,或未分配给 VMware Tools 完成任务所需的时间。在这种情况下,虚拟机监控服务会确定虚拟机已发生故障,然后重新引导虚拟机以还原服务。

在某些情况下,仍在正常运行的虚拟机或应用会停止发送检测信号。为了避免不必要的重置,该虚拟机监控服务还将监控虚拟机的 I/O 活动。如果在故障期间没有收到任何检测信号,则会检查 I/O 统计信息间隔(集群级别的属性)。I/O 统计信息间隔可以确定虚拟机在之前两分钟(120 秒)内是否发生了任何磁盘或网络活动。如果没有,则将重置虚拟机。可使用高级选项 das.iostatsinterval 更改默认值(120 秒)。

要启用应用监控,您必须首先获取适当的 SDK(或者使用支持 VMware 应用监控的应用),然后使用它为您想要监控的应用设置自定义检测信号。在您完成这些操作之后,应用监控将按照与虚拟机监控类似的方式运行。如果在指定的时间内未收到某个应用的检测信号,则会重新启动其虚拟机。

您可以配置监控敏感度级别。监控的敏感度越高,就能越快得出发生故障的结论。然而,如果采用高敏感度监控,当监控的虚拟机或应用实际上仍在运行,但由于资源限制等因素而未收到检测信号时,可能会导致错误地认为发生了故障,但出现这种情况的可能性较小。低敏感度监控会延长实际故障和虚拟机重置之间的服务中断时间。请选择能够有效满足您的需求的折衷选项。

检测到故障之后,vSphere HA 会重置虚拟机。重置可确保虚拟机仍然可用。为了避免因非暂时性错误反复重置虚拟机,在默认情况下,虚拟机在可配置的特定时间间隔内仅进行三次重置。虚拟机重置三次之后,如果以后再发生故障,vSphere HA 不会再次尝试重置虚拟机,直到超过指定的时间。您可以使用Maximum per-VM resets(每个虚拟机的最大重置次数)自定义设置配置重置次数。

在本课中,我们将处理虚拟机故障。

 

 

展示 vSphere HA 对虚拟机故障的响应

 

  1. 确保您位于Host and Clusters(主机和集群)导航选项卡上。
  2. 向下追溯到并突出显示linux-App-01a虚拟机。
  3. 选择Summary(摘要)选项卡
  4. 验证虚拟机和 VMware Tools是否正在运行

 

 

打开连接到 Linux 虚拟机的 SSH 会话

 

  1. 双击 ControlCenter 桌面上的 PuTTY图标。
  2. 在Saved Sessions(保存的会话)列表中选择linux-App-01a
  3. 单击Load(加载)
  4. 单击Open(打开)

 

 

使 Linux 虚拟机崩溃

 

  1. 登录用户名:root
  2. 输入 echo c > /proc/sysrq-trigger
  3. Enter

这将导致虚拟机陷入内核混乱。vSphere HA 将检测到 Linux OS 已经崩溃,并根据之前在 vSphere HA 配置中输入的设置触发适当的响应。

注意:您不会看到来自 PuTTY 窗口的响应。它不会有所响应,最终您将收到来自 PuTTY 的网络错误信息。

 

 

监控 vSphere HA 响应

 

返回到 vSphere Client 并刷新屏幕,直到接收到 vSphere HA 的虚拟机监控措施

 

 

确认事件日志,了解更多信息

 

  1. 选择Monitor(监控)选项卡
  2. 单击Event(事件)选项
  3. 查找本示例中突出显示的事件

根据用户的设置,vSphere HA 一停止接收 VMware Tools 的检测信号就对虚拟机进行了重置。

 

 

清除警告消息

 

  1. 选择Summary(摘要)选项卡。
  2. 单击Reset to Green(重设为绿色)超链接清除警告消息。

 

 

视频:vRealize Operations Manager:故障分析徽标(3 分 54 秒)

 
 

以下视频将向您展示在 vRealize Operations Manager 中管理 vSphere 故障的基础知识。

 

 

总结

vSphere HA 课程到此结束。

我们成功地演示了 vSphere 对以下事件的响应:

 

展示网络组件故障的恢复能力


本练习将演示如何使用 VMware vSphere Web Client 启用和配置网络冗余以防止系统出现网络故障。


 

从 ControlCenter 桌面启动 Firefox

 

如果 Firefox 尚未运行,请双击 ControlCenter 桌面上的 Firefox图标或单击快速启动栏上的 Firefox 图标

 

 

登录 VMware vSphere Web Client

 

  1. 输入用户名:CORP\Administrator
  2. 输入密码:VMware1!
  3. 单击Login(登录)

 

 

导航到Hosts and Clusters(主机和集群)

 

  1. 首先,请转到Home(主页)按钮
  2. 选择Hosts and Clusters(主机和集群)

 

 

验证绑定和故障转移虚拟交换机

 

  1. 确保您位于Networking(网络连接)导航选项卡上。
  2. 单击VM Network(虚拟机网络)。
  3. 选择Manage(管理)选项卡。
  4. 单击Settings(设置)菜单。
  5. 查看VM Network(虚拟机网络)端口组的Teaming and Failover(绑定和故障转移)配置。

在这里,我们可以看到该端口组已被配置为使用Route based on originating virtual port(基于源虚拟端口的路由)策略跨所有可用的上行链路分配网络流量。只有在第 2 层级别上声明该链路失效时才会检测网络故障。我们还可以看到,如果上行链路在发生故障后再次重新上线,则会被自动添加到网络绑定。

 

 

验证主机上的虚拟交换机的上行链路配置

 

  1. 确保您位于Hosts and Clusters(主机和集群)导航选项卡上。
  2. 单击esx-01a.corp.local。
  3. 选择Manage(管理)选项卡。
  4. 单击Networking(网络连接)菜单。
  5. 选择Virtual switches(虚拟交换机)。
  6. 单击vds-site-a。
  7. 展开 vds-site-a虚拟交换机的第一条和第二条上行链路

您可以在此屏幕上轻松查看到,在该主机上,vds-site-a 具有两条活动的上行链路。第一条上行链路是 vmnic0。我们可以看到,管理网络、存储网络和 vMotion 网络依赖这两条上行链路与存储和其他 ESXi 主机进行通信,并执行远程管理。

我们将模拟一个上行链路故障,让其中一条上行链路断开连接。

 

 

模拟网络链路故障

 

举例来说,使用 vSphere Web Client,我们可以轻松跟踪虚拟机正在使用的网络接口。在本例中,我们可以看到虚拟机 linux-App-01a 使其网络流量通过 vmnic0 和 vmnic1 进行路由。

 

 

测试网络连接性

 

  1. ControlCenter 桌面上,单击命令提示符图标
  2. 输入 ping192.168.110.123-t,然后按 Enter键。
  3. 确认您正在收到 linux-App-01a的响应。

使 ping 命令继续发送请求。

 

 

连接到 ESXi 主机

 

  1. 双击 ControlCenter 桌面上的 PuTTY图标
  2. 在Saved Sessions(保存的会话)列表中选择esx-01a.corp.local
  3. 单击Load(加载)
  4. 单击Open(打开)

 

 

更改上行链路 vmnic0 的链路状态

 

输入

esxcli network nic down -n vmnic0

然后按 Enter键。

 

 

网络响应时间

 

切换回命令提示符窗口,然后按 CTRL-C停止 ping 命令

向上滚动,直到您可以找到稍长些的响应时间。在本示例中,我们得到的响应时间都在 1 毫秒之内。在我们禁用上行链路时,响应时间增加到 14 毫秒。

 

 

请注意错误消息

 

切换回 Firefox

  1. 选择Cluster Site A(集群站点 A)。
  2. 单击Summary(摘要)选项卡。
  3. 查看显示的错误消息。

 

 

验证主机的上行链路状态

 

  1. 选择esx-01a.corp.local。
  2. 选择Manage(管理)选项卡。
  3. 单击Networking(网络连接)。
  4. 选择Virtual switches(虚拟交换机)。
  5. 选择vds-site-a。
  6. 滚动直到看到上行链路状态。

在这里,我们可以看到上行链路的状态显示在屏幕上。

 

 

物理适配器状态

 

  1. 单击物理适配器
  2. 查看我们禁用的 vmnic 的详细信息。

 

 

将上行链路 vmnic0 的链路状态更改回正常

 

输入

esxcli network nic up -n vmnic0

然后按 Enter键。

 

 

总结

绑定和故障转移课程到此结束。

我们成功地演示了 vSphere 能在发生网络链路故障时以透明的方式均衡网络流量和进行故障转移。

课程清理 - 请关闭命令提示符窗口和 PuTTY 会话。

 

vSphere Data Protection 和 vSphere Replication


vSphere Data Protection 是专为 vSphere 环境设计的备份和恢复解决方案。它由 EMC Avamar 提供支持,可提供存储到磁盘的无代理映像级虚拟机备份。它还能够为关键业务 Microsoft 应用(例如 Exchange、SQL Server 和 SharePoint)提供可识别应用的保护,以及提供高效利用 WAN 的加密备份数据复制功能。vSphere Data Protection 与 vCenter Server 和 vSphere Web Client 完全集成。

VMware vSphere Replication 是一款基于虚拟化管理程序的异步复制解决方案,适用于 vSphere 虚拟机。它与 VMware vCenter Server 和 vSphere Web Client 完全集成。vSphere Replication 提供了灵活、可靠和经济高效的复制技术,可为您环境中的所有虚拟机启用数据保护和灾难恢复功能。

要更深入地了解 vSphere Data Protection 和 vSphere Replication,请考虑进行以下练习:

VMware 业务连续性和灾难恢复 (BC/DR) 解决方案可以促进自动化、提高效率和实现数据保护,并能够验证组织的企业级 BC/DR 战略。了解如何借助 Site Recovery Manager (SRM) 和 VMware Data Protection Advanced (VDP-A) 减少应用和服务的停机时间并提高其可用性。

HOL-SDC-1605 高可用且弹性的基础架构


第 6 单元:简化安全性和合规性(60 分钟)

vSphere 强化简介



 

vSphere 强化指南

vSphere 强化指南针对如何在生产环境中安全地部署 VMware vSphere 提供指导原则。vSphere 强化指南还可以充当构建法规遵从性目标的基石。这些组织可以借助 vSphere 强化指南的指导原则映射合规性指导原则。

vSphere 指南以易于使用的电子表格格式提供,提供了丰富的元数据来支持指导原则分类和风险评估。这些指南还包括用于实现安全自动化的脚本示例。我们还将提供比较文档,其中列出了该指南各连续版本之间的指导原则更改。

强化指南是一种行业认可的方法,用于实施更严格的安全性,在满足监管和本地安全性标准方面超出 Common Criteria 等框架的要求。

 

 

为本课程做准备

如果您已关闭窗口或已从 VMware vSphere Web Client 界面和 VMware vRealize Operations 注销,请执行以下操作来完成练习前的准备。

 

 

从 ControlCenter 桌面启动 Firefox

 

如果 Firefox 尚未运行,请双击 ControlCenter 桌面上的 Firefox图标或单击快速启动栏上的 Firefox 图标

 

 

登录 VMware vSphere Web Client

 

  1. 如果页面无法自动将您带到 vSphere Web Client,请单击按钮栏上的Site A Web Client(站点 A Web Client)快捷方式。
  2. 勾选Use Windows session authentication(使用 Windows 会话身份验证)复选框
  3. 单击Login(登录)。

 

 

vSphere Update Manager 合规性

VMware vSphere Update Manager 可自动管理 vSphere 主机和虚拟机的补丁程序,无需再进行手动跟踪和修补。它会将 vSphere 主机的状态与基准状态进行比较,然后通过更新和修补强制其合规。

 

 

导航到Hosts and Clusters(主机和集群)

 

  1. 首先,请转到Home(主页)按钮
  2. 选择Hosts and Clusters(主机和集群)

 

 

附加 VMware Update Manager 基准

 

  1. 单击Cluster Site A(集群站点 A)。
  2. 单击Manage(管理)。
  3. 单击Update Manager。
  4. 单击Attach Baseline...(附加基准...)按钮。

 

 

附加基准或组

 

在这一步骤中,我们将为Cluster Site A(集群站点 A)集群分配两个默认的主机补丁程序基准。该集群内的所有主机都将继承这些补丁程序基准。

  1. 选择两个现有的补丁程序基准。
  2. 单击OK(确定)(或按 Enter 键)。

 

 

扫描主机的合规性状态

 

请注意,两个新附加的基准的状态为Non-Compliant(不合规)。我们首先需要对各个主机进行扫描。我们可以一次扫描一个主机,也可以像本示例这样,一次扫描整个集群。

单击Scan for Updates...(扫描更新)按钮。

 

 

确认扫描

 

确认两个复选框处于选中状态,然后单击OK(确定)开始扫描。

 

 

确认任务已启动

 

因为我们仅扫描两台主机,扫描速度应该会非常快。如想跟踪扫描进度,可单击Recent Tasks(近期任务)选项卡。

任务完成后,再次单击Recent Tasks(近期任务)选项卡将其折叠。

 

 

确认主机的合规性状态

 

  1. 单击我们刚刚针对其对主机进行扫描的其中一个基准。

我们可以看到两台主机均符合关键和非关键补丁程序的要求。如果不符合,它们将在Non-Compliant(不合规)选项卡中列出。

单击esx-01a.corp.local链接,了解有关已安装补丁程序的更多详细信息。

 

 

确保位于正确的位置!

 

确保您转到:

  1. esx-01a.corp.local
  2. Manage(管理)
  3. Update Manager

 

 

获取主机详细的合规性状态

 

单击Critical Host Patches (Predefined)(关键主机补丁程序 [预定义])基准,然后查看该主机各个补丁程序的状态。

 

 

vRealize Operations 中的主机合规性

vSphere 强化指南可以在未按照该指南配置主机或虚拟机上的设置或属性时提供警报来通知您。要使用该警报,请重写策略设置以启动本地策略。

在您启用一个或两个 vSphere 强化指南警报之前,基于警报的合规性不会生效。这两个警报分别适用于 ESXi 主机和虚拟机。强化指南将检查收集的数据以确定是否已配置建议的设置,从而使您的 ESXi 主机和虚拟机以一种安全的方式运行。

 

 

打开一个新的选项卡

 

  1. 在 Firefox 中打开一个新选项卡。
  2. 单击按钮栏上的vROPs-01a快捷方式。

 

 

登录 vRealize Operations Manager

 

  1. 输入用户名:admin
  2. 输入密码:VMware1!
  3. 单击Login(登录)。

 

 

默认策略

 

单击Administrative(管理)选项卡(齿轮),然后在左侧导航窗格中,单击Policies(策略)。

注意:根据屏幕尺寸,您可能需要单击才能选择Administration(管理)选项卡。

 

 

自定义策略以启用 vSphere 强化指南警报

 

  1. 单击Policy Library(策略库)选项卡,然后展开Base Settings(基本设置)(视需要)。
  2. 选择您想要自定义的Default Policy(默认策略)策略。
  3. 单击铅笔图标以编辑策略。

 

 

编辑监控策略

 

  1. 在工作区导航窗格中,单击Alert and Symptom Definitions(警报和症状定义)。
  2. 在Alert Definitions(警报定义)窗格的Filter(过滤器)文本框中输入 hardening。
  3. 该列表将显示ESXi Host is Violating vSphere Hardening Guide(ESXi 主机违反 vSphere 强化指南)和Virtual Machine is Violating vSphere Hardening Guide(虚拟机违反 vSphere 强化指南)警报。

 

 

更改 vSphere 强化警报的本地状态

 

  1. 对于各个警报,请单击State(状态)下拉菜单,然后单击Local(本地)。
  2. 单击Save(保存)。

注意:已启用警报和相关的症状定义。当已配置的策略处于活动状态,而且发现为主机或虚拟机配置的症状定义真实无误时,将生成强化指南警报。

 

 

确保采用基于警报的合规性的主机对象合规

作为虚拟基础架构管理员,您可以使用 vRealize Configuration Manager 监控环境中的对象,其中包括您在其上运行公司虚拟机的 ESXi 主机。您查看了一个或多个主机的Compliance(合规性)选项卡,发现一些主机违反了 VMware vSphere 强化指南标准,因此,您需要确定并解决这些问题。

vRealize Configuration Manager 针对 VMware vSphere 强化指南内的一些规则提供了基于警报的合规性。

 

 

检查警报

 

单击Environment(环境)选项卡,然后单击vSphere Hosts and Clusters(vSphere 主机和集群)。

 

 

查看Recommendations(建议)仪表盘

 

在左侧窗格中,单击Home(主页)按钮,然后查看Risk(风险)列,了解与 vSphere 强化指南有关的所有警报。

截止到目前,您应该已经接收到两个警报:

 

 

选择一个 ESXi 主机

 

在屏幕最右侧的搜索框中,输入 esx-01a.corp.local

向下滚动到列表底部。

单击esx-01a.corp.local主机系统。

注意:使用搜索框通常是导航至对象的最快方式。如果不止一个对象具有相同的名称,则会按照类别名称对其进行区分。

 

 

列出 vSphere 强化指南警报

 

在Summary(总结)选项卡上,单击ESXi host is violating vSphere 5.5 Hardening Guide(ESXi 主机违反 vSphere 5.5 强化指南)。

 

 

查看警报

 

查看该页面,以确定此主机以及环境中不合规标准的严重程度和普遍程度。该页面包含了违反的规则(症状)以及消除警报的建议。

在Recommendations(建议)区域,单击指向 vSphere 5.5 强化指南的链接。

 

 

总结

我们确定并解决了该主机对象的不规范规则。在您对主机设置进行更改后,已经历了四个(或更多)收集周期,该规则应不再出现在该主机违反的规则列表中

 

确保管理操作的可审核性



 

锁定模式

为了提高 ESXi 主机的安全性,可以将它们置于锁定模式下。在锁定模式下,默认情况下必须通过 vCenter Server 执行操作。

从 vSphere 6.0 开始,您可以选择正常锁定模式或严格锁定模式,两者提供了不同程度的锁定效果。vSphere 6.0 中还包含例外用户列表。在主机进入锁定模式时,例外用户不会失去权限。使用例外用户列表添加需要在主机处于锁定模式时直接访问主机的第三方解决方案和外部应用帐户。

在正常锁定模式下,DCUI 服务不会中断。如果到 vCenter Server 系统的连接断开,并且无法再通过 vSphere Web Client 进行访问,那么特权帐户可以登录 ESXi 主机的直接控制台界面,然后退出锁定模式。只有以下帐户可以访问直接控制台用户界面:

正常锁定模式

严格锁定模式

在严格锁定模式(vSphere 6.0 的新增功能)下,DCUI 服务会停止。如果到 vCenter Server 的连接断开,而且 vSphere Web Client 不再可用,那么 ESXi 主机将不可用,但如果启用了 ESXi Shell 和 SSH 服务并定义了例外用户则例外。如果您无法还原到 vCenter Server 系统的连接,那么您不得不重新安装主机。

锁定模式和 ESXi Shell 和 SSH 服务

严格锁定模式会中断 DCUI 服务。然而,ESXi Shell 和 SSH 服务不受锁定模式的影响。要使锁定模式成为有效的安全措施,请确保同时禁用 ESXi Shell 和 SSH 服务。默认情况下,这些服务处于禁用状态。

当主机处于锁定模式时,如果例外用户列表中的用户在主机上具有管理员角色,那么他们可以通过 ESXi Shell 和 SSH 访问主机。即使在严格锁定模式下也可以进行这种访问。在最安全的选项中,使 ESXi Shell 和 SSH 服务保留为禁用状态。

注意:例外用户列表是指用于执行特定任务(如主机备份)的服务帐户,而非管理员。将管理员用户添加到例外用户列表中有悖于锁定模式的初衷。

 

 

为本课程做准备

如果您已关闭窗口或已从 VMware vSphere Web Client 界面注销,请执行以下操作来完成练习前的准备。

 

 

从 ControlCenter 桌面启动 Firefox

 

如果 Firefox 尚未运行,请双击 ControlCenter 桌面上的 Firefox图标或单击快速启动栏上的 Firefox 图标

 

 

登录 VMware vSphere Web Client

 

  1. 如果页面无法自动将您带到 vSphere Web Client,请单击按钮栏上的Site A Web Client(站点 A Web Client)快捷方式。
  2. 勾选Use Windows session authentication(使用 Windows 会话身份验证)复选框
  3. 单击Login(登录)。

 

 

导航到Hosts and Clusters(主机和集群)

 

  1. 首先,请转到Home(主页)按钮
  2. 选择Hosts and Clusters(主机和集群)

 

 

使用 vSphere Web Client 启用锁定模式

 

  1. 在左侧窗格中,单击Host and Clusters(主机和集群)选项卡。
  2. 导航至Cluster Site A(集群站点 A),然后单击esx-01a.corp.local。
  3. 单击Manage(管理)选项卡
  4. 单击Settings(设置)。
  5. 在System(系统)下,选择Security Profile(安全配置文件)。
  6. 在Lockdown Mode(锁定模式)面板中,单击Edit(编辑)。

 

 

配置锁定模式

 

  1. 选择Strict(严格)选项。
  2. 单击Exception Users(例外用户)。

注意:只能通过 vCenter Server 访问主机。如果已启用 SSH 或 ESXi Shell,则将针对 DCUI.Access 高级选项中的帐户以及仍旧具有有效管理员权限的例外用户帐户运行会话。所有其他会话已结束。

当系统提示为该主机启用严格锁定模式时,请单击OK(确定)。

 

 

添加例外用户

 

  1. 单击Exception Users(例外用户)选项卡。
  2. 单击绿色的+按钮。
  3. 选择root用户。
  4. 单击Add(添加)。
  5. 单击OK(确定)。

注意:如果已经在主机上激活 Active Directory 身份验证,那么您还将能够从 Active Directory 域中选择用户。

 

 

验证设置

 

如果所有内容都与图片一致,请单击OK(确定)继续。

 

 

确认锁定模式配置

 

验证锁定模式已启用且为严格锁定模式,以及 root 用户位于Exception Users(例外用户)列表中。

 

 

跟踪和审核 vCenter Web Client 中的更改

vSphere 包含一个可由用户配置的事件和警报子系统。此子系统负责跟踪 vSphere 内发生的各种事件,并将数据存储在日志文件和 vCenter Server 数据库中。通过此子系统,还可以指定警报的触发条件。警报状态可随着系统状况的变化而从轻微警告演变为更严重的警报,并可以触发自动的警报操作。如果您希望在某一个或一组清单对象发生特定事件或进入特定状态时能够收到通知或立即采取措施,就可以使用此功能。

 

 

审核 vSphere 更改

 

  1. 在左侧窗格中,单击Host and Clusters(主机和集群)选项卡。
  2. 导航至vcsa-01a.corp.local。
  3. 单击Monitor(监控)选项卡
  4. 单击Events(事件)。

搜索您刚刚在激活锁定模式时完成的修改,并查看相关事件的详情。

注意:您可以查看与单个对象有关的事件或者查看所有的 vSphere 事件。所选清单对象的事件列表包含与子对象有关的事件。vSphere 可将与任务和事件相关的信息保留 30 天。此外,如果想缩小搜索范围,您还可以选择清单树中的任何对象。

 

 

跟踪和审核 vRealize Operations Manager 中的活动

用户活动报告有助于您了解用户在 vRealize Operations Manager 实例中的活动范围,例如用户的登录时间、对集群和节点执行的操作、对系统密码所做的更改、激活证书的时间以及注销时间。

 

 

打开一个新的选项卡

 

  1. 在 Firefox 中打开一个新选项卡。
  2. 单击按钮栏上的vROPs-01a快捷方式。

 

 

登录 vRealize Operations Manager

 

  1. 输入用户名:admin
  2. 输入密码:VMware1!
  3. 单击Login(登录)。

 

 

审核 vRealize Operations Manager 中的用户和环境

 

  1. 单击Administration(管理)(注意:您可能必须使用才能看到Administration[管理] 选项卡)
  2. 单击Audit(审核)

 

 

用户活动审核

 

用户活动报告有助于您了解用户在 vRealize Operations Manager 实例中的活动范围,例如用户的登录时间、对集群和节点执行的操作、对系统密码所做的更改、激活证书的时间以及注销时间。

 

 

用户权限审核

 

用户权限审核报告将概要介绍 vRealize Operations Manager 实例中的本地用户和 LDAP 导入的用户,并提供各用户所属的组的列表。该报告有助于您了解自己环境中的用户帐户的范围及其角色、访问组和访问权限。

该报告显示了与各本地用户和 LDAP 导入的用户有关的访问组,以及授予各访问组中用户的访问权限。此报告不涉及 vCenter Server 用户、角色或权限。

如果用户位于特定的用户组中,则相关的访问组可使用户能够访问配置、仪表盘和模板,或者是用户界面内具体的导航区域(如管理区域)。与访问组有关的访问权限包括针对各访问组的操作,例如,用户能够添加、编辑或删除仪表盘,或者查看、配置或管理对象。

 

 

vRealize Operations Manager 的系统审核

 

系统审核报告将概要介绍 vRealize Operations Manager 实例中各对象、衡量指标、超级指标、应用及自定义组的数量。此报告有助于您了解环境的规模。

系统审核报告将显示 vRealize Operations Manager 管理的对象类型和数量。报告的对象包括那些已配置和正在收集数据的对象、对象类型、适用于适配器的对象数量、已配置和正在收集的衡量指标、超级指标、vRealize Operations Manager 生成的衡量指标、使用的应用数量以及自定义组数量。

您可以使用该报告来确定环境中的对象数是否超出所支持的限制范围。

 

 

跟踪许可证使用情况

 

  1. 单击Administration(管理)。
  2. 单击Licensing(许可)。

我们可以在此跟踪许可证授权和每个已安装解决方案的使用情况。

许可证密钥可以激活解决方案或产品,并具有多种级别。一般来说,更高级别的许可证使 vRealize Operations Manager 可以监控更多对象。

 

 

总结

我们演示了如何使用锁定模式选项限制对 vSphere ESXi 主机的访问。我们还演示了如何跟踪对 vCenter Server 管理的所有对象的更改。另外,我们还演示了 vRealize Operation 的审核功能以及如何跟踪许可证的使用情况。

 

演示用户授权功能


VMware 建议您通过创建角色来满足环境的访问控制需求。如果 vCenter Server 系统是处于链接模式的某个连接组的一部分,则在该系统上创建或编辑角色时,所做的更改将会传播到该组中的所有其他 vCenter Server 系统上。

角色是一组预定义的权限。权限定义用于执行操作和读取属性的权利。例如,虚拟机管理员角色由读取属性和一组操作执行权限构成。借助该角色,用户可以读取和更改虚拟机的属性。

分配权限时,您可将用户或组与角色配对,并将该配对关系与某个清单对象相关联。单个用户或组对于清单中的不同对象可拥有不同的角色

在默认情况下,vCenter Server 可提供系统角色和样本角色:

系统角色 - 系统角色是永久性的。您无法编辑与这些角色相关联的权限。

样本角色 - VMware 可为某些经常执行的任务组合提供样本角色。您可以克隆、修改或删除这些角色。

注意:对用户和权限的更改会立即生效,即使相关用户已经登录也是如此。对搜索的更改属于例外,此类更改将在用户注销和再次登录后生效。


 

在 vSphere Web Client 中创建角色

您可以创建 vCenter Server 自定义角色来满足环境的访问控制需求。

如果某 vCenter Server 系统与其他 vCenter Server 系统位于相同的 vCenter Single Sign-On 域上,则在该系统上创建或编辑角色时,VMware Directory Service (vmdir) 会将您所做的更改传播到组中的所有其他 vCenter Server 系统。针对特定用户和对象的角色分配不会在 vCenter Server 系统间共享。

 

 

管理

 

vSphere Web Client中,单击Home(主页)图标,然后选择Administration(管理)。

 

 

角色

 

确认Roles(角色)选项卡处于选中状态。

 

 

创建角色

 

单击绿色+创建角色。

 

 

角色名称

 

  1. 将角色命名为 HOL Role
  2. 勾选All Privileges(所有权限)旁的复选框
  3. 单击OK(确定)按钮创建新角色

 

 

在 vSphere Web Client 中编辑角色

编辑角色时,可更改为该角色选择的权限。编辑完毕后,这些权限将应用到分得了该编辑后角色的所有用户或组。在链接模式下,您做出的更改将会传播到组中的所有其他 vCenter Server 系统。但是,分配给特定用户和对象的角色不会在链接的 vCenter Server 系统间共享。

 

 

编辑 HOL Role

 

  1. 单击角色HOL Role将其选中
  2. 单击Edit(编辑)按钮

 

 

删除权限

 

假设您的公司有专门的团队管理网络连接和存储,因此 HOL Role不需要对它们的访问权限。

取消选中Networking(网络连接)和Storage views(存储视图)复选框,然后单击OK(确定)。

 

 

在 vSphere Web Client 中克隆角色

您可以复制、重命名和编辑现有角色。复制角色时,新角色不会应用到任何用户、组或对象,除设置之外,它不会继承父项的任何属性。在链接模式下,这些更改将会传递到组中的所有其他 vCenter Server 系统,但分配给特定用户和对象的角色不会在链接的 vCenter Server 系统间共享。

 

 

克隆角色

 

  1. 单击角色HOL Role将其选中
  2. 单击Clone(克隆)按钮

 

 

角色名称和权限

 

  1. 将克隆的角色命名为 HOL Dev Role。由于我们对角色采取的是克隆操作,它会缺少 HOL Dev用户所需的网络存储视图权限。
  2. 勾选All Privileges(所有权限)旁的复选框,以便将所有管理权限还原至该角色。
  3. 单击OK(确定)完成克隆

 

 

新角色克隆完成

 

 

 

在 vSphere Web Client 中重命名角色

更改角色用途时可能需要重命名角色。重命名角色时,角色的分配状态不会发生变化。在链接模式下,对角色做出的更改将会传递到组中的所有其他 vCenter Server 系统,但分配的角色不会在链接的 vCenter Server 系统间共享。

 

 

编辑角色名称

 

单击角色HOL Role将其选中,然后单击Edit(编辑)按钮。

 

 

新名称

 

  1. 将角色重命名为 HOL Admin Role
  2. 单击OK(确定)

 

 

在 vSphere Web Client 中删除角色

删除并未分配给任何用户或组的角色时,将从角色列表中删除该角色的定义。删除已分配给用户或组的角色时,可删除分配设置或将其改为分配其他角色。

注意:

如果 vCenter Server 系统是处于链接模式的某个连接组的一部分,则在该系统中删除角色之前,应检查组中的其他 vCenter Server 系统上是否也在使用此角色。如果从一个 vCenter Server 系统中删除某个角色,将会从组中所有其他的 vCenter Server 系统中删除该角色,即便将权限重新分配给当前 vCenter Server 系统上的其他角色也是如此。

 

 

删除角色

 

  1. 单击角色HOL Admin Role将其选中。
  2. 单击Delete(删除)按钮。

 

 

确认删除

 

单击Yes(是)确认要删除该角色。

 

 

角色已删除

 

我们可以看到,名为 HOL Admin Role的角色已经删除。

为组织中的用户创建唯一且精细的角色可提高 vSphere 基础架构的安全性。

关于用户访问和身份验证角色的课程到此结束。

 

 

vSphere Web Client 中的 SSO 配置

您可以使用身份标识源将一个或多个域连接到 vCenter Single Sign-On。域是用户和组的存储库,vCenter Single Sign-On 服务器可以用它来验证用户的身份。

身份标识源是用户和组数据的集合。用户和组数据存储在 Active Directory、OpenLDAP 或安装了 vCenter Single Sign-On 的计算机的本地操作系统中。

安装后,vCenter Single Sign-On 的每个实例都具有身份标识源 your_domain_name,例如 vsphere.local。这是 vCenter Single Sign-On 的内部身份标识源。vCenter Single Sign-On 管理员可以添加身份标识源、设置默认的身份标识源,还可以在 vsphere.local 身份标识源中创建用户和组。

 

 

从 vSphere Web Client 注销

 

从Administrator@CORP.LOCAL菜单中,选择Logout(注销)。

 

 

使用更高权限登录

 

从 vSphere Web Client 中配置 vCenter Single Sign-On。要配置 vCenter Single Sign-On,您必须具有 vCenter Single Sign-On 管理员权限。具有 vCenter Single Sign-On 管理员权限有别于在 vCenter Server 或 ESXi 上具有管理员角色。默认情况下,在新安装的系统中,只有 administrator@vsphere.local 用户才具有 vCenter Single Sign-On 服务器的管理员权限。

  1. 在User Name(用户名)字段中,输入 administrator@vsphere.local
  2. 在Password(密码)字段中,输入 VMware1!
  3. 单击Login(登录)。

 

 

管理

 

vSphere Web Client中,单击Home(主页)图标,然后选择Administration(管理)。

 

 

编辑 vCenter Single Sign-On 身份标识源

 

vSphere 用户是在身份标识源中定义的。您可以编辑与 vCenter Single Sign-On 相关联的身份标识源的详细信息。

  1. 在左侧窗格中,选择Configuration(配置)。
  2. 单击Identity Sources(身份标识源)选项卡。
  3. 选择corp.local身份标识源。
  4. 单击铅笔按钮编辑身份标识源。

 

 

编辑身份标识源

 

在此示例中,我们只拥有对一个 Active Directory 域的访问权限并已完成集成。我们只能够更改域名。

如果您不希望重命名该计算机,请使用Use machine account(使用计算机帐户)选项。如果您希望重命名本地计算机,则必须指定一个 SPN(可以使用身份标识源进行身份验证的用户)以及该用户的密码。

单击Cancel(取消)退出Edit Identity Source(编辑身份标识源)向导(如果没有Cancel[取消] 按钮,请按 Esc键)。

 

 

添加 vCenter Single Sign-On 组

 

  1. 单击Users and Groups(用户和组)。
  2. 在右侧窗格中,单击Group(组)选项卡。
  3. 单击绿色+按钮添加新的 vCenter Single Sign-On 组。

注意:在 vCenter Single Sign-On 中,Groups(组)选项卡上列出的组对于 vCenter Single Sign-On 而言为内部组。组可作为容器来容纳一批组成员(主要用户)。

 

 

为新组命名

 

  1. 在Group Name(组名称)字段中,输入 HOL DEV Users
  2. 单击OK(确定)。

注意:创建组后,组名称将无法更改。

 

 

添加成员到 vCenter Single Sign-On 组

 

  1. 选择HOL Dev Users组。
  2. 单击添加成员按钮。

注意:vCenter Single Sign-On 组的成员可以是来自一个或多个身份标识源的用户或其他组。您可以从 vSphere Web Client 添加新成员。在 vSphere Web Client 中,Groups(组)选项卡上列出的组是 vsphere.local 域的一部分。

 

 

添加主要用户

 

  1. 在Domain(域)下拉列表中,选择corp.local作为身份标识源。
  2. 选择Show Groups First(先显示组)。
  3. 搜索框中,输入 dev
  4. 选择Private Cloud Developers(私有云开发人员)组。
  5. 单击Add(添加)。
  6. 单击OK(确定)。

注意:您可以同时添加多个成员。

 

 

添加全局权限

 

使用全局权限,您可以为用户或组添加对部署中的所有清单分层结构中的所有对象的权限。

  1. 在左侧窗格中,选择Global Permissions(全局权限)。
  2. 单击Manage(管理)选项卡。
  3. 单击绿色+按钮添加新权限。

注意:请谨慎使用全局权限。请确认您真的希望将权限分配到所有清单分层结构中的所有对象。

 

 

分配现有的组

 

单击Add(添加)按钮。

 

 

选择用户或组

 

  1. 在Domain(域)下拉列表中,选择vsphere.local作为身份标识源。
  2. 搜索框中,输入 dev
  3. 选择我们最近创建的HOL Dev Users组。
  4. 单击Add(添加)。
  5. 单击OK(确定)。

 

 

选择角色

 

  1. 从Assigned Role(分配的角色)下拉菜单中,选择HOL Dev Role。
  2. 将Propagate to Children(传播到子级)复选框保持选中状态。
  3. 单击OK(确定)。

注意:菜单中会显示分配给该对象的角色。角色包含的权限将在角色标题下方的部分中列出。如果您分配了全局权限,但没有选择Propagate(传播),则与该权限相关联的用户或组将无法访问分层结构中的对象。他们只能使用一些全局功能(比如创建角色)。

 

 

验证全局权限

 

确认创建的新权限已在Global Permission(全局权限)视图中列出。

 

 

在 vRealize Operations Manager 中对用户和访问控制进行管理

所有用户都必须具有用户帐户才能使用 vRealize Operations Manager。管理员可以将每位用户分配为一个或多个用户组的成员,并应用角色以将特定权限分配给每位用户,从而授权执行操作。

用户访问控制

作为系统管理员,为了确保 vRealize Operations Manager 实例中对象的安全性,您可以对用户访问控制的各个方面进行管理。您可以创建用户帐户、将每位用户分配为一个或多个用户组的成员、将角色分配到每个用户或用户组以设置其权限,还可以选择环境中每位用户都可以访问的对象。

角色是一个操作权限集合,可授予用户或用户组访问对象的权限。角色不包括查看或配置对象的权限。如果要添加或编辑用户帐户,您必须单独为对象分配权限。

 

 

切换到vROPs-01a选项卡

 

  1. 转至vRealize Operations Manager选项卡。
  2. 如果您尚未打开或已经关闭该选项卡,只需单击vROPS-01a快捷方式,然后使用Admin和VMware1!即可重新登录。
  3. 如果您已经注销,使用Admin和VMware1!即可重新登录。

 

 

身份验证源

 

您可以从外部源获取用户帐户,以便在 vRealize Operations Manager 实例中使用。

打开 Firefox,然后使用设置为书签的快捷方式登录 vROPS-01a,如果未打开,则用用户名Admin和密码VMware1!登录。

外部源包括使用轻型目录访问协议 (LDAP) 的所有身份标识源,比如 Active Directory 和 OpenLDAP。外部源可对这些用户进行身份验证。

  1. 单击Administration(管理)图标(您可能需要使用才能看到Administration[管理] 图标)。
  2. 选择Authentication Sources(身份验证源)。
  3. 单击绿色+图标添加新的身份验证源。

 

 

添加新的源

 

  1. 在Source Display Name(源显示名称)字段中,输入 corp.local
  2. 选择Active Directory作为Source Type(源类型)。
  3. 在Domain/Subdomain(域/子域)字段中,输入 corp.local
  4. 在User Name(用户名)字段中,输入 administrator@corp.local。
  5. 在Password(密码)字段中,输入 VMware1!
  6. 单击Test(测试)按钮确认设置,然后单击OK(确定)关闭信息框。
  7. 单击OK(确定)。

vRealize Operations Manager 现已准备好从新创建的外部身份验证源导入用户或组。

 

 

角色

 

您可以为用户分配特定角色,以执行相关操作并查看 vRealize Operations Manager 中的功能和对象。借助基于角色的访问权限,用户只能执行系统管理员指定的权限范围内的操作。

  1. 在 vRealize Operations Manager 客户端中,单击Administration(管理)图标。
  2. 选择Access Control(访问控制)。
  3. 选择Roles(角色)。

 

 

创建角色

 

  1. 在左侧窗格中,选择Access Control(访问控制)。
  2. 单击Roles(角色)选项卡。
  3. 单击绿色+创建角色。

 

 

角色名称

 

  1. 将角色命名为 HOL Role
  2. 单击OK(确定)按钮创建新角色

注意:一旦指定角色名称,将无法更改。

 

 

编辑 HOL Role

 

  1. 向下滚动
  2. 单击角色HOL Role将其选中。
  3. 单击Edit(编辑)按钮

 

 

编辑权限

 

假设您的公司有单独的团队来监控和管理 vRealize Operations 的内容,则 HOL Role无需获得任何内容管理权限。

  1. 勾选Administrative Access - all permission(管理访问权限 - 所有权限)旁的复选框。
  2. 取消勾选Content(内容)旁的复选框。
  3. 单击Update(更新)。

 

 

 

在 vRealize Operations 中克隆角色

您可以复制、重命名和编辑现有角色。复制角色时,新角色不会应用到任何用户、组或对象,除设置之外,它不会继承父项的任何属性。

 

 

克隆角色

 

  1. 单击角色HOL Role将其选中。
  2. 单击Clone(克隆)按钮。

 

 

角色名称

 

  1. 将克隆的角色命名为 HOL Dev Role
  2. 单击OK(确定)完成克隆。

 

 

新角色克隆完成

 

 

 

在 vRealize Operations 中删除角色

删除并未分配给任何用户或组的角色时,将从角色列表中删除该角色的定义。删除已分配给用户或组的角色时,可删除分配设置或将其改为分配其他角色。

 

 

删除角色

 

  1. 单击角色HOL Dev Role将其选中。
  2. 单击Delete(删除)按钮。

 

 

确认删除

 

单击Yes(是)确认要删除该角色。

 

 

角色已删除

 

我们可以看到名为 HOL Dev Role的角色已经删除。

关于用户访问和身份验证角色的课程到此结束。

 

 

从外部源导入组

您可以将导入的用户帐户分配到一个或多个用户组、将角色分配到导入的用户帐户,还可以将导入的用户帐户与 vRealize Operations Manager 环境中允许用户访问的对象相关联。

 

 

访问用户组配置面板

 

  1. 在左侧窗格中,单击Access Control(访问控制)。
  2. 选择User Groups(用户组)选项卡。
  3. 单击Import Group(导入组)图标。

 

 

导入用户组

 

  1. 从Import From(从导入)下拉列表中,选择corp.local。
  2. 选择Basic(基本)选项。
  3. 在Search String(搜索字符串)字段中,输入 Private Cloud Developers,然后按 Enter 键。
  4. 勾选列表中Private Group Developers(私有组开发人员)组旁的复选框。
  5. 单击Next(下一步)。

 

 

角色和对象

 

  1. 在Select Role(选择角色)下拉列表中,选择HOL Role。
  2. 勾选Assign this role to the group(将此角色分配到组)旁的复选框。
  3. 在Select Object Hierarchies(选择对象分层结构)窗格中,选择vSphere Hosts and Clusters(vSphere 主机和集群)对象。
  4. 单击Finish(完成)。

要进一步限制或控制该组可访问的对象,我们可以使用 vRealize Operations Manager 容器(例如自定义组自定义数据中心)来实现。

注意:要允许用户帐户访问 vRealize Operations Manager 实例的 vCenter Server 清单中的所有对象,请单击Allow access to all objects in the system(允许访问系统中的所有对象)复选框。例如,单击复选框允许用户(比如管理员)访问所有对象。

 

 

总结

为组织中的用户创建唯一且精细的角色可提高 vSphere 基础架构和 vRealize Operations Manager 的安全性。

关于用户访问和身份验证角色的课程到此结束。

 

管理和跟踪更改



 

在虚拟机 (linux-CPU-Load-01a) 上启动 CPU 负载模拟

 

将任何正在运行的应用的窗口最小化。然后,从桌面或快速启动栏加载 PuTTY

 

 

通过 PuTTY 连接到 linux-CPU-Load-01a 虚拟机

 

  1. 选择linux-CPU-Load-01a。
  2. 单击Load(加载)。
  3. 单击Open(打开)。

 

 

为 linux-CPU-Load-01a 启动 CPU 负载模拟

 

  1. 在 login as: 提示符处,输入 root,然后按 Enter 键。无需密码。
  2. 在 linux 提示符下,输入 /opt/CPULoad.sh 2,然后按 Enter 键。
  3. 若显示Starting CPU load,则表明 CPU 负载模拟正在进行。

 

 

确认虚拟机 linux-CPU-Load-01a 的工作负载状态

 

打开 vRealize Operations Manager

  1. 搜索框中,输入 linux-CPU-Load-01a
  2. 在结果框中,选择linux-CPU-Load-01a虚拟机。
  3. 单击Analysis(分析)选项卡。
  4. 选择Workload(工作负载)选项卡。

如果成功完成了之前的任务,您应该会看到工作负载得分为 99,CPU 频率大约为 3 GHz。请注意,该虚拟机上没有配置 CPU 限制。

注意:CPU 负载可能会过几分钟才会增加。您可以单击Refresh(刷新)(6) 按钮查看它是否开始剧增。

 

 

在虚拟机环境中打开 vCenter Web Client

 

  1. 单击Actions(操作)菜单。
  2. 选择Open Virtual Machine in vSphere Web Client...(在 vSphere Web Client 中打开虚拟机...)

注意:如果 Firefox 警告您连接不可信,只需展开I Understand the Risks(我了解风险),然后单击Add Exception...(添加例外...)按钮。按相关按钮确认安全例外。

 

 

 

编辑资源设置

 

请在 vSphere Web Client中执行以下操作:

  1. 单击Action(操作)显示Action(操作)菜单。
  2. 单击Edit Resource Settings...(编辑资源设置...)。

 

 

添加 CPU 限制

 

  1. 在CPU下的Limit(限制)框中,输入 200。
  2. 单击OK(确定)。

 

 

验证 CPU 限制的影响

 

切换回到 vRealize Operations Manager,然后观察工作负载,现在应该在 45% 左右。CPU 频率应该在预计的 200 Mhz 左右,因为我们为该虚拟机设置了 CPU 限制。

注意:您可能需要等待一两分钟,让工作负载根据当前的 CPU 使用情况进行调整。同样,您可以使用Refresh(刷新)(4) 按钮监控这些更改。

 

 

跟踪时间表中的配置更改

 

  1. 单击Troubleshooting(故障排除)选项卡。
  2. 选择Timeline(时间表)选项。
  3. 单击Select Criticality Level(选择严重性级别)按钮缩小搜索范围。(取消选中除Info[信息] 之外的所有其他选项)

您现在应该会看到一个属性症状,指示已经设置虚拟机 CPU 限制。将鼠标悬停在事件描述上方,以显示更多详细信息。

 

 

配置更改通知

 

  1. 单击左侧窗格中的Content(内容)按钮(您可能需要使用按钮才能看到Content[内容] 按钮)。
  2. 选择Alert Definitions(警报定义)。
  3. 单击绿色+按钮创建新警报。

 

 

为警报命名

 

  1. 在Name(名称)文本框中,输入 HOL - Virtual machine has limits set and is demanding more CPU than the configured limit
  2. 单击Base Object Type(基础对象类型)。

 

 

指定警报的对象类型

 

  1. 在搜索框中,输入 virtual machine,以这种方式选定对象类型
  2. 单击Virtual Machine(虚拟机)。
  3. 单击Alert Impact(警报影响)。

 

 

指定警报类型和子类型

 

将除Alert Type and Subtype(警报类型和子类型)之外的所有配置保留为默认值。

  1. 选择Hardware (OSI): Configuration(硬件[OSI]: 配置)。
  2. 单击Add Symptom Definitions(添加症状定义)。

 

 

配置警报症状

 

  1. 筛选框中,输入 cpu limit
  2. 将显示的两个症状拖放到右侧窗格中。
  3. 单击Save(保存)。

我们刚才所执行的操作是创建一个警报,该警报将在满足两个选中的条件时触发。对于任何设置了 CPU 限制的虚拟机,当 CPU 需求超过我们所配置的限制时,就将触发警报。

 

 

返回到linux-CPU-Load-01a

 

在搜索框中,输入linux-CPU-Load-01a即可导航回到 linux-CPU-Load-01a 虚拟机。

单击指向 linux-CPU-Load-01a的链接。

 

 

触发警报

 

导航回 linux-CPU-Load-01a 虚拟机

  1. 单击Alerts(警报)选项卡。
  2. 选择您刚刚创建的警报。

注意:可能需要一分钟左右的时间才会显示错误。

 

 

检查警报详细信息

 

观察该警报的详细信息。

展开突出显示的症状,以显示有关每条症状的更多详细信息。

注意:您也可以针对该警报配置一些修复措施和相关操作。

 

 

进行清理以准备下一单元

 

  1. 重新回到连接到 Linux-CPU-Load-01a 的 PuTTy 会话,然后按 Enter 键停止 CPU 负载脚本
  2. 关闭 PuTTY 应用。

 

 

切换到vSphere Web Client选项卡

 

切换回到vSphere Web Client,这样我们就可以移除 linux-CPU-Load-01a 上的资源限制了。

 

 

Resource Settings(资源设置)

 

从Action(操作)菜单中,选择Edit Resource Settings(编辑资源设置)。

 

 

更改 CPU 限制

 

将CPU下的Limit(限制)设置回0,然后单击OK(确定)。

 

 

总结

我们展示了 vRealize Operations 对在 vCenter Server 中执行的更改进行跟踪的功能。我们还展示了当进行了更改并且更改影响到受管对象的运行状况时,可能会触发警报的情况。

 

第 7 单元:利用 vRealize Log Insight 进行日志管理(60 分钟)

vRealize Log Insight 概述


vRealize Log Insight 可跨物理、虚拟和云计算环境执行基于机器学习的智能分组、高性能的搜索和更出色的故障排除,从而为 VMware 环境提供实时日志管理功能。

高性能接收

vRealize Log Insight 可处理任何类型的日志数据或机器生成的数据。vRealize Log Insight 支持非常高的吞吐率和低延迟。vRealize Log Insight 具有收集框架,该框架可通过 syslog、Windows 和 Linux 代理或者基于 REST 的接收 API 接受数据。

可扩展性

vRealize Log Insight 可使用多个虚拟设备实例进行横向扩展。这可以让接收吞吐量实现线性扩展,提高查询性能,并实现接收高可用性。在集群模式下,vRealize Log Insight 可提供主节点和 Worker 节点。主节点和工作节点均负责处理一部分数据。主节点可以查询数据的所有子集并汇总结果。vRealize Log Insight 可提供内部负载均衡器以进行横向扩展,从而使您能够即时实现负载均衡和横向扩展。

实时搜索

几秒钟后,便可以对 vRealize Log Insight 接收的数据进行搜索了。此外,还可以从同一界面,以同样的低延迟搜索历史数据。

vRealize Log Insight 支持完整关键字查询。关键字是指任意字母数字、连字符或带下划线的字符。除了完整关键字查询,vRealize Log Insight 还支持 glob 查询(例如,erro?、vm*)和基于字段的筛选(例如,主机名与 test* 不一致、IP 地址包含10.64)。此外,包含数值的日志消息字段可用于设定选择筛选条件(例如,CPU  80、10  线程数量  100 等)。

搜索结果将以单个事件的形式显示。每个事件源自单一源,但搜索结果可能来自多个源。您可以使用 vRealize Log Insight 将数据与一个或多个跨体系提供一致视图的维度(例如,时间和请求标识符)关联起来。这样,根本原因分析将变得更加简单。

vRealize Log Insight 代理

vRealize Log Insight 使用本机 Windows 和 Linux 代理从 Windows 和 Linux 服务器以及桌面收集日志数据。您可以从 Windows 事件渠道和日志文件收集事件,并将它们转发至 vRealize Log Insight 服务器。您可以获得的一些好处包括:集中式配置、易用性、数据压缩以及加密。第三方代理同样受支持,但只有使用我们的原生代理才能获得上述独一无二的好处。

智能分组

vRealize Log Insight 使用新的机器学习技术。智能分组可扫描传入的非结构化数据,并按照问题类型对消息进行快速分组,以便您快速了解整个物理、虚拟和混合云环境中可能都存在的问题。Interactive Analytics(交互式分析)页面上的Event Trends(事件趋势)选项卡可自动分析与新的洞察信息和异常检测相关的事件。现在,我们可以查看指定时间间隔内的事件发展趋势,并轻松检测出可能会影响环境或应用运行状况的事件。

聚合

从日志数据中提取的字段可用于进行聚合。这与 Microsoft Excel 中的 GROUP-BY 查询在关系数据库或数据透视表中提供的功能类似。区别在于您无需执行提取、转换和加载 (ETL) 流程,vRealize Log Insight 会扩展到任意数据规模。

您可以生成数据的聚合视图并确定特定的事件或错误,且无需访问多个系统和应用。例如,查看每分钟的错误数等重要的系统衡量指标时,您可以深入了解特定时间范围内的事件并检查环境中发生的错误。

运行时间字段提取

原始日志数据并不是始终都易于理解,您可能需要对一些数据进行处理,以确定对搜索和聚合非常重要的字段。vRealize Log Insight 可自动提取大多数字段,并且您可以从数据中动态提取新字段。操作非常简单,只需双击消息文本并选择Extract Field(提取字段)。系统将基于您的选择自动提供 Regex。提取的字段可用于进行选择、预测和聚合。

仪表盘

您可以创建包含希望密切监控的有用衡量指标的仪表盘。任何查询都可以转变成仪表盘小组件,并针对任何时间范围而汇总。您可以检查过去五分钟、一小时或一天的系统性能。您可以按小时查看错误明细,并观察日志事件的趋势。

安全注意事项

如果 IT 决策者、架构师、管理员及其他人员需要熟悉 vRealize Log Insight 安全组件,则必须阅读 VMware vRealize Log Insight 安全指南。有关更多信息,您可以参阅 vRealize Log Insight 文档,网址如下:https://www.vmware.com/support/pubs/log-insight-pubs.html

安全指南简要引用了 vRealize Log Insight 的安全功能。其中包括以下主题:产品外部接口、端口、身份验证机制以及安全功能配置和管理选项。


 

仪表盘概述

 

仪表盘 - 请将Dashboards(仪表盘)页面视为概述部分。仪表盘能够快速直观呈现日志数据并确定环境中的潜在问题。Log Insight 可在仪表盘内提供两种不同类型的小组件:图表和查询。图表是数据的图形表示形式,并且是最常使用的小组件。查询是已保存的多条信息,可以在Interactive Analytics(交互式分析)页面上提供数据的图形和文本表示形式,但查询在仪表盘页面上仅按既定的名称列出。查询小组件通常在图表小组件并不一定能提供有用信息时使用。

交互式分析 - 允许管理员和工程师使用通俗易懂的语言或 REGEX 字符串执行搜索,以及查看详细的日志消息以确定问题区域并执行根本原因分析。

 

 

交互式分析概述

 

利用Interactive Analytics(交互式分析)页面,管理员和工程师可以深入了解日志消息,以确定问题区域并执行根本原因分析。

在页面顶部,导航栏的正下方,您将看到一个具有黑色背景的部分。此部分为日志数据提供了图形表示形式。

该部分中的图表看起来应该与您在Dashboards(仪表盘)页面上看到的图表小组件类似。默认情况下,概览图表是柱状图,可显示一段时间内的事件总数(就过去五分钟内看到的日志消息而言)。Log Insight 将已接收的数据视为事件。对于概览图表上直观显示的事件,可采用各种不同的方法进行操作,但最常用的方式是利用各种功能和分组进行更改。

在Interactive Analytics(交互式分析)页面中创建自定义查询后,系统将提供许多选项:

 

 

内容包概述

内容包提供了一种强大的方法来通过有关特定事件的预定义知识延展 Log Insight。要浏览至Content Packs(内容包)部分,请选择导航栏中的三道杠图标,然后选择Content Packs(内容包)。

内容包由各种组件组成。这些组件包括:

 

 

管理概述

管理部分提供运行状况信息,并且可用于对配置设置进行修改。对于产品初始配置向导运行期间显示的所有信息,都可以从管理部分进行修改。管理部分中还有其他一些方面无法在初始配置向导运行期间配置,比如,可以在何处管理集群成员和代理。

 

 

配置 vRealize Log Insight

现在,我们已经了解了 vRealize Log Insight 的用途,接下来要配置我们的环境。

 

配置 vCenter 与 vSphere 集成


在配置 Log Insight 以从 vSphere环境中收集警报、事件和任务数据之前,必须将 Log Insight 连接至一个或多个 vCenter Server 系统。

Log Insight 可从 vCenter Server 实例及其管理的 ESXi 主机收集两种类型的数据:

在本练习部分,我们会将 Log Insight 配置为与 vCenter 及其管理的两台主机集成。


 

键盘快捷键

 

为了帮助您在练习中输入一些条目,我们在 ControlCenter 桌面上添加了一个 README.txt 文件,用来帮助说明键盘布局的变化。根据情况,您还可以使用该 README.txt 文件来逐步复制和粘贴其中包含的命令。

 

 

启动 vRealize Log Insight 用户界面

 

在 ControlCenter 桌面上,启动 Firefox。

 

 

浏览器缩放设置

 

如果在本单元中将使用的任何向导中进行导航时遇到问题,请使用 Firefox 缩放设置来调整用户界面屏幕。

  1. 单击打开 Firefox 菜单
  2. 根据情况使用+和-进行放大或缩小以适应屏幕大小

 

 

Log Insight 书签

 

  1. 单击 Log Insight 文件夹,然后选择loginsight-01a

 

 

连接到 loginsight-01a 设备

 

  1. Username(用户名):admin
  2. Password(密码):VMware1!
  3. 单击Login(登录)

 

 

准备接收数据

 

Log Insight 设备已提前准备好,随时可以配置日志收集。

现在,我们可以转至 vSphere 集成部分。

1. 单击Configure vSphere Integration(配置 vSphere 集成)

 

 

配置 vCenter 与 vSphere 集成

 

输入以下配置信息。

1. Hostname(主机名):vcsa-01a.corp.local

2. Username(用户名):administrator@vsphere.local

3. Password(密码):VMware1!

4. 单击Test Connection(测试连接)

注意:默认情况下,Collect vCenter Server events, task, and alarms(收集 vCenter Server 事件、任务与警报)和Configure ESXi hosts to send logs to Log Insight(配置 ESXi 主机以向 Log Insight 发送日志)均处于选中状态。这些选项将重新配置 vCenter 及相关 ESXi 主机,以向 Log Insight 发送 Syslog 数据。要发送更多 vCenter Syslog 数据,还需进行其他配置。稍后我们将在此部分中介绍其他配置步骤。

 

 

测试成功

 

在继续之前,请确认您收到了Test successful(测试成功)消息。

注意:如果您未收到Test successful(测试成功)消息,请返回至上一步骤并验证您的配置。

1. 单击Save(保存)

 

 

等待 vCenter 和 ESXi 主机配置操作完成

 

如屏幕截图所示,此步骤可能需要片刻时间。完成此步骤后,请执行下一步。

 

 

配置操作成功完成

 

1. 单击OK(确定)继续

 

 

查看帮助信息

 

1. 如果您单击Collect vCenter Server events, tasks, and alarms(收集 vCenter Server 事件、任务与警报)旁的?,便会发现我们需要配置 vCenter 以向 Log Insight 发送日志。

暂将该选项卡保持打开状态。稍后我们将返回至 Log Insight 界面。请继续执行下一步。

 

 

在 vCSA 6.0 中转发 vCenter 日志

VMware vCenter Server Virtual Appliance (vCSA) 为选择不运行 Windows vCenter Server 但仍需要在企业中集中管理 VMware vSphere 部署的组织提供了备选选项。

vCSA 提供与传统 Windows vCenter Server 完全相同的功能,但打包在 Linux 发行版中。

借助 vCSA 6.0,可为原生远程 Syslog(可在 vSphere Web Client 中通过新的 vCenter Server 系统配置下的 VMware Syslog Service进行配置)提供部分支持。

目前的日志集主要有两种,当配置新的 Syslog 服务时,系统便会将这些日志集转发到远程 Syslog 服务器:

  1. 连接到 vCenter Server 的 ESXi 主机中的所有日志均将被转发
  2. vCenter Server 服务日志集的一部分将被转发。所转发的特定服务日志可在 in /etc/vmware-syslog/custom-file-location.conf 中找到

 

 

启动 vSphere Web Client

 

在浏览器中打开一个新的选项卡以转至 vSphere Web Client。

  1. 在浏览器中单击vSphere Web Client书签
  2. Username(用户名):administrator@vsphere.local
  3. Password(密码):VMware1!
  4. 单击Login(登录)

 

 

导航至Administration(管理)

 

  1. 单击Administration(管理)以打开 Web Client 的管理部分

 

 

系统配置

 

  1. 单击System Configuration(系统配置)

 

 

Services(服务)

 

  1. 单击Services(服务)

 

 

VMware Syslog Service 设置

 

接下来,我们将浏览到 System Configuration Services,通过以下步骤编辑 VMware Syslog Service:

  1. 您将看到两个名为VMware Syslog Service (...的服务,您需要选择第二个服务
  2. 为验证您是否选择了正确的服务,请确认Summary(摘要)选项卡是否显示了 VMware Syslog Service (vcsa-01a.corp.local)

 

 

编辑 VMware Syslog Service 设置

 

  1. 选择Manage(管理)选项卡
  2. 选择Edit(编辑)

 

 

更新值

 

您将需要配置四种设置:

  1. Common Log Level(常见日志级别)- 输入 info
  2. Host(主机)- 输入 loginsight-01a.corp.local
  3. Port(端口)- 输入 514
  4. Protocol(协议)- 输入 UDP
  5. 单击OK(确定)

配置 Syslog 服务时不需要重新启动。系统会自动将日志转发到远程 Syslog 服务器。

 

 

转发 vCenter Server 日志 (vpxd.log)

 

vCenter 日志文件 vpxd.log 未被转发。在接下来的几个步骤中,我们将更改配置,以便此日志可被转发到 Log Insight。此更改要求重新启动。

 

 

导航至vCenter Inventory List(vCenter 清单列表)

 

  1. 单击Home(主页)图标。
  2. 单击vCenter Inventory Lists(vCenter 清单列表)

 

 

打开vCenter Object(vCenter 对象)列表

 

  1. 单击vCenter Servers(vCenter Server)

 

 

编辑高级设置

 

现在,我们必须导航到高级设置并对其进行编辑。

  1. 单击 vCenter 对象vcsa-01a.corp.local
  2. 单击Manage(管理)选项卡
  3. 单击Settings(设置)选项卡
  4. 单击左侧窗格中的Advanced Settings(高级设置)部分
  5. 单击Edit(编辑)按钮

 

 

修改并保存 vCenter Server 的高级设置

 

1. 您需要将 vCenter Server 高级设置config.alert.log.outputToSyslog的属性从false更改为true。

2. 单击OK(确定)

 

 

通过导航器退出配置页面

 

  1. 单击Home(主页)按钮
  2. 单击Administration(管理)

 

 

打开System Configuration(系统配置)

 

  1. 单击System Configuration(系统配置)

 

 

打开 vcsa-01a.corp.local 的操作

 

  1. 单击Nodes(节点)
  2. 右键单击vcsa-01a.corp.local
  3. 单击Reboot(重新启动)

 

 

确认重新启动

 

  1. 输入重新启动的理由:Changed SysConfig
  2. 单击OK(确定)

 

 

确认重新启动

 

完成重新启动将需要几分钟的时间。如果单击Web Browser Refresh(Web 浏览器刷新),您将会看到上面的屏幕截图或 Web Client 中可能会出现的错误消息,这是因为浏览器试图缓存特定的屏幕且 VCSA 关闭。您不必等待Unable to connect(无法连接)屏幕出现。当 vCenter 重新启动时,请转至下一部分。

 

 

已完成部分

现在您已完成本单元的这一部分,可以转至下一部分。

 

从 Log Insight 独立实例到 Log Insight 集群


在下面的情况下,Log Insight 将提供集群选项:当接收的日志事件数量(或每秒钟的事件数量)增加到高于单个字节所支持的数量时,或者当业务要求有规定时(如需要防止日志接收操作停止)。在这些情况下,集群化配置可满足规模和高可用性方面的要求。Log Insight 支持每个集群实例最多拥有 6 个节点,并且能够在每个节点上最多保留 2 TB 的可搜索日志数据(一个集群实例共保留 12 TB)。当集群功能与附带的内部负载均衡器 (ILB) 或受支持的外部负载均衡器配合使用时,可使接收功能实现高可用性。在此部分中,我们将讲解如何配置 Log Insight 集群以及启用内部负载均衡器 (ILB)。   

重要说明:

为了便于您完成本练习,我们将只配置一个含 2 个节点的集群。在生产实例中,最低支持含 3 个节点的集群。


 

打开 loginsight-02a

 

首先,我们打开一个新的浏览器选项卡以导航到已为您部署好的新 Log Insight 设备。 转至您已打开的浏览器窗口。

  1. 单击+图标以打开新选项卡。
  2. 单击书签栏中的Log Insight
  3. 单击loginsight-02a链接

 

 

部署新的 Log Insight 设备

 

1. 单击Next(下一步)

 

 

选择部署类型

 

1. 选择Join Existing Deployment(加入现有部署)。

 

 

加入现有部署

 

1. 输入 Log Insight 主设备的域名全称 (FQDN):loginsight-01a.corp.local

2. 单击Go(执行)

 

 

成功收到加入申请

 

尝试加入集群成功后,会显示上面的消息。

1. 单击Click here to access the Cluster Management page(单击此处访问集群管理页面)链接,此时,您将重定向到主节点的Cluster Management(集群管理)页面。

您可能需要重新进行身份验证才能访问 Log Insight。如果不需要重新进行身份验证,请忽略下一步骤。

 

 

如果需要,请重新进行身份验证以访问 loginsight-02a 设备

 

  1. Username(用户名):admin
  2. Password(密码):VMware1!
  3. 单击Login(登录)

 

 

接受 Worker 的请求

 

1. 单击Allow(允许)以接受新工作节点加入集群的请求。

此过程可能需要一些时间。

 

 

集群模式现已启用

 

请注意,页面已更新并创建了另一个节点 192.168.120.121 (loginsight-02a)。

 

 

启用集成式负载均衡器

 

在同一页面的底部,完成以下操作以启用集成式负载均衡器。

  1. 选中Enable Integrated Load Balancer(启用集成式负载均衡器)旁的复选框
  2. 输入 ILB 的 IP (192.168.120.123)。此 IP 地址的 FQDN(可选)为 loginsight.corp.local。
  3. 选择Save(保存)。您会看到 IP 地址下方显示Status In Progress(进度状态)。完成此过程将需要几分钟的时间,因此,请耐心等待。

注意:必须在此输入 IP 地址而非 FQDN(可选)。

 

 

 

集群页面

 

此时应会显示上图所示的集群页面。现在,您已经创建了带有内部负载均衡器的集群。

请注意显示的警告消息。此时,还需要完成一个步骤,才能完成所有操作以使警告消息消失。

 

 

重新配置 vSphere 集成

 

请注意,现已将 Syslog 目标配置为 Log Insight 主设备。

  1. 通过单击左侧窗格中的vSphere导航到vSphere Integration(vSphere 集成)部分。
  2. 单击Unconfigure(取消配置)。

 

 

取消配置 ESXi 主机

 

  1. 单击Continue(继续)

 

 

已完成配置更改

 

  1. 单击OK(确定)以继续

 

 

保存 vSphere 集成

 

  1. 单击Configure ESXi hosts(配置 ESXi 主机)以向 Log Insight 发送日志。请注意,内部负载均衡器的 IP 现已列出。
  2. 单击Save(保存)以提交更改。此过程可能需要一些时间。

 

 

确认更新

 

  1. 单击OK(确定)以完成配置更改。

 

 

完成集群配置

 

  1. 在左侧菜单中的Management(管理)部分下,选择Cluster(集群)。

注意:将不再显示有关重新配置 vSphere 集成的警告消息。集群状态现已设为Available(可用)。恭喜,您已成功创建了集群,并重新配置了 vSphere 集成。停留在此选项卡上以转至下一部分。

 

事件转发


您可对任何 Log Insight 实例(无论是独立实例还是集群实例)进行配置以转发事件。转发事件时,Log Insight 实例仍然在本地接收和存储事件。配置完毕后,还可以选择使用归档功能。此外,还可以在为执行事件转发而配置的 Log Insight 实例中执行查询。通常,出于以下原因,我们也需要用到转发器:

重要说明:


 

浏览到Event Forwarding(事件转发)

 

  1. 选择Event Forwarding(事件转发)。
  2. 单击New Destination(新建目标)。

注意:您可能会看到控制台右上角显示红色感叹号。此警告是由于练习环境中不包括 SMTP 服务器所致。

 

 

新建目标

 

选择用于创建新目标的选项后,系统将提示您提供以下信息:

还有一些高级选项,其中包括:

Note: We recommend always changing this to the maximum allowed (2000)

 

 

输入新目标信息

 

设置 Log Insight 转发器时,您可以选择使用筛选条件指定要转发的特定事件,在此示例中,我们将根据消息中是否含有错误一词进行筛选。

  1. 输入名称:LI Forwarded Events
  2. 输入主机:loginsight-03a.corp.local
  3. 单击Add Filter(添加筛选条件)
  4. 修改筛选条件:将主机名更改为text,将筛选条件设为does not match(不匹配),然后输入error作为筛选词
  5. 单击Test(测试),然后确认已成功转发测试事件
  6. 单击Save(保存)

注意:或者,您可以选择Run in Interactive Analytics(在交互式分析中运行)以显示将基于您创建的筛选条件转发的事件的示例。

 

 

已完成配置

 

  1. 如果未显示任何数据,请单击Web Browser Refresh(Web 浏览器刷新)。
  2. 您将看不到事件。

现在已完成配置,我们来看一看到达我们在 loginsight-03a.corp.local 上的目标的事件

 

 

打开 loginsight-03a

 

  1. 单击图标+以打开新的浏览器选项卡
  2. 单击书签栏上的Log Insight
  3. 单击loginsight-03a链接

 

 

登录 loginsight-03a

 

  1. Username(用户名):admin
  2. Password(密码):VMware1!
  3. 单击Login(登录)

 

 

查看Interactive Analytics(交互式分析)

 

  1. 单击Interactive Analytics(交互式分析)选项卡

已转发的事件现已列在 loginsight-03a.corp.local 的Interactive Analytics(交互式分析)中。

注意:由于时间的不同,显示的内容可能会有所不同。

 

 

已完成部分

此时,您已完成事件转发器的基本配置。

 

了解 vSphere 日志事件


在此部分,我们将使用 Log Insight 探索 vSphere 环境的日志。通常情况下,如果没有 Log Insight 等日志分析工具,则只有在生产工作负载降级或发生故障并且影响到业务的情况下,才可以查看日志错误。借助 Log Insight,我们可以发现最终可能会导致发生问题的日志事件和模式,因此,我们可以提前采取措施。在此部分,我们将重点了解日志分析和仪表盘,但您可以使用这些相同的原则或通过 SMTP 创建警报并将其转发至 vRealize Operations。


 

Log Insight 书签

 

  1. 如果您尚未登录 Log Insight 服务器 loginsight-01a,请单击Log Insight文件夹,然后选择loginsight-01a

 

 

登录 Loginsight-01a

 

  1. 输入Username(用户名):admin
  2. 输入密码:VMware1!
  3. 单击Login(登录)

 

 

Log Insight 仪表盘总览

 

如果您在此单元的前面部分已成功连接到 vCenter,则您将看到的第一个屏幕便是General Overview(总览)仪表盘。

  1. 如果您尚未位于这个屏幕上,请单击Dashboard(仪表盘)选项卡。
  2. 这是仪表盘类别标题,为您显示了可用仪表盘的来源(要查看已安装仪表盘的完整列表,请单击类别标题旁的向下箭头)。仪表盘是在 Log Insight 中创建的或者是作为内容包的一部分提供的。默认情况下,vSphere 内容包已预先安装。单击箭头可以找到您所安装的任何其他内容包中的仪表盘。
  3. 此部分是当前类别的实际仪表盘的列表,上图显示了 VMware vSphere 内容包中的仪表盘。
  4. 使用屏幕的这一部分,可以应用日期/时间范围筛选条件来限制您在仪表盘中查看的数据。
  5. 此部分显示了作为此仪表盘的一部分提供的筛选条件。利用筛选条件,您可以在仪表盘中快速找到所关注的特定对象/项。
  6. 小组件,Log Insight 中配置了一些小组件以用于查询整合的日志数据库并显示经常关注的特定区域。在此示例中,小组件将以图形表示形式显示所有 vSphere 日志消息及其生成时间。您可以使用多种方式排列小组件,所排列的小组件的大小也可以有多种。

 

 

切换至Interactive Analytics(交互式分析)

 

  1. 单击Interactive Analytics(交互式分析)选项卡

 

 

Interactive Analytics(交互式分析)屏幕

 

下文介绍了Interactive Analytics(交互式分析)屏幕的各个不同部分:

  1. 此区域显示当前查询的图形表示形式,由于我们未指定任何查询内容或筛选条件,因此,全部事件均会显示。
  2. 此部分将修改图中的数据显示方式。
  3. 在Search(搜索)框中,您可以输入想要在日志中搜索的任何内容。例如,搜索内容可以是主机名、错误消息或数字。
  4. 借助Data Range(数据范围),Log Insight 可自动关联所有日志数据,您可以在此字段中指定想要搜索哪个特定时间范围内的日志条目。默认情况下,时间范围字段设为搜索过去 5 分钟的数据。请注意:如果日期范围较大,则将需要较长的时间才能返回完整的数据集,但在系统返回查询结果时,数据将会蜂拥而入。在本练习中,我们仅连接到 vCenter,因此,搜索的数据所在的时间范围有限。
  5. 事件是与查询相匹配的日志条目,将在此处显示。对于每条日志消息中的关键词(字段),将在日志消息下方用蓝色标注出来。默认情况下,Log Insight 了解 Syslog 定义的所有字段。字段是内容包的一部分,特定于所在的域,系统会添加它们。在此示例中,所有 vSphere 和 Syslog 字段均可用。
  6. Field List(字段列表)是所有日志消息(查询结果集的一部分)中的所有已定义字段。您可以单击其中的任意一个字段,这将会以图形表示形式显示与该字段相关联的日志消息数量。

 

 

搜索日志事件

 

当您在搜索框中输入搜索关键字时,Log Insight 将在您输入时提供自动填写选项。

  1. 在搜索字段中输入 vcsa*(切记输入星号),在此示例中,我们要查找的是所有与 vCenter vcsa-01a 相关的消息。在英语版中,只需输入您要查找的内容,然后添加一个星号作为通配符即可。
  2. 输入数据范围:Latest 5 minutes of data(过去 5 分钟的数据)。
  3. 单击Search(搜索)图标

 

 

事件类型

 

在进行故障排除时,会用到事件类型,这样可以快速将所生成的日志消息集的范围缩小为模式匹配集群。利用此功能,可以快速消除不相关的日志消息。

  1. 单击Event Types(事件类型)选项卡。此操作将按事件类型对生成的日志消息集进行排序。
  2. Events(事件)列将显示属于模式匹配类型的消息数量
  3. 单击x以从结果集中删除此类型的消息并自动为其创建筛选条件(必须将鼠标悬停在相应区域中,x才会显示)。

注意:您的练习环境为实时的动态环境。您所看到的内容将与屏幕截图中捕获的内容不同。请在窗口中选择任一事件,然后继续进行下一步。

 

 

筛选条件

 

删除事件类型后,日志消息会保留下来。系统只是将它们从此查询中删除,并且会自动创建筛选条件或限制条件,以将该特定事件类型排除在外。

 

 

创建筛选条件

 

现在,我们将创建新的筛选条件,只将基于文本 API 调用的日志消息包含在内。此操作将显示 API 与 vCenter Server 的连接数。

  1. 单击Add Filter(添加筛选条件)

 

 

设置筛选限制条件

 

 

  1. 将Filter(筛选条件)设为text(文本)。
  2. 将Operator(运算符)设为contains(包含)
  3. 输入 API invocations
  4. 单击Search(搜索)按钮。
  5. 此时,结果列表中将只显示与文本 API invocations(不属于您筛选掉的事件类型)相关联的日志消息。

注意:现在我们已缩小了结果的范围。在添加筛选条件之前,有十几种不同的事件类型。

 

 

字段提取

 

提取的字段为在 Log Insight 中构建查询提供了行之有效的方法。您还可以创建自己自定义的提取字段。

1. 切换回到Events(事件)选项卡。

2. 选中API invocations:(API 调用次数:)旁的值。在上面的示例中,所显示的值为 1,但这一数字可能会有所不同。

3. 在出现的弹出窗口中,选择Extract field(提取字段)。

 

 

 

字段配置

 

字段配置将显示在屏幕的右侧。现在,我们需要对已提取字段进行命名,确定谁可以使用该字段,然后保存该字段以在将来使用。在此单元中的后面部分,当与 vRealize Operations Manager 进行集成时,会用到这个已提取字段。

1. 在Field Name(字段名称)输入框中,输入 vmw_vc_api

2. 在Available for(适用于)下拉列表下方,可以选择将这一提取的字段设为可供您自己或所有用户使用。将此项保留为Me Only(仅限我自己)。

3. 单击Save(保存)。

 

 

已完成提取字段

 

请注意,我们现在已拥有一个名为 vmw_vc_api 的新字段。在本单元中的后面部分,我们将用到这一字段。现在,我们将转到下一步。

 

 

对事件进行分组

 

现在,我们要对这些向我们的图中添加一些额外信息的事件进行分组。

1. 选择over time(按时间)下拉列表

2. 选中vmw_vc_auth_source (VMware - vSphere)和vmw_vc_auth_user (VMware - vSphere)旁边的复选框。

3. 单击Apply(应用)

 

 

已创建图例

 

请注意,已在图的右侧创建了图例来显示连接到 vCenter 设备的用户的 IP 地址和用户名。

 

 

将查询添加到仪表盘

 

现在,我们将基于搜索结果创建名为API Invocation Events的新仪表盘。

  1. 单击Add to Dashboard(添加到仪表盘)。

 

 

将图表添加到仪表盘

 

  1. 在Name(名称)字段中输入 API Invocation Events以替换默认内容
  2. 确保选中Dashboard 1(仪表盘 1)。您可以将要将此查询添加到的仪表盘更改为您有权修改的任何仪表盘,也可以创建新的仪表盘
  3. 单击Add(添加)

 

 

导航至Dashboards(仪表盘)页面

 

  1. 单击Dashboards(仪表盘)选项卡

 

 

选择My Dashboards(我的仪表盘)

 

  1. 单击下拉箭头以显示仪表盘列表
  2. 选择My Dashboards(我的仪表盘)

 

 

观察修改后的仪表盘

 

请观察Dashboard 1(仪表盘 1)现在是否附带一个名为 API Invocation Events的新的小组件。

 

 

本部分结束

现在,您已了解如何使用 Log Insight 探索 vSphere 环境的日志。您可以使浏览器保持打开状态,以便在下一部分中使用。

 

安装内容包


内容包中含有仪表盘、已提取的字段、已保存的查询以及与特定产品或日志集相关的警报。

有些内容包(如 VMware - vSphere 内容包)会默认加载,而有些内容包则可以从 Log Insight 内容包商城 (Solutions Exchange) 下载。在此部分中,我们将:


 

管理内容包

 

在本练习中,我们将继续使用 loginsight-01a。在 Log Insight 用户界面的右上角,执行以下操作:

  1. 单击Menu(菜单)图标
  2. 单击Content Packs(内容包)

 

 

Log Insight 内容包商城

 

练习环境未连接至 Internet,因此,vRealize Operations 内容包文件已提前下载到练习环境中。 

 

 

Log Insight Content Pack Marketplace

 

此屏幕截图描绘了当虚拟设备连接至 Internet 时 Log Insight Content Pack Marketplace 的情况。

该 Marketplace 包含大量由 VMware 及第三方创建的内容包,延展了查看、查询日志消息以及将其用于警报的方式。

 

 

适用于 Log Insight 的 Solutions Exchange(商城)

 

此外,您还可以浏览 Solution Exchange 并查看内容和文档。对于 Log Insight:

  1. 您可以看到共有 47 个内容包(内容包的数量和页面格式风格可能会随着时间的变化而改变)
  2. 由于内容包数量多达 47 个,我们可以通过一项搜索功能来减少所显示内容包的数量

注意:内容量相当大,有必要访问 Solutions Exchange 来获取 Log Insight、vRealize Operations 以及其他与 VMware 相关的可延展内容。

 

 

VMware - vSphere 内容包

 

  1. 在左侧导航窗格中单击VMware - vSphere
  2. 请观察 VMware vSphere 内容包 3.0 版是否已安装
  3. 单击不同的选项卡以获取有关已安装内容的信息

 

 

Log Insight 通用内容包

 

  1. 在左侧导航窗格中单击General(通用),即默认安装的第二个内容包
  2. 请观察通用内容包 2.5 版是否已安装

 

 

导入 vRealize Operations Manager 内容包

 

在左侧导航窗格的底部,执行以下操作:

  1. 单击Import Content Pack(导入内容包)按钮

 

 

导入内容包

 

  1. 单击Browse(浏览)

 

 

文件上传

 

  1. 浏览至C:\LabFiles\
  2. 单击VMware - vR Ops 6.x.vlcp
  3. 单击Open(打开)

 

 

导入内容包(续)

 

安装内容包时,有两个选项可供选择。

Install as content pack(作为内容包安装)

说明 - 内容作为只读内容包导入,并且将向 Log Insight 实例的所有用户显示。

注意:内容包仪表盘是只读的。您无法对它们执行删除或重命名操作。不过,您可以将内容包仪表盘克隆到您的自定义仪表盘中。您可以克隆全部仪表盘或个别小组件。

Import into My Content(导入到我的内容)

说明 - 内容作为自定义内容导入到您的用户空间中,并且仅向您显示。您可以编辑已导入的内容,而无需对其进行克隆。

注意:在此模式下,不显示名称、作者、图标等内容包元数据。一旦将内容包导入到My Content(我的内容)中,便不能将其作为包进行卸载。如果您要从My Content(我的内容)中删除内容包,必须单独删除内容包的每个要素,如仪表盘、查询、警报和字段。

  1. 选择Install as content pack(作为内容包安装)。
  2. 单击Import(导入)。

 

 

成功 - VMware - vRealize Operations Manager 内容包已安装

 

请观察 VMware - vR Ops 6.x特有的小组件、查询、警报、代理组和字段现在是否已出现在Installed Content Packs(已安装内容包)中。内容包的每个要素都有助于突出显示 vRealize Operations Manager 设备的特定问题。内容包可简化查找和查看相关日志数据的流程,并促进 Log Insight 与 vRealize Operations Manager 之间的警报集成。

如果能够访问 Internet(在练习环境中无法实现),系统将在有更新推出时通知您。在示例屏幕截图中,您可以看到有一项更新可用。

 

 

更新内容包

 

要查看更新,请单击导航窗格中的Update(更新)链接,然后选择Update(更新)来更新特定内容包,或选择Update All(全部更新)更新全部内容包(如果有多个更新可用)。在此 Log Insight 介绍课程中,没有最新 vROps 内容包并不会影响要演示的功能。

 

 

配置 vRealize Operations Manager 以向 Log Insight 发送日志

现已安装适用于 vRealize Operations Manager 6 的内容包,接下来,我们将配置 vrops-01a.corp.local为将其日志发送到 Log Insight 集群 (loginsight.corp.local)

如果您运行的是 vRealize Operations 6.0.1 或更高版本,Log Insight 代理已预安装在您的设备上,您只需对其进行配置即可!

我们已在 C:\LabFiles 目录中提供了完整的配置文件。在本练习中,我们将手动复制代理配置,但是您可以使用 Log Insight 用户界面Administration(管理)部分中的Agent Groups(代理组)来集中管理代理配置。

 

 

配置参数

注意:如果您拥有的是多层部署,则需要为每个节点自定义以下配置文件。

以下是一些需要更改的参数:

 

 

打开 WinSCP

 

 

  1. 打开 Windows 的开始屏幕
  2. 单击WinSCP

 

 

在 WinSCP 中转至 vrops-01a.corp.local

 

  1. 选择vrops-01a.corp.local
  2. 单击Login(登录)

 

 

更新未知的服务器、安全或横幅消息

 

如果您看到此unknown server(未知服务器)消息...

  1. 请选择Yes(是)

注意:您可能还会看到一条安全消息或横幅消息。单击Accept(接受)或Continue(继续)以将消息清除。

 

 

浏览至目录

 

正确的目录路径可能已经显示在 WinSCP 中。如果您未看到正确的路径,请按照以下步骤继续操作。否则,您可以转至下一步。 

  1. 浏览至 C:\LabFiles\(左侧框)。此操作可轻松完成,只需使用工具栏中的上层目录导航功能导航到 C:\,然后选择LabFiles文件夹即可。
  2. 在 vrops-01a.corp.local (右侧框)上浏览到 /var/lib/loginsight-agent。通过使用上层文件夹工具栏按钮转至根目录,然后导航到 loginsight-agent 文件夹,即可完成此操作。

 

 

将 liagent.ini 拖到 /var/lib/loginsight-agent 目录中

 

单击文件 liagent.ini 并将其从左侧窗格拖到右侧窗格中

 

 

覆盖 liagent.ini

 

使用 C:\LabFiles\liagent.ini覆盖 /var/lib/loginsight-agent/liagent.ini,只需将 liagent.ini 从左侧框拖到右侧框中即可。

  1. 单击Yes(是)

 

 

关闭 WinSCP

 

  1. 单击右上角的X以关闭 WinSCP

 

 

完成 WinSCP 关闭操作

 

  1. 单击OK(确定)以完成 WinSCP 关闭操作

 

 

打开 Putty

 

  1. 从任务栏中选择 Putty的快捷方式

 

 

登录 vrops-01a.corp.local

 

  1. 滚动至列表的底端
  2. 选择vrops-01a.corp.local
  3. 选择Load(加载)
  4. 单击Open(打开)

 

 

输入 root 凭证

 

  1. 输入登录用户名:root
  2. 输入密码:VMware1!并按 Enter

 

 

重新启动 Log Insight 代理

 

运行以下命令以重新启动 Log Insight 代理:

  1. 输入 /etc/init.d/liagentd restart,然后按 Enter
  2. 确认 liagentd 已停止重新启动
  3. 输入 exit,然后按 Enter

 

 

查看 VMware vRealize Operations Manager 6.x 内容包中的日志内容

 

现在,系统开始将 vrops-01a.corp.local 的日志发送至 Log Insight 集群 (loginsight.corp.local)。

  1. 如果您尚未位于此位置,请选择Dashboard(仪表盘)选项卡
  2. 选择下拉箭头
  3. 在Content Pack Dashboards(内容包仪表盘)部分下,选择VMware - vR Ops 6.x
  4. 导航到仪表盘后,请使用Update(更新)按钮刷新视图

 

 

总结

内容包安装到此结束。

请继续进行下一部分,届时我们将完成安装和管理 Log Insight 代理的操作。

 

安装和管理 Log Insight 代理


在本练习中的前面部分,我们在具有 Linux 代理功能的 vRealize Operations Manager 设备上配置了 Linux 代理。

Log Insight Linux 代理会从 Linux 计算机上的日志文件中收集事件,然后将其转发到 vRealize Log Insight 服务器。在 Linux 系统中,应用可以将日志数据存储在文件系统上的纯文本文件中。Log Insight Linux 代理作为守护程序运行,一旦安装完毕,便会立即启动。

我们还有 Log Insight Windows 代理,该代理会从 Windows 事件渠道和日志文件中收集事件,然后将其转发到 Log Insight 服务器。Windows 事件渠道是用于在 Windows 系统中收集相关事件的池。默认情况下,Log Insight Windows 代理会从应用、系统和安全渠道收集事件。Log Insight Windows 代理作为 Windows 服务运行,一旦安装完毕,便会立即启动。

两种代理均可监控目录并从纯文本日志文件中收集事件

在安装过程中以及安装完成后,您可以为 Log Insight Windows 代理配置以下选项:

■ 选择 Log Insight Windows 代理转发事件时的目标 Log Insight 服务器。

■ 选择 Log Insight Windows 代理使用的通信协议和端口。

■ 添加 Log Insight Windows 代理可从中收集事件的其他 Windows 事件渠道。

■ 选择要监控的 Windows 目录并将纯日志文件添加到收集范围内。

第三方代理也受支持,但我们的原生代理(适用于 Windows 及 Linux)具有显著的优势,如通过 Log Insight 用户界面实现的简便/集中式配置、数据压缩以及基于 SSL 的加密(在 3.0 版中提供)。

在此练习部分中,我们将在 ControlCenter 服务器上安装 Windows 代理。在真实环境中部署时,您可以为代理提供您喜爱的应用交付管理方法,其中包括 vRealize Configuration Manager、Microsoft System Center Configuration Manager、Active Directory GPO's 等


 

选择代理管理页面

 

注意:确保您位于 Log Insight 浏览器选项卡上。

  1. 在右上角,单击admin(管理)下拉列表
  2. 选择Administration(管理)
  3. 在左侧导航窗格中,选择Agents(代理)

 

 

代理

 

单击Download Log Insight Agent Version 3.0.0(下载 Log Insight 代理 3.0.0 版)

 

 

下载 Log Insight 代理 3.0.0 版

 

  1. 单击Windows MSI (32-bit/64-bit)(Windows MSI [32 位/64 位])

 

 

保存文件

 

  1. 单击Save File(保存文件)

 

 

启动 Log Insight 代理安装程序

 

  1. 单击 Firefox 中的下载箭头
  2. 单击VMware-vCenter-Log-Insight-Agent.....

 

 

打开File(文件)-Security Warning(安全警告)

 

  1. 单击Run(运行)

 

 

VMware vRealize Log Insight 代理安装 - EULA

 

  1. 单击I accept the terms of the License Agreement(我接受许可协议中的条款)旁的复选框
  2. 单击Next(下一步)

 

 

VMware vRealize Log Insight 代理安装 - 服务器配置

 

  1. 在Host(主机)上下文框中确认/输入loginsight.corp.local。这是集成式负载均衡器的地址
  2. 单击Install(安装)

 

 

VMware vRealize Log Insight 代理安装 - 完成

 

  1. 单击Finish(完成)

 

 

关闭下载代理选择框

 

  1. 单击X以关闭下载代理的选择框

 

 

刷新代理信息页面

 

  1. 通过按 F5或单击Refresh(刷新)按钮刷新浏览器页面
  2. 请观察现在是否已将 ControlCenterServer 配置为将其日志发送到 Log Insight

 

 

集中式代理配置

 

此版本具有一个新功能,即可以创建代理组。在用户界面Administration(管理)部分的Agents(代理)页面中,用户可以配置一个代理组,并集中管理适用于 Linux、Windows 及 vSphere 解决方案的不同代理配置组。

我们将创建一个由 Windows 代理组成的新组,以将特定的配置更改应用到我们的 Windows 代理。

  1. 选择All Agents(所有代理)
  2. 选择New Group(新建组)

 

 

新代理组

 

  1. 在Name(名称)字段中输入 Windows Agents
  2. 单击New Group(新建组)

 

 

保存新组

 

要修改 .ini 文件,替代方案是使用代理配置实用程序。可将在代理配置实用程序中所做的更改传播到所有代理。不适用于本地代理的配置信息将被忽略。即,Linux 代理将忽略 Windows 防火墙的配置。

现在,我们将针对运行 Windows 操作系统的代理创建一条筛选规则,并应用特定于 Windows 的代理配置。

1. 在筛选规则中,单击下拉列表,然后将hostname(主机名)更改为OS

2. 在筛选条件中,输入 windows

3. 将以下文本添加到Agent Configuration(代理配置)窗口

[winlog|Events_Firewall]

channel=Microsoft-Windows-Windows Firewall With Advanced Security/Firewall

enabled=yes

4. 单击Save New Group(保存新组)

 

 

 

成功保存代理配置

 

代理配置现已保存,您将看到Agent configuration saved successfully(已成功保存代理配置)弹出窗口,稍后它会自动消失。

 

 

已完成 Windows 代理组

 

  1. 单击Windows Agents(Windows 代理)下拉菜单
  2. 现在,您应该会看到 Windows 代理位于代理下拉列表中的Active Groups(活动组)下方

 

 

总结

安装和管理 Log Insight 代理到此结束。

 

将 vRealize Log Insight 与 vRealize Operations Manager 集成


vRealize Log Insight 与 vRealize Operations Manager 之间的集成极其强大。此部分将对集成进行探讨,以说明这两种产品的协作方式。正如您所了解的,您的环境中的数据主要有两种类型。

在您的环境中收集和分析这两种类型的数据非常重要。将 Log Insight 与 vRealize Operations Manager 集成,即可顺利执行此操作。

在接下来的部分中,您将完成以下各项操作:

执行以下各项以安装管理包并配置集成之后,我们可以在两个解决方案之间以双向方式在上下文中启动以及实施警报集成和清单统一,从而在故障排除工作流中为您提供帮助。


 

安装 Management Pack for Log Insight

 

  1. 在 Firefox 浏览器中单击图标+以打开New Tab(新选项卡)
  2. 单击书签vROps-01a

 

 

登录 vRealize Operations Manager

 

使用以下凭证登录到系统中。

  1. Authentication Source(身份验证源):Local Users(本地用户)
  2. Username(用户名):admin
  3. Password(密码):VMware1!
  4. 单击Login(登录)

 

 

导航到Administration(管理)选项卡

 

  1. 在导航窗格中选择Administration(管理),或选择Administration(管理)按钮

 

 

添加解决方案

 

  1. 确保Solutions(解决方案)部分突出显示
  2. 在右侧框中,选择绿色加号图标

 

 

选择要安装的解决方案

 

  1. 单击Browse(浏览)

 

 

浏览至 LabFiles 目录

 

完成以下步骤:

  1. 选择C:\LabFiles目录(如果未突出显示)
  2. 选择vmware-vcops-6.0-MPforLogInsight-1.0... pak 文件
  3. 单击Open(打开)

 

 

上传 Management Pack for Log Insight

 

  1. 单击Install the PAK file even if it is already installed(安装 PAK 文件,即使已安装)和Reset predefined content to a newer version provided by this update(将预定义内容重置为此更新提供的较新版本)复选框。尽管首次安装无需这样操作,但这样操作可确保升级期间将内容完全安装。
  2. 对于Warning: User modifications to predefined Alerts...(警告: 用户对预定义警报的修改),单击OK(确定)按钮。这展现了一条重要的最佳实践。修改 vROps 内容(仪表盘、视图、报告、警报等)时,始终进行克隆并更改已克隆的内容。这样可以确保您能获益于未来版本中的新内容,同时不丢失已创建的自定义内容。

 

 

安装适用于 Log Insight 的管理包

 

 

  1. 单击Upload(上传)。大约一分钟左右之后,上传过程便会完成,并且Next(下一步)按钮不再灰显
  2. 一旦Next(下一步)按钮可用,请单击此按钮

 

 

接受 EULA

 

  1. 单击复选框以接受此协议的条款
  2. 单击Next(下一步)

 

 

完成安装

 

安装将需要几分钟的时间才能完成

  1. 当完成安装且Finish(完成)按钮不再灰显时,请单击Finish(完成)

 

 

验证安装

 

适用于 Log Insight 的管理包现已安装。无需在 vRealize Operations Manager 产品用户界面中进行进一步的配置。现在,我们将切换到 Log Insight 产品用户界面以完成集成。

 

 

配置 vRealize Operations 集成

 

  1. 选择Log Insight浏览器选项卡。此操作的前提是您在上一部分使用的浏览器仍处于打开状态。如果您关闭了浏览器,请在 FireFox 书签中选择LogInsight-01a,然后登录并导航到管理窗格。
  2. 在导航窗格中,单击vRealize Operations链接。

 

 

配置 vRealize Operations 集成

 

  1. 在Hostname(主机)字段中输入 192.168.110.70
  2. 在Username(用户名)字段中,输入 admin
  3. 在Password(密码)字段中,输入 VMware1!
  4. 确保两个复选框均已选中
  5. 选择Test Connection(测试连接),然后确认Test Successful(测试成功)
  6. 选择Save(保存)

 

 

在 vRealize Operations Manager 中注册

 

初始配置需要几分钟的时间才能完成,因此,请耐心等待。

 

 

注册成功

 

  1. 注册完成后,单击OK(确定)。

 

 

导航到 vRealize Operations

 

  1. 在 Firefox 浏览器中,返回至vrops-01a.corp.local。

 

 

环境

 

  1. 在导航窗格中,单击Environment(环境)图标(外观像地球)

 

 

vSphere 主机和集群

 

  1. 单击vSphere Hosts and Clusters(vSphere 主机和集群)

 

 

esx-01a.corp.local

 

  1. 单击World、vCenter、Datacenter Site A(数据中心站点 A)和Cluster Site A(集群站点 A)的每个对象旁的折叠项(小三角)
  2. 单击esx-01a.corp.local
  3. 单击Actions(操作)下拉列表
  4. 选择Search for logs in vRealize Log Insight(在 vRealize Log Insight 中搜索日志)。选择此选项将在上下文中启动 vRealize Log Insight(即,只显示 esx01-a 的日志)

 

 

此连接不受信任

 

注意:如果您未收到此警告消息,请继续进行下一步。

  1. 单击I Understand the Risks(我了解风险)(风险始终相同:眼睛发痒、口干舌燥、失眠、难以集中精力以及突然莫名地想看《浪漫满屋》的重播!)
  2. 单击Add Exception(添加例外)

 

 

确认安全例外

 

  1. 如有需要,单击Confirm Security Exception(确认安全例外)。

 

 

登录 Log Insight

 

如果需要,再次进行身份验证以登录 Log Insight。

  1. Username(用户名):admin
  2. Password(密码):VMware1!
  3. 单击Login(登录)

 

 

交互式分析

 

如果您在 vRealize Operations 中对某对象进行故障排除,并且需要快速检查该对象的相关日志,可以使用Launch in context(在上下文中启动)。

  1. 系统会自动将 vR Ops 标识符 (vmw_vr_ops_id) 添加到限制条件中
  2. 注意:已将 esx-01a 的 vR Ops 标识符添加到限制条件中。
  3. 只有 esx-01a特有的日志事件才会显示在Events(事件)选项卡中。
  4. 单击Interactive Analytics(交互式分析)以清除限制条件。或者,您也可以单击限制条件旁的x。如果您想要从查询中清除所有限制条件,单击Interactively Analytics(交互式分析)会非常有用。

 

 

在 Log Insight 中创建警报

 

现在,Log Insight 已与 vRealize Operations 集成,我们还可以在 Log Insight 中创建警报,然后将其发送到 vRealize Operations。我们将在接下来的几个步骤中检查警报功能。

  1. 单击Add Filter(添加筛选条件)
  2. 选择含有text一词的下拉列表,然后输入 vmw_vc_api_invocations
  3. 选择含有=符号的下拉列表,然后选择符号
  4. 在最后一个输入框中输入值1
  5. 单击表示查询的放大镜
  6. 请注意,列表中只显示API invocation(API 调用次数)大于 1 的日志事件

 

 

基于查询创建警报

 

我们想基于 API 查询将一条警报发送到 vcsa-01a 的 vRealize Operations 仪表盘中,这样,我们的运维团队便能够及时注意到问题。

  1. 在搜索栏的右侧,单击红色警报按钮
  2. 单击Create Alert from Query(通过查询创建警报)

 

 

新建警报

 

填写警报:

  1. Name(名称):API Invocation Alert
  2. Enable Email(启用电子邮件):取消选中
  3. Enable Send to vRealize Operations Manager(启用发送至 vRealize Operations Manager):选中
  4. 单击Select(选择)

 

 

选择用于接收警报的 vRealize Operations Manager 资源

 

  1. 输入:vCenter
  2. 从下拉列表中选择All Objects(所有对象)
  3. 在列表中选择最后一个 vCenter,即vCenter-Actions。

注意:假设清单映射未返回由 Log Insight 警报触发的事件(例如,非 vSphere 事件)的任何信息,则资源选项将在 vRealize Operations Manager 中用作接收 LI 警报的默认对象。如果事件确实具有清单映射信息,则 Log Insight 警报将自动映射至 vRealize Operations Manager 中的正确对象,无论 Log Insight 中的资源参数设为什么,都没有关系。

 

 

完成警报

 

输入备注以提醒团队我们创建此警报的原因。您可以根据需要输入任何内容。

  1. 利用备注字段,可以向通知中添加信息。例如,信息可能会包括解决步骤或知识库文章链接。
  2. 单击Save(保存)

警报集成已使用之前用到的查询信息进行了配置。

注意:Log Insight 警报将作为通知事件发送到 vRealize Operations Manager 中。可从各种不同的位置访问 vRealize Operations Manager 中的通知事件,其中包括:

 

 

总结

 

由于练习环境的动态性,vRealize Operations 中可能未提供警报。为了便于进行本练习,我们将视为已经配置警报,并会显示示例。

 

总结


感谢您学完 vRealize Log Insight 单元!有关其他 Log Insight 内容,请查阅 HOL-SDC-1635 (vRealize Log Insight) 和 HOL-SDC-1601(借助 vRealize Suite Standard 进行云计算管理)。


第 8 单元:PowerCLI 的初级及高级功能(60 分钟)

单元概述


本单元将向您介绍 VMware vSphere PowerCLI。新用户将轻松学会如何使用该工具,较高级的用户将会熟悉该产品最新版本中提供的新功能(例如,先配置 OVA,然后进行部署,并按标记筛选对象)。新用户和有经验的用户都一定可以学习到一些新知识。


开始使用 PowerShell 和 PowerCLI


在本节课中,您将学习有关 PowerShell 和 PowerCLI 的基础知识。您将学习如何启动 PowerCLI 控制台和 PowerShell ISE,如何列出可用命令和查看它们的帮助。


 

启动 PowerCLI

 

安装之后,可通过双击标签为VMware vSphere PowerCLI的桌面图标来启动 PowerCLI。此操作将打开 PowerShell 控制台并加载所有的 PowerCLI 模块。

 

 

使用 Powershell ISE

 

作为简单控制台的备选方案,您可以使用 Powershell ISE 脚本编辑器,它可以提供更好的用户体验。您可以通过双击桌面上相应的图标 (1) 来启动该编辑器。上面的窗格 (2) 用于查看/编辑脚本文件,下面的窗格 (3) 用于运行各条命令和显示它们的输出(与标准 PowerShell 控制台类似)。

 

 

使用 Powershell ISE

 

在本练习中,您将在 PowerShell ISE 下面的窗格或 PowerShell 控制台中执行各种 PowerCLI 命令。您可以自己输入命令,也可以从桌面上的Module7.ps1文件进行复制粘贴。完成练习最便捷的方法是在 Powershell ISE 的上窗格中打开 Module7.ps1。此文件包含您将在本单元中调用的所有命令。您可以选择每条命令 (1),并按 F8(或运行选择按钮 [2])执行命令。在执行新命令之前,请确保上一条命令已经完成 - 您将在控制台底部看到Completed(已完成)消息 (3)。

 

 

列出可用的命令

让我们来看一看借助 PowerCLI 可以做些什么。PowerCLI 的管理单元可提供 500 多种命令(在 PowerShell 中称为 cmdlet),用于管理 vSphere、vCloud Air、Site Recovery Manager、vR Ops 和 vSphere Update Manager。您可以输入以下内容查看可用的 PowerCLI 命令:

Get-VICommand

此操作将列出所有的 PowerCLI 命令。由于列表内容较多,您可能希望将其范围缩小到一些更具体的内容,例如用于管理虚拟机的所有命令,则可输入以下内容:

Get-VICommand *VM

提示:您可以使用自动完成功能来加快输入速度 - 只需输入命令/参数的开头,然后按 Tab 键即可。

 

 

连接到 vSphere

 

要管理 vCenter Server,我们首先需要做的就是连接到它。这可以使用 Connect-VIServer 命令完成。我们的 vCenter 名为vcsa-01a,下面是连接到它的方法:

Connect-VIServer vcsa-01a -User corp\administrator -Password VMware1!

该命令将使用指定的用户凭证连接到 vCenter。

 

 

获取帮助

 

如果您不确定如何使用特定的 cmdlet,可以输入 Get-Help(或者只简便地输入 help)和 cmdlet 的名称轻松查看其帮助:

help Connect-VIServer

如果您想查看带有 cmdlet 使用示例及参数描述的完整帮助,则应打开 cmdlet 的完整帮助:

help Connect-VIServer -Full

如果您只想查看示例,可以使用-examples开关,如下所示:

help Connect-VIServer -Examples

您也可以在整个帮助归档文件中搜索特定关键字。让我们试着搜索一下对虚拟机进行 vMotion 迁移的 cmdlet:

help vmotion

结果包含我们需要的 cmdlet - Move-VM。在本单元的稍后部分,我们将用到该 cmdlet。

大家可以随意查看我们在本练习中展示的任何 cmdlet 的帮助。

 

 

使用 PowerCLI 进行报告


PowerCLI 不但具有 100 多种 Get-* cmdlet,还是一款强大的报告工具。在本节课中,您将学习更多有关使用 PowerCLI 的知识。


 

检索虚拟机

 

用户最常执行的操作之一就是列出 vCenter Server 中的虚拟机。这有助于浏览清单和进行报告,以及对特定的虚拟机进行进一步处理(例如,批量修改虚拟机)。您可以使用以下命令检索所有虚拟机:

Get-VM

您还可以按名称检索一个或多个虚拟机。请尝试以下命令:

Get-VM linux-CPU-Load-01a
Get-VM linux*

 

 

检索某个对象的特定属性

 

当调用某个 cmdlet(例如 Get-VM)后,您获得的结果是一个对象或对象阵列(在本示例中是一个虚拟机对象)。要查看对象具有的属性,您可以使用 Get-Member cmdlet,如下所示:

Get-VM linux-CPU-Load-01a | Get-Member -MemberType property

此 cmdlet 将列出该虚拟机对象的所有可用属性。

注意:我们在这里使用的是被称为管道(或管道传输)的 PowerShell 功能。实际上,Get-Member cmdlet 具有一个名为InputObject的参数,该参数可接受虚拟机对象(以及所有其他的 PowerShell 对象)。该 cmdlet 不会检索虚拟机,而是以变量形式存储虚拟机,并将其传递到 Get-Member 的 InputObject 参数,我们只是通过管道将 Get-VM 的输出结果传输到 Get-Member。这样,第一个 cmdlet 的输出就会变成第二个的输入。

然后,您可以使用 PowerShell 的select命令从得到的对象中只检索自己需要的属性:

Get-VM linux-CPU-Load-01a | Select Name, NumCPU, MemoryMB, PowerState, VMHost

 

 

筛选报告结果

 

当 Get-* cmdlet 没有相应参数来按您需要的属性筛选对象时,您可以使用 PowerShell 的where命令来筛选调用的 cmdlet 的结果:

Get-VM | Where {$_.Powerstate -eq PoweredOn} | Select Name, NumCPU, MemoryMB, PowerState, VMHost

提示:$_ 是预留的 powershell 变量,可用于存储管道中当前的对象

 

以不同格式导出报告结果


要向您的经理或另一个团队展示数据,或将数据传输到公司使用的另一个系统,您需要以某种方式设置数据的格式。在本节课中,您将学习如何以各种不同格式(txt、csv、xml、html)导出 PowerCLI 报告生成的数据。


 

以 txt 格式导出

 

让我们从导出为 txt 文件这一最基础的导出操作开始。要以 txt 格式导出报告,请使用 Out-File PowerShell cmdlet:

Get-VM | Select Name, NumCPU, MemoryMB, PowerState, VMHost | Out-File c:\myPowerCLIReport.txt

打开文本文件检查结果。

 

 

以 csv 格式导出

 

现在,让我们以 csv 格式导出相同数据。我们将使用 Export-Csv cmdlet 来实现这一目的:

Get-VM | Select Name, NumCPU, MemoryMB, PowerState, VMHost | Export-Csv c:\myPowerCLIReport.csv -NoTypeInformation

在 csv 文件中查看结果

 

 

以 xml 格式导出

 

接下来您将以 XML 格式导出数据。我们将使用的 PowerShell cmdlet 是 ConvertTo-Xml。因为该 cmdlet 会返回 XMLDocument 对象,所以我们需要调用其 Save 方式来将已格式化的数据写入文件:

(Get-VM | Select Name, NumCPU, MemoryMB, PowerState, VMHost | ConvertTo-Xml -NoTypeInformation).Save("c:\myPowerCLIReport.xml")

在 xml 文件中查看结果

 

 

以 HTML 格式导出

 

通过 ConvertTo-Html cmdlet,您还可以采用 HTML 格式导出数据。因为该命令只会将数据转化为 HTML 格式,因此您还需要使用 Set-Content cmdlet 来将已格式化的数据写入文件:

Get-VM | Select Name, NumCPU, MemoryMB, PowerState, VMHost | ConvertTo-Html | Set-Content "c:\myPowerCLIReport.html"

现在,请转到c:\文件夹,然后打开报告。

 

 

向 HTML 页面添加格式

 

如果想让 HTML 报告看起来更美观一点,我们可以在报告上应用一些样式,如下所示:

$a = "<style>"
$a = $a + "BODY{background-color:Gainsboro;}"
$a = $a + "TABLE{border-width: 1px;border-style: solid;border-color: black;border-collapse: collapse;}"
$a = $a + "TH{border-width: 1px;padding: 5px;border-style: solid;border-color: black;background-color:SkyBlue}"
$a = $a + "TD{border-width: 1px;padding: 5px;border-style: solid;border-color: black;background-color:PaleTurquoise}"
$a = $a + "</style>"
Get-VM | Select Name, NumCPU, MemoryMB, PowerState, VMHost | ConvertTo-Html -head $a | Set-Content "c:\myPowerCLIReport.html"

如果现在打开报告,您将会发现它看起来更加美观了

 

 

设置和配置集群


在接下来的几节课中,您将为一家虚构公司 Nephosoft 设置一个小型虚拟环境。您首先要创建和配置集群。然后,您要通过创建和配置 Virtual Distributed Switch (VDS) 来设置网络连接。最后,您将根据预定义的规范创建一些虚拟机,并相应地进行标记,然后根据它们的标记对多个虚拟机规范进行批量更新。在本节课中,我们先来学习如何借助 PowerCLI 创建和配置集群。您将设置其 EVC、HA 和 DRS 设置。

 


 

创建集群

要创建新集群,我们将使用 New-Cluster cmdlet。我们必须指定新集群的名称和位置:

$cluster1 = New-Cluster -Name "Nephosoft Cluster 1" -Location "Datacenter Site A"

 

 

配置集群的 Enhanced vMotion Compatibility 模式

 

现在,我们来配置集群的 Enhanced vMotion Compatibility 模式,以确保 vMotion 的 CPU 兼容性。为此,我们需要先确定主机支持的 EVC 模式:

$evcModes = Get-VMHost | Select MaxEVCMode

现在,请检查 $evcModes 变量的内容。只需输入变量 ($evcModes) 的名称,其值就将会显示到屏幕上。您将发现两台主机支持相同的 EVC 模式。

注意:EVC 模式可能不同于以上屏幕截图中所示,这是因为具体的模式取决于运行练习环境的物理硬件。

让我们将 EVC 模式设置到集群,以确保将来可能添加到该集群的任何其他主机都必须与该 EVC 模式匹配:

Set-Cluster $cluster1 -EVCMode $evcModes[0].MaxEVCMode

当系统提示您确认时,请单击Yes(是)。

提示:提示确认有利于实现交互,但却不适合用在脚本中,因为这会使脚本暂停。您可以将-Confirm:$false参数附加到调用的 cmdlet,以便自动确认操作。

 

 

在集群中启用 HA

 

下一步是在集群中启用 HA,以确保在主机出现故障时为虚拟机提供保护:

Set-Cluster $cluster1 -HAEnabled:$true -Confirm:$false

 

 

在集群中启用 DRS 并配置 DRS 设置

 

现在,让我们在该集群中启用 DRS,然后将其自动化级别设置为manual(手动),以使其针对虚拟机放置和迁移生成建议(您可以使用 Get-DrsRecommendation 和 Apply-DrsRecommendation cmdlet 来检索和应用这些建议):

Set-Cluster $cluster1 -DRSEnabled:$true -DRSAutomationLevel Manual -Confirm:$false

 

将主机迁移到集群


在本节课中,您将学习如何将主机迁移到已创建的集群中。


 

将主机迁移到集群

 

要将主机迁移到新集群中,我们需要先将它们置于维护模式。要将它们置于维护模式,我们必须先关闭所有正在运行的虚拟机。因此,让我们来检索一下所有正在运行的虚拟机,然后将其停止:

$vmsToStop = Get-VM | Where {$_.Powerstate -eq "PoweredOn"}
Stop-VM $vmsToStop -Confirm:$false

现在,让我们将主机置于维护模式:

Get-VMHost | Set-VMHost -State Maintenance

接下来,我们将使用 Move-Host cmdlet 来将主机迁移到集群:

Get-VMHost | Move-VMHost -Destination $cluster1

最后,让我们将主机退出维护模式:

Get-VMHost | Set-VMHost -State Connected

 

设置和配置 Virtual Distributed Switch


在本节课中,您将学习如何创建 Virtual Distributed Switch 以及如何将主机网络连接迁移到 Distributed Switch。


 

创建 VDS (Virtual Distributed Switch)

 

我们先通过 New-VDSwitch cmdlet 创建 VDS:

$vds = New-VDSwitch -Name "Nephosoft VDS" -Location "Datacenter Site A"

您可以检查 $vds 变量的内容。

 

 

将 ESX 主机添加到 VDS

 

下一步是将两台 ESX 主机同时添加到 Distributed Switch:

Add-VDSwitchVMHost -VDSwitch $vds -VMHost esx-01a.corp.local, esx-02a.corp.local

您可以验证 ESX 主机是否已成功添加到 Distributed Switch 中:

Get-VMHost -DistributedSwitch $vds

 

 

创建分布式端口组

 

现在,让我们使用 New-VDPortGroup cmdlet 来为管理、存储、vMotion 和虚拟机网络创建端口组:

$pgManagement = New-VDPortGroup $vds -Name "management"
$pgvMotion = New-VDPortGroup $vds -Name "vMotion"
$pgStorage = New-VDPortGroup $vds -Name "storage"
$pgVM = New-VDPortGroup $vds -Name "VM"

您可以验证是否已成功创建端口组:

Get-VDPortGroup -VDSwitch $vds

 

 

将主机网络连接迁移到 VDS

我们将逐台主机地迁移主机的网络连接。首先,我们将以变量形式保存两台主机:

$hosts = Get-VMHost  esx-01a.corp.local, esx-02a.corp.local 

然后,我们将使用 PowerShell 的 foreach 循环来迁移每台主机的网络连接。对于每台主机,我们将首先检索其物理网卡,然后检索其管理、存储和 vMotion VMKernel 网卡。随后,我们将使用 Add-VDSwitchPhysicalNetworkAdapter cmdlet 共同迁移它们,同时通过 VirtualNicPortGroup 参数为每个 VMKernel 网卡指定分布式端口组:

foreach ($vmhost in $hosts) {
  $pNics = Get-VMHostNetworkAdapter -VMHost $vmhost -Physical
  $vNicManagement = Get-VMHostNetworkAdapter -VMHost $vmhost -Name vmk0
  $vNicStorage = Get-VMHostNetworkAdapter -VMHost $vmhost -Name vmk1
  $vNicvMotion = Get-VMHostNetworkAdapter -VMHost $vmhost -Name vmk2
  Add-VDSwitchPhysicalNetworkAdapter -DistributedSwitch $vds -VMHostPhysicalNic $pNics -VMHostVirtualNic $vNicManagement,$vNicStorage,$vNicvMotion -VirtualNicPortGroup $pgManagement,$pgStorage,$pgvMotion -Confirm:$false
}

 

 

将虚拟机网络连接迁移到 VDS

 

最后,我们再来迁移虚拟机网络连接。首先,我们将获取所有虚拟机的网络适配器:

$vmNetworkAdapters = Get-VM | Get-NetworkAdapter

接下来,我们会将这些网络适配器迁移到上一步中创建的虚拟机端口组:

Set-NetworkAdapter -NetworkAdapter $vmNetworkAdapters -Portgroup $pgVM -Confirm:$false

现在,所有虚拟机的网络流量均通过 VDSwitch。

 

创建虚拟机并在主机之间进行 vMotion 迁移


在本节课中,您将学习如何创建虚拟机并在集群中的两台主机之间进行 vMotion 迁移。


 

从头开始创建虚拟机

 

我们先通过 New-VM cmdlet 来创建一个虚拟机。我们将指定虚拟机的名称、硬盘和内存大小,以及要在其上创建虚拟机的主机和数据存储。此外,我们还将为虚拟机网络指定将位于之前创建的 Distributed Switch 中的端口组。我们将把虚拟机放置在 NFS 数据存储上,该数据存储由两台主机共享。

$vm = New-VM -Name 'jsmith' -VMHost esx-01a.corp.local -DiskGB 10 -MemoryMB 512 -Datastore ds-site-a-nfs01 -Portgroup $pgVM 

让我们启动该虚拟机:

$vm | Start-VM

 

 

在主机之间对虚拟机进行 vMotion 迁移

 

现在,让我们将虚拟机迁移到其他主机,以便工作负载更加均匀地分布:

Move-VM $vm -Destination esx-02a.corp.local

注意:如果这不是本节课的第一个单元,您的环境中可能存在一些断开连接的数据存储。在这种情况下,您将收到错误消息,提示 Move-VM 无法访问虚拟机配置。如果出现这种情况,您将必须在一台主机上重新连接 NFS 数据存储。为此,我们将使用 Get-EsxCli cmdlet:

Retrieve EsxCLli for esx-02a.corp.local:

$esxCli = Get-EsxCli -VMhost esx-02a.corp.local

确认 NFS 数据存储不可访问:

$esxCli.storage.nfs.list()
...
Accessible          : false
...

断开 NFS 数据存储:

$esxCli.storage.nfs.remove('ds-site-a-nfs01')

重新连接 NFS 数据存储:

$esxCli.storage.nfs.add('10.10.20.60', $false, $false, '/mnt/NFSA', 'ds-site-a-nfs01')

如果需要,请针对 esx-01a.corp.local 重复相同流程

提示:由于 Move-VM 操作需要的时间较长,您可能希望以异步方式迁移虚拟机并在此期间继续工作。您可以通过指定 Move-VM 的 -RunAsync 参数来实现这一目标。许多可能需要很长时间才能完成的其他 cmdlets 也支持 -RunAsync。

 

创建多个虚拟机并相应地进行标记


在本节课中,您将学习如何按照 csv 文件中保存的规范使用 PowerCLI 创建多个虚拟机。您还将根据相同的规范来标记虚拟机。


 

查看规范

 

首先,让我们来查看创建虚拟机时将遵守的规范。打开桌面上的vmspec.csv文件。里面列出了每台虚拟机的名称、内存大小(以 MB 为单位)、磁盘大小(以 GB 为单位)、部门和类型(用户虚拟机或服务器虚拟机)。

 

 

以阵列形式读取 csv 文件中的信息

 

现在,我们来把该文件导入为 PowerShell 变量:

$spec = Import-Csv 'C:\Users\Administrator\Desktop\vmspecs.csv'

检查 $spec 变量的内容。您将发现其中包含一个对象阵列(每个对象对应一个虚拟机),每个对象都具有相应的名称、内存大小、磁盘大小、部门和类型属性。

 

 

根据规范创建虚拟机

 

现在,让我们来根据规范创建虚拟机。我们将再次使用 PowerShell 的 foreach 循环:

foreach ($vmSpec in $spec)
{
   New-VM -Name $vmSpec.Name -MemoryMB $vmSpec."Memory size" -DiskGB $vmSpec."Disk size" -VMHost esx-01a.corp.local -Portgroup $pgVM
}

 

 

创建标记类别

 

接下来,我们的任务是相应地标记新创建的虚拟机。为此,我们将先创建两个不同的标记类别 -部门和类型:

New-TagCategory -Name Department 
New-TagCategory -Name Type 

 

 

根据规范创建标记

 

我们先来检索一下唯一的部门名称:

$departmentTagNames = $spec | select -Unique Department

现在,让我们为每个部门创建标记:

foreach ($departmentTagName in $departmentTagNames) 
{
  New-Tag -Name $departmentTagName.Department -Category Department 
}

接下来,我们必须对虚拟机类型执行相同的操作:

$vmTypes = $spec | select -Unique Type
foreach ($vmType in $vmTypes) 
{
  New-Tag -Name $vmType.Type -Category Type
}

通过调用以下命令,您可以查看最后定义了哪些标记:

Get-Tag

 

 

 

根据规范为虚拟机分配标记

 

现在,我们已经正确定义了标记和标记类别,是时候相应地标记虚拟机了。我们将使用 New-TagAssignment 命令将标记分配到虚拟机:

foreach ($vmSpec in $spec) 
{
  $departmentTag = Get-Tag $vmSpec.Department
  $typeTag = Get-Tag $vmSpec.Type
  $vm = Get-VM -Name $vmSpec.Name
  New-TagAssignment -Entity $vm -Tag $departmentTag
  New-TagAssignment -Entity $vm -Tag $typeTag
} 

 

根据标记修改多个虚拟机


在本节课中,您将学习如何使用 PowerCLI 基于标记同时修改多个虚拟机。


 

基于标记更新虚拟机内存容量

 

Nephosoft 的销售部门将部署一款新应用,这需要将用户计算机上的内存更新为 1 GB。我们已经正确标记了虚拟机,因此可以更轻松地对虚拟机进行批量更新。我们先来检索一下销售部门的所有虚拟机:

$salesVMs = Get-VM -Tag sales

接下来,让我们检索所有的用户虚拟机:

$userVMs = Get-VM -Tag user

注意:我们不能使用Get-VM -Tag sales, user,因为这将返回包括销售部门虚拟机及用户虚拟机在内的所有虚拟机,而实际上,我们是想要获得既是销售部门虚拟机又是用户虚拟机的虚拟机。

现在,让我们来选择分到了两种标记的所有虚拟机。为此,我们将使用 Compare-Object Powershell cmdlet:

$salesUserVMs = Compare-Object $salesVMs $userVMs -IncludeEqual -ExcludeDifferent -PassThru

我们需要先确保所有虚拟机均已停止,才能更新虚拟机内存:

$salesUserVMs | where {$_.PowerState -eq PoweredOn} | Stop-VM -Confirm:$false                         

最后,我们将使用 Set-VM cmdlet 更新虚拟机的内存容量:

Set-VM $salesUserVMs -MemoryGB 1 -Confirm:$false

 

配置和部署 OVF 模板


在本节课中,您将学习如何才能在部署 OVF 模板时向其应用配置。


 

检索 OvfConfiguration 对象

 

PowerCLI 中的 OVF 配置以 OvfConfiguration 对象的形式呈现,您可通过 Get-OvfConfiguration cmdlet 从 ovf 文件中对其进行检索。请注意,要使用该 cmdlet,您必须连接到 vCenter Server,因为它需要连接才能解析 OVA 属性。

$linuxMicroConfig = Get-OvfConfiguration -Ovf C:\OVF\linux-micro-01a\linux-micro-01a.ovf 

我们来看一看 $linuxMicroConfig 变量中的对象。NetworkMapping 即是该对象,它包含一个指向源 ovf 文件的属性,该属性还是选定 ovf 文件的实际可配置属性。在了解 NetworkMapping 对象中的内容时,我们将看到它只包含一个属性 VM_Network,这是唯一可以应用到 ovf 模板的配置。

 

 

更新 OVF 配置

您可以通过将值分配给对象属性来更新检索到的配置,从而与要应用的配置保持一致。在此示例中,我们将把值分配给VM_Network

$linuxMicroConfig.NetworkMapping.VM_Network.Value = 'VM'

 

 

导入 vApp 应用的配置

 

在导入 vApp 时,您可以使用新的 Import-VApp 参数OvfConfiguration来应用其配置。

Import-VApp -Source 'C:\linux-micro-01a\linux-micro-01a.ovf' -OvfConfiguration $linuxMicroConfig -Name 'LinuxMicro' -VMHost 'esx-01a.corp.local'

让我们来验证一下配置是否已经应用:

$linuxMicroVM = Get-VM 'LinuxMicro' 
$linuxMicroVM | Get-NetworkAdapter 

如您所见,vApp 已部署了正确的网络映射。

 

延伸阅读


本节课仅供参考之用,其中列出了一些较高级的 PowerCLI 功能、面向初级用户和高级用户的有用阅读材料以及有关其他 PowerCLI 相关练习的信息。如果您愿意,请随意尝试。


 

其他 PowerCLI 相关练习

HOL-SDC-1602 vSphere with Operations Management - 高级主题:第 8 单元将向您介绍用于管理 vRealize Operations Manager 的新 PowerCLI cmdlet。

HOL-HBD-1683 管理您的混合云:第 3 单元主要介绍如何借助 VMware vSphere PowerCLI 管理 vCloud Air。

 

 

访问整个 vSphere API

尽管 PowerCLI 提供了 300 多条用于管理 vSphere 的 cmdlet,但这些并未涵盖平台的全部功能。尽管如此,您仍然可以使用 Get-View cmdlet 来访问所有功能。通过这一特殊的 cmdlet,可以访问整个 vSphere API。该 cmdlet 返回的对象被称为视图,是 vSphere API 对象的精确副本。有关这些对象的更多信息,请参见《vSphere API 参考》

文档:

http://pubs.vmware.com/vsphere-60/index.jsp

使用该 cmdlet,您将能够面向对象直接针对 API 编写脚本。

 

 

Onyx for the Web Client

Onyx for the Web Client 是一款实验性软件,可以将在 vSphere Web Client 中执行的操作转换成 PowerCLI.Net 代码。该实验性软件是去年的 2014 年实验性软件大赛上的获奖作品。它可以算是对 Onyx 实验性软件的更新,因为它支持 Web Client 中的类似功能。

Onyx for the Web Client 实验性软件能够记录在 vSphere Web Client 中执行的操作,并将这些操作转换成 PowerCLI.Net 代码。然后,通过生成的代码,可以了解 VMware 如何在 API 中执行操作,还可以更好地定义功能。您还可以将生成的代码输入搜索引擎,以查找有关如何使用 vSphere API 这一领域的 API 文档和信息。

https://labs.vmware.com/flings/onyx-for-the-web-client

 

 

可帮助您开始使用 PowerCLI 高级脚本编写功能的实用资料

如果您刚开始接触 PowerCLI,或者希望详细了解该产品,可以关注以下博客。您可以在其中找到有关 PowerCLI 的好文章和脚本:

PowerCLI 官方博客:http://blogs.vmware.com/PowerCLI/

Alan Renouf 的博客:http://www.virtu-al.net

Luc Dekens 的博客:http://www.lucd.info

 

Conclusion

Thank you for participating in the VMware Hands-on Labs. Be sure to visit http://hol.vmware.com/ to continue your lab experience online.

Lab SKU: HOL-SDC-1610-SpringRelease

Version: 20160418-074303