VMware Hands-on Labs - HOL-1801-03-CMP-LT


练习概述 - HOL-1801-03-CMP - vRealize Suite Standard:可识别应用的软件定义的数据中心 (SDDC) 和多云环境管理

练习指导


注意:完成本练习需要 90 多分钟。每次最好只完成 2 到 3 个单元。这些单元彼此相互独立,因此您可以选择任一单元从头学起。您可以使用目录访问所选择的任何单元。

目录可以从练习手册的右上角访问。

在本练习中,我们将讨论如何使用 vRealize Operations 和 vRealize Log Insight 对计算、网络、存储和应用进行集成式性能和运行状况监控,以对问题进行故障排除、期待性能提升、避免中断并主动管理软件定义的数据中心 (SDDC)。 

练习单元列表:

练习负责人:

 

本练习手册可以从动手练习文档站点下载,网址为:

[http://docs.hol.vmware.com]

本练习可能会提供其他语言版本。要设置语言首选项并在练习中部署本地化手册,可以在本文档的帮助指导下完成:

http://docs.hol.vmware.com/announcements/nee-default-language.pdf


 

主控制台的位置

 

  1. 红框区域包含主控制台。练习手册位于主控制台右侧的选项卡上。
  2. 个别练习可能会用到其他控制台,分别位于左上角的不同选项卡上。如有需要,系统将引导您打开另一特定控制台。
  3. 练习时间为 90 分钟,由计时器计时。练习结果无法保存。所有工作必须在练习课程中完成。但是您可以单击“EXTEND”(延长)延长时间。在 VMware 活动期间,您有两次延长练习时间的机会,最多可延长 30 分钟。每单击一次可延长 15 分钟。非 VMware 活动期间,最多可将练习时间延长至 9 小时 30 分钟。每单击一次可延长一小时。

 

 

键盘式数据输入的替代方法

在本单元中,您将向主控制台中输入文本。除直接输入外,还有两种非常有用的数据输入方法,可简化输入复杂数据的过程。

 

 

单击练习手册内容并拖放到控制台的活动窗口

您也可以单击练习手册中的文本和命令行界面 (CLI) 命令并将其直接拖放到主控制台中的活动窗口。 

 

 

使用在线国际键盘

 

您还可以使用主控制台中的在线国际键盘。

  1. 单击 Windows 快速启动任务栏上的键盘图标。

 

 

激活提示或水印

 

首次开始练习时,您可能会注意到桌面上有一个水印,提示 Windows 尚未激活。 

虚拟化的一个主要优势在于,可以在任意平台上移动和运行虚拟机。本动手练习利用了这一优势,我们可以运行多个数据中心内的练习。但是,这些数据中心的处理器可能不同,这就需要通过 Internet 进行 Microsoft 激活检查。

请放心,VMware 和这些动手练习完全符合 Microsoft 的许可要求。您使用的练习是一个独立的单元,没有对 Internet 的完全访问权限,而 Windows 需要该权限才能验证激活。如果没有对 Internet 的完全访问权限,此自动化过程会失败,并且显示此水印。

这一表面问题不会影响到您的练习。 

 

 

查看屏幕右下部分

 

请检查练习的所有启动例程是否均已完成,并可以开始着手练习。如果您看到“Ready”(准备就绪)以外的内容,请等待几分钟。如果 5 分钟后,您的练习仍未变为“Ready”(准备就绪)状态,请寻求帮助。

 

第 1 单元 - 使用指标和日志进行全方位故障排除(30 分钟)

简介


在本单元中,您将对 Web 服务器的性能问题进行故障排除。IIS 服务器正经历大量 HTTP GET 请求。通过使用 vRealize Operations 警报和 Log Insight 日志,您将能够查看正在发生的情况,同时还能查看能为其他团队成员返回哪些类型的信息供他们进行审查。 


指标和 IIS 示例


本单元使用实时版 vRealize Operations。 


 

从 Windows 快速启动任务栏打开 Firefox 浏览器

 

现在,让我们开始本练习单元。

  1. 如果现在未打开 Firefox,请单击 Windows 快速启动任务栏上的 Firefox 图标。

 

 

打开“vRealize Operations Manager”选项卡

 

1. 单击“vRealize Operations Manager - Live Instance”(vRealize Operations Manager - 实时实例)。

 

 

登录 vRealize Operations Manager

vRealize Operations 已与我们将用于此练习的 VMware Identity Manager 进行集成。 

更改 vIDM 的主要原因不仅包括减少了占用空间、能够轻松扩展,还包括新增了功能。vIDM 现在提供大量新功能,其中包括:

此外,vIDM 身份堆栈还支持多种身份验证协议和方法(其中一些协议和方法之前不受支持):

  1. 单击下拉菜单并选择“VMware Identity Manager”。
  2. 单击“REDIRECT”(重定向)。

 

 

 

vIDM 登录

 

正确的用户名和密码均已填写完毕。

  1. 单击“Sign In”(登录)。

 

 

vRealize Operations 实时实例

 

首次登录 vRealize Operations 时,您将看到一个仪表盘,其中显示了练习环境中 3 台主机的当前运行状况。

 

 

搜索 IIS 服务器

 

  1. 单击 vRealize Operations 右上角的“放大镜”。这是搜索图标,如图所示。

 

 

搜索 IIS 服务器

 

  1. 键入“IIS”开始筛选项目,直到看到“IIS WWW Service - web-02a.corp.local”。
  2. 单击“IIS WWW Service - web-02a.corp.local”。

 

 

摘要仪表盘

 

  1. 确认您查看的是 web-02a 的 IIS WWW 服务的“Summary”(摘要)页面。
  2. 如果有任何针对 IIS 服务的警报,系统会将它们列在高亮显示的区域。
  3. 我们需要为 Web 服务器创建警报,以便在 HTTP 请求开始时收到通知。单击“Alerts”(警报)。

 

 

创建症状定义

 

首先,我们需要定义症状定义。症状是用于表明环境中所存在问题的状况。您需要创建症状,然后将其添加到警报定义,以便在监控对象出现问题时收到通知。

  1. 单击“v”展开“Alert Settings”(警报设置)菜单。
  2. 单击“Symptom Definitions”(症状定义)。
  3. 单击“+”创建新定义。

 

 

基础对象类型

 

  1. 对于基础对象类型,单击“v”展开适配器列表。
  2. 单击“EP Ops Adapter”(EP Ops 适配器)旁边的“v”展开对象类型。
  3. 向下滚动,直到您找到 WWW 服务并单击“IIS WWW Service”(IIS WWW 服务)。

 

 

配置 WWW 症状

 

  1. 单击“v”展开“UTILIZATION”(利用率)指标部分。
  2. 双击“Total Get Requests per Minute”(每分钟 GET 请求总数)。
  3. 键入“WWW Service”作为症状名称。
  4. 单击下拉菜单并设定为“Critical”(严重)。
  5. 键入“100”作为 GET 请求的阈值。
  6. 单击“v”展开“Advanced”(高级)部分。
  7. 将“Wait Cycle”(等待周期)时间更改为“1”
  8. 将“Cancel Cycle”(取消周期)时间更改为“2”
  9. 单击“SAVE”(保存)。

 

 

筛选 WWW 症状

 

vRealize Operations 具有很多预定义的症状,接下来我们来筛选我们创建的那个症状。

  1. 在筛选条件字段中键入“www”,然后按“Enter 键”。此时显示的唯一项目应该是我们刚才创建的 WWW 服务定义。

下一步是创建警报定义。

 

 

警报定义

 

  1. 单击“Alert Definitions”(警报定义)。
  2. 单击“+”创建新警报。

 

 

警报名称

 

  1. 键入“WWW Alert”作为新警报的名称。

 

 

基础对象类型

 

我们的基础对象将是虚拟机。

  1. 单击“v”展开适配器列表。
  2. 单击“vCenter Adapter”(vCenter 适配器)旁边的“v”展开对象。
  3. 向下滚动并单击“Virtual Machine”(虚拟机)

 

 

警报影响

 

验证第 3 部分。警报影响的设置如图所示。

 

 

警报症状

 

我们希望在虚拟机任何后代的相应症状处于活动状态时,都会在该虚拟机上触发警报。为此,我们需要选择后代作为警报中定义的对象。

  1. 单击“v”并单击“Descendant”(后代),将“Defined On from Self”(自行定义)更改为“Descendant”(后代)。
  2. 单击“v”列出可用的适配器。
  3. 单击“EP Ops Adapter”(EP Ops 适配器)旁边的“v”展开对象列表。
  4. 向下滚动并单击“IIS WWW Service”(IIS WWW 服务)。

 

 

警报症状

 

  1. 单击“WWW Service”(WWW 服务)症状并将其拖动到右侧工作区的“Symptoms”(症状)部分。
  2. 单击“Count”(数量)旁边的“v”并更改为“Any”(任意)。

 

 

警报建议

 

现在,您可以为警报创建新的建议。

  1. 单击“v”展开“Add Recommendation”(添加建议)部分。
  2. 单击“+”添加新建议。

 

 

新建议

 

  1. 键入“Additional Web Servers are needed for High HTTP Requests”。
  2. 单击“SAVE”(保存)。

 

 

拖动建议

 

  1. 单击建议并将其拖动到工作区的警报定义部分。
  2. 单击“SAVE”(保存)以完成警报定义。

 

 

URL Stress 程序

 

现在我们已经创建了警报,接下来我们将启动一个名为“URL Stress”的工具。这是一个在本练习中使用的程序,用于将多个 HTTP Get 请求发送至 Web 服务器,在本例中是在 web-02a.corp.local 上运行。您可以在桌面上一个名为“HOL Files”的文件夹中找到 URL Stress。

  1. 双击“HOL Files”打开该文件夹。

 

 

 

启动 URL Stress 程序

 

  1. 双击“URLSTRESS.exe”启动该程序。

 

 

URL Stress 参数

 

使用以下 URL Stress 参数将多个 HTTP GET 请求发送至 web-02a.corp.local。 

  1. 在 URL 行中,键入“http://web-02a.corp.local”。
  2. 将“Threads”(线程数量)设置为“100”。
  3. 将“Repeat Count”(重复次数)设置为“10000”。
  4. 单击“Run”(运行)。然后,您会看到请求开始。  

这将开始生成大量针对 IIS 服务器的 HTTP GET 请求。下一步是创建图表,以在指标图表上查看请求。

 

 

查看指标图表历史记录

 

vRealize Operations 中有许多可用的指标。我们将只扩展其中一些类别,如“AVAILABILITY”(可用性)、“THROUGHPUT”(吞吐量)和“UTILIZATION”(利用率)。在本示例中,我们想查看“Total Get Requests per Minute”(每分钟 GET 请求总数)指标,这需要使用 URL Stress 工具绘制 HTTP Get 请求图表。 

  1. 单击“All Metrics”(所有指标)选项卡。
  2. 单击“v”展开“All Metrics”(所有指标)。
  3. 单击“v”展开“AVAILABILITY”(可用性)。
  4. 单击“v”展开“THROUGHPUT”(吞吐量)。
  5. 单击“v”展开“UTILIZATION”(利用率)。
  6. 双击“Total Get Requests per Minute”(每分钟 GET 请求总数)指标。系统将针对该指标创建图表,图表显示过去一个小时的数据。
  7. 选择图中所示的符号以展开关系窗口。

注意:练习中的图表可能会与本示例所示图表不同。

 

 

虚拟机图表

 

  1. 单击“v”展开对象类型。
  2. 向下滚动
  3. 单击“Virtual Machine”(虚拟机)类别。
  4. 单击“web-02a”。所显示的内容将改为反映虚拟机的视图。

 

 

刷新指标图表

  1. 几分钟后,关系图表会指示运行状况为红色,如上图所示。 
  2. 图表将显示每分钟有大量的 Get 请求数,如上图高亮显示区域所示。
  3. 我们来看看这是否触发了警报。单击“Summary”(摘要)选项卡。

 

 

IIS WWW 警报

 

运行 URLStress 程序创建了一条警报。我们来查看一下该警报的详细信息。

  1. 单击“WWW Alert”(WWW 警报)链接。这样便可转至警报,以便我们查看详细信息。

 

 

查看 Web 服务器问题

 

要进一步查看此警报的详细信息,请执行以下操作:

  1. 单击“v”展开后代的详细信息。
  2. 单击“v”展开服务的详细信息。与指标图表类似,您在此可以看到显示事件发生了多久的时间表。我们来查看一下使用 vRealize Log Insight 收集的日志。
  3. 高亮显示的内容是您在警报定义步骤中创建的建议。
  4. 单击“View Logs”(查看日志)链接。由于 vRealize Operations 已与 Log Insight 集成在一起,此链接将带您转至 Log Insight 产品,并显示与 IIS WWW 服务相关的日志。

注意:根据所花的时间,您可能已从 VMware Identity Manager 注销,因此可能需要单击“REDIRECT”(重定向)来重新进行身份验证。单击“Login via SSO”(通过 SSO 登录)按钮(如果显示)。

 

 

vRealize Log Insight - 交互式分析

 

此时显示了 web-02a 的日志条目。在本示例中,条目超过 3,000,000 个。我们来看看有多少条目来自同一个源 IP 地址。

  1. 注意:如果您看不到日志条目,请单击下拉箭头,并将时间范围更改为“Last hour of data”(过去一小时的数据)。
  2. 单击放大镜进行搜索。

 

 

Log Insight 事件

 

  1. 单击“Event Types”(事件类型),按日志条目类型对条目进行分类。
  2. Log Insight 将日志条目分为 7 个事件类型,如黄色区域所示。
  3. 主要条目包含 200 万个条目,如黄色区域所示。请注意,包含流向端口 80 的“GET”的条目表明这些条目来自“URL Stress”程序。
  4. 单击“Expand”(展开)查看各个日志条目。

 

 

字段表

 

  1. 单击“Field Table”(字段表),按字段查看日志。您会发现 Log Insight 创建了一个主要字段表。我们来看看所有这些日志是否都为 IIS 日志。
  2. 单击“-”展开“ms_product”字段。
  3. 将鼠标悬停在蓝色条上,如图所示。请注意,条目数量保持不变,表明它们全都是 IIS 日志。

 

 

按源筛选

 

  1. 单击其中一个条目的“Source”(源)IP 地址。此时会显示一个对话框。
  2. 单击“Value is Not‘192.168.120.40’”(值不是“192.168.120.40”)。

 

 

无结果

 

最后一个筛选条件显示不包含 IP 地址“192.168.120.40”的条目,与预期一致,没有任何结果。这是因为我们是从同一个 IP 地址启动的 URL Stress 工具。这是一个能够以不同方式进行筛选的简单演示。我们来删除最后一个筛选条件,再次查看所有条目。

  1. 单击“X”清除源筛选条件。
  2. 单击“Search”(搜索)”图标。

此时您应该能再次看到所有条目。现在,我们要将该信息添加到您可以与其他团队成员共享的仪表盘中,以便他们可以进一步调查。

 

 

将结果添加到仪表盘

 

  1. 单击“Add to Dashboard”(添加至仪表盘)按钮。
  2. 键入“High HTTP Get Requests”之类的名称。
  3. 单击“Add”(添加)按钮,将此图表添加到仪表盘。
  4. 单击所示的“Dashboards”(仪表盘)图标。

 

 

仪表盘

 

转到仪表盘屏幕后,我们需要展开“My Dashboards”(我的仪表盘)。

  1. 单击“v”展开“My Dashboards”(我的仪表盘)。
  2. 单击“Dashboard 1”(仪表盘 1)以显示我们之前保存的内容。这样可以清楚地了解发生 GET 请求的时间。
  3. 单击时间段更改为“Last Hour of Data”(过去一小时的数据)。我们来看另一个仪表盘。
  4. 单击“v”展开“Microsoft IIS”仪表盘。

 

 

IIS 仪表盘

 

  1. 单击“General - Overview”(总述)了解 IIS 条目的其他信息。

 

 

单元清理

要为下个单元清理环境,请关闭 Firefox 浏览器和 URL Stress 程序。

 

总结


在本单元中,我们能够对经历高 IIS GET 请求的 Web 服务器的性能问题进行故障排除。vRealize Operations 和 vRealize Log Insight 集成后,我们可以使用多种工具来探索性能指标和日志数据。


 

您已完成第 1 单元的学习

祝贺您!您已经完成了第 1 单元的学习。

继续学习以下您最感兴趣的任意一个单元。

 

 

 

如何结束练习

  1. 如果您不想继续学习任何其他单元,可以通过单击“END”(结束)按钮来结束本练习。

 

第 2 单元 - 运行状况和性能监控(30 分钟)

简介


本练习中的场景是系统管理员经常会遇到的一个场景。虚拟机的 CPU 使用率攀升到 90% 以上,导致运行状况恶化。您将了解 vRealize Operations 运行状况和性能监控,以及新的故障排除工作流、警报、自定义分组、自定义仪表盘/报告。查看完 CPU 使用率较高的当前状况之后,您将更改 CPU 的数量以解决此问题。


使用全新的故障排除工作流、警报、自定义分组、自定义仪表盘/报告进行运行状况和性能监控


在本单元中,我们将使用实时版 vRealize Operations Manager 查看警报,并使用引导式修复主动解决性能问题。


 

首先,我们需要打开 vRealize Operations 实时实例。

 

 

 

如您所见,我们的练习环境是一个小环境,但因为它是一个实际环境,所以我们可以在其中做出历史实例中无法实现的更改。vRealize Operations 现在包括仪表盘,可帮助您开始操作。 

  1. 单击“DashBoards”(仪表盘)。

 

 

开始体验

 

  1. 欢迎使用仪表盘!“Getting Started”(开始体验)页面将引导您逐步探索一些有用的仪表盘类别和页面,以帮助您开始使用。高亮显示的区域是“Operations”(运维)类别的仪表盘。

单击以下各项,您将看到各个类别的其他有用的仪表盘。 

  1. 单击“Capacity and Utilization”(容量和利用率)。
  2. 单击“Performance and Troubleshooting”(性能和故障排除)。
  3. 单击“Workload Balance”(工作负载均衡)。
  4. 单击“Configuration and Compliance”(配置和合规性)。

 

 

虚拟机性能

 

在本单元中,我们将重点研究一台名为“Photon-OS-Container-Host”的虚拟机。我们将调查虚拟机和父主机的现状。然后,我们将创建一个警报并创建一个 CPU 负载以触发该警报,以便使用切实可行的行动项来更改 CPU 数量。

  1. 单击“Getting Started”(开始体验)以返回到仪表盘类别。
  2. 单击“Capacity and Utilization”(容量和利用率)类别。
  3. 向下滚动,直到您可以选择“VM UTILIZATION”(虚拟机利用率)仪表盘。
  4. 单击“VM UTILIZATION”(虚拟机利用率)。

 

 

虚拟机利用率仪表盘

 

此时显示了虚拟机利用率仪表盘,但可能没有显示我们想要研究的虚拟机。

  1. 单击“Photon-OS-Container-Host”。仪表盘此时会显示我们想要研究的虚拟机的结果。
  2. 向下滚动以查看剩余图表。记下第一张图,即“CPU/Demand”(CPU/需求),目前接近于零。可能存在一些来自之前启动的虚拟机以前的历史记录。
  3. 单击“Photon-OS-Container-Host”链接可查看有关虚拟机的更多详细信息。

 

 

Photon 虚拟机的详细信息

 

当前显示了“Summary”(摘要)页面,其中显示有关 Photon-OS-Container-Host 虚拟机的整体运行状况。请查看以下区域。

  1. 此区域显示了虚拟机的“Health Status”(运行状况)。
  2. 此区域包含与我们在图表上看到的性能指标类似的指标。
  3. 此区域将显示与虚拟机有关的任何警报。
  4. 向下滚动到页面底部,以查看其他详细信息。

 

 

查看主机信息

 

  1. 仪表盘底部显示了关于运行 Photon 虚拟机的主机的其他信息。在本示例中,虚拟机在主机“esx-01a.corp.local”上运行,其运行状况显示为绿色,表示良好。
  2. 我们来查看一下有关 Photon 虚拟机的其他信息。单击“more”(更多)展开可用的选项卡。

 

 

症状定义

 

首先,我们需要创建症状定义。症状定义是一种使用 vRealize Operations Manager 识别环境中对象所存在的问题的方法,当发生被视为问题的状况时,会触发警报。在我们的场景中,要监控的状况是虚拟机“Photon-OS-Container-Host”上的高 CPU 工作负载。创建一个或多个稍后可添加到警报定义的症状。触发症状时,vRealize Operation 将发出警报。

  1. 单击“Alerts”(警报)选项卡。
  2. 单击“v”符号(如图所示)展开“Alert Settings”(警报设置)。
  3. 单击“Symptom Definitions”(症状定义)。
  4. 单击“+”创建新的症状定义。

 

 

创建新的症状定义

 

  1. 单击“v”展开适配器列表。
  2. 单击“v”展开“vCenter Adapter”(vCenter 适配器)对象类型。
  3. 向下滚动并单击列出的“Virtual Machine”(虚拟机)

 

 

CPU 使用率定义

 

请使用以下参数配置症状定义。

  1. 键入“CPU|USAGE”的指标筛选条件。
  2. 单击“v”展开生成的指标。
  3. 双击“Usage (%)”(使用率 [%])。
  4. 键入“High CPU”作为症状名称。
  5. 将定义设置为“Critical”(严重)。
  6. 键入“95”作为症状必须超过才能被触发的值。
  7. 单击“v”展开“Advanced”(高级)部分。
  8. 将“Wait Cycle”(等待周期)修改为“1”。“Wait Cycle”(等待周期)字段表示在症状被触发之前,触发条件在此数量的收集周期内应保持为 true,这意味着当条件变为 true 时,系统将在同一收集周期中触发症状。
  9. 将“Cancel Cycle”(取消周期)修改为“2”。“Cancel Cycle”(取消周期)字段表示触发条件对于此数量的收集周期为 false 之后,症状就会被取消,这意味着当条件变为 false 时,系统将在同一周期中取消症状。
  10. 单击“SAVE”(保存)。

 

 

警报定义

 

现在来创建警报定义。警报定义是症状和建议的组合,用于识别环境中的问题区域并生成警报。

  1. 单击“Alert Definitions”(警报定义)。
  2. 单击“+”创建新定义。

 

 

警报名称

 

  1. 键入“High CPU Alert”作为警报名称和描述。
  2. 单击“>”展开“2. Base Object Type”(2. 基础对象类型)部分。

 

 

警报对象类型

 

  1. 单击“vCenter Adapter”(vCenter 适配器)旁边的“v”以展开对象列表,向下滚动并从列表中选择“Virtual Machine”(虚拟机)。
  2. 单击“v”展开“4. Add Symptom Definitions”(4. 添加症状定义)部分。

 

 

警报影响

 

警报影响

这些设置及其定义如下所示。这些设置将决定您警报的分类和触发方式。 

注意:在我们的场景中,我们将使用默认值。 

  1. “Impact”(影响)字段将对警报运行状况、风险或效率问题进行分类。
  2. “Criticality”(严重程度)字段表示问题的严重程度。

对于严重程度,您可以选择以下值之一。

  1. “Alert Type and Subtype”(警报类型和子类型)字段可用于对警报进行分类。例如,将这些字段用作信息,以便将警报发送给组织中相应的人员和部门。
  2. 最后选择周期设置,即数据收集时间间隔。“Wait Cycle”(等待周期)表示在触发警报之前,应经过多少个存在症状的周期。 
  3. “Cancel Cycle”(取消周期)表示在取消警报之前,应经过多少个不存在症状的周期。

 

 

添加症状定义

 

  1. 键入“high cpu”并按下“Enter”键,以筛选出我们刚刚在上一步中创建的症状定义。
  2. 将“High CPU”(高 CPU)拖动到工作区的症状定义部分,如图所示。
  3. 单击“v”展开“5. Add Recommendations”(5. 添加建议)部分。

 

 

添加建议

 

通过添加可用于修改虚拟机所需 CPU 数量的建议来完成定义。

  1. 键入“cpu”并按下“Enter”键,将建议范围缩小到与 CPU 相关。
  2. 将“Add more CPU Capacity for this virtual machin”(为此虚拟机添加更多 CPU 容量)建议拖放到工作表中,如图所示。
  3. 单击“SAVE”(保存)。

 

 

警报列表

 

验证警报是否存在。

  1. 键入“High CPU”并按下“Enter”键,以减少列出的警报定义。
  2. 单击“放大镜”图标,此图标是搜索工具。

 

 

搜索虚拟机

 

  1. 键入“photon”搜索以 photon 开头的对象。
  2. 单击“Photon-OS-Container-Host”以转到此虚拟机的摘要页面。

 

 

所有指标图表

 

通过完成以下操作来设置“CPU”和“Memory”(内存)图表。

  1. 单击“All Metrics”(所有指标)。
  2. 单击“v”展开“CPU”指标部分。
  3. 双击“CPU/Usage (%)”(CPU/使用率 [%])以创建图表。
  4. 单击“v”展开“Memory”(内存)指标部分。
  5. 双击“Memory/Usage (%)”(内存/使用率 [%])以创建内存使用率图表。
  6. 单击所示的“^”符号以打开关系窗口。这有助于查看警报触发时间。
  7. 在本例中,虚拟机运行状况徽标的颜色从绿色变为红色。但是,颜色可以是绿色、黄色、橙色或红色,具体取决于警报的严重程度。

 

 

Putty 图标

 

  1. 单击“Putty”图标以开始与 Photon-OS-Container-Host 的 Putty 会话,以便启动 CPU 负载条件。

 

 

通过 Putty 连接到 Photon-OS-Container-Host

 

  1. 单击已保存的会话“photon-os-container-host.corp.local”。
  2. 单击“Load”(加载)。
  3. 单击“Open”(打开)开始 Putty 会话。

 

 

启动 CPU 负载

 

  1. 键入cat /dev/zero > /dev/null并按下“Enter”键以启动 CPU 负载。

 

 

刷新指标图表

 

 

  1. 几分钟后,单击“刷新”图标。指标图表上将开始显示 CPU 使用率增加。CPU 使用率高于 95% 时,会生成警报。
  2. 单击“Refresh”(刷新)以更新整个“Operations”(运维)屏幕。
  3. 单击“Summary”(摘要)以转到“Summary”(摘要)页面。

 

 

摘要页面

 

如图所示,虚拟机的运行状况已变为严重,并且已就高 CPU 使用率触发警报。

注意:您可能会看到此虚拟机的其他警报,因为我们的环境中还有其他处于活动状态的警报。

  1. 单击“High CPU Alert”(高 CPU 警报)链接,了解有关警报的更多详细信息。

 

 

警报详细信息

 

此时显示了警报详细信息页面,我们可以进一步查看关于症状的信息。

  1. 单击“v”展开“Symptoms”(症状)页面。您可以看到,以黄色高亮显示的阈值设置为 95%,而使用率高于 96%。此外,以黄色显示的建议是为此虚拟机添加更多 CPU 容量。
  2. 单击“RUN ACTION”(运行操作),将 CPU 从 1 个 vCPU 更改为 2 个。

能够在 vRealize Operations 中执行操作和进行虚拟机配置更改可以节省时间,因为这无需登录 vCenter。能否执行这些操作由 vROps 中的权限控制。

 

 

操作

 

通过进行以下更改,将 CPU 数量从 1 更改为 2。

  1. 键入“2”作为“New CPU”(新 CPU)的数量。
  2. 选中“Power Off Allowed”(允许关闭)复选框。
  3. 单击“BEGIN ACTION”(开始操作)以启动对虚拟机的更改。

 

 

针对 CPU 数量的近期任务

 

启动操作之后,将显示一个用于查看任务状态的对话框。 

  1. 单击所示的“34ac9996-da2a-468f-80e6-07cefacd14d2”链接。您的练习环境可能具有不同的任务 ID。

 

 

近期任务列表

 

  1. 单击“Set CPU Count for VM”(设置虚拟机的 CPU 数量)任务。下方显示了关于已完成操作的其他详细信息。
  2. 单击虚拟机“Photon-OS-Container-Host”的链接以转到虚拟机的摘要页面。

 

 

摘要屏幕

 

“Summary”(摘要)屏幕将在几分钟之后自动更新,显示运行状况再次呈现为绿色且警报已清除。

 

 

配置更改 - 2 个 CPU

 

  1. 要查看配置更改,请在“Summary”(摘要)页面上向下滚动。
  2. 请注意,现在 vCPU 的数量设置为 2。

 

 

单元清理。

在退出本单元之前,请通过关闭 Putty 会话和 Firefox 浏览器重置环境。

 

总结


在本单元中,您了解了 vRealize Operations 运行状况和性能监控,以及新的故障排除工作流、警报、自定义分组、自定义仪表盘/报告。 


 

您已完成第 2 单元的学习

祝贺您!您已经完成了第 2 单元的学习。

继续学习以下您最感兴趣的任意一个单元。

 

 

 

如何结束练习

如果您不想继续学习其他单元,可以通过单击练习环境中的“END”(结束)按钮来结束本练习。

 

第 3 单元 - 软件定义的数据中心和多云环境监控(30 分钟)

SDDC 和多云环境监控(混合云)简介


VMware 的 Cloud Management Platform 可提供最全面的异构混合云管理解决方案。

在本单元中,我们将了解 vRealize Operations Manager (vROps) 如何监控软件定义的数据中心 (SDDC) 和多种公有云。

vRealize Operations 在一个可延展的集成式平台中整合了所有管理功能:性能管理、容量规划、拓扑分析和故障排除。下面是一些能够轻松跟踪整个基础架构(本地部署和/或远程部署)的常用方法。


 

仪表盘

 

仪表盘是 vRealize Operations 提供的一项功能,可让您快速大致了解基础架构的性能和状况。自定义的仪表盘可通过一系列小组件显示数据和分析结果。

 

 

警报和报告

 

警报和报告是其他选项,有助于您监控环境,而不受所处位置的限制(本地部署和远程部署)。

 

监控 SDDC 和多云环境的运行状况


我们来深入了解一些可用于监控 SDDC 环境(本地部署)的仪表盘。

我们要了解的第一个仪表盘与管理环境的工作方式有关(监控监控器)。第二个仪表盘可以让您了解整个环境,允许您深入了解问题区域的不足之处。


 

启动实时版 vRealize Operations Manager 控制台

 

 

SDDC 管理运行状况仪表盘

此仪表盘通过解决方案管理包提供。该解决方案包含监控 SDDC 管理堆栈的各种应用组件的功能。其目的是提供单一窗口,以便隔离在 SDDC 管理平面上运行的应用中的运行状况问题。

包括以下内容:

 

 

使用其他仪表盘 - 运维概览仪表盘

  1. 单击“All Dashboards”(所有仪表盘)下拉菜单。
  2. 将鼠标悬停在“Operations”(运维)上以查看运维仪表盘。
  3. 单击“Operations Overview”(运维概览)以打开该仪表盘。

 

管理公有云


智能运维最主要的一个方面就是能够跨多个平台(如虚拟和云计算基础架构)管理运维。将环境迁移到公有云或混合云模式时,您仍然需要能够以和现在相同的方法管理整个基础架构(外部和内部)。通过 vRealize Operations,您可以通过一个集中位置执行此操作,同时利用您现有的投资和专业技能。

例如,借助一个 Amazon Web Services 实例,单个应用很可能可以跨越组织的内部 vSphere 私有云,而您需要能够维持适当级别的可见性和控制力。

在本单元中,我们将了解如何连接到 Amazon 以及如何使用适用于 vROPS 的“Management Pack for AWS”监控公有云资源。


 

管理包电子市场

 

管理包可对 vRealize Operations 进行延展,从而管理传统 vSphere 环境之外的对象。与大多数管理包一样,安装和配置都非常简单。请注意,要实现管理包可延展性,需要使用 vRealize Operations Advanced 或 Enterprise 版本。请参阅 VMware Solution Exchange 网站了解更多详细信息。

 

现在,我们先了解一下 Management Pack for AWS,以及它如何帮助您更好地了解和控制公有云环境。我们将使用练习中 vRealize Operations 的 Blue Medora HVM 实例,因为它已经配置了多个管理包。

 

 

返回练习开始页面

 

 

访问 Blue Medora vRealize Operations Manager 历史视图模式 UI

 

  1. 单击“HOL-1801 Lab Links”(HOL-1801 练习链接)浏览器选项卡以返回启动页面。
  2. 单击浏览器中的“vRealize Operations Manager - Blue Medora Management Pack”(vRealize Operations Manager - Blue Medora 管理包)链接以在新标签页中将其打开。

 

 

设置浏览器缩放级别

 

练习环境的默认分辨率是 1280x800。为了最大限度减少在 vRealize Operations 用户界面中执行大量滚动操作的需要,请调整 Firefox 中的缩放级别。   

  1. 打开“Firefox Menu”(Firefox 菜单)下拉菜单。
  2. 设置所需的缩放级别。通常,80% 的缩放级别就足以在练习环境中提供充足的屏幕空间。另外,建议使用全屏选项。

 

 

登录

 

使用本地管理员凭证登录。 

  1. 从下拉菜单中选择“Local Users”(本地用户)。
ID = admin
密码 = VMware1! 
  1. 单击“LOG IN”(登录)。

 

 

查看 Management Pack for AWS 属性

 

在本单元中,我们将使用已在练习中完成安装和配置的管理包。如果您有任何关于如何安装管理包的问题,请参阅 VMware vRealize Operations Manager 信息中心网站,然后搜索“Configuring Additional Solutions and Adapters in vRealize Operations Manager”(在 vRealize Operations Manager 中配置其他解决方案和适配器)以进一步了解详细信息。

本步骤的目的是展示如何配置 AWS 管理包。

  1. 导航至“Administration”(管理)。
  2. 单击“Solutions”(解决方案)。
  3. 滚动以查找“Management Pack for AWS”管理包。
  4. 单击“Management Pack for AWS”以将其选中。
  5. 选择管理包并单击“配置”图标。

 

 

查看 Management Pack for AWS 设置

 

  1. 单击“编辑凭证”图标以查看所使用的 AWS 凭证。选择“Cancel”(取消)。不要更改此设置。
  2. 单击“Advance Settings”(高级设置)以查看 AWS 的其他设置。
  3. 单击“Close”(关闭)按钮,而不更改任何设置。

 

 

 

AWS 管理包仪表盘

 

AWS 管理包随附七个仪表盘,可为您提供所需的更多可见性和控制力。

要查看随附在 AWS 管理包中的仪表盘,请执行以下操作:

  1. 单击“Dashboards”(仪表盘)。
  2. 单击“All Dashboards”(所有仪表盘)下拉菜单。
  3. 将鼠标悬停在“AWS”类别上。
  4. 单击“AWS Instance Utilization”(AWS 实例利用率)。

 

 

了解 AWS EC2 实例利用率

 

虚拟机利用率仪表盘包含几个小组件,可以一目了然地显示云计算环境中虚拟机的有序列表。此列表包括可以指示性能不佳的指标,如 CPU 使用率和内存使用率。

 

 

EC2 实例 - CPU 利用率

 

vRealize Operations AWS 管理包针对每个公有云的每个对象类型提供很多指标。

要查看 AWS EC2 实例的 CPU 利用率,请执行以下操作:

  1. 双击 EC2 实例名称,选择 CPU 使用率仪表盘中列出的第一台虚拟机。

 

 

EC2 实例 - CPU 平均利用率...续

 

我们来深入了解一下...

  1. 单击“All Metrics”(所有指标)以查看可供对象使用的指标。
  2. 双击“CPU Utilization Average”(CPU 平均利用率)以查看该指标的历史图表。

现在,无论虚拟机驻留在何处,您都可以获取有关指标的更多详细信息并分析 CPU 利用率。

 

 

 

其他 AWS 仪表盘

 

您可以随意探索随附在管理包中的其他 AWS 仪表盘。查看其他仪表盘。

要查看随附在 AWS 管理包中的其他仪表盘,请执行以下操作:

  1. 单击“Dashboards”(仪表盘)。
  2. 单击“All Dashboards”(所有仪表盘)下拉菜单。
  3. 将鼠标悬停在“AWS”类别上。
  4. 单击任何其他仪表盘进行探索。

 

 

摘要

在本单元中,我们了解了 vRealize Operations 与 AWS 的集成、即时可用的仪表盘和指标,以及适用于本地部署 vSphere 和 AWS 云的管理包。

 

总结


您已完成第 3 单元 - 软件定义的数据中心和多云环境监控的学习。

您现在应该已经了解了以下内容:

 

您可以继续学习以下您最感兴趣的任意单元:

第 4 单元 - 操作系统和应用监控

第 5 单元 - 通过堆栈延展监控 - 从物理到应用


 

如何结束练习

如果您希望此时结束练习,请单击“END”(结束)按钮。这将终止您的练习和所有进度。仅在您想继续学习其他单元时执行此操作。

 

第 4 单元 - 操作系统和应用监控(30 分钟)

简介


在本单元中,我们将探索如何通过 vRealize Operations 的端点运维 (EPOps) 功能来监控操作系统。

如您所知,您可以通过适用于 vRealize Operations 的标准 vCenter 适配器对虚拟化基础架构的所有层进行详细监控,这些层包括虚拟机、主机、集群、数据存储和虚拟网络连接。虽然它还提供一些关于客户机的有限洞察数据(如磁盘空间利用率),但它缺乏一些特定于操作系统的指标。

这正是端点运维功能的用武之地。端点运维使用安装在客户操作系统中的基于 Java 的代理,这便可以显示特定于操作系统的指标,如操作系统 CPU 使用率、内存使用率和交换。

端点运维的另一项至关重要的功能是无需在虚拟机上运行。您可以在物理硬件上安装代理(只要操作系统受支持),并在 vRealize Operations 单一窗口下引入物理机。


 

工作方式

 

通常,vRealize Operations 系统通过查询 vCenter API 收集有关虚拟机的信息。在实施端点运维功能时,您可以使用操作系统内的信息补充从 vCenter 收集的数据。

此操作可通过在计算机(虚拟或物理)上安装代理完成。代理是一个小程序,可向操作系统和硬件发出探询并将数据发送回 vRealize Operations。在 vRealize Operations 内,来自 vCenter 的指标可与通过端点运维产生的指标无缝集成。

 

探索端点运维


在本部分,我们将详细了解端点运维功能提供的内容及其使用方法。


 

启动实时版 vRealize Operations Manager 控制台

 

 

查找虚拟机及其相关的操作系统指标

 

我们来查找一台虚拟机,并探索它与通过端点运维解决方案收集的操作系统指标之间的关系。

  1. 单击“放大镜”以展开右上角的搜索字段,然后键入“web-01a”。此时将显示匹配对象的列表。

请注意,多个对象类型的名称中包含“web-01a”。在本例中:

  1. 在列表中,单击“Linux”部分下的“web-01a.corp.local”链接

您将转到该操作系统的“Summary”(摘要)页面。

 

 

添加进程级监控

 

除了标准操作系统指标(如 CPU、磁盘、网络和内存利用率)以外,您还可以监控计算机上运行的具体进程。这样一来,您就可以了解每个进程的可用性和利用率。

您可以使用简单的查询语言选择希望监控的进程。您可以使用进程名称、程序路径、pid 文件、pid 和一些其他条件进行搜索。在本示例中,我们将查看 VM Tools 进程。为此,我们将匹配进程名称中包含字符串“vmtoolsd”的所有内容。“State.Name.ct”中的“ct”运算符表示“包含”。如果您需要完全匹配的内容,可以使用“eq”(表示“相同”)。

  1. 在您在上一步骤中打开的“web-01a.corp.local”Linux 操作系统资源上,单击“Actions”(操作)菜单。
  2. 选择“Monitor OS Object”(监控操作系统对象)。
  3. 选择“Monitor Processes”(监控进程)。此时将弹出一个对话框。

 

 

总结

现在,您应该能够利用端点运维解决方案来了解如何通过端点运维代理收集操作系统指标甚至进程级指标,以及如何将这些指标与不同时间范围内的总体操作系统统计信息相关联。请注意,您可以在 vRealize Operations 超级指标定义、警报、报告和仪表盘中使用这些指标。

 

应用监控


智能运维最主要的一个功能就是能够管理多个应用,如 MS SQL Server、Oracle 和 SAP 等。 

在本单元中,我们将了解如何使用针对 Microsoft SQL Server、Oracle 数据库和 SAP 的管理包来延展 vRealize Operations Manager,以便进行资源监控。我们将了解通过 vRealize Operations 管理包安装的各种仪表盘和指标。请注意,这些只是 vRealize Operations Manager 的几十个可用管理包的其中一些示例。


 

vRealize Operations Management Pack

 

管理包可以延展 vRealize Operations 的功能,用于管理 MS SQL Server、Oracle 和 SAP 等外部对象。vRealize Operations 管理包的安装和配置都非常简单。基本步骤如下文所述。为了进行本练习,我们已下载并安装了管理包。您不需要完成以下步骤。所列步骤仅供参考。

注意:不同的管理包需要不同版本的 vRealize Operations Manager - Standard、Advanced 或 Enterprise。有关具体信息,请参阅 vRealize Operations 产品介绍。

1. 从 https://marketplace.vmware.com 下载管理包或查找指向更多信息的链接。

2. 登录 vRealize Operations Manager 控制台,然后选择“Administration”(管理)选项卡。

3. 添加可导入先前下载的管理包安装程序的解决方案。

VMware 信息中心网站中定义了有关安装新管理包的说明。

现在,我们先了解一下针对 SQL Server 的管理包,以及它如何为 MS SQL Server 应用提供更好的可见性和控制力。

 

 

启动 vRealize Operations Manager - Blue Medora 管理包控制台

请注意,vRealize Operations Manager 的此实例是在练习环境的历史视图模式 (HVM) 下运行的。该实例不会收集任何实时数据,而是重放过去在实际环境中捕获的数据。因此,某些 vRealize Operations 功能已禁用。此外,您可能会在 vRealize Operations Manager 中看到显示许可证警告水印的屏幕。这在本练习单元中属于正常情况。

Blue Medora 是一个集成开发组件,其中构建有许多 vRealize Operations 管理包。有关 True Visibility Suite 的更多信息,请访问其网站。

 

 

Microsoft SQL Server 管理包

Blue Medora 提供的其中一种 vRealize Operations 管理包是针对 Microsoft SQL Server 的管理包。此管理包可从 Microsoft SQL Server 中检索数据,以监控、管理和收集有关 SQL Server 资源的关键绩效指标。在每个数据收集周期期间,该管理包会使用 JDBC 来查询 Microsoft SQL Server,以获取有关服务器资源的数据。

针对 Microsoft SQL Server 的管理包可以收集 Microsoft SQL Server 及其相关资源的性能、运行状况、可用性和容量数据。以下资源种类被视为 Microsoft SQL Server 管理包中的资源:

 

 

Oracle 数据库管理包

针对 Oracle 的数据库管理包是适用于 vRealize Operations (vROps) 的嵌入式适配器,可通过 JBDC 连接远程监控 Oracle 数据库系统,从而检索有关 Oracle 数据库资源的性能数据。

该管理包可以收集以下 Oracle 数据库资源的性能数据、关系(关联)和事件:

 

总结


您已完成第 4 单元 - 操作系统和应用监控的学习。

您现在应该已经了解了以下内容:

 

您可以继续学习以下您最感兴趣的任意单元:

第 1 单元 - 使用指标和日志进行全方位故障排除(30 分钟)

第 2 单元 - 运行状况和性能监控(30 分钟)

第 3 单元 - 软件定义的数据中心和多云环境监控(30 分钟)


 

如何结束练习

如果您希望此时结束练习,请单击“END”(结束)按钮。这将终止您的练习和所有进度。仅在您想继续学习其他单元时执行此操作。

 

第 5 单元 - 通过堆栈延展监控范围 - 从物理到应用(30 分钟)

简介 - 管理物理数据中心组件


对于大多数数据中心运维团队来说,要全面了解其 IT 生态系统的情况很困难。虚拟化和云服务抽象化使得 IT 堆栈不同层之间的跨平台关系变得更加复杂。异构环境和混合环境是常态,这就是可见性成为运维团队如今面临的主要挑战的原因。

VMware 通过 vRealize Operations Manager (vROPS) 为 vSphere 提供了一流的运维管理。Blue Medora 对 vRealize Operations Manager 进行了补充并延展了其功能。在本单元中,我们将指导您使用 Blue Medora 管理包来管理物理数据中心组件。我们将了解如何针对可见性将 vROPS 延展到 Cisco UCS、NetApp 和 F5(物理资产)。


 

管理包

管理包可将 vRealize Operations Manager 的功能延展到第三方产品和技术,以通过数据可视化、仪表盘、报告、警报和操作实现端到端运维智能。此外,管理包还能够以代理插件、内容包或合规性包的形式提供,这些包可以将功能延展到混合环境和异构环境,从而在跨应用、计算、存储和网络设备的单个运维控制台中提供全面的可见性。

 

vRealize Operations 和 Blue Medora


我们来开始探索环境,并通过 vRealize Operations Manager 和 Blue Medora 管理包更深入地了解环境。


 

启动 Blue Medora vRealize Operations Manager 控制台

 

 

UCS 结构互联阵列概览(网络连接)的仪表盘列表

  1. 单击“All Dashboards”(所有仪表盘)旁边的向下箭头。
  2. 依次单击“UCS”、“UCS Fabric Interconnect Overview”(UCS 结构互联阵列概览)。

此视图将向您显示 UCS 网络连接环境的运行状况,以及吞吐量、与虚拟机的关系、交换机和机架关系。下面我们来深入了解一下...

 

 

 

 

UCS 结构互联阵列详细信息的仪表盘列表

 

此“Dashboard”(仪表盘)视图将向您显示 UCS 网络连接环境的运行状况,以及吞吐量、虚拟机映射、交换机和机架关系。您可以随意进一步探索每个小组件中的内容。

  1. “Alerts”(警报)小组件可让您查看问题区域。根据收集的信息,有两个与电源有关且处于活动状态的警报。
  2. “Relationships”(关系)小组件将允许您深入分析环境,以便详细了解所有相关对象。

 

 

 

 

 

查看 UCS 关系

 

我们来深入了解一下 Cisco UCS 环境中的相关对象。

  1. 选择“Home”(主页)选项卡。
  2. 在右上角(搜索框)搜索 ucs-1.bluemedora.localnet,然后选择“Host System”(主机系统)对象。

 

 

 

 

主机系统

 

  1. 单击“more”(更多)选项卡以查看其他选项。
  2. 单击“Environment”(环境)选项卡,然后选择“Map”(映射)选项(未显示)来查看主机关系。

 

 

 

主机系统关系

 

由于 Blue Medora 无代理管理包可以显示硬件情况,在对问题或故障进行排除时,您可以轻松确定受影响的区域。

  1. 此视图向您显示了所有关联的数据存储和虚拟机。
  2. 此部分向您显示了与主机关联的机架、刀片服务器和 hypervisor。

 

 

主机系统性能

 

在继续查看其他仪表盘选项之前,我们先来了解一下性能。

  1. 选择主机系统的“Summary”(摘要)选项卡。
  2. 向下滚动,以快速查看此主机的性能容量信息。

请注意,性能在目前似乎没什么问题,但根据增长率来看,容量可能很快就会成为一个问题。

 

 

NetApp 的仪表盘列表

 

适用于 NetApp 存储的 Blue Medora VMware vRealize Operations 管理包针对 NetApp 存储上运行的工作负载提供了端到端可见性、分析和容量规划。 

  1. 单击“Dashboards”(仪表盘)选项卡,然后选择“All Dashboards”(所有仪表盘)
  2. 依次选择“NetApp”、“Overview”(概述)、“NetApp Storage Topology”(NetApp 存储拓扑)。

 

 

NetApp 存储拓扑

 

  1. 选择出现警告的主机系统(橙色)。这将在其他仪表盘小组件中填充更多信息。
  2. “Relationship”(关系)小组件将向您显示环境的布局,并帮助您确定问题区域。在本例中,主机运行正常(绿色),但 UCS 机架正在显示警告,这就是以不同颜色进行定义的原因。
  3. 通过选择主机系统,您还会看到与主机关联的 KPI。具体来说,这有助于您了解 NetApp 存储的读写 IOPS。

 

 

 

NetApp 数据存储

 

由于此仪表盘是 NetApp 基础架构的拓扑结构,我们可以快速查看所选资源的关键绩效指标和关系。我们来看一下 NetApp 数据存储。 

  1. 使用右侧的滚动条向下滚动,直到您看到“Datastores”(数据存储)
  2. 单击第一个 NetApp 卷

 

 

NetApp 数据存储检查

 

  1. 将第一个数据存储仍保持选中状态,继续探索其他小组件。  
  2. 这些小组件提供了有关 NetApp 物理卷的关键信息,并允许您深入了解对确定潜在的性能和容量问题至关重要的其他指标。

本单元已完成,请关闭所有打开的浏览器。

 

总结


您已完成第 5 单元 - 通过堆栈延展监控范围 - 从物理到应用的学习。

您现在应该已经了解了以下内容:

 

练习 HOL-1801-03-CMP 到此结束。


 

如何结束练习

如果您希望此时结束练习,请单击“END”(结束)按钮。这将终止您的练习和所有进度。仅在您想继续学习其他单元时执行此操作。

 

Conclusion

Thank you for participating in the VMware Hands-on Labs. Be sure to visit http://hol.vmware.com/ to continue your lab experience online.

Lab SKU: ManualExport-HOL-1801-03-CMP-LT.zip

Version: 20171020-141559