VMware 动手练习 - HOL-1901-04-CMP


实验室概述 - HOL-1901-04-CMP - 利用 vRealize Operations 和vRealize Log Insight.对基础架构和应用执行监控和故障排除

实验室指导


注意:本实验室总时长超过 90 分钟。体验期间,您最好只完成 2 到 3 个单元。这些单元彼此独立,因此您可以从任一单元开始学起。您可以使用目录访问所选择的任何单元。

目录可以从实验室手册的右上角访问。

本实验室将介绍监控、故障排除和创建仪表盘等 vRealize Operations 主题。

实验室单元列表:

(30 分钟)在本单元中,我们将利用引导式工作流来排除常见的 vSphere 基础架构性能问题。我们将了解引导式工作流(包括“vSAN 故障排除”工作流)的形式和步骤,以确定是否有任何虚拟机配置会影响 vSAN 性能。

(45 分钟)在本单元中,您将对影响 Web 服务器性能的问题进行排除。IIS 服务器正面临着大量 HTTP GET 请求。通过使用 vRealize Operations 警示和 vRealize Log Insight,您将能够查看日志以确定所发生的情况。确定根本原因后,可将信息提供给其他团队,以供他们查看并用于修复 IIS 服务器。

(45 分钟)在本单元中,我们将了解 vRealize Operations 中的端点运维 (EPOps) 适配器。

(45 分钟)了解第三方管理包提供的不同仪表盘和指标。

实验室负责人:

  • 第 1 单元 - Jase Machado,云计算管理专员,萨克拉门托
  • 第 2 单元 - Tony Welsh,云计算管理专员,圣地亚哥
  • 第 3-4 单元 - Josh Green,站点可靠性工程师,帕洛阿尔托

本实验室手册可以从动手实验室文档站点下载,网址为:

http://docs.hol.vmware.com

本实验室可能提供其他语言版本。要设置语言首选项并在实验室中部署本地化手册,可以在以下文档的帮助指导下完成:

http://docs.hol.vmware.com/announcements/nee-default-language.pdf


 

主控制台的位置

 

  1. 红框区域包含主控制台。实验室手册位于主控制台右侧的选项卡上。
  2. 个别实验室可能会用到左上角独立选项卡上的其他控制台。如有需要,系统将引导您打开其他的特定控制台。
  3. 实验室时间为 90 分钟,由计时器计时。实验室结果无法保存。所有操作都必须在实验室课程中完成。但是您可以单击“EXTEND”(延长)延长时间。在 VMware 活动期间,您可以将实验室时间延长两次,最多可延长 30 分钟。每单击一次可延长 15 分钟。非 VMware 活动期间,最多可将实验室时间延长至 9 小时 30 分钟。每单击一次可延长一小时。

 

 

键盘数据输入的替代方法

在本单元中,您将向主控制台中输入文本。除直接输入外,还有两种非常有用的数据输入方法,可简化输入复杂数据的过程。

 

 

单击实验室手册内容并拖放到控制台的活动窗口

 
 

您也可以单击实验室手册中的文本和命令行界面 (CLI) 命令,并将其直接拖放到主控制台中的活动窗口。 

 

 

访问在线国际键盘

 

您还可以使用主控制台中的在线国际键盘。

  1. 单击 Windows 快速启动任务栏上的键盘图标。

 

 

激活提示或水印

 

首次启动实验室时,您可能会注意到桌面上有一个水印,提示 Windows 尚未激活。 

虚拟化的一个主要优势在于,可以在任意平台上移动和运行虚拟机。本动手实验室利用了这一优势,我们可以运行多个数据中心内的实验室。但是,这些数据中心的处理器可能不同,因此会通过 Internet 触发 Microsoft 激活检查。

请放心,VMware 和这些动手实验室完全符合 Microsoft 的许可要求。您使用的实验室是一个独立的单元,不具备对 Internet 的完全访问权限,而 Windows 需要该权限才能验证激活。如果没有对 Internet 的完全访问权限,此自动化过程会失败,并且显示此水印。

这一表面问题不会影响到您的实验室。 

 

 

查看屏幕右下部分

 

请检查是否完成实验室的所有启动例程,以及是否准备好开始。如果您看到的内容并非“Ready”(准备就绪),请等待几分钟。如果 5 分钟后,您的实验室仍未变为“Ready”(准备就绪),请寻求帮助。

 

第 1 单元 - 使用 vRealize Operations 中的引导式工作流排除基础架构问题(30 分钟)

简介


在本单元中,我们将利用引导式工作流来排除常见的 vSphere 基础架构性能问题。我们将了解引导式工作流(包括“vSAN 故障排除”工作流)的形式和步骤,以确定虚拟机配置是否会影响 vSAN 性能。

本单元包含以下课时:


登录 vRealize Operations HVM 实例


本实验室环境运行着三个不同的 vRealize Operations 实例和一个 vRealize Log Insight 实例。我们使用不同的 vRealize Operations 实例,旨在处理具有独特要求的不同用户场景。下面列出了各种实验室实例:

在本课中,我们将使用 vRealize Operations 的历史实例。

 

如果您已登录 vRealize Operations 的历史(非实时)实例,请单击直接前往历史实例部分。


 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

如果您的浏览器尚未打开,请启动 Google Chrome

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标

 

 

打开 vRealize Operations - 历史实例标签页

 

浏览器主页包含实验室中运行的不同 vRealize Operations 实例的链接。

  1. 单击“vRealize Operations - Historical Instance”(vRealize Operations - 历史实例)链接以在新浏览器标签页中打开 UI

 

 

登录 vRealize Operations

 

  1. 如果默认设置不是“Local Users”(本地用户),请单击所显示的下拉菜单,然后单击“Local Users”(本地用户)

输入用户凭证。用户名为 admin,密码为 VMware1!

  1. 单击“LOG IN”(登录)。

 

引导式工作流概述


在本课中,我们将了解许多可用的引导式工作流,以帮助您快速识别基础架构问题修复机会。我们将使用 vRealize Operations Manager 的历史视图模式实例,该实例记录了来自更大环境的数据,使我们能够更好地介绍各个功能。这意味着可以做出的更改有限,因此,即使您导航稍微有误并且遇到错误,也不必担心。如果您想尝试进行更改,欢迎您返回并使用实时实例重新完成课程。


 

查找仪表盘和引导式工作流

 

要开始体验,我们必须首先导航至仪表盘的引导式工作流部分。

  1. 单击“Dashboards”(仪表盘)
  2. 单击“Performance Troubleshooting”(性能故障排除)
  3. 向下滚动以查看所有可用的引导式性能故障排除选项

 

 

研究引导式工作流的工作方式

 

  1. 选择“Troubleshoot a cluster”(集群故障排除)工作流。

 

 

分步引导式分析

 

让我们来完成工作流步骤...

  1. 选择“east-mgmt”集群。
  2. 请注意,后续的故障排除步骤可动态更新所提供的信息范围,以反映高亮显示的基础架构组件。

 

 

导航到其他仪表盘

 

在此步骤中,我们将导航到“Troubleshoot a Datastore”(数据存储故障排除)仪表盘。

  1. 在屏幕中上方,选择“All Dashboards”(所有仪表盘)箭头。
  2. 导航到“Performance Troubleshooting”(性能故障排除),然后选择“Troubleshoot a Datastore”(集群故障排除)。

 

 

并非所有工作流都相同

 

数据存储的布局和故障排除步骤与集群故障排除的差别很大。

  1. 我们会发现,“数据存储故障排除”工作流可为我们提供非常好的图形化热图来展示数据存储性能。这样即可更加轻松地直观显示受影响的数据存储。
  2. 此外,我们可以手动从列表中选择数据存储,也可以添加筛选条件。
  3. 后续故障排除步骤的使用情境会动态调整,以显示相关信息。
  4. 最后,让我们回到“Getting Started”(开始体验)页面。

 

使用引导式工作流识别基础架构问题并进行排除


在本课中,我们将了解如何使用引导式工作流来研究潜在的基础架构问题。引导式工作流能够将虚拟基础架构中的许多相关数据点关联起来,以便更快速地确定根本原因。


 

选择引导式工作流以排除潜在的虚拟机存储问题

 

在本课中,我们将了解如何排除 vSAN 性能问题,以确定是否有任何虚拟机会受未知配置问题的影响。

  1. 选择“Performance Troubleshooting”(性能故障排除)。
  2. 选择“Troubleshoot vSAN”(vSAN 故障排除)。

 

 

搜索 vSAN 集群的相关警示

 

默认情况下,故障排除步骤将显示与步骤 1 中选择的第一个对象相关的数据。对于 vSAN 集群“east-comp”,我们可以看到一条警示:“Virtual machine disk I/O write latency is high”(虚拟机磁盘 I/O 写入延迟较高)。

  1. 单击该链接。

 

 

选择要检查的警示实例

 

我们现在可以看到该警示的 2 个实例。让我们深入了解“weblogic-01”警示。

  1. 在服务器“weblogic-01”所在的行中,单击“View Details”(查看详细信息)

 

此时,系统会警告我们,如果我们从仪表盘导航到警示详细信息,所有未保存的数据都将丢失。这没问题,请继续。

 

 

查看警示详细信息

 

从“Alerts”(警示)视图中,我们可以看到有关“Actions”(操作)、“Recommendations”(建议)的更多信息,以及用于查看其它指标的链接。我们还能够快速查看哪些症状以及哪个特定症状指标会触发警示。

 

 

可用操作

 

如果我们展开可用“Actions”(操作),则可以看到哪些选项可用。

  1. 单击“Actions”(操作)下拉箭头

有关 vRealize Operations Manager 操作的更多信息,请单击以下链接:https://docs.vmware.com/en/vRealize-Operations-Manager/6.7/com.vmware.vcom.core.doc/GUID-BCD1B7D8-6988-4F3A-A70E-BE46A660383B.html

 

 

导航到症状

 

现在,我们已确定虚拟机“weblogic-01”存在一些问题,接下来可以查看这些问题可能会引发的详细警示、症状和各种指标。

  1. 首先我们来了解一下症状。单击“Symptoms”(症状)按钮。

 

 

 

查看症状

 

默认情况下,症状根据重要程度按顺序列出。我们还可以按“Created On”(创建日期)以及症状类型排序。从初始视图中,我们可以看到“Virtual machine memory demand exceeds configured memory”(虚拟机内存需求超过已配置内存)这样一条重要警示,这似乎是我们可以修复的非常明显的问题。

  1. 单击“Virtual machine memory demand exceeds configured memory...”(虚拟机内存需求超过已配置内存...)症状。

 

 

症状详细信息

 

我们现在已经能够确认,虚拟机所需的内存量超过已配置的内存量。内存配置似乎会影响这一使用 vSAN 的虚拟机的磁盘延迟性能。在真实场景中,对于各种工具和技术以复杂方式集成的情况,如要寻找性能问题的根本原因,这将很有帮助。

有关借助 vRealize Operations Manager 对 vSAN 进行故障排除的更多信息,请参阅 VMware Solutions Exchange 网站上的“Management Pack for vSAN”,网址为:https://marketplace.vmware.com/vsx/solutions/management-pack-for-vsan\

对此特定工作负载执行进一步故障排除不在本单元讨论范围之内。本课着重展示了 vROps 不断收集和聚合信息的动态且强大的功能,并且提供了引导式性能故障排除工作流。

 

登录 vRealize Operations 实时实例


本实验室环境运行着三个不同的 vRealize Operations 实例和一个 vRealize Log Insight 实例。我们使用不同的 vRealize Operations 实例,旨在处理具有独特要求的不同用户场景。下面列出了各种实验室实例:

在本课中,我们将使用 vRealize Operations 的实时实例。

如果您已登录 vRealize Operations 的实时(非历史)实例,请单击


 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

如果您的浏览器尚未打开,请启动 Google Chrome

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标

 

 

打开 vRealize Operations - 实时实例标签页

 

浏览器主页包含实验室中运行的不同 vRealize Operations 实例的链接。

  1. 单击“vRealize Operations - Live Instance”(vRealize Operations - 实时实例)链接以在新浏览器标签页中打开 UI

 

 

登录 vRealize Operations

 

vRealize Operations 已与我们将在此实验室中用于执行用户身份验证的 VMware Identity Manager 集成。

应预先选择“VMware Identity Manager”作为身份标识源。但如果没有选择,则应进行选择。

单击下拉箭头

  1. 选择“VMware Identity Manager”
  2. 单击“REDIRECT”(重定向),这将使您进入用户登录页面

 

 

 

VMware Identity Manager 登录

 

用户和密码信息应已填充完毕。但如有需要,则请输入这些信息。

用户:hol

密码:VMware1!

  1. 单击“Sign in”(登录)

 

使用仪表盘识别性能问题


在本课中,我们将利用引导式工作流识别可能会导致出现性能问题的未知配置问题。


 

了解引导式工作流

 

我们来查看可用的仪表盘和引导式工作流。

  1. 选择“Dashboards”(仪表盘)
  2. 选择代表功能仪表盘类型的各个框。
  3. 请注意可用于提供以下相关信息的仪表盘:概述、利用率、故障排除、优化和评估

 

 

深入了解性能故障排除工作流

 

在“Performance Troubleshooting”(性能故障排除)仪表盘中,我们具有“引导式工作流”。这些是特殊的交互式动态工作流,有助于将相关的基础架构警示、症状和配置关联起来。我们可以看到,有一些引导式工作流可用于对常见的 vSphere 基础架构项目进行故障排除。

  1. 选择“Performance and Troubleshooting”(性能和故障排除)
  2. 请注意可用的引导式工作流

 

 

导航到虚拟机性能故障排除

 

我们来对虚拟机性能问题进行排除。

  1. 选择“Troubleshoot a VM”(虚拟机故障排除)按钮

 

 

引导式虚拟机故障排除

 

我们现在启动“Troubleshoot a VM”(虚拟机故障排除)引导式工作流。第一步是确定是否有虚拟机具有有效警示,我们也可以利用筛选条件来查找满足其他条件的虚拟机。从此视图中,我们可以看到虚拟机“base-w10”具有有效警示。如果在第一个步骤中,此虚拟机高亮显示,则我们可以看到其他步骤提供了与此虚拟机相关的其他信息。

  1. 选择“base-w10”虚拟机
  2. 请注意与高亮显示的虚拟机有关的更多信息

 

 

查看有效警示

 

查看步骤 3,我们可以看到有一条警示,指出此虚拟机正在旧快照上运行。具体而言,此警示指示该快照已存在 2 天以上。单击此警示,查看更多详细信息。

  1. 单击“Virtual machine is running on snapshots for more than 2 days”(虚拟机正在已存在 2 天以上的快照上运行)警示

 

 

警示详细信息和症状

 

警示的详细视图显示警示的症状。我们可以看到,虚拟机拥有大小约为 1.7 GB 的快照并且快照已存在 2 天以上。

 

修复性能问题


在本课中,我们将了解如何使用自动化修复操作来帮助管理员实现快速解决问题,且无需管理员登录其他管理控制台。


 

了解建议和自动化修复操作

 

通过查看警示的“Recommendations”(建议)区域,我们可以看到 vRealize Operations Manager 针对如何纠正警示提出了一些建议。一些建议是预定义的、人员提供的,甚至是自动提供的。根据基础架构组件类型的不同,预定义的选项将有所不同。

 

 

运行修复操作

 

在可用的建议中,某些建议是切实可行的。通过选择“Run Action”(运行操作)按钮,我们能够启动自动化流程,从而使 vRealize Operations Manager 指示 vCenter 移除有问题的快照。

  1. 单击“RUN ACTION”(运行操作)按钮。

有关配置 vRealize Operations Manager 操作的更多信息,请单击以下链接:https://docs.vmware.com/cn/vRealize-Operations-Manager/6.7/com.vmware.vcom.core.doc/GUID-C279EDE7-0720-462B-9BB3-5D2D2003D626.html

 

 

启动自动化快照删除操作

 

此时返回带有快照的可用虚拟机的列表。我们只有这一台带有快照的虚拟机,因此它已经高亮显示。选择“NEXT”(下一步)按钮。

 

此时会显示虚拟机“base-w10”上可用快照的列表。我们只有一个快照,并且它已经高亮显示,因此,我们现在可以点击“BEGIN ACTION”(开始操作)以启动快照移除操作。

 

 

生成的任务

 

我们收到一条确认消息,指出快照移除任务已启动,并且系统还向我们提供了任务 ID 和用于监控进度的链接。让我们单击任务链接以监控进度。

 

一旦链接带我们进入“Administration”(管理)的“Recent Tasks”(近期任务)区域,我们便可以看到状态。状态最初显示为“In Progress”(进行中)。

 

 

确认任务已完成

 

单击 “Refresh”(刷新)后,我们将看到状态变为“Completed”(已完成)。

 

 

确认警示已消除

 

如果我们现在返回到“Troubleshoot a VM”(虚拟机故障排除)引导式工作流,我们将看到虚拟机“base-w10”不再显示为具有有效警示。

 

结束语


在本单元中,您了解了 vRealize Operations 仪表盘以及用于识别性能问题的引导式工作流。还了解了引导式工作流如何导航相关基础架构组件并将其关联起来,从而快速且直观地识别问题。除了可帮助关联日志信息和配置的引导式流程以外,系统还提供了其他解决方案建议和选项来帮助解决问题。


 

您已完成第 1 单元的学习

 

祝贺您!您已经完成了本单元的学习。

如果您要查找有关 vRealize Operations 的更多信息,请访问 https://www.vmware.com/cn/products/vrealize-suite.html

如果您想要跳到特定单元,请单击以下链接之一。

或者,如果您想结束对实验室的学习,

  1. 请单击页面顶部的“END”(结束)按钮。

 

第 2 单元 - 结合使用指标和日志与 vRealize Operations 和 vRealize Log Insight 排除问题(45 分钟)

简介


在本单元中,您将排除影响 Web 服务器性能的问题。IIS 服务器正面临着大量 HTTP GET 请求,并且导致某服务停止。通过使用 vRealize Operations 警示和 vRealize Log Insight,您将能够查看指标和日志以确定所发生的情况。确定根本原因后,可将信息提供给其他团队,以供他们查看并用于修复 IIS 服务器。


登录 vRealize Operations 实时实例


本实验室环境运行着三个不同的 vRealize Operations 实例和一个 vRealize Log Insight 实例。我们使用不同的 vRealize Operations 实例,旨在处理具有独特要求的不同用户场景。下面列出了各种实验室实例:

  • 实时实例:连接到实验室中运行的小型 vSphere 环境。此实例中没有庞大的对象清单,但是支持我们与 vCenter 交互。
  • 历史实例:运行时长 30 分钟的数据循环,这些数据是过去捕获的。这种实例具有更庞大的对象清单,但是由于它目前没有连接到 vCenter,我们无法执行任何操作。
  • Blue Medora 管理包:这种实例也在历史模式下运行,它具有来自 Blue Medora 的大量管理包,使我们能够查看来自相邻基础架构(存储和物理服务器)的信息,以及操作系统和应用信息。

在本课中,我们将使用 vRealize Operations 的实时实例。

如果您已登录 vRealize Operations 的实时实例,请单击


 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

如果您的浏览器尚未打开,请启动 Google Chrome

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标

 

 

打开 vRealize Operations 标签页

 

浏览器主页包含实验室中运行的不同 vRealize Operations 实例的链接。

  1. 单击“vRealize Operations Manager - Live Instance”(vRealize Operations Manager - 实时实例)链接以在新浏览器标签页中打开 UI

 

 

登录 vRealize Operations

 

vRealize Operations 已与我们将在此实验室中用于执行用户身份验证的 VMware Identity Manager 集成。

应预先选择“VMware Identity Manager”作为身份标识源。但如果没有选择,则应进行选择。

单击下拉箭头

  1. 选择“VMware Identity Manager”
  2. 单击“REDIRECT”(重定向),这将使您进入用户登录页面

 

 

 

VMware Identity Manager 登录

 

用户和密码信息应已填充完毕。但如有需要,则请输入这些信息。

用户:hol

密码:VMware1!

  1. 单击“Sign in”(登录)

 

指标和 IIS 示例


本单元使用实时版 vRealize Operations。 


 

搜索 IIS 服务器

 

WWW 服务站点正在名为“base-w12-01”的 Windows 2012 服务器上运行,最快的方法是搜索虚拟机。

  1. 单击 vRealize Operations 右上角的放大镜。这是搜索图标,如图所示。

 

 

搜索 IIS 服务器

 

  1. 键入 base 开始筛选项目,然后向下滚动,直至找到虚拟机“base-w12-01”。您可能需要在列表中向下滚动才能找到虚拟机。
  2. 单击“base-w12-01”

 

 

摘要仪表盘

 

  1. 确认您查看的是 base-w12-01 虚拟机的“Summary”(摘要)页面。
  2. 如果有任何针对虚拟机的警示,系统会将它们列在高亮显示的区域。

接下来,我们看一下在 Base-w12-01 上运行的 IIS 默认站点。

 

 

IIS 摘要页面

 

要查看 IIS 默认站点,我们需要查看“Related Objects”(相关对象)。

  1. 单击“Related Objects”(相关对象),这展开文件夹中包含的对象。
  2. 单击“IIS WWW Service Site”(IIS WWW 服务站点),此时将列出默认的 Web 站点。
  3. 单击“Default Web Site”(默认 Web 站点),此时系统会显示“Default Web Site”(默认 Web 站点)的“Summary”(摘要)页面。
  4. 如果有任何警示,系统会将它们列在摘要屏幕的这一区域。为了显示警示,我们必须创建警示症状和警示定义。
  5. 有时,创建用于监控一些指标的仪表盘将很有帮助。单击“All Metrics”(所有指标)开始该流程。

 

 

创建指标图表

 

我们想要在此仪表盘上列出“利用率 - 每分钟的 GET 请求总数”和“IIS 服务可用性”这两个指标。首先,我们需要将它们添加到指标图表。

  1. 单击“V”符号以展开“All metrics”(所有指标)的内容。
  2. 单击“UTILIZATION”(利用率)旁边的“V”符号以展开这一部分。
  3. 双击“Total Get Requests per Minute”(每分钟的 GET 请求总数)以向图表添加指标。
  4. 单击“AVAILABILITY”(可用性)旁边的“V”符号以展开这一部分。
  5. 双击“Resource Availability”(资源可用性)以向图表添加指标。

 

 

向图表中添加 CPU 使用率

 

还有一个指标需要添加到图表中,那就是 base-w12-01 虚拟机的“CPU 需求”。现在,将焦点移至虚拟机的属性上:

  1. 单击“base-w12-01”。如果虚拟机“base-w12-01”未显示,请单击“BACK”(后退)以返回到上一页。
  2. 单击“V”以展开“Utilization”(利用率)指标部分。
  3. 双击“CPU Demand (%)”(CPU 需求 [%])。
  4. 我们还想将图表的时间段更改为过去一小时。单击看起来像日历的图标。
  5. 单击“V”,然后选择“Last Hour”(过去一小时)时间段。
  6. 单击“GO”以设置新的时间段。

 

 

图表和创建仪表盘

 

现在,图表的时间段已经正确了,是时候创建可用于监控这些指标的仪表盘了。

  1. 单击所示图标以生成仪表盘

 

 

IIS 请求和可用性

 

  1. 输入 IIS Requests & Availability 作为仪表盘的名称。
  2. 单击“OK”(确定)以保存名称,然后在指示仪表盘已创建的通知中,单击“OK”(确定)

 

 

查看仪表盘

 

  1. 单击“Dashboards”(仪表盘)
  2. 单击“IIS Requests & Availability”这一新的仪表盘
  3. 将光标移到仪表盘的右上角,然后单击眼睛图标以打开工具栏。
  4. 单击铅笔图标以编辑该小组件。

 

 

编辑仪表盘

 

将仪表盘的刷新内容设置更改为以下内容:

  1. 单击单选按钮以将“Refresh Content”(刷新内容)设置为“ON”(打开),并在“Refresh Interval”(刷新时间间隔)中输入 30 秒。
  2. 单击“SAVE”(保存)。

现在,仪表盘已创建完毕,我们需要创建警示症状和定义了。

 

 

警报

 

  1. 单击“Alerts”(警示)以在左侧窗口中查看警示设置。

 

 

创建症状定义

 

首先,我们需要定义症状定义。症状是用于表明环境中所存在问题的状况。创建症状后,将其添加到警示定义中,这样,便可以在受监控对象出现问题时收到通知。

  1. 单击“V”以展开“Alert Settings”(警示设置)菜单。
  2. 单击“Symptom Definitions”(症状定义)
  3. 单击“+”以创建新定义。

 

 

基础对象类型

 

  1. 对于“Base Object Type”(基本对象类型),请单击“V”以展开适配器列表。
  2. 单击“EP Ops Adapter”(EP Ops 适配器)旁边的“V”以展开对象类型。
  3. 向下滚动,直到找到 WWW 服务,然后单击“IIS WWW Service”(IIS WWW 服务)

 

 

配置 WWW 症状

 

  1. 单击“V”以展开“UTILIZATION”(利用率)指标部分。
  2. 双击“Total Get Requests per Minute”(每分钟的 GET 请求总数)。
  3. 键入 WWW Service 作为症状名称。
  4. 单击下拉菜单,并设定为“Critical”(严重)
  5. 键入 100 作为 GET 请求的阈值。
  6. 单击“V”以展开“Advanced”(高级)部分。
  7. 将“Wait Cycle”(等待周期)时间更改为“1”。
  8. 将“Cancel Cycle”(取消周期)时间更改为“2”。
  9. 单击“SAVE”(保存)。

 

 

筛选 WWW 症状

 

vRealize Operations 具有很多预定义的症状,接下来我们来筛选我们创建的那个症状。

  1. 在筛选条件字段中键入 www,然后按键盘上的 Enter 键。此时显示的唯一项目应该是我们刚才创建的“WWW 服务定义”。

下一步是创建警报定义。

 

 

警报定义

 

  1. 单击“Alert Definitions”(警示定义)
  2. 单击“+”以创建新警示。

 

 

警报名称

 

  1. 键入 WWW Alert 作为新警示的名称。
  2. 单击“2. Base Object Type”(2. 基础对象类型)

 

 

vCenter 适配器

 

我们的基础对象将是虚拟机。

  1. 单击“V”以展开适配器列表。
  2. 单击“vCenter Adapter”(vCenter 适配器)旁边的“V”以展开对象。
  3. 向下滚动并单击“Virtual Machine”(虚拟机)
  4. 单击“3. Alert Impact”(3. 警报影响)

 

 

警报影响

 

验证“3. Alert Impact”(3. 警示影响)部分是否具有所示设置。

  1. 单击“4. Add Symptom Definitions”(4. 添加症状定义)

 

 

警报症状

 

我们希望,当症状在后代中处于活动状态时,在该虚拟机上触发警示。为此,我们需要选择后代作为警示中定义的对象。

  1. 依次单击“V”和“Descendant”(后代),以将“Defined On from Self”(自行定义)更改为“Descendant”(后代)。
  2. 单击“V”以列出可用的适配器。
  3. 单击“EP Ops Adapter”(EP Ops 适配器)旁边的“V”以展开对象列表。
  4. 向下滚动并单击“IIS WWW Service”(IIS WWW 服务)

 

 

警报症状

 

  1. 单击“WWW Service”(WWW 服务)并将其拖放到右侧工作空间的“Symptoms”(症状)部分。
  2. 单击“Count”(数量)旁边的“V”并更改为“Any”(任意)
  3. 单击“5. Add Recommendations”(5. 添加建议)

 

 

警报建议

 

现在,您可以为警报创建新的建议。

  1. 单击“+”以添加新建议。

 

 

新建议

 

  1. 键入 Additional Web Servers are needed for High HTTP Requests
  2. 单击“SAVE”(保存)

 

 

拖动建议

 

  1. 在筛选条件字段中键入 Additional web
  2. 看到所键入的内容后,单击“Additional Web Services for high HTTP Requests”(大量 HTTP 请求的其他 Web 服务)并将其拖动至“Recommendation”(建议)部分。
  3. 单击“SAVE”(保存)以完成警示定义。

接下来检查默认 Web 页面是否显示。

 

 

IIS Web 页面

 

  1. 在浏览器中打开新的标签页,然后输入 http://base-w12-01.corp.local 以查看 Web 服务是否正常运行。

 

 

仪表盘

 

  1. 单击 vRealize Operations 的标签页以返回到该页面
  2. 单击“Dashboards”(仪表盘)以返回到仪表盘区域。
  3. 如果当前的仪表盘不是“IIS Requests & Availability”(IIS 请求和可用性),请单击它。请注意,利用率的高值和低值均为 1.这一数字将很快增加为数千个请求。

 

 

URL Stress 和 Stop Service

 

您将使用 PowerShell 启动名为 URLSTRESS 的实用程序,后者可将数千个 GET 请求发送到 http://base-w12-01.corp.local  上运行的 IIS 服务。几分钟后,这些请求将反映在 GET 请求图中。此外,虚拟机 CPU 的需求将开始攀升。5 分钟后,可用性图表将反映出这样一种情况:IIS 服务崩溃。您需要对显示服务中断的日志进行调查,并重新启动服务。

  1. 双击桌面上的“URL Stress”实用程序。

 

 

URL Stress 参数

 

使用以下 URL Stress 参数将多个 HTTP GET 请求发送至 base-w12-01

  1. 在“URL”行中键入 http://base-w12-01
  2. 将“Threads”(线程数量)设置为“100”
  3. 将“Repeat Count”(重复次数)设置为“10000”
  4. 单击“Run”(运行),然后您会看到请求开始,并且,只要 WWW 服务在运行,当前的故障数量便为 0。

这将开始生成大量针对 IIS 服务器的 HTTP GET 请求。

 

 

图表开始显示请求

 

  1. 此指标图表显示 Get 请求的数量剧增到 100,000 以上。
  2. 中间的图表显示 Web 服务器已停止运行,并且可用性为 0。
  3. 下部的图表显示 base-w12-01 的 CPU 需求已提高至 75%,并在可用性降至 0 之后开始下降。
  4. 单击“BACK”(返回)以查看 base-w12-01 摘要。

 

 

警报

 

  1. 让我们看看警示的默认 Web 页面。单击“Related Objects”(相关对象)以展开对象(如果尚未展开)。
  2. 单击“IIS WWW Service Site”(IIS WWW 服务站点)。
  3. 单击“Default Web Site”(默认 Web 站点)。
  4. 您应该看到一条指出默认 Web 站点不可用的警示。
  5. 单击“base-w12-01”以返回到虚拟机摘要。

 

 

base-w12-01 的警示

 

  1. 单击“Summary”(摘要)(若尚未进入此处)。
  2. 单击“WWW Alert”(WWW 警示)以查看有关警示的更多详细信息

 

 

Base-w12-01 Web 站点停止运行

 

  1. 要检查 Web 页面是否在运行,请刷新之前打开的标签页,以访问 IIS 服务器地址。
http://base-w12-01.corp.local

 

 

警示说明

 

  1. 请注意,此区域包含您之前在实验室的“Alert Definition”(警示定义)部分输入的建议。  
  2. 让我们查看发送到 Log Insight 的有关此故障的日志。单击“View Logs”(查看日志)

 

 

查看日志

 

Log Insight 在 vRealize Operations 中启动。注意:显示消息时,您可能必须“Login via SSO”(通过 SSO 登录)。

如图所示,Log Insight 中还有一些其他事件类型,但我们只看一下第二组。

  1. 让我们单击“Custom time range”(自定义时间范围)并将其更改为“Latest hour of data”(过去一小时的数据),从而将时间段更改为过去一小时。
  2. 单击“Expand”(展开)以查看事件详细信息。

 

 

 

Events Like This(这种类型的事件)

 

列表中还有其他事件,这导致列表非常混乱。我们来添加其他筛选条件。如果将鼠标悬停在事件左侧的区域,则会显示包含齿轮图标的菜单。

  1. 单击齿轮图标
  2. 单击“Events Like This”(这种类型的事件),以便通过添加筛选条件,仅将与 WWW 服务相关的事件查找出来。

 

 

 

字段表

 

屏幕上目前应该列有 2 个筛选条件。Log Insight 还能够以不同的格式查看事件。其中一种格式是查看组成事件的各个字段。

  1. 单击“Field Table”(字段表)以查看其他格式。

Log Insight 还有许多其他用户场景和功能。您可以在 HOL-1901-01-CMP 实验室中找到更多信息。

让我们重新启动 WWW 服务。

  1. 单击“Summary”(摘要)以返回 base-w12-01 摘要页面。

 

 

启动 WWW 服务

 

要重新启动服务,请最小化浏览器并双击桌面上的“WWW Service Start”(WWW 服务启动)图标。

 

 

IIS 服务已还原

 

几分钟后,您将看到图表中反映出 WWW 服务已重新启动。

  1. 此指标图表显示 Web 服务器运行,并且可用性为 100。
  2. 中间的图表显示 GET 请求数量已降回到 0。
  3. 下部的图表显示 base-w12-01 的 CPU 使用率已降回到 3%
  4. 单击“BACK”(返回)以查看 base-w12-01 摘要。

 

 

基本警示已清除

 

现在,服务已还原为 WWW 默认服务,警示已清除,并且,如果 base-w12-01 恢复为绿色,则运行状况正常。

关于 IIS 请求,您可以查看一些仪表盘。

 

 

IIS 仪表盘

 

  1. 单击“Logs”(日志)以返回到 Log Insight。
  2. 在 Log Insight 应用中,单击“Dashboards”(仪表盘)
  3. 单击“V”以展开 Microsoft - IIS 仪表盘的内容
  4. 向下滚动以查看仪表盘的其他内容。或许,可以试着查看一些其他仪表盘,以查看所存在的其他内容。

 

 

单元清理

要清理环境以便学习下一个单元,请关闭浏览器和 URL Stress 程序。

 

结束语


在本单元中,您发现了影响 Web 服务器性能的问题。IIS 服务器面临着大量 HTTP GET 请求。通过使用 vRealize Operations 警示和 vRealize Log Insight,您得以能够查看日志并确定所发生的情况。确定根本原因后,系统将信息提供给了其他团队,以供他们查看并用于修复 IIS 服务器服务。


 

您已完成第 2 单元的学习

 

祝贺您!您已经完成了本单元的学习。

如果您要查找有关 vRealize Operations 的更多信息,请访问 https://www.vmware.com/cn/products/vrealize-suite.html

如果您想要跳到特定单元,请单击以下链接之一。

或者,如果您想结束对实验室的学习,

  1. 请单击页面顶部的“END”(结束)按钮。

 

第 3 单元 - 使用 vRealize Operations 的 Endpoint Operations 功能监控应用和操作系统(45 分钟)

简介


在本单元,我们将了解 vRealize Operations 中的端点运维 (EPOps) 适配器。

如您所知,您可以通过适用于 vRealize Operations 的 vCenter 适配器对虚拟化基础架构的所有层进行详细监控,这些层包括虚拟机、主机、集群、数据存储和虚拟网络连接。虽然它还提供一些关于客户机的有限洞察数据(如磁盘空间利用率),但它缺乏一些特定于操作系统的指标。

这正是端点运维适配器的用武之地。端点运维适配器利用客户机操作系统内部的 Java 代理,这便可以显示特定于操作系统的指标,如操作系统 CPU 使用率、内存使用率和交换。

端点运维的另一项至关重要的功能是无需在虚拟机上运行。您可以在物理硬件上安装代理(只要操作系统受支持),并将物理机性能指标引入 vRealize Operations 单一窗口中。


 

方法

 

vRealize Operations 通过 API 向 vCenter 进行查询,以此来收集有关虚拟机的信息。在安装端点运维适配器时,您可以使用操作系统内的指标补充通过 vCenter 收集的数据。

此操作可通过在计算机(虚拟或物理)上安装代理完成。Java 代理可向操作系统和硬件进行探询并将数据发回到 vRealize Operations。对于在 vSphere 虚拟机中运行的操作系统,vRealize Operations 会将虚拟机对象链接到操作系统对象,因此,您可以根据以下两点来查看它们并构建仪表盘和警示:来自 vSphere 层和操作系统层的指标及已发现的属性。

 

登录 vRealize Operations 实时实例


本实验室环境运行着三个不同的 vRealize Operations 实例和一个 vRealize Log Insight 实例。我们使用不同的 vRealize Operations 实例,旨在处理具有独特要求的不同用户场景。下面列出了各种实验室实例:

  • 实时实例:连接到实验室中运行的小型 vSphere 环境。此实例中没有庞大的对象清单,但是支持我们与 vCenter 交互。
  • 历史实例:运行时长 30 分钟的数据循环,这些数据是过去捕获的。这种实例具有更庞大的对象清单,但是由于它目前没有连接到 vCenter,我们无法执行任何操作。
  • Blue Medora 管理包:这种实例也在历史模式下运行,它具有来自 Blue Medora 的大量管理包,使我们能够查看来自相邻基础架构(存储和物理服务器)的信息,以及操作系统和应用信息。

在本课中,我们将使用 vRealize Operations 的实时实例。

如果您已登录 vRealize Operations 的实时实例,请单击


 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

如果您的浏览器尚未打开,请启动 Google Chrome

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标

 

 

打开 vRealize Operations - 实时实例标签页

 

浏览器主页包含实验室中运行的不同 vRealize Operations 实例的链接。

  1. 单击“vRealize Operations - Live Instance”(vRealize Operations - 实时实例)链接以在新浏览器标签页中打开 UI

 

 

登录 vRealize Operations

 

vRealize Operations 已与我们将在此实验室中用于执行用户身份验证的 VMware Identity Manager 集成。

应预先选择“VMware Identity Manager”作为身份标识源。但如果没有选择,则应进行选择。

单击下拉箭头

  1. 选择“VMware Identity Manager”
  2. 单击“REDIRECT”(重定向),这将使您进入用户登录页面

 

 

 

VMware Identity Manager 登录

 

用户和密码信息应已填充完毕。但如有需要,则请输入这些信息。

用户:hol

密码:VMware1!

  1. 单击“Sign in”(登录)

 

探索端点运维


在本章,我们将详细了解端点运维适配器提供的内容及其使用方法。


 

检查实验室准备情况

 

在开始下一部分之前,请进行检查以确保实验室准备就绪。如果实验室尚未准备好,您可能需要等待几分钟,实验室的状态才会显示为“Ready”(准备就绪)。

 

 

登录 vRealize Operations Manager 实时实例

实验室环境包括三个 vRealize Operations Manager 实例。其中两个实例被配置为在特殊模式下运行,这使得它们可以重放以往收集的数据。在本实验室单元中,我们将使用 vRealize Operations 的实时实例。

 

 

启动 Chrome 浏览器

 

要启动 Chrome 浏览器,请执行以下操作:

  1. 单击 Windows 任务栏上的 Chrome 图标。

 

 

打开 vRealize Operations UI

 

  1. 单击“Live vRealize Operations”(实时 vRealize Operations)快捷方式或“vRealize Operations Manager - Live Instance”(vRealize Operations Manager - 实时实例)超链接,以打开 vRealize Operations 登录页面。

 

 

选择身份验证源

 

您将看到用于登录 vRealize Operations 的不同身份验证源选项。在我们的实验室中,我们已将 VMware Identity Manager 配置为使用 Active Directory 进行身份验证,并已将 vRealize Operations Manager 配置为使用 VMware Identity Manager 作为身份验证源。这样一来,便可以在实验室中实现单点登录体验。

  1. 单击下拉菜单将其展开。
  2. 选择“VMware Identity Manager”作为身份验证源。
  3. 单击“Redirect”(重定向)按钮。

 

 

确认凭证

 

以下帐户信息应已填写完毕。如果尚未填写,请键入或选择以下信息(这是我们将用于登录的 Active Directory 帐户):

用户名:hol

密码:VMware1!

域:corp.local

  1. 验证信息是否已填写好。
  2. 单击“Sign in”(登录)按钮。

 

 

查找操作系统对象

 

让我们查找一个内置端点运维代理的操作系统对象。我们可以了解一下详细操作步骤

  1. 单击放大镜以展开右上角的搜索字段,然后键入 w12
  2. 在列表中向下滚动,然后选择“base-w12-01.corp.local”,如屏幕截图所示。

您将转到该操作系统对象的“Summary”(摘要)页面。请切记,此处的所有内容都是端点运维代理从操作系统收集的或根据操作系统中的信息计算得出的。

 

 

定位操作系统关系和指标

 

要查看 vRealize Operations Manager 自动为该操作系统对象创建的关系,请执行以下操作:

  1. 单击“All Metrics”(所有指标)选项卡。
  2. 单击“Show Object Relationship”(显示对象关系)向下箭头。

 

 

查看操作系统关系和指标

 

顶部面板是一个关系树,显示了操作系统对象及其父项和子项。

  1. 这阐明了 vRealize Operations Manager 如何自动构建和维护虚拟机的 vCenter 表示形式和它的操作系统之间的关系。
  2. 依次展开“All Metrics”(所有指标)和“UTILIZATION”(利用率)类别,然后双击“Percent Used Memory (%)”(使用的内存百分比 [%])

关于内存使用情况(从操作系统的角度而言)的图表应该显示在指标列表的右侧。

如果您看不到右侧的图表,请再次双击“Percent Used Memory (%)”(使用的内存百分比 [%])指标

 

 

添加进程监控

 

除了标准操作系统指标(如 CPU 和内存利用率)以外,您还可以监控计算机上运行的具体进程。这样一来,您便可以按进程了解进程级别的可用性和利用率。

您可以使用简单的查询语言选择希望监控的进程。您可以使用进程名称、程序路径、pid 文件、pid 和一些其他条件进行搜索。在本示例中,我们将查看 VM Tools 进程。为此,我们将匹配进程名称中包含字符串“vmtoolsd”的所有内容。“State.Name.ct”中的“ct”运算符表示“包含”。如果您需要完全匹配的内容,可以使用“eq”(表示“相同”)。

要添加进程监控,请执行以下操作:

  1. 单击“Actions”(操作)下拉菜单。
  2. 选择“Monitor OS Object”(监控操作系统对象)。
  3. 选择“Monitor Processes”(监控进程)。此时将弹出一个对话框。

 

 

创建进程监控

 

我们想要监控在 web-01a.corp.local 虚拟机 的 Linux 操作系统中运行的 VM Tools 进程。进程监控查询将查找名称中包含字符串“vmtoolsd”的进程。

  1. 在“Display Name”(显示名称)字段中,输入 VM Tools
  2. 在“process.query”字段中,输入 State.Name.ct=vmtoolsd
  3. 单击“OK”(确定)

UI 将会更新。

 

 

展开关系

 

  1. 选择“All Metrics”(所有指标)
  2. 单击下拉菜单以显示各种关系。

 

 

新进程监控

 

您需要放大一点,因为此操作系统上还有许多组策略设置。

  1. 选择“base-w12-01.corp.local”操作系统。
  2. 选择您刚定义的新进程监控对象“VM Tools”。

请注意,进程监控对象的运行状况指示器最初将为灰色。这是因为代理在该对象上的第一次数据收集尚未执行。

 

 

查看进程指标

 

我们刚刚设置的针对 VM Tools 的进程监控需要花几分钟的时间收集指标。目前,我们只想让您了解它的运行位置。

  1. 单击“Web Service process”(Web 服务进程)图标对象,以将焦点转到该对象上。
  2. 您可以判断哪个对象处于“焦点”状态,因为该对象周围会环绕着一个圆圈。
  3. 现在,下方面板中的指标和属性针对的将是 Web 服务进程

 

 

检查进程指标

 

要查看特定于该进程的指标,请执行以下操作:

  1. 选择“IIS WWW Service”(IIS WWW 服务)图标。
  2. 在左侧的指标列表中,依次展开“All Metrics”(所有指标)和“UTILIZATION”(利用率)组,然后双击“Process Cpu Usage (%)”(进程 CPU 使用率 [%])。您将在右侧看到图表。

您所查看的图表显示了 IIS Web 服务的 CPU 利用率。您也可以在此处监控其他指标或进程可用性。

 

 

 

课程学习完成

祝贺您!在本课中,我们了解了端点运维、创建了进程监控,并查看了新进程的指标。

 

构建应用仪表盘


在实验室的这一部分,我们将使用 vRealize Operations 的实时实例。

作为秘密机构的系统管理员,您必须对环境的 Web、应用和数据库层中可能会影响系统性能的组件进行监控。您应构建一个应用,在每个层中将相关对象组合在一起。如果其中一个对象出现问题,将会反映在应用显示中,您可以打开摘要以便进一步调查问题的根源。


 

定位应用选项卡

 

  1. 单击“Environments”(环境)选项卡
  2. 选择“Applications”(应用)选项卡
  3. 单击加号以启动创建流程。

 

 

选择应用类型

 

  1. 选中“Basic”(基本)单选按钮
  2. 现在,单击“OK”(确定)

 

 

应用名称

 

  1. 让我们将默认值更改为有用的设置:“Field Readiness App”(现场就绪应用)

 

 

移除层

 

我们确定不需要网络层,所以让我们将它删除。

  1. 选择“Network tier”(网络层)
  2. 然后单击“Delete Tier”(删除)按钮

 

 

选择对象

 

  1. 选择您要向其中添加对象的层的名称。
  2. 筛选出 IIS WWW
  3. 选择该服务并将其拖放至“Tier Objects”(层对象)窗口。

对 Web 层中的至少 3 个对象重复执行此操作,对象如“Tier Objects”(层对象)窗口中所示。

 

 

数据库层

 

  1. 选择数据库层
  2. 再次进行筛选,将数据库虚拟机筛选出来并拖放至“Tier Objects”(层对象)中
  3. 使用 app-01a 虚拟机对应用层执行同样的操作

如果需要,您可以重命名每个层名称。

 

 

 

查看我们的新应用仪表盘

 

  1. 让我们返回至“Environment”(环境)选项卡
  2. 然后单击“Applications”(应用)选项卡
  3. 现在,您可以选择我们的新应用仪表盘,然后单击“Field Readiness App”(现场就绪应用)

新应用显示在“Environment Overview Applications”(环境概述应用)页面上的应用列表中。如果任何层中的任何组件出现问题,该应用都会显示黄色或红色状态。

您也可以在此处编辑应用仪表盘。

 

 

 

现场就绪应用概述

 

  1. 您可以在每个对象和我们的 3 层应用下面看到建议的操作。
  2. 选择“All Metrics”(所有指标)

请尽管随意使用此应用。

 

 

在我们的应用仪表盘中显示关系

 

  1. 单击此处的下拉按钮以显示关系

 

 

应用仪表盘的映射视图

 

现在,我们可以看到作为对象显示的 3 层应用仪表盘及其依赖关系。

  1. 双击 Web 虚拟机查看我们在 Web 层中添加的对象。

您可以在这里添加新的应用仪表盘以及要查看其结果的任何对象。

 

 

结束语

应用仪表盘会显示一个对象的性能对同一应用中的其他对象有何影响,并帮助您找到问题的根源。例如,如果您的应用包含能够处理业务销售数据的所有数据库、Web 和网络服务器,则在应用运行状况降级时,您会看到黄色、橙色或红色状态。您可以从应用摘要仪表盘开始,调查会导致或出现问题的服务器。

 

服务发现管理包


vRealize Operations 服务发现管理包 (SDMP) 可发现每台虚拟机中运行的所有服务,然后基于网络通信在各台虚拟机的服务之间建立关联或依赖关系。

请注意,SDMP 并不使用代理。


 

定位服务发现仪表盘

 

  1. 选择“Dashboards”(仪表盘)
  2. 单击“All Dashboards”(所有仪表盘)下拉菜单
  3. 选中“Service Discovery”(服务发现)复选框
  4. 现在,您可以看到已添加到导航栏的列表

 

 

显示关系

 

  1. 从导航窗格中选择“Service Relationships”(服务关系)
  2. 选择服务。在此示例中,让我们选择“Apache HTTP”
  3. 等待来自所选服务的连接填入,并在填入位置检查该连接。
  4. 我们也可以选择所选服务的属性。

 

结束语


在本单元,我们了解了 vRealize Operations 的端点运维功能。涉及的主要主题如下:

  • 端点运维概述
  • 深入研究应用仪表盘创建以及第三层应用中指标的关联。

 

您已完成第 3 单元的学习

 

祝贺您!您已经完成了本单元的学习。

如果您要查找有关 vRealize Operations 的更多信息,请访问 https://www.vmware.com/cn/products/vrealize-suite.html

如果您想要跳到特定单元,请单击以下链接之一。

或者,如果您想结束对实验室的学习,

  1. 请单击页面顶部的“END”(结束)按钮。

 

第 4 单元 - 利用 Blue Medora 管理包将监控范围延展到整个体系(从物理设备到应用)(45 分钟)

简介


对于大多数数据中心运维团队来说,要全面了解其 IT 生态系统的情况很困难。虚拟化和云服务抽象化使得 IT 堆栈不同层之间的跨平台关系变得更加复杂。异构环境和混合环境是常态,这就是可见性成为运维团队如今面临的主要挑战的原因。

VMware 通过 vRealize Operations Manager (vROPS) 为 vSphere 提供了一流的运维管理。Blue Medora 对 vRealize Operations Manager 进行了补充并延展了其功能。在本单元中,我们将使用 Blue Medora 管理包来提供一组强大的仪表盘。


 

管理包

管理包可将 vRealize Operations Manager 的功能延展到第三方产品和技术,以通过数据可视化、仪表盘、报告、警报和操作实现端到端运维智能。此外,管理包还能够以代理插件、内容包或合规性包的形式提供,它们可以将功能延展到混合环境和异构环境,从而在跨应用、计算、存储和网络设备的单个运维控制台中提供全面的可见性。

在整个单元中,我们都将使用位于 Chrome 浏览器中的 Blue Medora 链接

 

登录 vRealize Operations Blue Medora 实例


本实验室环境运行着三个不同的 vRealize Operations 实例和一个 vRealize Log Insight 实例。我们使用不同的 vRealize Operations 实例,旨在处理具有独特要求的不同用户场景。下面列出了各种实验室实例:

  • 实时实例:连接到实验室中运行的小型 vSphere 环境。此实例中没有庞大的对象清单,但是支持我们与 vCenter 交互。
  • 历史实例:运行时长 30 分钟的数据循环,这些数据是过去捕获的。这种实例具有更庞大的对象清单,但是由于它目前没有连接到 vCenter,我们无法执行任何操作。
  • Blue Medora 管理包:这种实例也在历史模式下运行,它具有来自 Blue Medora 的大量管理包,使我们能够查看来自相邻基础架构(存储和物理服务器)的信息,以及操作系统和应用信息。

在本课中,我们将使用 vRealize Operations 的 Blue Medora 管理包实例。


 

从 Windows 快速启动任务栏中打开 Chrome 浏览器

 

如果您的浏览器尚未打开,请启动 Google Chrome

  1. 在 Windows 快速启动任务栏上,单击“Chrome”图标

 

 

打开 vRealize Operations - Blue Medora 管理包标签页

 

浏览器主页包含实验室中运行的不同 vRealize Operations 实例的链接。

  1. 单击“vRealize Operations Manager - Blue Medora Management Packs”(vRealize Operations Manager - Blue Medora 管理包)链接以在新浏览器标签页中打开 UI

 

 

登录 vRealize Operations

 

  1. 如果默认设置不是“Local Users”(本地用户),请单击所显示的下拉菜单,然后单击“Local Users”(本地用户)

输入用户凭证。用户名为 admin,密码为 VMware1!

  1. 单击“LOG IN”(登录)。

 

 

Microsoft SQL Server 运行状况


在本单元中,我们将了解数据库监控。请注意,我们将要查看的并不是实时数据,而是专为本动手实验室制作的历史数据。

在本课中,我们将使用 Blue Medora HVM。


 

查找运行缓慢的查询

 

  1. 选择“Dashboard”(仪表盘)
  2. 选择“All Dashboards”(所有仪表盘)
  3. 选择“Microsoft SQL Server”
  4. 单击“Microsoft SQL Server Query Plan”(Microsoft SQL Server 查询计划)

 

 

 

在 vROPS 中查看数据库查询输出

 

在近期的一个任务中,一个 Spectre 代理无法将数据下载到移动设备中,并因此而无法在之后完成该任务。我们需要弄清楚为何会花如此长的时间。我们的 NOC 团队收到了一条警示,但他们并未向任何随时待命的工程师提及。警示指出数据库中的查询运行缓慢。

  1. 您可以选择想要查看的任一数据库服务器并找到性能较差的一个。
  2. 平均执行时间已按耗时最长的查询排序。
  3. 我们将使用该查询来了解为何会花如此长的时间
  4. 实际的查询文本位于 vROPS 仪表盘中!

滚动至 vROPS 仪表盘的底部以进入下一页。

 

 

分析查询

 

如果看一下此处的所有异常情况,便会发现一个嵌套循环会消耗整个事务的 22%。在本例中,您不是数据库管理员,但您可为数据库管理员团队创建一项任务来优化此查询,以便去掉这一嵌套循环。代理到访并感谢您快速找到原因。

  1. 找到“Nested Loops (Inner Join) Cost 22%”(嵌套循环 [内连接] 开销 22%)并将鼠标悬停在上面
  2. 在这里可以看到运算符开销

 

 

节省的时间

向您之前付出的努力表示感谢,由于您安装了此管理包,之后又使用了此即时可用的仪表盘,您为自己和公司节省了数个小时因设法查找这一异常情况而花费的工作时间。您现在可以向数据库管理员展示您认为可能存在问题的地方,并且您有证据。 

 

 

结束语

本次课非常短。我们只是想展示将管理包添加到 vRealize Operations Manager 中所具有的强大功能及其实用性。

 

应用的总体运行状况


MSSQL 工作负载托管在 VMware、Hyper-V 以及 Docker 上。IT 运维部门需要并行查看这些工作负载的 KPI。

在本课中,我们将使用 Blue Medora HVM。


 

MS SQL 异构基础架构概述

 

  1. 选择“Dashboards”(仪表盘)选项卡
  2. 向下滚动并选择“MS SQL Heterogenous Infrastructure overview”(MS SQL 异构基础架构概述)

 

 

并行查看 KPI

 

  1. 选择任意一个“Server Instances”(服务器实例)
  2. 您可以查看您选择的每个服务器实例的相应情况,实例会显示不同的“VM/Container List”(虚拟机/容器列表)

在这里,我们可以看到虚拟机和容器与它们的指标之间的关系。之后,我们可以看到要识别问题而需要了解的所有相关指标,且不需要花时间登录每个实例,登录每个实例会非常耗时。请尽管随意使用此仪表盘。

 

 

结束语

这不是实时实例,并且这里的数据是用于实验室的静态数据,因此,我们将只了解 Blue Medora 管理包可为您提供的功能。

 

Cohesity 关键任务备份


 

  1. 选择“Dashboards”(仪表盘)
  2. 将鼠标悬停在“Cohesity”上
  3. 选择“Cohesity Protected VMs”(Cohesity 保护的虚拟机)

 

深入了解故障对象

 

我们可以在右侧的拓扑图下看到,MSSQL 集群上一些用于备份作业的对象运行不正常。

  1. 在拓扑图中双击“MSSQLCluster”

 

 

查看警示

 

  1. 单击警示链接“Virtual machine disk I/O write latency is high”(虚拟机磁盘 I/O 写入延迟较高)

 

 

查看建议的操作

 

  1. 在这里可以看到具体的故障。总线共享导致快照故障。

 

 

结束语

在这里,我们了解了可使用 vRealize Operations 和 Blue Medora 监控的第三方备份解决方案。vRealize Operations 是一种多功能工具,它可以使用第三方管理包,这让它成为了 IT 部门的必备工具。

 

结束语


在本实验室中,我们了解了 vRealize Operations 中安装的第三方管理包所带来的价值。对于那些没有时间根据自己公司所用技术构建仪表盘的企业而言,这是一项巨大好处。


 

您已完成第 4 单元的学习

 

祝贺您!您已经完成了本单元的学习。

如果您要查找有关 vRealize Operations 的更多信息,请访问 https://www.vmware.com/cn/products/vrealize-suite.html

如果您想要跳到特定单元,请单击以下链接之一。

或者,如果您想结束对实验室的学习,

  1. 请单击页面顶部的“END”(结束)按钮。

 

总结

感谢您参加 VMware 动手练习。 请务必访问 http://hol.vmware.com/ 继续完成在线练习。

练习 SKU: HOL-1901-04-CMP

版本: 20190103-183729