案例研究

CSI的圣骑士监控从一个主要的电子邮件故障中拯救了一个客户,并允许我们主动处理另一个电子邮件故障问题

CSI的 圣骑士远程监控 解决方案在周三的一个小时内发现了两起主要的Exchange 2010电子邮件危机. 其中一个受影响的用户不到700人,另一个约有1350人.

第一件事是圣骑士给了我们一个叫做“反压”的交换警报. Exchange认为,根据它所消耗的服务器资源(RAM和磁盘空间)的速度,它将无法完成工作. 然后Exchange试图保护核心. 它通常首先做的事情是关闭进出Exchange服务器的电子邮件流. 这就回避了这样一个问题:“你怎么知道你发送的邮件没有收到呢?? 你怎么知道你发送的邮件没有被接收? 圣骑士 知道. 由于CSI积极地监视警报控制台,并不仅仅依赖于对我们的客户的自动警报, 我们采取了“老派”的方式,拿起电话,与不知道他们不能得到的合适的人交谈
电子邮件. 我们与他们合作解决了这个问题. 只需对虚拟环境进行简单的资源分配更改,并进行快速重启,这700个用户就可以继续做他们所做的事情,而不必担心, “beat365网电子邮件关闭了??”

当我们结合 圣骑士的监控圣骑士邮件国防,我们可以做得更好. 圣骑士邮件国防 为我们提供了24x7x365的短信提醒,当邮件流入和流出电子邮件服务器停止和开始. 如果停机是由于真正的灾难情况, 圣骑士邮件国防 立即切换到灾难恢复模式,在这种模式下,无法发送到邮件服务器的客户端入站电子邮件可以通过web立即可用. 邮件服务器可能已经瘫痪或者大楼被毁, 但如果你能找到上网的地方, 您仍然可以发送和接收关键的电子邮件,直到任何糟糕的情况得到解决. 如果情况是暂时的, 圣骑士邮件国防 是否会在连接重新建立后自动重启入站和出站邮件流,然后通过短信通知所有人正常的邮件流再次工作.

第二个Exchange事件发生在第一个事件后一个小时. 不幸的是,Exchange服务器提供的访问权限大约为1,350个用户有一个高CPU条件. 这将导致用户性能下降. 没有任何警告. 前一分钟还很正常. 下一分钟就糟了. 圣骑士 提醒我们. 当客户的电话响了起来,报告Exchange中出现了奇怪的性能问题时,我们已经在调查中断了. 在这种情况下,我们无法防止性能的下降. 没有人能一直这样做. 然而,在我们的客户知道有一个紧急问题之前,我们就知道了. 我们积极主动地解决问题,尽可能快地减少停机时间. 活动开始大约20分钟后,我们解决了问题,每个人都回去工作了. 在这个紧急警报中,我们从警报到行动的反应时间大约是三分钟.

你不可能知道你的网络正在发生的或将要发生的所有事情. 通过覆盖24 x7x365 圣骑士远程监控 我们可以为您提供了解您的网络的能力,这是您自己不可能了解的. 通过覆盖 圣骑士邮件国防 我们可以为您的关键电子邮件通信提供额外的灾难恢复保护层. 关于你的网络,你怎么知道你不知道什么?

CSI的圣骑士监控节省了另一个客户端过多的停机时间

CSI的 圣骑士远程监控 解决方案在过去几天有一个令人印象深刻的拯救.

上周我们有一个ISP去现场,在几个小时后做了一个例行的硬件升级/交换. 这次中断是计划好的,也是预料之中的. 这是一个快速进出和返回在线. 圣骑士 看到客户端站点离线(按照计划). 然而,该网站再也没有恢复. 时间一去不复返. 小时过去了. 很明显,事情出了严重的问题. 如果这种情况持续到明天早上,我们的委托人就会出事. 有2,100个用户坐在这个连接后面——如果这个问题不解决,很多人会很生气. 我们在下班后给相关人员打了适当的电话,大约在晚上10:45 ISP重新访问了客户,并迅速解决了升级造成的连接问题. 最终用户甚至不知道发生了中断. 负责那个网站的人知道是因为 圣骑士 是24x7x365监控那个地点,不管他们是否站在那里. 我们知道不能只依赖自动的“你下线了”警报,因为我们非常努力地与客户进行互动讨论,并尽最大努力让他们保持健康. 在这种情况下,是几个小时后, 实时“人”监控——只是为了确保一切顺利. 你不可能知道你的网络正在发生的或将要发生的所有事情.

通过覆盖24 x7x365 圣骑士远程监控 我们可以为您提供了解您的网络的能力,这是您自己不可能了解的. 有太多的数据需要筛选. 在这两种情况下,我们都能够发现实质性的问题,并在它们成为导致大量用户不满的主要危机之前解决它们.

关于你的网络,你怎么知道你不知道什么?

CSI通过飓风艾琳监控我们客户的网络

当飓风艾琳接近纽约时, CSI使用我们的24x7x365帕拉丁监测服务帮助我们的客户准备他们的电脑和网络即将到来的飓风. 我们能够迅速识别所有管理下的不间断电源(又名电池)有坏电池或其他硬件问题. 插在这些电池单元上的设备受到的功率波动比正常情况下要大.

一个客户网站打算在风暴期间关闭全部业务. 在他们关闭他们的设备之前,我们发现了一个服务器,该服务器在RAID阵列中有坏驱动器和其他硬件问题. 我们担心的是,由于这个关键服务器已经有一个失败的冗余组件和其他问题, 它可能会被关闭,永远无法恢复.

意识到时间是修复服务器的关键, 我们能够使用圣骑士的远程管理工具,在周六中午12点风暴来临时远程连接到服务器,重建冗余驱动器,并在服务器实际关闭之前重新建立完全冗余. 客户从来不用下床. 没人会出现让我们进入大楼, 关闭警报并解锁通往服务器储物柜所需的多个门. 在我们的工作完成之后, 服务器按照客户的计划宕机了,风暴过后又恢复正常了.

在风暴期间,我们主动监控我们客户的网络,并提供积极的状态更新,因为我们看到整个地区的建筑物和服务器由于电力故障而宕机. 通过查看之前的警报和查询电源,我们能够识别“无电源”和实际设备故障之间的区别.

周日风暴平息后,我们能够准确地确定该地区哪些建筑处于关闭状态. 然后当这些建筑恢复运行时我们能够准确地确定每个建筑内的哪些设备没有重新启动. 从那里,我们有一份设备清单,供客户的beat365网人员或CSI的工作人员调查.

周日晚上,我亲自通过圣骑士监控控制台监视我们客户的网络. 在这期间,我家里停电了. 我走到外面,启动了发电机. 然后,我打开笔记本电脑上的Verizon无线卡,没有错过任何节奏.

CSI的办公室有自己充足的备用发电机和良好的网络连接,所以无论风暴情况如何,我们的24x7x365监控都能继续进行.

有一次,尽管洪水肆虐,星期一的早晨还是来了, 一些地区道路关闭和大规模停电,我们的大多数客户重新开始工作,他们的计算机网络运行情况就像他们周五离开去度周末时一样.

这就是《beat365官网》的圣骑士的监控所做的24x7x365.

友情链接: 1 2