案例研究

CSI的圣骑士监控将一个客户端从一个重大的电子邮件中断中拯救出来,并允许我们主动地处理另一个电子邮件中断问题

CSI的 圣骑士远程监控 周三,解决方案在一个小时内揭露了两起主要的Exchange 2010邮件危机. 其中一个影响不到700名用户,另一个影响约1350名用户.

第一个事件是圣骑士给了我们一个叫做“反压力”的交换警告. 根据服务器资源(RAM和磁盘空间)的消耗速度,Exchange认为它将无法完成它的工作. 然后Exchange试图保护核心. 它通常首先做的事情是关闭进出Exchange服务器的电子邮件流. 这就回避了问题,“你怎么知道你发出的邮件有没有送达?? 如何知道发送的邮件是否没有收到? 圣骑士 知道. 因为CSI积极地监视着警报控制台,而不是完全依赖于对客户的自动警报, 我们走的是“老路”,拿起电话与合适的人交谈,但他们并不知道他们得不到
电子邮件. 我们和他们一起解决了这个问题. 只需简单地改变虚拟环境的资源分配,然后快速重启,这700名用户就可以继续做他们所做的事情,而无需担心, beat365网电子邮件是关闭的?”

当我们结合 圣骑士的监控圣骑士邮件国防我们可以做得更好. 圣骑士邮件国防 为我们提供24x7x365短信文本提醒时,邮件流进入和离开电子邮件服务器停止和启动. 如果停电是由真正的灾难造成的, 圣骑士邮件国防 立即切换到灾难恢复模式,无法发送到其邮件服务器的客户端入站电子邮件立即通过web可用. 邮件服务器可能已死或建筑物被毁, 但如果你能找到上网的地方, 你仍然可以发送和接收重要的电子邮件,直到任何糟糕的事情被解决. 如果情况是暂时的, 圣骑士邮件国防 只要重新建立连接,就会自动重启入站和出站邮件流,然后通过SMS通知所有人,正常的邮件流重新工作了吗.

第二个Exchange事件发生在第一个事件的一个小时之后. 不幸的是,Exchange服务器提供了大约1的访问,350个用户有一个高CPU条件. 这导致用户性能下降. 没有任何警告. 前一分钟还很正常. 下一分钟它就在一个糟糕的地方. 圣骑士 提醒我们. 当客户打电话报告Exchange中出现奇怪的性能问题时,我们已经在调查故障了. 在这种情况下,我们无法防止性能下降. 没人能一直这么做. 然而,在我们的客户知道有一个紧急问题之前,我们已经知道了. 我们积极努力,以尽快解决问题,减少停机时间. 活动开始大约20分钟后,我们解决了问题,每个人都回去工作了. 从警报到采取行动,我们的反应时间大约是三分钟.

你不可能知道你的网络正在发生或即将发生的一切. 通过覆盖24 x7x365 圣骑士远程监控 我们可以为你提供了解你的网络的能力,这是你自己不可能知道的. 通过覆盖 圣骑士邮件国防 我们可以为您的关键电子邮件通信提供一个附加的灾难恢复保护层. 你怎么知道你不了解你的网络呢?

CSI的圣骑士监控为另一个客户节省了过多的停机时间

CSI的 圣骑士远程监控 Solution在过去的几天里有一个令人印象深刻的扑救.

上周我们有一个ISP去现场,几个小时后做例行的硬件升级/交换. 中断是计划和预期的. 这是一个快速进出和返回在线. 圣骑士 看到客户端站点脱机(按计划). 然而,网站再也没有回来. 时间过去了,它仍然没有回来. 小时过去了. 显然,出了什么可怕的事. 如果这种情况持续到早上,我们的委托人就会遭遇不幸. 有2,100个用户坐在这个连接后面——如果这个问题得不到解决,他们中的许多人会非常生气. 我们给相应的人打了适当的下班电话,大约晚上10:45 ISP重新访问了客户端,并迅速解决了他们升级带来的连接问题. 最终用户甚至不知道发生了中断. 那个网站的负责人知道是因为 圣骑士 不管他们是否站在那里,他们都在24 × 7 × 365地监控那个站点吗. 我们知道,不能仅仅依赖自动的“你关机了”警报,因为我们非常努力地与客户进行互动讨论,并努力让他们保持健康. 在这种情况下,是在几个小时之后, 实时“人”监控——只是为了确保一切顺利. 你不可能知道你的网络正在发生或即将发生的一切.

通过覆盖24 x7x365 圣骑士远程监控 我们可以为你提供了解你的网络的能力,这是你自己不可能知道的. 要筛选的数据实在太多了. 在这两种情况下,我们都能够发现重大问题,并在它们成为导致大量用户不满的主要危机之前进行处理.

你怎么知道你不了解你的网络呢?

CSI通过飓风艾琳监控客户网络

随着飓风艾琳逼近纽约, CSI使用我们的24x7x365圣骑士监控服务来帮助我们的客户为即将到来的飓风做好电脑和网络的准备. 我们能够快速识别管理下的所有不间断电源(又名电池),其中有坏电池或其他硬件问题. 插入这些电池单元的设备比正常情况下更容易受到电力波动的影响.

一个客户网站打算在风暴期间关闭他们的整个运营. 在他们关闭他们的设备之前,我们发现了一个服务器,因为RAID阵列中的坏驱动器和其他硬件问题而受到损害. 我们担心的是,由于这个关键服务器已经有一个失败的冗余组件和其他问题, 它可能会被关闭,永远不会再上线.

意识到时间对于修复服务器至关重要, 我们能够使用圣骑士的远程管理工具,在周六中午12点,当风暴接近时,远程连接到服务器,在服务器真正关闭之前重建冗余驱动器并重新建立完全冗余. 客户从来不用下床. 没人能让我们进去, 关掉警报器,打开服务器壁橱所需的多个门. 在我们的工作完成之后, 服务器像客户端计划的那样宕机了,但风暴过后又恢复正常.

在风暴期间,我们主动监测客户的网络,并提供了活跃状态更新,因为我们看到整个地区的建筑和服务器由于断电而出现故障. 通过查看以前的警报和查询电源,我们能够识别“无电源”和实际设备故障之间的区别.

周日风暴平息后,我们准确地确定了该地区哪些建筑离线. 然后,随着这些建筑重新上线,我们能够准确地确定每座建筑内的哪些设备没有重新启动. 在那里,我们有一个设备列表,供客户的beat365网人员或CSI的工作人员进行调查.

周日晚上,我通过圣骑士监控控制台观看了我们客户的网络. 在这中间,我家里停电了. 我走到外面,启动了我的发电机. 然后我打开我笔记本电脑上的Verizon无线卡,没有错过任何一个节拍.

CSI的办公室有充足的备用发电机和良好的互联网连接,因此无论风暴情况如何,我们都能持续进行24 × 7 × 365的监控.

有一次,尽管洪水泛滥,星期一的早晨还是到来了, 道路关闭和一些地区的大规模停电,我们的大多数客户回到工作,他们的计算机网络运行,就像他们在周五周末离开时一样.

这就是CSI的圣骑士的监控所做的24x7x365.