|
最近一切都还顺利,但是难度有点大。遇到的问题很难在这里发表。因此最近很少发表言论。呵呵请原谅。
可以谈谈其他方面的问题,就是信息化后系统管理员的水平问题。
刚过来的时候,就觉得我们这里的硬件维护(客户端、服务器、网络)有点问题。但是总感觉大家都在公司工作了三年以上的时间,并专职从事系统维护。因此就想当然的认为,他们的技术水平应该不错,有一定的工作经验。因此只需帮助他们整理一下工作的方法就应该能够适应信息化后的系统维护需要。
但是事实证明我想错了。
过来半年多了,一开始我以为仅仅是服务器的管理有问题,从公司的应用情况来看,虽然有一些应用,例如:门禁系统,OA系统,文件共享与备份系统,公司的网站和邮件、和域服务器等等。在加上新增加的PLM、ERP等系统,一共有十一台服务器,一般是一个应用占用一个服务器。因此希望系统管理员将服务器的硬件和安装的应用程序给出一个清单,以便协助他们进行应用分析,优化一下应用,将服务器资源更加合理的加以利用。为新增加的ISA和Exchange,Project等应用留出一些资源。
没想到他们根本对服务器的硬件配置很不了解,都是根据开发商的要求购买的,因此对服务器的很多情况都不了解。我要求的文档迟迟拿不出来。
可是看着他们一天到晚的忙,并且忙得不可开交,整天忙于客户端出现的各种问题,所以改变策略,要求他们从客户端开始进行梳理,全面整理公司的PC机和应用软件。虽然好像也按要求做了,但是过了一段时间,还是问题不断。居然只有近200台计算机的局域网,竟然把3个人忙得不亦乐乎。
也怪我,每当发生问题后,我追问问题解决的怎么样,都是告诉我已经解决了。我想当然的就认为确实没有问题了。
可是同类的问题一直不断,并且没有好转的趋势,根据我的经验,我提出的一系列解决办法肯定是有效的,不应该是这样的结果。确实让我大惑不解,到底是怎么回事?
由于一直忙于ERP和PLM的个方面的协调和推动工作,因此一直没有深入了解问题的真正原因。
上周由于OA系统出现了问题,并在副总协调会上大家都反映OA系统最近很慢,几乎打不开。我终于忍不住了,就深入了解了一下情况,发现很多他们告诉我已经解决的问题,其实仅仅是临时性的措施,甚至有些就是在制造新的问题。
看到这种情况不由得让我十分愤怒。把硬件小组好好批评了一顿,我当时的感觉就是他们根本就不负责任,结果批评完了以后,发现他们的工作更混乱了。
出现这种情况,一方面让我更加愤怒,一方面也让我感到十分的困惑。
愤怒的是,有多年工作经验的一组人居然拿不出一个合理的解决办法来。并且还在互相推诿责任。
困惑的是,我在追问他们的解决问题的过程和办法时,他们总是支支吾吾的,越追问越乱,没有一个清晰的分析问题的思路。
到底是为什么?我什么地方做错了?
周末没什么事情,就到机房打开几台服务器察看了一下,发现问题多多。几乎没有进行任何日常维护。仅在日志文件中就可以发现,很多问题重复出现,根本没有进行任何处理。
看到这种情况,到让我冷静了下来。今天早上抽了点时间,和服务器管理员好好聊了一下,发现了几个问题。
第一个问题就是他们的基础知识太有限了。虽然每天都在忙,但是根本就是在救火,出了严重点的问题就会重装系统,一般问题也没有很好的深入分析问题发生的原因,一般的处理方法就是,临时找一个办法,只要问题不出现了就认为解决了。
其次是对什么是“解决了”这个词汇的理解有根本性的不同,他们告诉我解决了,其实仅仅是问题暂时不出现了。我理解的解决了就是问题发生的原因已经找到了,并且彻底解决了。
举个例子:
由于原来OA系统是由单独的一台服务器承担的,后来根据我的要求,将OA的应用程序和数据库分别放在两台服务器上,他们认为现在OA系统慢的原因,是由于分开两台服务器了,并且两台服务器的千兆网卡是用百兆交换机进行连接的,因此慢的原因是交换机不能满足千兆网卡的传输要求,所以就将OA又合并到一台服务器上了。我周末打开服务器发现,有的服务器配置很高,但是CPU和内存资源仅用了10%以下。
但是OA的那台服务器仅有1G的内存,居然内存占用竟达到了1.8G。CPU占用达到80%以上。
经测试,OA系统慢的主要原因是由于不知道什么原因(到现在还没有找出来,但肯定不是网络的原因),网卡的传输速率仅为5%-7%。因此将OA按应用分配在两台服务器上时速度非常慢。并且还有另外两台服务器也是同样的传输速率。
也就是说,问题的真正原因在于操作系统设置或者应用程序安装的有问题,他们的解决办法会让一台服务器负担过重,最终有可能导致严重的故障。
我终于明白为什么原来布置的工作总也达不到要求了。我有点官僚主义了。没有找到问题的真正原因。
看来需要从头带这支硬件维护的队伍了。不过找到问题的真实原因就好办了。从基础管理做起,我最近一段时间将花一定的时间,跟硬件小组一起分析和解决问题,帮助他们掌握正确的分析和解决问题的方法。让双方在对“解决了”有共同的认识的基础上,一同从基础做起,虽然有点麻烦,但是应该能通过一段时间的训练,逐步改变现在被动的局面。
原来在推广信息系统时,也曾遇到过同类问题,由于我们承担着客户的服务器的维护工作,所以经常在和一些号称有经验的客户系统管理员打交道时,告诉他们如何处理问题的方法后,仍然解决不了问题。我原来一直不理解,认为他们根本不负责任,把所有的问题都推给我们。其实真正的原因就是这些系统管理员的知识水平和结构太有限了。平常大部分时间都是在救火,根本没有时间深入学习有关知识。因此虽然有多年的工作经历,但是其技术水平根本无法适应网络环境下的系统管理要求。
看来信息化真的还有很长的路要走。
|
一共有 0 条评论