linux急救模式_抢救Linux:我如何将组织介绍给Linux

 2023-09-18 阅读 22 评论 0

摘要:linux急救模式 1998年,我管理了明尼苏达大学新网络团队的服务器管理小组。 密西根大学是一个非常大的机构,在所有系统校区中有60,000多名学生。 在那之前,大学在老化的大型机系统上管理学生记录。 但这一切都将改变。 大型机不符合Y2K标准,因此我

linux急救模式

1998年,我管理了明尼苏达大学新网络团队的服务器管理小组。 密西根大学是一个非常大的机构,在所有系统校区中有60,000多名学生。 在那之前,大学在老化的大型机系统上管理学生记录。 但这一切都将改变。

大型机不符合Y2K标准,因此我们正在努力建立由PeopleSoft提供的新的学生记录系统。 新系统在很多方面对大学来说都是一件大事,不仅是为了使我们的记录系统现代化,而且是为了提供新功能。 但是它缺少一个关键功能:您无法从Web浏览器注册课程。

从今天的标准来看,这似乎是一个重大的疏忽,但是在1990年代后期,万维网仍然很新。 亚马逊只有几年的历史。 eBay刚满一岁。 Google最近上线了。 维基百科还不存在。 在上下文中,1998年PeopleSoft不支持通过网络注册课程也就不足为奇了。 但是,作为一所开创性的大学,它起源于Gopher网络并为以前的大型机系统创建了功能性的Web界面,我们认为Web注册是新学生记录系统的关键功能。

linux进入紧急修复模式。 我们在网络团队中的工作是为PeopleSoft构建缺少的网络注册前端。

幸运的是,我们不必一个人做。 我们与IBM签约,在接下来的一年中,我们共同合作构建了新的Web注册系统。 IBM捐赠了用于运行新Web系统的硬件和软件:三个运行最新版本的AIX,IBM Java和IBM WebSphere的SP计算机节点,以及一个单独的IBM负载均衡器,用于在三个节点之间分配流量。

AIX network diagram

经过一年多的开发和测试,我们终于上线了! 不幸的是,这是一个立即的失败。

负载太大

在整个开发过程中,我们无法现实地模拟许多学生立即访问新系统的负担。 但这并不是因为缺乏尝试。 该大学拥有一个自定义的Web负载测试软件包,而IBM用自己的工具对其进行了补充。 但是Web仍然很新,我们还没有意识到Web负载测试工具还不能胜任这项工作。

在使用这两种工具进行了数月的负载测试之后,我们已经对新的Web注册系统进行了调整,预期可容纳240个并发用户。

centos停止服务命令, 不幸的是,我们的实际使用量几乎是原来的两倍。 在系统开始运行的第一天,就有400多名学生同时登录了新的网络注册系统。 由于意外负载,三台Web服务器崩溃了。 我们发现自己不断地重启Web服务器,因为高流量的网络继续压榨它们。 一旦我们重新启动一台Web服务器,下一台将崩溃。 以此类推,适用于整个月的注册期。

如果没有可靠的方式在网络上注册课程,则学生不得不以老式的方式注册课程:前往注册服务商办公室。 登记线沿着走廊走了出去。 坏消息很快就传到了当地新闻上,头条是“计算机故障迫使学生亲自报名”。

Negative headlines about web registration crashes

面对公众的失败,我们竭尽所能改善下一个注册周期(距离六个月之遥)。 我们疯狂地工作以增加Web系统的容量。 尽管进行了许多代码修复和配置调整,但我们仍无法增强系统以充分支持更多用户。 尽我们所能,在下一个注册周期中我们将面临一定的失败。

而且,正如我们担心的那样,Web系统在我们下次注册时再次严重失败。 服务器在巨大的负载下一次又一次崩溃。 这次,新闻头条包括诸如“ Web注册系统毫无价值”之类的瑰宝。

在下一次上线之前还有六个月,我们感到被困。 没有人能弄清楚为什么系统在负载下经常崩溃。 我们知道它将在下一个注册期再次失败。 我们必须做任何事情来改善系统。 但是该怎么办? 每个选项都在桌子上。

如果我们更换平台怎么办?

如何进入linux, IBM最近接受了Linux,发布了Java和WebSphere产品的Linux版本。 所有产品均已通过RHEL(红帽企业Linux)认证,其中有几个已经在我们的桌面系统上运行。 我们意识到,现在我们已经有了生态系统,可以在Linux上作为受支持的平台运行Web注册系统。 但是它在Linux上的性能会比AIX好吗?

设置好测试服务器并运行初始负载测试后,我们惊讶地发现一台Linux服务器可以轻松支持三台AIX服务器所不能提供的支持。 一台运行相同Web注册代码,具有相同IBM Java和IBM WebSphere的Linux服务器可容纳200多个用户。

我们与注册商和CIO分享了我们的发现,他们批准了将Web注册系统迁移到Linux的计划。 这是我们在明尼苏达大学企业中首次运行Linux,但是我们没有损失。 无论如何,AIX系统将再次失败。 Linux是一个远景,但这是我们唯一的希望。

我们立即增加了用于生产的新Linux服务器。 另一个团队的同事将多台英特尔服务器转移到我们的工作中,在那里我们安装了RHEL和IBM组件。 我们在新系统上进行了无数次负载测试,以寻找薄弱环节,只是发现Linux服务器运行平稳。

经过两个月的不安,我们终于上线了。 这是一个巨大的成功! 尽管使用率很高,但Web注册系统在Linux上仍可完美运行。 在该注册期间的高峰期,Linux服务器管理着600多个并发用户,而这只是一点点。 Linux拯救了明尼苏达大学的网络注册。

成功经验

centos启动服务命令, 当我回顾这项大规模的救援行动时,发现了几个可以用来在您自己的组织中介绍Linux的主题:

  1. 解决问题,不要轻描淡写。

当我们提议在企业中运行Linux时,我们之所以没有这样做,是因为我们认为Linux很酷。 当然,我们是Linux的狂热者,我们已经在台式机和家庭中运行Linux,但是我们在那里解决了一个问题。 我们的注册服务商和其他利益相关者赞赏Linux是解决问题的方法,不仅仅是因为Linux很酷,我们还想做的事情。

  1. 尽可能少更改。

我们的成功取决于一个事实,即IBM最终发布了其Linux版的Java和WebSphere产品版本。 当我们从AIX迁移到Linux时,这使我们对系统的更改最小化。 将AIX配置与Linux配置进行比较,仅更改了硬件和操作系统。 系统上的所有其他组件均保持不变。 正是这种“已知的”数量为改变做出了信心。

AIX cost diagram

Linux cost diagram
  1. 对风险和收益诚实。

我们的问题很明显:在我们之前的两个注册周期中,Web注册失败,并且很可能再次失败。 当我们向利益相关者介绍我们的想法,建议我们用Linux代替AIX Web服务器时,我们对预期的风险和收益持开放态度。 最重要的是,如果我们什么都没做,我们将失败。 如果尝试Linux,则可能失败,也可能不会失败。 我们分享了最初的负载测试的结果,这些结果表明Linux成功与失败的可能性更大。

但是,即使Linux失败了,我们也可以轻松地将旧的AIX服务器重新投入生产。 该“后备”准备工作使注册服务机构确信,我们已经适当地衡量了收益和风险,并为万一出问题做好了准备。

  1. 广泛交流。

linux紧急模式。 为了向Linux迁移,我们进行了广泛的交流。 我们写了一份执行白皮书,清楚地说明了我们计划做的事情以及我们认为它会起作用的原因。 该白皮书成功的关键在于简洁。 高管不想阅读有关技术思想的“新手”,也不想沉迷于技术细节。 我们特意为行政级别撰写了白皮书,从广义上描述了我们的提案。

当我们用Linux替换系统时,我们提供了定期更新,以告知利益相关者我们在构建新Linux系统方面的进展。 最终在Linux Web注册系统上线后,我们发布了每日更新,报告有多少学生在新系统上注册了课程,以及是否发现任何问题。

尽管距我们在AIX上的早期失败和Linux的非常成功的实验已经过去了将近二十年,但所有这些教训仍然适用。 当然,Linux在这里完成了繁重的工作,但是我们的整体成功归功于将人们团结在一起解决共同问题的精神。 我认为这是一个教训,几乎可以适用于您遇到的任何情况。

翻译自: https://opensource.com/article/17/7/how-introduced-organization-linux

linux急救模式

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/1/73403.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息