大佬教程收集整理的这篇文章主要介绍了linux – 集群机器管理,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在寻找的东西可以:
>获取一组将托管我的服务的Linux机器作为输入,
>获取每项服务的实例数量,
>自动将服务部署到Linux机器上,
>根据某些预定义规则检测并响应故障(重新启动,在备份计算机上安装服务等).
有什么建议?
@H_489_2@第4项有点困难 – 你需要一个监控系统(在这里查看,或者询问谷歌.你会收到很多建议),如果你想要自动回复,你的监控系统将不得不提供其他一些系统来接受行动.
这不需要太复杂 – 我使用InterMapper实现了类似的功能:当检测到故障时,InterMapper运行一个“命令行通知程序”来指定发生故障的系统.命令行通知程序只是一个sHell脚本,它将系统名称作为参数并重新启动它,如果重新启动失败则发送一封电子邮件.
以上是大佬教程为你收集整理的linux – 集群机器管理全部内容,希望文章能够帮你解决linux – 集群机器管理所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。