云計(jì)算平臺管理的三大利器Nagios、Ganglia和Splunk
2012/4/28 9:08:03

云計(jì)算早已不是停留在概念階段了,各大公司都購買了大量的機(jī)器,開始正式的部署和運(yùn)營。而動輒上百臺的性能強(qiáng)勁的服務(wù)器,為運(yùn)營管理帶來了巨大的挑戰(zhàn)。  如果沒有方便的監(jiān)控報警平臺,對于管理員而言猶如噩夢,每天都將如救火隊(duì)員一樣,飛快地敲擊鍵盤,用原始的Unix命令在多臺機(jī)器中疲于奔命。 如果沒有好的日志管理平臺,對于開發(fā)者Troubleshooting更是一件淚流滿面的事情。 而如果你是運(yùn)維團(tuán)隊(duì)的總負(fù)責(zé)人,簡潔清晰的Report則非常重要。Stakeholder們動不動就可能問起系統(tǒng)的SLA、機(jī)器的利用率等諸多問題,畢竟,公司為此投入了巨大的資金和人力。 
朋友們,當(dāng)我們管理起公司寄予厚望的云計(jì)算平臺時,當(dāng)我們面對如此多充滿挑戰(zhàn)的實(shí)際問題時,該怎么辦?
概述
我們在搭建趨勢云計(jì)算平臺時,遇到了很多的問題和挑戰(zhàn)。開始搭建時,第一次來了那么多性能強(qiáng)勁的機(jī)器,我們在感到興奮的同時,也不免有些顧慮。大家坐在一起討論,問題就列了滿滿一白板。  出了問題怎么辦,有沒有預(yù)警機(jī)制? 有沒有可視化的管理界面? 管理平臺需要自己開發(fā)嗎?開發(fā)難度有多大? 有沒有開源的管理工具? 那么多日志分布在各個機(jī)器上,有沒有更有效的方法管理? 能否生成好的報表? 機(jī)器宕機(jī),管理員能否收到短信通知? 如何做性能調(diào)優(yōu)? 擴(kuò)容升級時,能否給出依據(jù)? 
帶著這些問題,我們開始了自己的云計(jì)算平臺管理和運(yùn)營之旅,一路走來,收獲頗豐。現(xiàn)在基本上形成了如圖1所示的一整套云計(jì)算平臺監(jiān)控體系。 
圖1 云計(jì)算平臺監(jiān)控架構(gòu) 
在這個系統(tǒng)中,我們綜合利用了Nagios、Ganglia和Splunk,搭建起云計(jì)算平臺監(jiān)控體系,使其具備錯誤報警、性能調(diào)優(yōu)、問題追蹤和自動生成運(yùn)維報表的功能。有了這套系統(tǒng),我們終于能夠輕松管理Hadoop/HBase云計(jì)算平臺了。接下來將簡單介紹它們的特點(diǎn)和功能。
Nagios:云計(jì)算平臺的智能報警器
總不能天天盯著機(jī)器看吧,因此我們首先關(guān)心的是機(jī)器的監(jiān)控與報警。最理想的境界是:如果機(jī)器出故障了,我能第一時間處理;如果機(jī)器沒有問題(最好永遠(yuǎn)沒有問題),我能去喝茶、釣魚和睡大覺。
發(fā)現(xiàn)機(jī)器有沒有問題,對我們而言不是什么難事。寫個腳本,Ping一下IP,Telnet每臺機(jī)器的Service端口,如果增加了新機(jī)器就改改配置即可。但這樣也太原始了吧,可視化效果差,不好維護(hù),沒有層次,不好管理,出不來報表,總不能老是用Excel人工寫報表吧。有沒有更好的方法呢?
有,你可以用Nagios。
Nagios是一個可運(yùn)行在Linux/Unix平臺之上的開源監(jiān)視系統(tǒng),可以用來監(jiān)視系統(tǒng)運(yùn)行狀態(tài)和網(wǎng)絡(luò)信息。Nagios可以監(jiān)視所指定的本地或遠(yuǎn)程主機(jī)以及服務(wù),同時提供異常通知功能。
Nagios可以提供以下幾種監(jiān)控功能。  監(jiān)控網(wǎng)絡(luò)服務(wù)(SMTP、POP3、HTTP、NNTP、Ping等)。 監(jiān)控主機(jī)資源(處理器負(fù)荷、磁盤利用率等)。 簡單的插件設(shè)計(jì)使得用戶可以方便地擴(kuò)展自己服務(wù)的檢測方法。 并行服務(wù)檢查機(jī)制。 具備定義網(wǎng)絡(luò)分層結(jié)構(gòu)的能力,并使用“parent”主機(jī)定義來表達(dá)網(wǎng)絡(luò)主機(jī)間的關(guān)系,這種關(guān)系可被用來發(fā)現(xiàn)和明晰主機(jī)宕機(jī)或不可達(dá)狀態(tài)。 當(dāng)服務(wù)或主機(jī)問題產(chǎn)生與解決時將告警發(fā)送給聯(lián)系人(通過電子郵件、短信、用戶定義方式)。 具備定義事件處理功能,可以在主機(jī)或服務(wù)的事件發(fā)生時獲取更多問題定位。 自動的日志回滾。 可以支持并實(shí)現(xiàn)對主機(jī)的冗余監(jiān)控。 可選的Web界面用于查看當(dāng)前的網(wǎng)絡(luò)狀態(tài)、通知和故障歷史、日志文件等。 
Nagios最好用的地方就是它將這些每天管理員做的工作自動化,你只需設(shè)定好要監(jiān)聽的端口即可,它會默默地工作,幫忙定時地去檢測服務(wù)端口的狀態(tài),一旦發(fā)現(xiàn)問題,會及時發(fā)出報警。報警可以是電子郵件也可以是手機(jī),從而使得管理員第一時間就能收到系統(tǒng)的狀況。
Nagios的報表功能也很強(qiáng)大。管理員可以很

下一頁
返回列表
返回首頁 主站蜘蛛池模板: 亚洲最大激情网| 国产人妖tscd合集| www.jizz在线观看| 日本pissjapantv厕所自| 国产无遮挡又黄又爽在线视频| a级国产乱理伦片在线观看| 新疆女人啪啪毛片| 久久青草精品38国产免费| 欧美日韩在线视频一区 | 被夫上司持续侵犯7天| 国产精品xxx| 97人妻人人揉人人躁人人| 日韩毛片无码永久免费看| 午夜欧美精品久久久久久久| 香蕉视频黄色在线观看| 国产精品人成在线播放新网站 | 日本三级视频网站| 久热这里只精品99国产6_99| 欧美换爱交换乱理伦片免费观看| 人妻少妇精品视频一区二区三区| 精品无码一区二区三区水蜜桃| 国产亚洲精品美女久久久久| 国产精品视频你懂的| 国产精品久久福利网站| 中文字幕5566| 日本特级淫片免费| 九九久久精品国产AV片国产| 欧美影片一区二区三区| 亚洲精品电影在线| 男人j桶进女人p无遮挡免费 | 久久国产真实乱对白| 国产精品亚洲а∨天堂2021| 91香蕉国产在线观看人员| 天堂中文资源网| www..99557c..com| 成年在线网站免费观看无广告| 久久久精品波多野结衣| 日韩大片在线永久免费观看网站| 亚洲av永久无码精品三区在线| 欧美人与动zozo欧美人z0| 亚洲妇女水蜜桃av网网站|