AWS發(fā)布Amazon DevOps Guru

2020-01-07 08:07佚名

中國信息化周報 2020年49期

佚名

近日，AWS發(fā)布了完全托管的運營服務(wù)Amazon DevOps Guru。該服務(wù)利用機器學(xué)習技術(shù)，幫助開發(fā)人員通過自動檢測操作問題和建議補救措施，提高應(yīng)用程序可用性。Amazon DevOps Guru應(yīng)用了支持Amazon.com和AWS的機器學(xué)習技術(shù)，通過自動收集和分析應(yīng)用程序指標、日志、事件和痕跡等數(shù)據(jù)，識別偏離正常操作模式的行為。

當Amazon DevOps Guru識別出可能導(dǎo)致服務(wù)中斷的異常應(yīng)用程序行為時，它將向開發(fā)人員發(fā)出問題詳細信息（例如，涉及的資源、問題時間表和相關(guān)事件等），并通過Amazon Simple Notification Service（SNS）以及Atlassian Opsgenie和PagerDuty等合作伙伴集成服務(wù)來幫助開發(fā)人員快速了解問題的潛在影響，并提出具體的修復(fù)建議。開發(fā)人員利用Amazon DevOps Guru的修復(fù)建議可以有效減少修復(fù)時間，無需手動設(shè)置或機器學(xué)習專業(yè)知識即可提高應(yīng)用程序的可用性和可靠性。

為了擺脫本地部署的限制并向全球擴展業(yè)務(wù)運營，越來越多的組織開始轉(zhuǎn)向基于云的應(yīng)用程序部署和微服務(wù)架構(gòu)，這也導(dǎo)致應(yīng)用程序為滿足客戶需求而變得越來越分散。開發(fā)人員需要更多的自動化方式來維護應(yīng)用程序的可用性，減少花費在檢測、調(diào)試和解決運營問題上的時間和精力。錯誤的代碼或配置更改、不平衡的容器集群或CPU、內(nèi)存、磁盤等資源耗盡帶來的應(yīng)用程序宕機事件將不可避免地導(dǎo)致不良客戶體驗和收入損失。

企業(yè)需要花費大量資金和開發(fā)人員時間來部署多個監(jiān)測工具，而這些監(jiān)測工具通常是分開管理的，并且針對負載平衡器錯誤或應(yīng)用程序請求率下降等常見問題開發(fā)和維護自定義警報。對于希望通過設(shè)置閾值以識別和警告應(yīng)用程序資源異常狀況的企業(yè)來說，不僅很難設(shè)置準確的閾值，涉及諸多手動操作，并且要求閾值必須隨著應(yīng)用程序使用情況的變化而不斷更新（例如，在假日購物季時突增大量請求）。如果閾值設(shè)置得太高，開發(fā)人員在運營性能已經(jīng)嚴重受損前無法收到警報。當閾值設(shè)置得太低時，開發(fā)人員則可能得到過多誤報并最終忽略警報。

即使開發(fā)人員對潛在的操作問題已經(jīng)有所警覺，仍然很難尋找和確認問題根源。使用現(xiàn)有工具，開發(fā)人員通常很難從圖形和警報中確定問題根源，而即使找到根本原因，也往往無法解決問題。每次故障排除都是冷啟動，團隊必須花費數(shù)小時或數(shù)天來識別問題，這種工作既耗時又繁瑣，從而減緩了解決操作故障的時間，并可能延長應(yīng)用程序的中斷時間。Amazon DevOps Guru的機器學(xué)習模型采用了亞馬遜過去20多年為Amazon.com構(gòu)建、擴展和維護高可用應(yīng)用程序的運營專業(yè)知識。這使Amazon DevOps Guru能夠自動檢測運營故障（例如，警報遺漏或配置錯誤，資源耗盡的早期警告，可能導(dǎo)致停機的配置更改等），提供有關(guān)資源和相關(guān)事件的背景，并建議補救措施，而無需開發(fā)人員具備任何機器學(xué)習經(jīng)驗。開發(fā)人員只需在Amazon DevOps Guru控制臺中單擊幾下，即可自動提取和分析所有資源的歷史應(yīng)用程序和延遲、錯誤率、請求率等基礎(chǔ)架構(gòu)指標，以建立操作基線，然后Amazon DevOps Guru就可以開始通過預(yù)先訓(xùn)練的機器學(xué)習模型識別與既定基線的偏差。

當Amazon DevOps Guru分析系統(tǒng)和應(yīng)用程序數(shù)據(jù)以自動檢測異常時，它還將這些數(shù)據(jù)分組為運營洞察，包括異常指標、隨著時間的推移對應(yīng)用程序行為可視化、以及有關(guān)補救措施的建議。Amazon DevOps Guru還將相關(guān)的應(yīng)用程序和基礎(chǔ)架構(gòu)指標（例如Web應(yīng)用程序延遲峰值、磁盤空間用盡、錯誤的代碼部署、內(nèi)存泄漏等）相關(guān)聯(lián)并進行分組，以減少冗余警報并幫助用戶關(guān)注高嚴重性問題。客戶可以通過查看配置更改歷史記錄、部署事件以及系統(tǒng)和用戶活動，以在Amazon DevOps Guru控制臺中生成需要優(yōu)先關(guān)注的潛在操作問題事件列表。為了幫助客戶快速解決問題，Amazon DevOps Guru提供了具有補救步驟的智能建議，并與AWS Systems Manager集成運行手冊和協(xié)作工具，使客戶能夠更有效地維護應(yīng)用程序并管理其部署的基礎(chǔ)架構(gòu)。Amazon DevOps Guru與Amazon CodeGuru（機器學(xué)習支持的開發(fā)人員工具，可提供智能建議以提高代碼質(zhì)量并識別應(yīng)用程序中最昂貴的代碼行）一起，使客戶可以針對其操作數(shù)據(jù)使用自動化機器學(xué)習技術(shù)，幫助開發(fā)人員輕松提高應(yīng)用程序的可用性和可靠性。

Amazon DevOps Guru通過AWS軟件開發(fā)工具包（AWS SDK）支持API終端節(jié)點，使合作伙伴和客戶可以輕松地將Amazon DevOps Guru集成到其現(xiàn)有解決方案中，以針對高嚴重性問題提交故障單、分級并自動通知工程師。 PagerDuty和Atlassian已將Amazon DevOps Guru集成到其運營監(jiān)控和事件管理平臺中，使用其解決方案的客戶現(xiàn)在可以從Amazon DevOps Guru提供的運營見解中受益。

Amazon DevOps Guru現(xiàn)已在美國東部（北弗吉尼亞）區(qū)域、美國東部（俄亥俄）區(qū)域、美國西部（俄勒岡）區(qū)域、亞太（新加坡）區(qū)域和歐洲（愛爾蘭）區(qū)域進行預(yù)覽。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

AWS發(fā)布Amazon DevOps Guru