王永
機(jī)器學(xué)習(xí)正在不斷地縱深發(fā)展。IDC數(shù)據(jù)顯示:2023年,人工智能系統(tǒng)支出會達(dá)到979億美元,相比2019年增長2.5倍,Gartner數(shù)據(jù)顯示,75%的企業(yè)在2024年底會把機(jī)器學(xué)習(xí)從試點(diǎn)轉(zhuǎn)向生產(chǎn)系統(tǒng),需要經(jīng)過反復(fù)迭代才能真正改變客戶體驗或者提升效率,而這樣的生產(chǎn)系統(tǒng)也在整個行業(yè)加速。
“亞馬遜有零售和硬件設(shè)備,比如,Alexa、Echo以及Prime Air,可以說二十年前亞馬遜就開始了自己的機(jī)器學(xué)習(xí)實(shí)踐,而且在運(yùn)營和運(yùn)作的背后到處都是機(jī)器學(xué)習(xí)的身影?!眮嗰R遜云科技大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡在接受筆者的采訪時表示,亞馬遜利用機(jī)器學(xué)習(xí)有一個核心理念,即“亞馬遜+機(jī)器學(xué)習(xí)”等于客戶體驗的提升。“所有案例中的關(guān)鍵不是算法,而是從解決客戶體驗的問題入手,然后在思考機(jī)器學(xué)習(xí)是否以工具的方式進(jìn)行使用?!?/p>
事實(shí)上,亞馬遜云科技的所有技術(shù)和服務(wù)同樣在賦能給亞馬遜自身快速地進(jìn)行創(chuàng)新。“亞馬遜和亞馬遜云科技完全可以想像為一個小飛輪,亞馬遜就是亞馬遜云科技最大的客戶,二者是客戶和平臺的關(guān)系,既然是客戶就會給亞馬遜云平臺提供大量的使用實(shí)例和需求,亞馬遜云科技產(chǎn)生的服務(wù)和產(chǎn)品又可以讓亞馬遜零售包括硬件部門充分使用起來,形成一個客戶和平臺之間互動的關(guān)系?!鳖櫡餐嘎叮瑏嗰R遜云科技的服務(wù)已經(jīng)超過200多種,計算、存儲、網(wǎng)絡(luò)數(shù)據(jù)庫、分析、IoT、AI/ML和安全等,其中很重要的一點(diǎn)就是,開始機(jī)器學(xué)習(xí)之前需要做好數(shù)據(jù)準(zhǔn)備、清理和籌備的工作。
亞馬遜云科技一直強(qiáng)調(diào),AI/ML普惠是其的核心使命,但是想要完成這樣一個使命的關(guān)鍵在于是否可以為不同行業(yè)的客戶提供一個全面的工具集。值得一提的是,從2016年到2020年,亞馬遜云科技的工具集重塑和演進(jìn)一直在保持穩(wěn)定的增長,僅去年一年時間,就新增了250多項機(jī)器學(xué)習(xí)的功能。
“談到AI/ML工具集,亞馬遜云科技一直有一個核心的理念——授人以魚,不如授人以魚,能夠幫助客戶獨(dú)立完成快速迭代,開發(fā)和規(guī)模化產(chǎn)生數(shù)據(jù)模型的工具。”顧凡表示,AI/ML工具集可以從三個層面進(jìn)行解讀:首先是,針對沒有數(shù)據(jù)科學(xué)家和算法開發(fā)工程師,但有數(shù)據(jù)、場景的客戶,亞馬遜云科技會提供開箱即用的服務(wù)。其次,針對數(shù)據(jù)科學(xué)家和開發(fā)人員,亞馬遜云科技會提供完全托管的平臺——Amazon SageMaker,集中資源深刻的了解業(yè)務(wù),針對基礎(chǔ)設(shè)施的管理,以及機(jī)器學(xué)習(xí)繁瑣的步驟打包成云服務(wù),實(shí)現(xiàn)自動化運(yùn)營,提高開發(fā)人員的效率。最后是,面對深層用戶,亞馬遜云科技會提供ML框架和基礎(chǔ)架構(gòu)。
其中,比較關(guān)鍵的一點(diǎn)是,Amazon SageMaker作為一個開放且對機(jī)器學(xué)習(xí)框架廣泛支撐的平臺,除了三大框架之外,客戶可以將自己的機(jī)器學(xué)習(xí)框架與SageMaker進(jìn)行DIY機(jī)器學(xué)習(xí)集成。
“亞馬遜云科技為了實(shí)現(xiàn)機(jī)器學(xué)習(xí)的普惠一直在開源的領(lǐng)域持續(xù)不斷地努力,AutoGluon自動化機(jī)器學(xué)習(xí)也是非常熱門的話題,真正達(dá)到客戶寫幾行代碼就可以做出模型,把特征的調(diào)取、參數(shù)的調(diào)優(yōu)、模型的建立都自動化完成,更進(jìn)一步地拉低整個機(jī)器學(xué)習(xí)的門檻?!鳖櫡脖硎?,無論是AutoGluon、DGL還是MxNet都是開源的,亞馬遜云科技要不遺余力地推進(jìn)開源生態(tài)系統(tǒng),讓更多的開發(fā)者加入到機(jī)器學(xué)習(xí)這樣低門檻的開發(fā)環(huán)境當(dāng)中。
如今,我們看到Amazon SageMaker機(jī)器學(xué)習(xí)服務(wù)越來越多地在中國各個行業(yè)相繼落地:醫(yī)療行業(yè),益體康利用亞馬遜云科技的機(jī)器學(xué)習(xí)服務(wù)快速構(gòu)建了智能遠(yuǎn)程心電平臺的AI訓(xùn)練和推理場景,提升了模型訓(xùn)練的速度;教育行業(yè),嘰里呱啦使用 Amazon Polly 和 Amazon EC2 P3 實(shí)例,依托 亞馬遜云科技 先進(jìn)的人工智能與機(jī)器學(xué)習(xí)技術(shù)快速地構(gòu)建具有逼真語音體驗的在線學(xué)習(xí)平臺,讓兒童獲得具有沉浸式體驗的純正英語發(fā)音學(xué)習(xí)環(huán)境。工業(yè)智能領(lǐng)域,天和榮在開發(fā)即視通門鈴產(chǎn)品的人臉識別功能過程中,采用了開箱即用的 Amazon Rekognition,短時間內(nèi)就為即視通平臺增加了人形偵測、人臉識別等能力。
亞馬遜云科技一直在強(qiáng)調(diào)未來傳統(tǒng)行業(yè)一定是機(jī)器學(xué)習(xí)發(fā)力的點(diǎn),所以在和傳統(tǒng)行業(yè)的客戶交流的過程中,主要方向包含四個方面:數(shù)據(jù)策略、找到ML技術(shù)切入點(diǎn)、數(shù)據(jù)科學(xué)家業(yè)務(wù)化,以及應(yīng)對技能差距。
山東淄博市熱力集團(tuán)有限責(zé)任公司是一家有著30余年供熱歷史的供熱企業(yè),通過使用亞馬遜云科技豐富的AL/ML技術(shù)和服務(wù),構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)了精準(zhǔn)供熱,可以根據(jù)氣象、工控數(shù)據(jù)、建筑物維護(hù)結(jié)構(gòu)等信息計算出最佳的供熱模式,并給出具體的操作指令,既讓用戶室溫始終保持人體最佳舒適溫度,又做到盡可能節(jié)約成本。
其中,精準(zhǔn)供熱模型使用Amazon SageMaker為核心開發(fā)平臺,而基于亞馬遜云科技的無服務(wù)器架構(gòu)搭建的大數(shù)據(jù)智能分析平臺,幫助淄博熱力提升了客戶滿意度。
為了更好地服務(wù)中國市場的客戶,亞馬遜云科技將會在中國區(qū)持續(xù)落地新的機(jī)器學(xué)習(xí)服務(wù):Amazon Personalize,開發(fā)人員無需具備機(jī)器學(xué)習(xí)專業(yè)知識,用戶可用它訓(xùn)練、調(diào)整和部署自己定制的機(jī)器學(xué)習(xí)模型,構(gòu)建個性化推薦系統(tǒng),用于產(chǎn)品推薦、個性化營銷、個性化搜索和定制化直銷等廣泛的個性化推薦場景。
此外,已經(jīng)落地中國一周年的Amazon SageMaker也迎來了7項新的功能更新:SageMaker Data Wrangler,簡化機(jī)器學(xué)習(xí)的數(shù)據(jù)準(zhǔn)備工作;SageMaker Feature Store,完全托管且專門構(gòu)建的特征存儲庫,用于存儲、更新、檢索和共享機(jī)器學(xué)習(xí)特征;SageMaker Clarify,讓機(jī)器學(xué)習(xí)開發(fā)人員可以更好地掌控其訓(xùn)練數(shù)據(jù)和模型,從而識別和限制偏差并解釋做出相關(guān)預(yù)測的原因;Distribued Training,為訓(xùn)練大型深度學(xué)習(xí)模型和數(shù)據(jù)集提供易用的方法;SageMaker Debugger v2.0,實(shí)時捕獲訓(xùn)練指標(biāo),自動識別機(jī)器學(xué)習(xí)訓(xùn)練任務(wù)中正在出現(xiàn)的復(fù)雜問題;Model Monitor v2.0,幫助客戶時刻保持機(jī)器學(xué)習(xí)模型的準(zhǔn)確性; SageMaker Pipelines,針對機(jī)器學(xué)習(xí)專門構(gòu)建、易于使用的持續(xù)集成和持續(xù)交付服務(wù),通過編排和自動化提高機(jī)器學(xué)習(xí)工作的效率。
“算力永遠(yuǎn)是機(jī)器學(xué)習(xí)最基礎(chǔ)的基礎(chǔ)。”顧凡透露,Amazon EC2 Inf1計算實(shí)例即將落地中國區(qū)域,Inf1計算實(shí)例基于亞馬遜設(shè)計的首款定制機(jī)器學(xué)習(xí)芯片Amazon Inferentia,與成本最低的基于GPU的實(shí)例相比,可以提高30%的吞吐量,每次推理成本最高能夠降低45%,對于機(jī)器學(xué)習(xí)的框架都完美支持。
據(jù)了解,亞馬遜Alexa團(tuán)隊已經(jīng)將其高度復(fù)雜的“文本轉(zhuǎn)語音”模型遷移到了Amazon Inferentia,該模型生成了類似于人的語音,目前有80%的Alexa語音響應(yīng)在Inf1實(shí)例上合成,節(jié)省30%的成本的同時,降低了25%的響應(yīng)延遲。
“我們始終在強(qiáng)調(diào)亞馬遜云科技的核心優(yōu)勢:開放的態(tài)度以及與客戶授人以魚不如授人以漁的合作模式?!鳖櫡脖硎荆瑹o論是上云還需要機(jī)器學(xué)習(xí)服務(wù),客戶都不希望被某一種服務(wù)鎖定。所以,在提供深度與寬度兼具的服務(wù)同時,亞馬遜云科技必要要保持開放的態(tài)度,做到真正與中國市場相結(jié)合,幫助客戶重塑競爭力。