Ibrahim Haddad
數(shù)據(jù)、資源的整合對開源AI生態(tài)系統(tǒng)的構(gòu)建至關(guān)重要,我們致力于將多個開源項目集成管理,為各領(lǐng)域開源用戶提供便捷、高效的多領(lǐng)域服務。
大家好,我是LF AI&Data foundation的執(zhí)行董事,我今天主要和大家探討LF AI&Data foundation為建立開源AI和數(shù)據(jù)生態(tài)系統(tǒng)提供的支持。
我先來介紹一下LF AI&Data foundation的來源,LF AI一直致力于人工智能學習和深度學習,而ODPI則聚焦于資源,為了整合技術(shù)與資源,LFAI基金會與ODPI合并成立了LF AI&Data foundation基金會。2018-2019年,在信息增長領(lǐng)域,我們確立了項目互相支持、互相合作的模式,這一模式橫跨整個生態(tài)系統(tǒng)。為了早日實現(xiàn)多項目一體化的目標,我們將LF AI和ODPI的人員聚集起來,向組織和項目中引入合適的開發(fā)人員,他們配合委員會支持開源AI和數(shù)據(jù)的開發(fā),為用戶提供統(tǒng)一的指引,尤其在提供跨項目、集成、標準的互操作性指導領(lǐng)域和人工智能領(lǐng)域。我們還連通了人工智能項目和數(shù)據(jù)項目,并對這兩個項目進行了整合,促進項目之間的互操作性。在單一的基金會下管理、開發(fā)這些項目,使我們能夠更加便捷的合作,建立起更強大的生態(tài)系統(tǒng),極大地提高了效率。我們?yōu)榧身椖刻峁┑姆沼?2~15個不同的類別,其中包括機器學習、深度學習、數(shù)據(jù)模型、精確計算、教育、安全和隱私等。這些類別中還包含多個子類,如機器學習類別中包含框架平臺、庫等大約300個子類別。在這些子類別中,許多項目互相競爭并提供相似的功能,如在機器學習平臺下的深度學習框架中有12種不同的產(chǎn)品,而在深度學習項目的資源庫中也提供了類似的產(chǎn)品。全世界超過35000個開發(fā)商正在積極地為不同的項目做出貢獻。
生態(tài)系統(tǒng)中的活動繁多且數(shù)量不斷增長,問題層出不窮。這些問題與缺乏管理項目有關(guān)。這些問題大部分來源于系統(tǒng)個體的內(nèi)部工作。隨著時間的推移,公司意識到將這些工作開源的重要性,對于數(shù)據(jù)模型的開源和應用來說,工作開源的重要性不體現(xiàn)在企業(yè)正在對項目進行研究的時候,而是體現(xiàn)在項目完成后。在項目完成后,確定誰來管理項目資產(chǎn)、誰來負責出口單據(jù)和出口控制單據(jù)的填寫、誰來為網(wǎng)站付錢、誰來為各種構(gòu)建系統(tǒng)買單、誰來使用AWS信用等。為了解決這些不同的需求,不斷擴大開源AI生態(tài)系統(tǒng),我們建立了LF AI。
開源具有如下幾個優(yōu)勢:具備多路徑訪問和更改代碼的能力、靈活的許可證模式、能夠進行同行之間的評審等。從開放源碼、AI的角度來看,人工智能也有很多獨特的優(yōu)勢,如透明和開放的發(fā)展模式、多領(lǐng)域可信度等。通過AI技術(shù)的應用,我們減少了模型和數(shù)據(jù)集的偏差,開發(fā)了檢測篡改數(shù)據(jù)集和模型的方法,這些方法提高了模型的穩(wěn)定性,幫助我們確認數(shù)據(jù)集和AI模型的來源。開源幫助我們尋找清理、排序、跟蹤數(shù)據(jù)來源的方法。LF AI&Data foundation支持人工智能機器學習、深度學習等技術(shù),為了提高這些不同項目之間的互操作性,我們將這些項目匯總、集成,實現(xiàn)了跨項目的緊密合作,在技術(shù)咨詢委員會的支持下,我們?yōu)橛脩籼峁┙y(tǒng)一的指導。這些努力幫助我們朝著建立一個強大的開放源碼AI&Data生態(tài)系統(tǒng)前進。為了建設(shè)這個系統(tǒng),我們建立了管理委員會、技術(shù)顧問委員會、互操作性委員會、Trusted AI委員會、BI&AI委員會。技術(shù)咨詢委員會推動我們對這些項目進行開放管理、獲得許多獨立的知識產(chǎn)權(quán),它還提供了很多機會使我們將項目深度整合。我們還在其他的場景中開發(fā)項目,如我們提供在edex平臺上的免費培訓;我們還關(guān)注數(shù)據(jù)方向的技術(shù)開發(fā),并為數(shù)據(jù)市場提供開源模型以及一系列支持工具。
我們還開展了涵蓋市場營銷領(lǐng)域的活動、給用戶提供電子郵件的活動通知、每月的計劃和項目的匯總,旨在為會員展示各領(lǐng)域領(lǐng)先的技術(shù)與項目。我們還專門為大學、政府實驗室、研究機構(gòu)和其他非盈利組織設(shè)立了會員級別,為他們提供免費的會員服務。技術(shù)咨詢委員會的項目采用開放和中立的治理模式,由全職的工作人員來進行全時段管理、提供全流程支持服務,并對重要的數(shù)據(jù)來源進行核實,從市場營銷的角度對項目進行公關(guān)宣傳,提供在不同地區(qū)的法律支持。我們正在從linux基金會中獲取經(jīng)驗,建立能夠為社區(qū)資產(chǎn)提供支持的系統(tǒng)。
LF AI&Data foundation開發(fā)過的項目中積累了很多孵化項目經(jīng)驗。我們管理項目的知識、產(chǎn)權(quán),為所有項目提供多項法律服務和免費的培訓服務、認證工作。我們有能力設(shè)計、執(zhí)行軟件和硬件的測試認證程序、協(xié)助開發(fā)商進行營銷活動。除了驗證工作和測試開發(fā)人員的操作之外,我們還提供創(chuàng)新、安保等服務。針對不同的項目,我們建立了發(fā)現(xiàn)漏洞的獎賞機制,并通過源代碼掃描服務,將這一機制覆蓋所有項目。在營銷方面,我們提供市場公關(guān)服務來支持所有的項目,從博客到公告、白皮書、海報、演示、推廣、對新項目的支持等。有些用戶關(guān)注特定項目的活動進程,還有一些用戶關(guān)注基金會的活動進程,如為了品牌推廣開展的LF AI峰會。為此,我們還提供活動服務,對不同類型的活動提供支持。如今我們正在為籌備LF AI&Data foundation峰會努力。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)