為提高計算機視覺能力,F(xiàn)acebook正為開發(fā)者社區(qū)越來越多地開源內(nèi)部工具。
計算機視覺隸屬于人工智能(AI),可協(xié)助機器理解圖像。計算機視覺不需要手工輸入關(guān)鍵詞或描述語等元數(shù)據(jù),而是將圖像分解并在逐個像素的基礎(chǔ)上處理圖像。
照片,視頻以及一般圖像都是Facebook的重要素材,而計算機識別圖像中的對象的能力非常利于縮放圖像的內(nèi)容分類。對于一段視頻或一張圖片,人眼可以輕易確定其中有3個人、1個冰箱和6罐啤酒,但對機器來說,建立自己的意志并不簡單。面對圖像上光線和顏色的無數(shù)種混合方式,人類顯然更具優(yōu)勢。
然而計算機視覺技術(shù)已經(jīng)取得跨越式發(fā)展,計算機越來越擅長識別圖像的內(nèi)容以及圖像中對象的位置。檢測對象只是一方面,機器還需要認清對象的重疊部分,這種影像分割問題更加復(fù)雜。比如,機器不能將動物的部分軀體和前方站立的人體混為一談。Facebook的研究人員想要推進的就是這個方面。
Facebook將一些計算機視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細化模塊,以此促進、同時在某種意義上幫助Facebook促進這項技術(shù)。另外還有給圖像上對象逐一打標簽的“專用卷積網(wǎng)絡(luò)”MultiPathNet。
Facebook將一些計算機視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細化模塊,以此促進、同時在某種意義上幫助Facebook促進這項技術(shù)。另外還有給圖像上對象逐一打標簽的“專用卷積網(wǎng)絡(luò)”MultiPathNet。
“我們開放代碼給所有人,希望他們能夠一起助力機器視覺領(lǐng)域的迅速提升?!盕acebook人工智能研究組(FAIR)的研究科學(xué)家PiotrDollar在博文中說,“隨著核心技術(shù)的發(fā)展,我們?nèi)詫⒗^續(xù)發(fā)布最新成果,更新開放給大眾的開源工具?!?/p>
越來越多的企業(yè)轉(zhuǎn)向關(guān)注機器學(xué)習(xí)領(lǐng)域,為客戶尋求更優(yōu)質(zhì)的自動化技術(shù)。最近被微軟收購的聯(lián)想輸入鍵盤企業(yè)SwiftKey就在研究一個與AI有關(guān)的復(fù)雜后端。其中的人工神經(jīng)網(wǎng)絡(luò)(ANN)直接基于人類大腦的架構(gòu)和工作方式。圖片庫巨頭Shutterstock也打造了自己的卷積神經(jīng)網(wǎng)絡(luò)以提高逆向圖像搜索技術(shù)。
將自己的軟件遞交給開發(fā)者社區(qū),F(xiàn)acebook能夠事半功倍。其實,F(xiàn)acebook已多次開源內(nèi)部技術(shù)。過去幾個月中,這個社交網(wǎng)絡(luò)巨頭就為加速AI的研究開源了Torchnet,以及將360photo和360video中的圖片和視頻嵌入到應(yīng)用中的SDK。GitHub上,F(xiàn)acebook的項目有200多個。開源總監(jiān)JamesPearce最近解答了Facebook擁抱開源社區(qū)的原因,總的來說可以歸結(jié)為意識形態(tài),創(chuàng)新,以及開源通常利于商業(yè)的這一事實經(jīng)驗?!拔覀冊贔acebook的目標是,盡可能多地開源我們的技術(shù),特別是我們認為對更廣大的整個工程界來說有價值的技術(shù)?!?/p>