Prisma走紅人工智慧試水圖像處理
北京新浪網 (2016-08-17 06:00)
特約記者 劉燕秋 北京報導
導讀:事實上,人工智慧技術在圖片處理甚至藝術領域的應用,才剛剛開始。2016年被稱作人工智慧元年,舉世矚目的人機大戰讓神經網路、深度學習等一系列技術術語為人所知。而在細分領域,探索的觸角還可以伸向更多的方向。
有句戲言稱,奧運前夕,一半的潮人在玩Pokémon Go,剩下的一半都在用Prisma修圖了。
和Pokémon Go齊名的Prisma 是一款修圖軟體,它的神奇之處在於,在你的手機相冊隨便選擇一張照片,Prisma能在十幾秒內將其變成獨具風格的藝術大師作品,無論你是想要「漫威風」還是想化身畢加索筆下的抽象派女郎。這款應用由俄羅斯一個4人團隊花了一個半月時間開發,於6月11日在App Store正式上線,上線僅一周就席捲了東歐10個國家排行榜的第一位。
Prisma的興起推動了同類應用的扎堆出現。Prisma投資公司Mail.ru推出的第二款產品Vinci,幾乎是Prisma的複製品。而在國內,8月4日,成都品果科技(Camera360)也推出了相似產品「poker濾鏡」,並將其定位為基於人工智慧技術的機器人繪畫引擎。
人工智慧「平民化」
伴隨Prisma的火爆,一個原本圈內人士才了解的技術名詞——「卷積神經網路(Convolutional Neural Networks)」也開始從幕後走向台前。
卷積神經網路是深度學習演算法在圖像處理領域的一個應用。「在機器學習中有個基本單位叫做感知器,具有分類的功能,可以理解成生物的神經元。當多個單元組合起來,並且具有分層結構時,就形成了神經網路。在處理一張圖像時,如果對每個像素進行處理,神經網路就變得非常龐大,幾乎無法進行訓練和使用。要進行優化,可以讓100個像素對應到一個神經元,這個對應過程就是卷積」,Camera360創新院高級研發工程師張靖淇向21世紀經濟報導記者解釋了「卷積神經網路」的由來。
這項人工智慧領域的技術跟傳統的濾鏡採用的是不同的技術實現思路。傳統的濾鏡是做加法,把效果一層一層疊加上去,而Prisma、Poker 濾鏡採用的是機器學習,開發者運用大數據技術,通過成千上萬張圖像的導入,訓練一個「卷積神經網路」,來表示某種風格的轉移過程。通過演算法去學習圖片的顏色、結構和紋理,最後實現的效果就像機器人模仿出來的一樣。
張靖淇告訴記者,去年10月左右,論文《A Neural Algorithm of Artistic Style》提出了使用神經網路來實現繪畫,「我們關注到這一動態后就成立了專門的獨立團隊進行跟進」。
有分析認為,Prisma可謂是第一款人工智慧平民化應用,「平民化」體現在將原本高大上的複雜技術應用在娛樂領域。更有觀點認為,類似Prisma應用的火熱,標誌著智能手機的人工智慧時代將要來臨。
「隨著人工智慧的發展,所有的應用都將慢慢加入人工智慧的技術,以此來提升自己的產品體驗」,慧辰資訊TMT高級研究經理林仁翔這樣評價當前的趨勢。
後勁不足?
需要指出的是,類似的炫酷爆款應用,後勁不足也是通病。Prisma開發者 Alexey Moissenkov此前就曾表示,Prisma始於一個想法,而不是商業目的。
迅速竄紅的驚喜之後,後續開發也在緊鑼密鼓地準備中。就在Prisma醞釀視頻版的同時,一款同樣是結合神經網路和人工智慧技術的視頻處理軟體Artisto搶先問世了。Artisto可以拍攝或編輯最長10秒鐘的視頻,像Prisma一樣轉化為名畫效果,目前有14種效果可以選擇,在Instagram上也受到了很多名人的喜愛。
然而,在最初的新鮮感褪去之後,單一的功能、界面很可能難以對用戶形成長久的吸引力。這種情況下,如何保持生命力,成為擺在此類爆款娛樂型應用面前的問題。從性質上說,Prisma之流確實更像「臉萌」,而不是Instagram,是可有可無的娛樂型產品,不是須臾不可離身的社交工具。
「在當前的技術環境下,基於微信朋友圈的便捷傳播,很多以炫酷好玩作為賣點的應用可以在網上快速發酵,但是一旦熱度下降,沒有新的創新點出現,用戶黏性就會降低。一款應用要延長生命周期,一定要不斷開發更有意思的玩法。」易觀智庫高級分析師龐億明告訴記者。
雖然前景不明,科技巨頭們仍不肯放過這種垂直領域的創新勢力。今年3月,Facebook買下了創業公司Masquerad。這家公司推出的App MSQRD就是通過人工智慧技術,透過手機前置鏡頭在自拍者的臉上疊加動畫效果或改變臉部形狀。
事實上,人工智慧技術在圖片處理甚至藝術領域的應用,才剛剛開始。2016年被稱作人工智慧元年,舉世矚目的人機大戰讓神經網路、深度學習等一系列技術術語為人所知。而在細分領域,探索的觸角還可以伸向更多的方向。
有研發人員認為,從技術層面上看,使用深度學習的方式進行圖像風格轉換屬於從0到1的創舉。在張靖淇看來,圖像處理和人工智慧本就密不可分,現階段的人工智慧技術,最直接且成效顯著的應用之一就是圖像處理。要知道poker濾鏡並不是第一次在產品中使用人工智慧相關技術,拍照場景檢測、照片分類、人臉及物體識別等等都是人工智慧的應用。
Poker目前只是Camera360應用內的一款濾鏡,不過據張靖淇透露,團隊已經著手將其開發為一款獨立APP了。但是,一個頗令人不解的現象是,火爆歐美的Prisma似乎並未在中國掀起相同的熱潮——雖然產品已經順勢推出了安卓版,在朋友圈分享圖片的人仍寥寥無幾。這樣的局面也給Poker的前景蒙上了一層迷霧。
在龐億明看來,Camera360、美圖秀秀都屬於能夠滿足用戶剛需的工具型應用,擁有穩定的用戶量,在這個基礎上開發新的玩法,促進用戶活躍度,對圖片處理應用來說是一個比較健康的狀態。只是基於一個點去開發,一旦沒有新的功能提升用戶黏性,相對來說,用戶就很容易流失。
對此,張靖淇則表現出了比較樂觀的態度。「人工智慧在機器繪畫領域的應用還只是剛剛開始,還有很多可以帶給大眾驚喜的地方,保持生命力根本不是問題」,他告訴記者。
資料來源: http://news.sina.com.tw/article/20160817/18299061.html
Search