在今年UCAN大會開場,阿里巴巴集團UED委員會委員長楊光發(fā)布的智能設計平臺——魯班,便出自樂乘的團隊。此平臺是通過人工智能算法和大量數(shù)據(jù)訓練機器學習設計。通過一段時間的學習,此平臺從去年“雙十一”前就已經(jīng)在阿里內(nèi)部大規(guī)模投入使用,目前其設計水平已經(jīng)非常接近專業(yè)設計師設計的效果。在大會上,樂乘介紹了阿里智能設計實驗室的實踐全過程。
用AI做設計
我們團隊現(xiàn)在叫人工智能設計實驗室,做的事情很簡單,用AI做設計。人工智能現(xiàn)在這個概念太火了,有一個數(shù)據(jù)證明它有多火:去年人工智能這個領域的創(chuàng)業(yè)公司開業(yè)速度超過了肯德基的開店速度。不可否認,這里一定有泡沫成分,也有很多概念的炒作。我們先拋開高大上的詞,把這個事情拆解一下。
現(xiàn)在講的人工智能都是通過算法、數(shù)據(jù)和強大的計算能力來完善服務場景,這是人工智能的四個要素。今天我們團隊做的就是用算法、數(shù)據(jù)、計算、場景來解決商業(yè)領域的事情,這樣使得這件事情看起來比較靠譜、容易落地。
為什么我們團隊會想要做這個事情呢,這不是YY出來的想法,而是從廣泛的業(yè)務場景里找到的一個機會。以一個廣告Banner為例,我們把它歸類為“大量低質(zhì)易耗”的設計,這樣的設計,設計師花一天做出來,在線上投放時間也只有一天。而且是重復的,改改字就可以了,非常適合被機器所取代。
今年UCAN的主題是新設計x新商業(yè),新商業(yè)里非常大的概念,是要通過新的技術(shù)、互聯(lián)網(wǎng)的手段,完成人、貨、場的重構(gòu),人是消費者,貨是商品的服務,場景就是連接人和商品之間的手段。在新的時期下,需要找到一種新的方式做設計。
我們團隊的使命是基于算法數(shù)據(jù)和前臺業(yè)務需求,打造一個商業(yè)設計大腦。這個大腦能理解設計,能為商業(yè)的產(chǎn)品去服務,做出合理的設計。
商業(yè)設計大腦的三大挑戰(zhàn)
在開始做事情之前,我們遇到了三個比較嚴峻的挑戰(zhàn)。
第一個挑戰(zhàn),缺少標注數(shù)據(jù)。今天所有的人工智能都基于大量的結(jié)構(gòu)化標注數(shù)據(jù),設計這件事情連數(shù)據(jù)都沒有完成在線化,更別說標準化、結(jié)構(gòu)化的數(shù)據(jù)了。
第二個挑戰(zhàn),設計不確定性。設計是個很不確定的東西,比如今天你讓機器設計一個高端大氣的Banner廣告,它就蒙圈了。
第三個挑戰(zhàn),無先例可循。在整個行業(yè)里過去一年做下來發(fā)現(xiàn),沒有一些現(xiàn)成的技術(shù)或者框架可以參考。比如AlphaGo把圍棋AI論文發(fā)完之后,全世界圍棋AI照這個方法都可以做到先進的水平。我們過去一年來都是自己一路摸索中走過來的,這一年走來我們給人工智能做的定義是,我們做的是可控的視覺生成?煽,就是根據(jù)商業(yè)的需求、業(yè)務的需求,智能地進行控制。它解決的是視覺從無到有的問題。
可控的視覺生成過程
這是機器人從誕生的第一版到最近一版的發(fā)展歷程。2016年9月,勉強完成一張圖片的拼合,沒有什么美感可言。第二張是去年圣誕節(jié)前做的廣告,稍微看起來精致一點,整個設計還是非常簡單。第三張是兩個月前的進展,基本上可以根據(jù)這個商品輸入主體的氛圍,找到最符合的背景氛圍,整個設計細節(jié)和結(jié)構(gòu),看起來更穩(wěn)定一點。
我們現(xiàn)在大概學會幾百種常規(guī)的設計手法,并且每天都在學習中。這是我們目前的設計能力和設計效果,青云給它定的評級是P4,意味著它還只是個助理設計師。我們今年目標是做到P5,還有很長的路要走。
機器如何學習設計
下面和大家詳細解釋一下這個機器背后的學習設計邏輯。
我們要讓機器學習設計,首先必須要讓機器理解感知設計是什么。以這樣一張非常常見的廣告為例,在機器的眼里是有一堆像素點組成的。如果今天以像素為單位讓機器去理解設計,對設計的可控性非常弱,所以在前期技術(shù)方案選擇中沒有走像素級生產(chǎn),而是走向了元素級生產(chǎn)。
四個組成部分:設計框架、元素中心、行動器、評估網(wǎng)絡
組成一,設計框架。還是以這個廣告為例,首先通過人工標注的方式,讓機器理解這張設計有哪些元素組成,比如它的商品主體,花的背景,蒙版。往上一層,我們通過設計的經(jīng)驗知識,定義一些設計的手法和風格。手法指的是這些元素為什么可以這么構(gòu)成,這個知識在設計腦子里機器是不知道的,所以會有手法這一層做輸入。最上面這一層是風格,當這些元素構(gòu)成之后,它從美學或者視覺角度看是一個什么感受。讓機器知道它是用什么組成的,為什么可以這么組成,以及它組成后的效果。這個過程將一個設計問題轉(zhuǎn)化成數(shù)據(jù)問題,這就是設計數(shù)據(jù)化。
下一步是準備設計的原始文件,比如一系列花朵和設計方法,輸入到深度學習系列網(wǎng)絡。這個網(wǎng)絡有一個很大特點:具備一定記憶功能。因為設計是個步驟很復雜的過程,經(jīng)常有好幾十步才能完成一個設計。
經(jīng)過這層神經(jīng)網(wǎng)絡學習之后,我們會得到一個設計框架。從技術(shù)上理解,它是一堆空間特征和視覺特征構(gòu)成的模型。設計師的視角來理解的話,它相當于設計師腦子里面在做一組設計之前大概的框架印象,比如今天你接到一個任務要做一個花朵風格,思考這個設計大概會怎么做,然后從一堆文件里提取出了特征模型出來。
組成二,元素中心。因為我們做的是元素級生成,所以必須準備一個元素的庫。我們會通過收集一些版權(quán)圖庫,以及自己造設計元素的方式,輸入到一個元素的分類器。這個分類器會把這些元素分布到各個類型里,比如背景、主體、修飾,也會完成圖片庫的提取。
組成三,行動器。接下來,就是設計的具體過程。比如今天我們接到一個設計任務,要為這樣一件衣服設計一個花朵風格的廣告。這時候會有一個行動器,負責把前面準備好的底料放到設計框架里。這個過程和下圍棋很像,左邊是棋盤,右邊是下圍棋的棋子。行動器就是把元素放到棋盤里,這是整個行動器的生成原理。
它很像設計師實際在做設計的過程,如設計師要做一個花朵的時候,也在軟件里面會不斷去調(diào)每個位置、每個像素、每個角度。同時,整個過程也是一個強化學習的過程,行動器會在不斷試錯中更智能。
組成四,評估網(wǎng)絡。設計成品出來之后,我們要告訴機器人,從設計的角度是好還是不好。我們有一個設計評估網(wǎng)絡,最終實現(xiàn)的效果就是給它輸入任何一個設計成品,它能打個分。技術(shù)原理是,我們通過人工輸入大量歷史上投放過的一些設計圖評分,它從這里訓練出一個打分的模型出來。同時,專家也會人工干預打分,完成雙向反饋。
這套框架并不是只能做Banner廣告,Banner廣告是我們找到的第一個最適合落地的業(yè)務場景。我們把它定義為是一個通用的設計智能,理論上,它可以設計一切的數(shù)字內(nèi)容。只要是通過元素或者像素組成的圖像,理論上都是可以完成的。
預告一下我們最新的實踐。前兩張圖是機器完成的服飾搭配,根據(jù)用戶輸入的服飾商品進行組合搭配,生成類似雜志的搭配效果圖。另外,我們也正在訓練機器完成頁面模塊的設計,比如大量的營銷活動頁面,我們現(xiàn)在正在訓練它完成復雜的排版設計。
正在攻克的三個難題
目前,我們已經(jīng)完成了框架搭建,以及數(shù)據(jù)的自我學習成長。接下來我們決心攻克的三個難題,也是讓機器變得更加強大的關(guān)鍵突破點。
第一,讓機器能夠自主生成元素。我們目前的元素是靠設計師來提供,一方面是為了保證版權(quán),另一方面,保證它的質(zhì)量足夠高。我們希望能做到,要求機器造一個花朵時,它自己能生成出來,這也是目前計算機視覺生成的一個非;鸬脑掝}。
第二,提高認知理解,F(xiàn)在機器還不太理解語義,只能根據(jù)需求或者任務生成一個結(jié)果,并不了解其中的關(guān)系。我們下一步要做的事情是,當用戶輸入了“清涼一夏”的文案時,機器人能理解“清涼”這個詞代表了什么意思,并且理解這張照片代表了“清涼一夏”的理念,圖文之間有一定的關(guān)系。
最后一個,設計的遷移。比如今天通過大量專家數(shù)據(jù)訓練了幾百種常規(guī)數(shù)據(jù)手法之后,它能夠完成主流的設計要求了。當這些手法很相似時,就可以完成風格遷移。我們會進一步探索AI,不再根據(jù)需求完成使命,而是通過自我學習和演化之后有新的東西出來。
AI+Design 擁抱新時代
今天人工智能設計真的來了,它不以任何意志為轉(zhuǎn)移的趨勢走來了,它離我們很近。當一個新的浪潮打過來的時候,我們應該學會的是擁抱它,而不是掉頭就跑,邊跑邊罵不靠譜。
視覺設計的四個層次
最基礎的是臨摹拓展。給你一個東西,照著它拓展一份出來,很明顯這一定是機器第一步取代的工作。而且目前已經(jīng)做到一大半了,證明這是一個沒法回避的問題。
第二層,場景表達。今天你給它一個東西,它能理解,能表達對。比如今天你根據(jù)情人節(jié),這些品牌能夠找到一種合適的設計手段,去表達出情人節(jié)的溫馨,這種手繪的方式會稍微難一點,也就是我們前面講到的語義這一層。
第三層,創(chuàng)意洞見。它能夠有一些啟發(fā)性的東西出來。天貓品牌里面經(jīng)常有把貓頭和品牌創(chuàng)意做聯(lián)合的事情,這是機器不可能做到的事情,或者在我有生之年沒有指望它能做到的。
最后一層,創(chuàng)造趨勢。這一般是設計大師做的事情。它能定義明年、未來幾年的設計趨勢走向,這是更高的設計能力。比如今年“三八”女王節(jié),天貓用了一種全新的設計手段,用這種很輕的質(zhì)感、很細膩的方式來表達商品。它能夠代表一個新的趨勢和未來,代表一個新的手段,這件事情一定是人來做的。
回到今天機器和人之間的差異和對比,如果今天我們搞設計人機大戰(zhàn)的話,機器最擅長的是數(shù)據(jù)、計算、學習。數(shù)據(jù)上,可以完成巨量素材庫,訓練成長速度,不斷地完成閉環(huán)。它的學習速度之快,一個晚上可以完成幾十萬次的學習訓練,是人不吃不喝也趕不上的。而人類設計師的特征,首先在情感層面,我們理解共情,情緒上有表達,這是機器很難做到的。另外兩層,創(chuàng)意和創(chuàng)造,設計師能夠創(chuàng)造出一些新的東西,做組合遷移,組合創(chuàng)意,美學趨勢。如果真正人機對戰(zhàn)的話,設計師還是應回歸創(chuàng)造、創(chuàng)意,以及理解用戶的層面。
擁抱這個AI時代,對我們來說有沒有什么新的工作方式呢。比如今天有顧客讓你做一個設計,以前是一對一的給他一個成品,一對一的完成一個設計任務。有了設計AI之后,就可以將一個設計手段輸入給機器,教會機器做執(zhí)行和生成。這樣,你就可以不止為一個客戶服務,而是為成千上萬的客戶服務。
人工智能設計是個不可阻擋的時代,是未來。但是它也剛剛來,我們也剛剛走出第一步。我們還有大量的時間,希望接下來和設計同行一起努力,繼續(xù)把這件事情做好。
[關(guān)于UCAN]
UCAN是阿里巴巴的年度設計盛會,聚焦用戶體驗設計。4月27—28日,由阿里巴巴用戶體驗設計委員會舉辦的UCAN2017用戶體驗設計論壇在阿里巴巴西溪園區(qū)舉行,本屆主題是“新設計×新商業(yè)”。圍繞“無界、融通、超距、生長”等概念,重新定義用戶體驗在新商業(yè)環(huán)境中的蛻變和價值,不斷把設計領域、設計概念向外延展,與技術(shù)、能源和商業(yè)產(chǎn)生新的化學反應。

全部評論