2015年的“雙11”是個關鍵節點。2015 年之前的“雙11”,商品推薦都是人來控制的,由運營決定給用戶推薦什么產品。而2015年那次“雙11”,是阿里第一次基于算法和大數據,為用戶做大規模的、個性化的商品推薦系統,叫做“千人千面”,是阿里流量分發模式很大的升級和轉型。
2015年的“雙11”結束后,淘寶的設計、工程和算法團隊聚在一起,商量下一年要做些什么。他們當時想,目前已經做到的個性化推薦,都是基于白底圖商品推薦,能不能往前邁一步,讓強營銷導向的廣告資源位的設計也“千人千面”呢?
從純商品個性化跨到廣告資源位個性化,中間幾個關鍵的技術點打通之后,他們就在內部發起了一個人工智能設計的項目,主要開發的產品就是“魯班”。之所以叫“魯班”,也是因為一句玩笑話。當時說要 “讓天下沒有難擼的banner ”,諧音就是“魯班”,后來發現簡直太合適了,魯班不僅本身是個偉大的工匠,也是很多工具的發明人,所以他的理念跟當時的“魯班”團隊做的事情是不謀而合的,他們也希望發明工具,讓設計師更好地工作。
隨著產品和團隊逐漸壯大,現在團隊已經演進為“阿里智能設計實驗室”。第一點是圖像算法“摳圖”。因為高質量的廣告設計需要把商品圖片摳出來,放到精美的設計主題里。以前都是設計師給商品摳圖后再做設計,現在阿里智能設計實驗室要用機器做海量設計,就得讓機器來做這個事情。他們跟阿里搜索部門做圖像切割的算法團隊合作,處理海量的商品自動摳圖。
第二點是把設計變成“數據”。一張廣告設計圖片是像素組成的“信息”,不是“數據”。利用機器把商品、文字和設計主題進行在線合成,這樣每張廣告圖片就帶上了商品信息,可以根據消費者偏好進行個性化投放。所以“魯班”產品上線初期,他們請設計師根據活動主題做了大批量風格確定的模板,證明了這種模式投放效果可以大幅提升點擊率。
第三點就是讓機器學習設計。靠“人肉設計模板”度過了第一個階段,但長遠發展角度必須讓機器來做設計。大概是 16 年 8 月份開始的,有一位之前負責淘寶“拍立淘”(在淘寶內通過圖片搜索找同款,隨拍隨找)產品開發的圖像算法專家加入了進來,主導整個智能設計的算法框架。第一個挑戰是解決數據問題。因為行業里沒有什么參考對象,只能不斷試錯。剛開始的時候,數據不太夠,團隊就制定了很強的設計規則去控制,結果要么就是機器跑不出設計結果,要么就是設計出來的結果很失控。設計是有無窮可能性的,靠弱數據強規則必然走不通。意識到這一點以后,他們就集中精力去解決數據問題,把內部設計師電腦里的設計圖和供應商的設計圖都收集過來。
他們有自己開發的設計協同工具“設計板”,有點類似Slack,但是是專門用于設計協同的。這樣才能方便大批量、規模化的找到這些數據。
第二個挑戰是數據清洗和輸入機器。因為收集過來的數據是很雜亂的。比如“雙11”期間“魔性”的設計風格跟無印良品這種“性冷淡”風格差異很大系統,這是完全不一樣的品牌調性和設計需求。團隊花了很大的力氣去整理和建立了一套數據體系去管理設計數據,讓機器生產出更匹配的結果。現在講 AI ,外界很難感受到機器的智能含量多高、體現在什么地方,但樂乘也不太同意“魯班”是“大數據生產”這種說法。這個疑問涉及兩個核心的,也是最基本的問題:一是什么叫設計智能,二是怎么評價機器是否具備了設計智能。
AI 目前有幾個主要方向,一個是“識別”,像語音識別、圖像識別;另一個是“生成”,也就是阿里智能實驗室在做的,從無到有創造東西,讓機器能根據請求生成符合特定要求的結果。他們把這一智能設計定位為:可控的圖像生成技術。可以結合技術框架和原理來理解,簡單來說,在整個生成過程中,有4個核心步驟(具體的講解可以參考
@剝桔子
分享的 UCAN 2017回顧):
第一步,讓機器理解設計是什么構成的:通過人工數據標注,對設計的原始文件中的圖層做分類,對元素做標注。設計專家團隊也會提煉設計手法和風格。通過數據的方式告訴機器這些元素為什么可以放在一起,把專家的經驗和知識通過數據輸入。這部分核心是深度序列學習的算法模型。
第二步,建立元素中心:當機器學習到設計框架后,需要大量的生產資料。阿里智能設計實驗室會建立元素庫,通過機器做圖像特征提取,然后分類,再通過人工控制圖像質量以及版權問題(實驗室購買了有版權的圖庫,也是希望從一開始就避免版權方面的糾紛)。
第三步,生成的電銷外呼程序:原理有點像 Alpha Go 下圍棋。在設計框架上構建起虛擬畫布,類似棋盤,生成的電銷外呼程序把元素中心的元素往棋盤放,在這里實驗室采用了“強化學習”,就好像你在家里放一臺掃地機器人,讓它自己跑,跑個幾圈,它自己會知道哪里有障礙要避開。在強化學習的過程中,機器參考原始樣本,通過不斷嘗試,得到一些反饋,然后從中學習到什么樣的設計是對的、好的。
第四步,評估的電銷外呼程序:實驗室會抓取大量設計的成品,從“美學”和“商業”兩個方面進行評估。美學上的評估由人來進行,這方面有專業眾包公司;商業上的評估就是看投放出去的點擊率瀏覽量等等。2016年“雙11”魯班設計了1.7億個banner。
其實這 1.7 億個 banner 是有設計強干預的,因為“雙11”的風格是比較確定而且需要嚴格執行,所以設計師制作了很多“雙11”特定風格的固定模板。機器在這個基礎上,把調整尺寸這些行為進行優化,節省了尺寸拓版的人力。用機器生成億級設計從而帶來商業效果提升,總體來說也是一次非常成功的應用實踐。
未來的“雙11”應該仍然會是設計師帶著機器做設計的模式,重大活動中設計機器是提升效率的助理角色。引用阿里 CEO 的話——“魯班是數據業務化的代表”,之前阿里有很多數據,但都是閑置的或者利用效率不高的,比如海量的商品圖,而“魯班”把數據變成了業務,通過大規模設計加精準投放,提高每個廣告位的資源效率,帶動了流量的效率和業務價值,點擊率是翻倍的,收益也接近翻倍。人員倒沒有出現縮減,只是做的事情有調整了,要學習這套電銷外呼程序,學習如何訓練機器,同時在美學方面做把控。