神圖鎮樓!昨天文章一發就有人向我靈魂三連問:
1.AI-CC哪家強?
2.AI-CC企業們現在拼什么?
3.AI-CC企業的同質化/近似化如何區分?
無言以對...我只好引用某個AI學術大神說過的話:
自然語言理解是人工智能的初級!
自然語言理解也是人工智能的終極!
所以,大概率還是要看NLP和NLU的...。。
還是繼續書接上文小議聯絡中心的AI發展方向-1,把聯絡中心的AI發展方向在員工輔助層和運維管理層說完吧,改天繼續嘮唄。
我來一句靈魂式的發問:
當我們在討論員工輔助端的AI的時候,到底是人工為智能還是智能為人工?
先說第一種,我在不同的AI廠家那里都看到一些新的人工為智能式的方案,比如說靜默坐席,又比如說人機耦合。
靜默坐席就是在訓練語音機器人的時,區別于傳統的錄音模型訓練,直接向最優秀人工坐席進行主動式強化學習。當高技能高績效坐席在與客戶交流的時候,通話音頻實時碼流實時傳輸給AI來訓練語音機器人,通過主動式學習他(她)們的表達方式和應答話術(SOP或者非標),讓坐席為人工智能的發育做出進一步的貢獻。很美好嗎?不,貢獻之后會是什么呢?會不會就是取代優秀坐席嗎?在智能沒有發展到完全盡善盡美的現在,AI實際上并不能100%的完全去替代人工的工作。
真正有溫度的永遠是人!
共情、復雜理解和非理性應答都不是算法短期可以解決的。
在我看來,這種發展方向遠不如另外一種,也就是人機耦合。舉例來說就是客戶通過網頁/APP/微信來與企業進行文字溝通,其實他并不清楚后端為他服務的是人還是機器人。因為后端的一個坐席可能同時管理監控著5-10個機器人的聊天窗口。一旦機器人在應答時出現了Confidence降低的問題,也就是可能出現了復雜短語或者句子的閱讀理解的難題或者是答案匹配度不高的情況,人工坐席通過監控發現后進行主動的介入接管,直接與客戶進行人工回復,后續再擇機選擇機器人托管。根據美好的企業宣傳,AI在這里可以進一步主動式學習/強化學習/監督學習...。。
那么我們再來說說智能為人工吧,也就是通過AI技術增強了人工坐席的能力,提高坐席的效率和能力,個人判斷這可能更加容易讓用戶接受,讓企業買單。坐席輔助系統,可能會是下一個AI-CC領域的當紅辣子雞。它旨在幫助坐席更加迅速的判斷用戶意圖并解答用戶問題,同時縮短了通話時間,企業/用戶/坐席三方都滿意,這個年代很難得了。而它的技術原理呢?客戶與坐席之間的通話實時碼流傳輸給ASR語音識別引擎,經過文字轉換之后再送給NLP/NLU進行閱讀理解,然后根據關鍵詞或熱詞這種匹配喚醒,適時地從知識庫中來取出最合適的答案,并主動推送/彈屏提醒到坐席,從而給客戶提供更加優質的服務。
講究在于適時和合適!
一個比較典型的案例就是車聯網呼叫中心。當車主進行通過車機系統進行車聯網icall咨詢汽車的儀表顯示盤的一些問題時,那么聯絡中心的坐席并不需要經過大量繁雜很專業的培訓和冗余式的發問和搜索,而是通過坐席輔助系統就能夠一步/幾步定位到問題所在并提供相應的解決方案。還有就是向車載導航服務也可以通過坐席輔助系統節省坐席輸入時間。
我的個人判斷:坐席輔助系統會成為員工輔助層AI應用的主流方式。
當然了技術上實現還有一些復雜性,比如通話怎樣實時傳送給坐席輔助系統?很多人第一反應就是端口鏡像span,那么如果同時還有錄音需求和第三方聲紋認證的需求以及整體聯絡中心上云部署的需求...。端口鏡像就涼涼了。基于SBC的多路SIP-REC可能就會是唯一的方案。
一說興起了,所謂Myvoiceismypassword的聲紋認證系統其實也是坐席輔助系統的一種變異罷了。國內的商業落地場景也并不太多,通常作為一種輔助手段。不過這里也是有迷思的,比如具體的使用問題。由于客戶實際的背景噪聲和網絡質量,具體在操作來鑒權的難度還是挺大的。通常聲紋認證系統會要求一些客戶說出特定短語去進行識別,有一些美好的廠商能夠做到客戶隨機說話也能夠進行聲紋認證,但我相信這畢竟是要耗費大量的資源的。怎么從成千上萬的聲音庫中找出客戶聲音的特征來匹配?這樣的技術難題就需要進一步的優化搜索/匹配引擎。我看到某金融頭部客戶做了一個比較取巧的應用:貸款信審環節,對正常的用戶并不作聲紋的認證,對風險識別較高的用戶去做定向聲紋認證,從XX萬個已被標注過的黑名單用戶中去進行一個匹配,輕松好多!好人太多,壞人容易抓。
回到這個坐席輔助系統啊,話還沒說完呢。
智能話術提醒同樣也是坐席輔助系統的一種具象表現形式。再強調下:
講究在于適時和合適!
那么對于這兩點,我們其實想到的是什么呢?其實我們就把坐席輔助的AI問題變成了一個智能知識庫的問題。而知識庫的發展經過了這么些年的技術不斷迭代,產生了諸如知識圖譜、圖數據庫等黑科技,改善了很多,目前還存在兩個最大的瓶頸:知識錄入的效率和有效閱讀理解的問題。
比如客戶拍個腦袋:這里有300份產品文檔,有pdf,有excel,有word的doc和docx,還有TXT,還有PPT的,你如何幫我有效的轉化成知識并錄入到知識庫中去?答案是并不容易。
有多少人工就有多少智能,甲方乙方一起來。
文字的隨意性特別大,區別于語音標注和圖像標注由專業第三方數據標注公司來提供服務,文本知識標注是不存在這個行業的。一方面是企業擔心由于信息安全不會將企業內部知識交付于第三方公司來去進行數據標注,而數據標注公司也不具備這種強專業性的文字知識標注工作,而且量還不大。所以呢,智能知識庫的問題居然演變成了知識的有效錄入的問題,而從目前得到的廣泛實踐來看并沒有特別好的方法能夠解決這樣的問題。我們已經能夠看到一些AI企業試圖用規范的文檔結構塞已有知識來提高效率,但是同樣塞的過程還是耗費大量人力。同時我也看到一些比較優秀的客戶從知識的生成端就開始著手去打造這樣的問題。記得在很多年前華為在產品文檔開發時,就已經采用了多標簽標注系統的技術來迅速地生成不同版本不同特性不同規格的文檔,也許這種技術也會應用在企業知識庫搭建和知識編寫的過程中。
關于自然閱讀理解,我相信短期內是一個比較難以逾越的問題,因為行業知識庫的這種特性太強了,每一個行業都會有特定的知識和特定的產品庫,這可不是閑聊機器人那種靠寒暄集就能解決的問題。
我個人認為:每個特定行業都應該有一家帶頭大哥來做智能知識庫的能力輸出,如果他們愿意輸出的話...(Fintech同學請坐下)
由信息轉化成知識本身就已經挺難的,能不能用知識根據5W1H來生成問題呢?可能就更難了,那能不能用知識推理并反問問題呢?可能是難上加難了,相信業界的專家能夠給出更好的實踐。
呃,超綱了啊,最后一點我們來說說智能培訓。
人們往往會說坐席培訓跟人工智能有什么事情啊?殊不知科技發展速度之快,已經讓坐席能夠擁有AI培訓系統。它旨意通過AI的方式來學習客戶與坐席的對話,注意是學習客戶不是學習坐席,學習客戶的提問方式,提煉出共性。最后用TTS或者真人錄音用來去模擬客戶去進行一個真實電話的撥打坐席,通過提出不同的問題來檢測坐席的回復是否準確符合標準sop。這樣子的一種系統呢,有人戲稱為坐席養成系統。
聯絡中心里很大的一塊成本就是人力成本,而人力成本中其中很大的一塊就是培訓成本。智能培訓系統有效地切到了運營管理者的一個痛點。目前存在的一個問題就是模擬客戶發問同樣是需要訓練。
我個人認為:智能坐席培訓系統方興未艾!
呃~~洋洋灑灑渾渾噩噩說了幾千字,忽然發現字數太多了。改天重新找一個時間去聊一聊聯絡中心的AI發展之運維管理層,明天我可不寫了,手指辛苦。不過您看得也辛苦了!多謝指正!要不,贊賞下?