婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 客服領域問答機器人能力評價體系

客服領域問答機器人能力評價體系

熱門標簽:遼寧房產電銷機器人系統 寧德防封電銷卡 高德地圖標注怎么選 騰訊地圖標注商戶收費嗎 外呼系統電話結果勾選 應急逃生疏散地圖標注 智能電話機器人推廣方案 微信小程序地圖標注點名 貴陽crm外呼系統運營商

從什么維度評價機器人的服務能力?

想要全面評價一個機器人,首先必須想清楚它的任務目標。機器人是替代人工客服去承擔客戶服務工作,它必須具備怎樣的能力才能合格地完成這項工作。就像人工客服需要一套人力資源的評價標準,機器人也需要構建一個能力模型。該模型通常由接待能力應答能力兩個方面組成。

首先,企業一般會從節能增效,幫助企業釋放人力的目標出發,啟用智能機器人。因此,評價機器人能夠接待多少提問用戶,在何種程度上替代人工是一個必要的維度,我們稱此為機器人的接待能力。接待能力越高,表明機器人可替代的人工量越大,機器人節能增效的效果越好。

其次,機器人在接待用戶后,根本的任務是要能夠回答用戶的問題而這要從兩個子維度去評判,一個是機器人能否回答用戶的問題,另一個是機器人的回答是否正確(圖1)。

圖1:機器人應答能力判別維度

“能否回答問題”是由機器人的知識范圍決定的。

如果某企業機器人知識庫的范圍是APP操作相關知識,那么當用戶問到與APP操作無關的問題時,如“為什么A產品不賣了”,機器人無法解答,只能給出類似“這對我來說有點難呢,還需要繼續努力,再換種問法試試唄”的拒識回復(圖2)。

圖2:機器人拒識回復

而“問題回答是否正確”是由機器人知識庫質量決定的。

其質量的好壞體現在,針對業務范圍內的知識,它能否準確識別用戶意圖,匹配正確答案,例如,當用戶用長難句表達“之前的密碼,說我錯誤,不可能啊,上個星期才登過”的時候,機器人能否識別用戶遇到的問題是“密碼失效,無法登錄”。或者在用戶意圖模糊的情況下,機器人能否引導用戶明確意圖,最終匹配到能夠解決用戶問題的答案。例如,用戶說“我要開卡”,機器人能否引導用戶明確是開借記卡,還是信用卡(圖3)。


圖3:問題回答是否正確示例

以上兩個子維度,我們綜合稱為機器人的應答能力。應答能力是機器人的內功,內功不佳,無法解決用戶問題,用戶難免還是尋求人工幫助,那么機器人接待能力也會隨之下降。因此應答能力是智能客服機器人最關鍵的一個能力。

然而,保證機器人的應答準確性,機器人的能力就是最佳了嗎?

并不盡然。


在實際情況中,用戶常常希望得到的答案簡潔明確,也希望客服人員能夠耐心溫柔,態度親切。因此機器人也需要注意回復內容的形式、態度,注重用戶體驗。如果一個復雜業務的解決方式已經通過文字的形式告知用戶,但用戶操作起來仍然很繁瑣,體驗很不好,那就需要更換一種回復方式。因此,為了提高用戶體驗,精益求精,機器人的服務滿意度也需要被關注。

圖4:機器人三個能力維度

通過圖4三個維度,可以較全面得評價一個智能客服機器人的服務能力。


如何量化評價?

確定機器人能力的評價維度后,針對各項能力具體如何評價,沒有一個可量化的指標,評價工作還是無法落到實處。然而用以評價的指標,需要明確且容易計算,對業務有代表性,對問題有指向性,在幫助企業觀測機器人能力表現的同時,還可以指導業務優化。

一般來說,行業內通常會采用“業務識別率”和“準確率”來評價機器人的應答能力,用“攔截率”評價機器人的接待能力,用“滿意度”或“差評率”評價機器人的服務滿意度(表1)。

表1:行業通用機器人能力判別指標


1、應答能力評估體系

1)業務識別率

業務識別率指在整個人機對話中,被機器人識別為業務問題的數量占總提問數的比例。

例如,某企業知識庫范圍是APP操作相關知識,機器人日志中用戶總提問數有2W,被識別為與APP操作有關并給出相應答案的有1.8W,另外的0.2W可能都是跟APP操作無關的對話,那么該企業智能機器人的業務識別率就為1.8w÷2w=90%。

其中,業務匹配數=總提問數-拒識問題數-非業務回復數

“拒識問題數”指機器人無法明確用戶意圖,回復未知問題話術的提問;“非業務”指機器人將用戶的提問識別為如“你好”、“謝謝”等與業務無關的意圖,并做出對應回復的問題。

2)準確率

準確率指回復正確的對話數占考察范圍內對話數的比例。

考察范圍內對話數不等同于總提問數。范圍如何確定,需要企業根據自己的業務及服務要求進行判定。有的企業認為超業務范圍問題是否給出拒識回復是需要考察的,閑聊類問題是否進行恰當的閑聊回復也需要考察,而有的企業只關心業務范圍內的問題。

某企業,抽樣數據如表2。總日志量為2萬,隨機抽樣1000條,其中非業務、超范圍問題數共有100條,業務范圍內問題900條,業務范圍內人工判斷回復正確的為820條,非業務、超范圍問題數回復正確的為70條(進行了恰當的閑聊回復或拒識回復視為正確)。

表2:抽樣數據表

如果只計算該機器人業務范圍內準確率,則計算基數只取業務范圍內問題900條,正確的為820條,則準確率為820÷900=91%。倘若,該企業同時要考察閑聊與超范圍問題準確率。則計算基數應為抽樣的總1000條,業務回復正確與非業務、超范圍回復正確共890條,則機器人準確率為890÷1000=89%。

倘若該企業的考察范圍再進行變化,那么機器人的準確率也必然會隨之改變。因此真實場景的準確率計算,依賴于具體選定的業務范圍,不同的企業客戶,計算的方式各有差異。

但通用的是,判斷什么是正確回復的方法。機器人回復是否正確,主要體現在針對用戶意圖是否匹配了正確的知識點,但這一點機器人無法自證,需要人工介入。線上數據通常流量很大,人工全量復檢可行性低,建議采用人工抽檢或標準測試集復檢的方式來判斷。

關注業務識別率和準確率,不只可以觀測到機器人的質量表現,更重要的是可以明確機器人的短板,找到提高改進的方向。


2、接待能力評估體系

機器人的接待能力,可以通過“攔截率”評價。

攔截率對應的是用戶提問由機器人解答之后,用戶沒有進一步要求人工服務,而直接結束了本次會話的情況,可以通過以下方式計算:

設置機器人的目的就是替代人工回復用戶問題,但用戶與機器人進行多番交互后,仍然得不到滿意的答案,可能就會轉人工。用戶與機器人的多番交互則為一次會話。它指某個用戶登錄開始與機器人交互到用戶退出或者在一定時間內沒有回復的,算作一次會話。而上文提到的對話或提問數指用戶與機器人的一輪交互,用戶提出一個問題,機器人給出一次答復,就記為一次對話。因此一個會話包含多輪對話。

攔截率的計算必須是基于有效會話的,否則會非常不客觀。

一些用戶進入場景后一言不發就退出,還有一些用戶進入場景后,直接要求人工服務,未向機器人詢問任何問題。這些沒有實際交互的會話屬于無效會話。

無效會話的產生在一定程度上反應了用戶對智能客服的接受度。一些企業的業務本身比較復雜,或者一些業務點如銀行錯賬,引發用戶焦急情緒,用戶不信任機器人,所以一進線就轉人工。還有一些用戶可能年齡層偏大,沒有養成通過互聯網獲取信息的習慣,依賴人工服務,因此也會進線即轉人工。這種由于業務特點或者用戶習慣產生的轉人工會話是機器人無法攔截的,不屬于有效的轉人工會話。

另有兩種情況屬于需要設定轉人工回復的情景。

一種情況是,一些業務問題,機器人只能做基礎回答或不做回答,需要進一步或直接引導用戶轉人工解決。例如快遞業的“特殊物品催派”,機器人會采用提醒用戶轉人工的策略。

另一種情況,用戶可能觸發一些敏感詞,需要轉人工回復。這兩類問題是不屬于機器人需要攔截的問題,轉人工是業務所需的配置策略,因此在計算攔截率時,是應當剔除的。

所以,如果一個機器人的總會話量為1w,沒有進行任何交互的為500,要求轉人工的會話為2000,其中進入機器人就要求轉人工的為300,觸發設定的轉人工場景而轉人工的為200,則該機器人的攔截率為1-(2000-300-200)÷(10000-500-300-200)=83.3%。

攔截率的統計,關鍵是要客觀。采用有效數據計算攔截率,可以客觀地評價機器人本身對人力的取代程度。


3、服務滿意度評估體系

服務滿意度即通過“滿意度”指標進行評價。

滿意度通常以主動推送,邀請用戶評價的方式進行,可以實施于對話維度,也可以實施于會話維度。滿意度指標相對主觀,它主要取決于用戶接受機器人服務后的感受是否良好,一般可以通過統計滿意數或者差評數來評估機器人服務的滿意度。但是,多數客戶在得到滿意的回答后會直接退出服務場景,不會給出評價,而在不滿意的時候傾向給出反饋,留下差評。所以關注差評率是更客觀的評價方式。


滿意度是一個結果指標,無法直接指明問題所在。影響用戶使用體驗的因素很多,所以指標本身不能指明改進方法,需要通過指標追溯具體原因,才能提升用戶體驗。


具體來說,導致用戶不滿意的原因可能是用戶對答案不滿意,或者覺得交互方式太死板等等。而收集具體信息的方法,可以是企業通過用戶調研等方式進一步分析,又或者在用戶提交差評的同時直接讓用戶選擇不滿意的原因,收集后分析,針對性優化。


結語


綜上所述,智能客服機器人評價體系包含三個維度,分別為接待能力評價、應答能力評價和服務滿意度評價。三個維度分別可以通過“攔截率”、“業務識別率”和“準確率”、“滿意度”指標進行量化分析。


智能客服機器人已經成為客服行業不可阻擋的一股升級趨勢。通過使用量化評估體系對智能客服機器人進行客觀評價,我們可以及時發現機器人或知識庫的內在問題,明確運營優化方向,提高知識運營水平,讓智能客服機器人發揮出最大的效力。




標簽:許昌 商洛 黔西 烏蘭察布 咸寧 眉山 鞍山 撫順

巨人網絡通訊聲明:本文標題《客服領域問答機器人能力評價體系》,本文關鍵詞  客服,領域,問答,機器人,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《客服領域問答機器人能力評價體系》相關的同類信息!
  • 本頁收集關于客服領域問答機器人能力評價體系的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 土默特左旗| 大石桥市| 新宁县| 玉溪市| 大石桥市| 庄河市| 兴宁市| 乐陵市| 和硕县| 塔城市| 沁阳市| 温州市| 平利县| 桐柏县| 哈尔滨市| 海伦市| 汶川县| 来凤县| 垣曲县| 界首市| 宽城| 屏边| 宣城市| 修水县| 乌鲁木齐县| 昌宁县| 呈贡县| 永丰县| 腾冲县| 且末县| 内黄县| 兴安盟| 平度市| 上林县| 昌平区| 嘉鱼县| 榆中县| 海南省| 新乡市| 兴业县| 昭平县|