軟件預測能比人工預測準多少?
這是我們在與同行業溝通探討時經常會被問道的一個問題,其實這里面存在一個誤區,準確度的高低并不是由系統或者人工來決定的,而是由選取的歷史數據、分析的方法以及特殊事宜的考慮而決定的,要做到精準的預測,往往與預測人員的工作經驗有著非常大的關系。
要做好準確的預測,目前普遍認為需要做到以下三點:
1、選取適當的歷史數據;
2、依靠經驗來撫平或剔除業務異常數據;
3、對業務未來活動、節假日等因素的預估。
選取適當的歷史數據
歷史數據是一切預測的基礎,后續的話量預測都會是在歷史數據的基礎上進行提升或下降的,那么按照統計學的原理來說是不是收集的樣本數越多就越可以反映出未來話量趨勢的走向呢?
其實不然。按理說數據應選取與未來業務變化一致的歷史數據進行預測,如下周或下個月業務將進行技能的調整或用戶群體的變化,那之前取的長時間的歷史話量參考性將會大幅下降,應該多參考近期業務的話量變化作為預測歷史數據,也就是說業務越不穩定,我們選擇的歷史數據應當越短較好,因為短時間的數據可以反應出業務話量起伏變化的趨勢與規律,而長時間的歷史數據會將業務的話務起伏抹平”;
反之,如果業務較為穩定且未來沒有重大的變化,我們就可以選擇較長的歷史數據進行預測,這樣會將短期內或少量的異常情況進行撫平”。
依靠經驗來撫平或剔除業務異常數據
在選取歷史數據中往往會選到節假日、活動日以及線路故障等日期數據,如果使用這部分數據對未來話量進行預測將會默認未來的一段時間內會同樣有節假日、活動日或故障,這顯然是不合適的,我們無法預測未來會出現故障問題,這就需要我們在業務運營時每日要記錄業務出現的臨時狀況如線路故障、天氣異常、國家政策等對于話務線路的沖擊,在將來進行預測的時候需要將這部分異常的日期數據進行拋出;
至于活動日和節假日,它們與故障不同,活動日和節假日無論是歷史數據還是未來都是有明確日期的,所以像這類特殊情況一般是將他們單獨提取出來單獨進行預測。
在上述的選取適當的歷史數據”與依靠經驗撫平或剔除業務異常數據”中可以看出基本上是依靠個人經驗或者是說直覺進行數據選取和話務剔除,有人會說這完全就是拍腦袋的決定,毫無科學依據”,但如果大家能夠真正能明白直覺”是什么時就會知道依靠直覺來進行判斷并不是毫無依據,歷史數據與數據剔除的影響因素有千千萬萬,我們必須承認如此海量的影響因素是無法全部收集的,既然無法收集全部的影響因素,那么即使運用科學的方法做出的預測又怎么會有科學依據呢?
反而直覺是依靠自己在平時工作、生活中的經驗而通過左右權衡得出的一個大體的數字,雖然這在很大程度上取決于操作者的時間經驗,但我們必須相信這種經驗并且頻繁地實施,之后我們才可以從經驗中得出數據上的結論,當然,這個結論可能只適用于某個業務。
對業務未來活動、節假日等因素的預估
對于這列特殊日期的預測需要用到特殊方法,不能像其他普通日期使用長時間歷史話量進行預測,而是提取特殊因子進行計算。
特殊因子存在于歷史發生過的活動日或節假日中,我們需要分析往年的活動或節假日對于線路的影響比例并將這種影響的比例進行計算后套用到今年的活動或節假日中,在基礎數據上進行折算,譬如對2017年國慶日的節假日預測,我們可以取2016年及2015年國慶日當周的話量以及前1-7天、8-14天、15-21天、22-28天來計算出國慶日當周的話量下降因子,例如把2016年國慶周的前22-28天話量當做是100%從而分析出前15-21天話量已經開始出現下降,假設話量下降了5%,那國慶前15-21天的話量只有國慶前22-28天話量的95%。
以此類推,一直展示到國慶當周的話量是百分之多少,這樣當我們預測出國慶前22-28天的話量時就可以套用話量下降或上升的百分比因子來計算出國慶當周的話量。
最終,我們將獲取一段時間業務穩定的話務數據,之后進行了異常數據的剔除并在加入了未來活動、節假日的考慮后得到了想要的基礎數據。
1、 將這些基礎數據按周維度統計后可以看到業務的話量在周中是存在遞減或遞增的趨勢,同樣可以將遞增或遞減的趨勢與當周的話量進行計算來得到未來一周的話量。
2、將選取的歷史數據按照星期維度再進行統計可以得到一周內每天的話量比例,即星期占比,用預測出的未來一周的話量與星期占比相乘可以計算出未來一周每天的話務量。
3、將選擇的歷史數據以時段的形式進行統計,這樣可以得到星期一至星期日每個時段的話量數據,將每個時段的話量與全天總量相除就可以得到歷史星期一至星期日每個時段的時段話量占比。
4、最終將我們計算出的未來一周每日的話務量與每天的時段占比相乘,就可以得出最終預測的每天每時段的話量數據。
預測的終點其實并不是100%契合實際話量,話量是自然發生的事情,任何人都無法做到預測與實際完全一致,我們能做到的是不斷收集數據并分析問題,在未來的預測中盡可能全面地考慮未來的影響因素,這樣即使無法與實際相同,但也不至于出現重大的預測錯誤。
隨著我們工作經驗的增加和預測水平的提升,終會有一天,我們可以完全地掌握未來話務所發生的所有因素,到時候,預測的準確度自然會得到提升。