国产精品国内免费一区二区三区,香蕉成人app,国产日韩在线亚洲字幕中文

主頁 > 知識庫 > Python 數據化運營之KMeans聚類分析總結

Python 數據化運營之KMeans聚類分析總結

Python 數據化運營

1、內容介紹

以 Python 使用 Keans 進行聚類分析的簡單舉例應用介紹聚類分析。

聚類分析 或 聚類 是對一組對象進行分組的任務，使得同一組（稱為聚類）中的對象（在某種意義上）與其他組（聚類）中的對象更相似（在某種意義上）。它是探索性數據挖掘的主要任務，也是統計數據分析的常用技術，用于許多領域，包括機器學習，模式識別，圖像分析，信息檢索，生物信息學，數據壓縮和計算機圖形學。

2、一般應用場景

（1）目標用戶的群體分類：根據運營或商業目的挑選出來的變量，對目標群體進行聚類，將目標群體分成幾個有明顯的特征區別的細分群體，在運營活動中為這些細分群體采用精細化、個性化的運營和服務，提升運營的效率和商業效果。

（2）不同產品的價值組合：按特定的指標變量對眾多產品種類進行聚類。將產品體系細分成具有不同價值、不同目的、多維度產品組合，在此基礎上制定相應的產品開發計劃、運營計劃和服務計劃。

（3）探索、發現孤立點及異常值：主要是風控應用。孤立點可能會存在欺詐的風險成分。

3、聚類的常見方法

分為基于劃分、層次、密度、網格、統計學、模型等類型的算法，典型算法包括K均值（經典的聚類算法）、DBSCAN、兩步聚類、BIRCH、譜聚類等。

4、Keans聚類實現

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn import metrics
import random

# 隨機生成100組包含3組特征的數據
feature = [[random.random(),random.random(),random.random()] for i in range(100)]
label = [int(random.randint(0,2)) for i in range(100)]

# 轉換數據格式
x_feature = np.array(feature)

# 訓練聚類模型
n_clusters = 3  # 設置聚類數量
model_kmeans = KMeans(n_clusters=n_clusters, random_state=0)  # 建立聚類模型對象
model_kmeans.fit(x_feature)  # 訓練聚類模型
y_pre = model_kmeans.predict(x_feature)  # 預測聚類模型
y_pre

實現如圖：

5、聚類的評估指標

inertias 是K均值模型對象的屬性，表示樣本距離最近的聚類中心的總和，它是作為在沒有真實分類結果標簽下的非監督式評估指標。該值越小越好，值越小證明樣本在類間的分布越集中，即類內的距離越小。

# 樣本距離最近的聚類中心的總和
inertias = model_kmeans.inertia_

adjusted_rand_s：調整后的蘭德指數（Adjusted Rand Index），蘭德指數通過考慮在預測和真實聚類中在相同或不同聚類中分配的所有樣本對和計數對來計算兩個聚類之間的相似性度量。調整后的蘭德指數通過對蘭德指數的調整得到獨立于樣本量和類別的接近于0的值，其取值范圍為[-1, 1]，負數代表結果不好，越接近于1越好意味著聚類結果與真實情況越吻合。

# 調整后的蘭德指數
adjusted_rand_s = metrics.adjusted_rand_score(label, y_pre)

mutual_info_s：互信息（Mutual Information, MI），互信息是一個隨機變量中包含的關于另一個隨機變量的信息量，在這里指的是相同數據的兩個標簽之間的相似度的量度，結果是非負值。

# 互信息
mutual_info_s = metrics.mutual_info_score(label, y_pre)

adjusted_mutual_info_s：調整后的互信息（Adjusted Mutual Information, AMI），調整后的互信息是對互信息評分的調整得分。它考慮到對于具有更大數量的聚類群，通常MI較高，而不管實際上是否有更多的信息共享，它通過調整聚類群的概率來糾正這種影響。當兩個聚類集相同（即完全匹配）時，AMI返回值為1；隨機分區（獨立標簽）平均預期AMI約為0，也可能為負數。

# 調整后的互信息
adjusted_mutual_info_s = metrics.adjusted_mutual_info_score(label, y_pre)

homogeneity_s：同質化得分（Homogeneity），如果所有的聚類都只包含屬于單個類的成員的數據點，則聚類結果將滿足同質性。其取值范圍[0,1]值越大意味著聚類結果與真實情況越吻合。

# 同質化得分
homogeneity_s = metrics.homogeneity_score(label, y_pre)

completeness_s：完整性得分（Completeness），如果作為給定類的成員的所有數據點是相同集群的元素，則聚類結果滿足

完整性。其取值范圍[0,1]，值越大意味著聚類結果與真實情況越吻合。

# 完整性得分
completeness_s = metrics.completeness_score(label, y_pre)

v_measure_s：它是同質化和完整性之間的諧波平均值，v = 2 （均勻性完整性）/（均勻性+完整性）。其取值范圍[0,1]，值越大意味著聚類結果與真實情況越吻合。

v_measure_s = metrics.v_measure_score(label, y_pre)

silhouette_s：輪廓系數（Silhouette），它用來計算所有樣本的平均輪廓系數，使用平均群內距離和每個樣本的平均最近簇距離來計算，它是一種非監督式評估指標。其最高值為1，最差值為-1,0附近的值表示重疊的聚類，負值通常表示樣本已被分配到錯誤的集群。

# 平均輪廓系數
silhouette_s = metrics.silhouette_score(x_feature, y_pre, metric='euclidean')

calinski_harabaz_s：該分數定義為群內離散與簇間離散的比值，它是一種非監督式評估指標。

# Calinski和Harabaz得分
calinski_harabaz_s = metrics.calinski_harabasz_score(x_feature, y_pre)

6、聚類效果可視化

# 模型效果可視化
centers = model_kmeans.cluster_centers_  # 各類別中心
colors = ['#4EACC5', '#FF9C34', '#4E9A06']  # 設置不同類別的顏色
plt.figure()  # 建立畫布
for i in range(n_clusters):  # 循環讀類別
    index_sets = np.where(y_pre == i)  # 找到相同類的索引集合
    cluster = x_feature[index_sets]  # 將相同類的數據劃分為一個聚類子集
    plt.scatter(cluster[:, 0], cluster[:, 1], c=colors[i], marker='.')  # 展示聚類子集內的樣本點
    plt.plot(centers[i][0], centers[i][1], 'o', markerfacecolor=colors[i], markeredgecolor='k',
             markersize=6)  # 展示各聚類子集的中心
plt.show()  # 展示圖像

如圖：

7、數據預測

# 模型應用
new_X = [1, 3.6,9.9]
cluster_label = model_kmeans.predict(np.array(new_X).reshape(1,-1))
print ('聚類預測結果為: %d' % cluster_label)

到此這篇關于Python 數據化運營之KMeans聚類分析總結的文章就介紹到這了,更多相關Python 數據化運營內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Python實現的KMeans聚類算法實例分析
Python KMeans聚類問題分析
python kmeans聚類簡單介紹和實現代碼
python中kmeans聚類實現代碼
Python實現Kmeans聚類算法

標簽：烏魯木齊銀川安慶湘西三亞呼倫貝爾葫蘆島呼倫貝爾

巨人網絡通訊聲明：本文標題《Python 數據化運營之KMeans聚類分析總結》，本文關鍵詞 Python,數據,化,運營,之,KMeans,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《Python 數據化運營之KMeans聚類分析總結》相關的同類信息！

Python 數據化運營之KMeans聚類分析總結

目錄 Python 數據化運營 1、內容介紹 2、一般應用場景 3、聚類的常見方法 4、Keans聚類實現 5、聚類的評估指標 6、聚類效果可視化 7、數據預測 Python 數據化運營 1、內容介紹以 Python 使用...

10-18

百應電話機器人呼和浩特（百應智能語音機器人）

今日給各位共享百應電話機器人呼和浩特的常識，其間也會對百應智能語音機器人進行解說，假如能可巧處理你現在面對的問...

11-06

網站被百度K站或降權的原因所在 k站后的收獲

1、群發垃圾外鏈首先我網站前段時間用過一個外鏈群發工具，用這個工具使勁的發垃圾外鏈，一天上它兩千多，所以網站被...

10-19

河北銷售外呼系統廠家區別（外呼系統哪里有賣）

本文目錄一覽： 1、外呼系統哪家公司做得好？？？2、電銷外呼系統哪個好了？市面上的太多了！有可以推薦的嗎？3、電話...

11-28

上海不封號電話呼叫軟件多少錢,外呼系統辦理商家-熱門

上海不封號電話呼叫軟件多少錢,外呼系統辦理商家然后通過電信、鐵通和網通的電話網撥回。2.再次利用手機的三方呼叫功能...

12-16

01-15

百應電話機器人哪里買（百應智能電話機器人）

本文目錄一覽： 1、電話機器人多少錢？ 2、我在福建想買一款電話機器人，有這種公司嗎？ 3、智能電話機器人多少錢？好用...

11-25

電銷機器人的特點跟優勢（機器人電銷怎么樣）

本文目錄一覽： 1、電話板滯人在電銷畛域的手藝優勢是什么？ 2、電銷板滯人相對于電銷營業員有什么優勢？ 3、電銷板滯人...

11-25

廣東正規外呼系統（廣州外呼營銷）

本篇文章給咱們談談廣東正規外呼體系，以及廣州外呼營銷對應的知識點，期望對各位有所協助，不要忘了保藏本站喔。本...

05-18

印媒揭秘小米如何用三年成為印度市場第一

小米通過 2014 年 7 月份的在線閃購意外打開了之前并不自信的印度市場，至今保持著最初的業務模式不變，依托著自身強大的...

10-19

基隆市電話機器人維修中心（基隆電子廠的位置）

本文目錄一覽：1、科沃斯掃地機器人維修點2、電話機器人好用不?3、關于智能電話機器人,你了解的有多少?科沃斯掃地機器人...

07-15

泰州電銷防封外呼軟件咨詢

泰州電銷防封外呼軟件咨詢,泰州電銷防封外呼軟件怎么樣,泰州電銷防封外呼軟件好用嗎外呼軟件靈活搭建企業電銷中心，...

11-23

慧營銷crm外呼系統丹丹（慧營銷外呼系統官網）

本文目次一覽： 1、有什么好的德律風呼喚零碎能夠保舉一下 2、外呼零碎哪家好，慧營銷外呼零碎價錢幾何 3、曉得有什么品...

11-25

揭陽市好用高頻外呼卡辦理

深圳移動聯合華為、移動研究院，對現網上干擾問題進行好用高頻外呼卡辦理深入分析，創新地提出專屬輔載波方案，在受干...

02-23

忘記了400電話的經銷商找誰續費呢？

忘記了400電話的經銷商找誰續費呢？ 400電話采用代理商制度，如果您忘記了自己的經銷商的聯系方式，不知道怎么續費的話...

12-22

51SAP同大漢資訊共同成立SAP人才外包服務中心

51SAP同大漢資訊共同成立SAP人才外包服務中心,雙方因此進行了會見座談，并成功簽署了相關的合作協議。大漢資訊是專門針對...

10-22

關于石家莊人工電銷系統費用的信息

本文目錄一覽： 1、電銷系統通常是多少錢一月或者半年的？2、電銷外呼系統多少錢一個月？3、電銷公司搭建一套電話銷售...

04-22

關于400電話彩鈴內容，浙江400企業彩鈴

關于400電話彩鈴內容，浙江400企業彩鈴400電話代理商為你解答。 400電話，彩鈴上傳和錄制內容需要和平臺提交公司的證件相...

07-20

電銷機器人外呼設置（智能語音電銷機器人怎么操作）

本篇文章給大家談談電銷機器人外呼設置，以及智能語音電銷機器人怎么操作對應的知識點，希望對各位有所幫助，不要忘了...

02-23

南京移動群呼系統開發-看這里

南京移動群呼系統開發進行業務需求或服務滿意度的調查，或者客戶回訪等活動。外呼系統沒有什么排名不排名的。因為系統...

01-16

外呼系統智能語音機器人（ai智能機器人外呼系統）

本文目錄一覽： 1、AI智能外呼機器人好一點的有哪些？2、電話機器人和外呼體系相比較哪個作用好一些？3、AI語音機器人有...

11-28

linux grep搜索命令的使用方法

用grep搜索文本文件如果您要在幾個文本文件中查找一字符串，可以使用 grep命令。grep在文本中搜索指定的字符串。假設您...

10-20

宜春自動外呼系統（宜春外呼軟件）

今日給各位共享宜春主動外呼體系的常識，其間也會對宜春外呼軟件進行解說，如果能可巧處理你現在面對的問題，別忘了重...

05-17

福州餐飲加盟語音ai機器人供應商-有效！

福州餐飲加盟語音ai機器人供應商任務完成后，可以查看外呼結果列表。目前對呼叫中心系統比較普遍接受的定義是：呼叫中...

05-17

貴港語音外呼系統代理商的簡單介紹

今天給各位分享貴港語音外呼系統代理商的知識，其中也會對進行解釋，如果能碰巧解決你現在面臨的問題，別忘了關注本站...

11-06

西安餐飲加盟AI機器人多少錢一臺-哪家專業？

西安餐飲加盟AI機器人多少錢一臺降低電話費用，抬高通話時間，比如一些企業用戶網絡在線呼叫系統直接和客戶打交道的業...

05-17

天津外呼系統哪家好（外呼系統哪個好）

本文目次一覽： 1、有曉得的么外呼零碎哪家的對照好？ 2、哪些德律風德律風外呼零碎對照好，功用欠缺呢？ 3、外呼零碎哪...

11-25

400電話怎么代理怎樣才能選擇一家靠譜的400電話外包公司？

400電話規范了客戶服務流程，提升了用戶服務體驗。申請400電話已經成為一種趨勢。除了找通信運營商，還有很多400電話代...

01-12

聯通電話機器人安裝（聯通電話機器人安裝流程）

本文目錄一覽：1、聯通上門送機器人,要求用花唄掃聯通app碼付610塊錢,然后每個月他們幫忙...2、打電話是人工助理接聽怎么...

06-20

成都呼叫中心外呼系統價錢（成都電話外呼系統

本文目錄一覽：1、成都呼叫中心哪家好?咱們是做金融的,電銷部急需一套電銷體系,要求能夠猜測式外呼,體系安穩2、呼叫中心...

11-29

如何參加win10預覽計劃？win10預覽版升級教程(附預覽版升級為正式版步驟)

win10預覽版怎么升級？ Win10預覽版一般都會比當前的Win10正式版功能上也會多很多，主要是面向測試用戶的。那么，怎么升級...

10-19

CentOS 7實現DNS+DHCP動態更新詳解

windows域里有一個功能，dhcp把新分發的ip數據發給DNS服務器，這樣只要知道一個人的電腦名字就可以很方便的遠程。 linux當然...

10-20

廣州防封外呼系統（廣州電話外呼系統）

今天給各位分享廣州防封外呼系統的知識，其中也會對廣州電話外呼系統進行解釋，如果能碰巧解決你現在面臨的問題，別忘...

05-16

北京哪種網絡電話好用

很多人在擔心網絡電話的一些問題，例如小公司缺技術，滿足不了客戶在功能方面的需求;而大公司服務的客戶又太多，售后...

10-25

通訊企業彩鈴錄音內容

1、引領尊貴品味，倡導靚號文化！歡迎致電鄭州翔翔通訊我們秉承“誠信第一信譽至上”的原則長期出售移動、聯通、電信...

11-27

物聯網卡的流量是真實流量嗎？三個角度分析

近年來，隨著物聯網發展速度的加快，物聯網卡這個專有名詞也在反復出現在大家的視覺當中，無論是網上，還是現實生活中...

10-13

電銷機器人能夠識別方言嗎（電銷機器人是什么意思）

本文目錄一覽： 1、電銷機器人能辨認四川話嗎？ 2、電銷機器人是只能辨認普通話嗎？ 3、電銷機器人能辨認多少種方言？...

11-26

北京外呼線路語音-慧營銷-企蜂云

導致企業迫切的需要提升自我的服務，切實做到為客戶解決問題，提升客戶滿意度，減少成本和增加拓客契機。最近很多客戶...

10-25

四川語音外呼系統廠家（成都電話外呼系統）

本篇文章給大家談談四川語音外呼系統廠家，以及成都電話外呼系統對應的知識點，希望對各位有所幫助，不要忘了收藏本站...

11-06

ajax 防止用戶反復提交的2種解決方案

可在服務器端加載方法：復制代碼代碼如下: private void OnLoading() { System.Text.StringBuilder sb = new System.Text.StringBuilder(); sb.Append...

10-18

400電話申請,讓企業服務更規范專業的400電話辦理服務

隨著社會的發展，第三產業的比例逐漸增加，企業不再僅僅從事生產，外部溝通和服務也非常重要。良好的發展不能與良好...

01-12

重慶電信電話群呼公司-信譽保證

重慶電信電話群呼公司主動營銷、節日/生日問候、投訴滿意度回訪、欠費催繳和通知等各類服務。企業電銷系統是根據市場...

01-15

常州教育外呼系統什么價格,電銷機器人-了解詳情

常州教育外呼系統什么價格,電銷機器人所以不可否認的就是電銷機器人的出現的確實給電銷行業帶來很多的便利，業務人員...

12-17

騰訊地圖添加店面位置，騰訊地圖店面位置添加

騰訊地圖怎么免費添加位置？如果經常去同一個地方，可以在騰訊地圖上添加地址，本期視頻就教大家如何在騰訊地圖添加...

11-26

400電話怎么辦理?400號碼如何申請?400電話上下班轉接不同號碼

很多公司，尤其是一些新成立的公司，要想節省大量的通信成本，就必須開400電話。因為400電話有很強的智能系統，包括接聽...

01-13

上海高頻次AI機器人辦理費用,回撥線路一企嗨-[安全可靠]

一企嗨電話營銷系統 1．當前的電銷場景有哪些困擾？ 1）手機.卡頻繁被封，電銷業務難以啟動； 2）銷售人員號碼被標注，...

12-17

廣州房產電銷專用機器人如何辦理-解讀

廣州房產電銷專用機器人如何辦理目前國內手機用戶已達9億，廣州網絡電話用戶規模則到100萬，市場發展前景很大。而相對...

05-18

“互聯網+”給力服務外包釋放市場潛力

什么是服務外包？義烏小商品城（600415）內的林女士在電商平臺售賣衣服已有5年。60后的她不會電腦不懂攝影，平日里，網店...

10-22

流量卡從商家買靠譜嗎，和在運營商購買有什么區別？

相信大家都從網絡上買過純流量卡，但是從運營商這邊買的基本上沒有，你這知道這是為什么嗎？從商家買和從運營商買有什...

10-13

400電話是什么,如何收費開通400電話收費標準是多少

400電話是運營商為企業事業單位推出的電話業務，個人無法處理。它是一個虛擬號碼，通過綁定手機、固定電話和其他物理...

01-12

如何便捷地辦理郴州400電話？——詳解四個方面的相關知識-郴州400電話辦理

隨著城市經濟的不斷發展，越來越多的企業、機構開始使用400電話。它為企業提供了有效的客戶服務，使客戶與企業之間的溝...

07-21

Python 數據化運營之KMeans聚類分析總結

10-18

本頁收集關于Python 數據化運營之KMeans聚類分析總結的相關信息資訊供網民參考！

推薦文章

上一篇：用Python寫腳本自動評論再也不怕碰到噴子

下一篇：Python做個自定義動態壁紙還可以放視頻

一起分享吧

婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

Python 數據化運營之KMeans聚類分析總結

目錄

Python 數據化運營

1、內容介紹

2、一般應用場景

3、聚類的常見方法

4、Keans聚類實現

5、聚類的評估指標

6、聚類效果可視化

7、數據預測