婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python方差特征過濾的實例分析

Python方差特征過濾的實例分析

熱門標簽:西藏房產智能外呼系統要多少錢 ai電話機器人哪里好 ai電銷機器人源碼 百度地圖標注沒有了 地圖標注審核表 湛江智能外呼系統廠家 宿遷星美防封電銷卡 外呼并發線路 長沙高頻外呼系統原理是什么

說明

1、通過特征本身的方差來篩選特征。特征的方差越小,特征的變化越不明顯。

2、變化越不明顯的特征對我們區分標簽沒有太大作用,因此應該消除這些特征。

實例

def variance_demo():
    """
    過濾低方差特征
    :return:
    """
    # 1. 獲取數據
    data = pd.read_csv('factor_returns.csv')
    data = data.iloc[:, 1:-2]
    print('data:\n', data)
 
    # 2. 實例化一個轉換器類
    transfer = VarianceThreshold(threshold=10)
 
    # 3. 調用fit_transform()
    data_new = transfer.fit_transform(data)
    print('data_new:\n', data_new, data_new.shape)
 
   
    return None

知識點擴充:

方差過濾法

VarianceThreshold 是特征選擇的一個簡單基本方法,其原理在于–底方差的特征的預測效果往往不好。而VarianceThreshold會移除所有那些方差不滿足一些閾值的特征。默認情況下,它將會移除所有的零方差特征,即那些在所有的樣本上的取值均不變的特征。

sklearn中的VarianceThreshold類中重要參數 threshold(方差的閾值),表示刪除所有方差小于threshold的特征 #不填默認為0——刪除所有記錄相同的特征。

import pandas as pd
import numpy as np
np.random.seed(1) #設置隨機種子,實現每次生成的隨機數矩陣都一樣
a= np.random.randint(0, 200,10)
b= np.random.randint(0, 200,10)
c= np.random.randint(0, 200,10)
d= [9,9,9,9,9,9,9,9,9,9]
data=pd.DataFrame({"A" : a,"B" : b,"C" : c,"D" : d})
data
from sklearn.feature_selection import VarianceThreshold
sel_model = VarianceThreshold(threshold = 0)
#刪除不合格特征之后的新矩陣
sel_model.fit_transform(data)

到此這篇關于Python方差特征過濾的實例分析的文章就介紹到這了,更多相關Python方差特征過濾的實現內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

標簽:盤錦 海南 南平 漯河 大同 林芝 寧夏 普洱

巨人網絡通訊聲明:本文標題《Python方差特征過濾的實例分析》,本文關鍵詞  Python,方差,特征,過濾,的,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python方差特征過濾的實例分析》相關的同類信息!
  • 本頁收集關于Python方差特征過濾的實例分析的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 岳阳市| 启东市| 浦北县| 遵义县| 岑巩县| 新野县| 休宁县| 安国市| 济阳县| 麻栗坡县| 舒兰市| 南部县| 离岛区| 宁海县| 板桥市| 正宁县| 新密市| 兴业县| 江源县| 泰来县| 龙山县| 雅江县| 汉川市| 连江县| 平遥县| 铜川市| 洪江市| 临湘市| 九台市| 衡阳市| 和顺县| 汝南县| 宜君县| 陈巴尔虎旗| 土默特左旗| 启东市| 白山市| 卓尼县| 聂荣县| 安岳县| 朝阳县|