亚洲一区二区在线免费观看,精品日韩欧美,久久久蜜臀国产一区二区

主頁 > 知識庫 > Pytorch中的數據集劃分&正則化方法

Pytorch中的數據集劃分&正則化方法

1.訓練集驗證集測試集

訓練集：訓練數據

驗證集：驗證不同算法（比如利用網格搜索對超參數進行調整等），檢驗哪種更有效

測試集：正確評估分類器的性能

正常流程：驗證集會記錄每個時間戳的參數，在加載test數據前會加載那個最好的參數，再來評估。比方說訓練完6000個epoch后，發現在第3520個epoch的validation表現最好，測試時會加載第3520個epoch的參數。

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from    torchvision import datasets, transforms
#超參數
batch_size=200
learning_rate=0.01
epochs=10
#獲取訓練數據
train_db = datasets.MNIST('../data', train=True, download=True,   #train=True則得到的是訓練集
                   transform=transforms.Compose([                 #transform進行數據預處理
                       transforms.ToTensor(),                     #轉成Tensor類型的數據
                       transforms.Normalize((0.1307,), (0.3081,)) #進行數據標準化(減去均值除以方差)
                   ]))
#DataLoader把訓練數據分成多個小組，此函數每次拋出一組數據。直至把所有的數據都拋出。就是做一個數據的初始化
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)
#獲取測試數據
test_db = datasets.MNIST('../data', train=False,
                   transform=transforms.Compose([
                        transforms.ToTensor(),
                        transforms.Normalize((0.1307,), (0.3081,))
                   ]))
test_loader = torch.utils.data.DataLoader(test_db, batch_size=batch_size, shuffle=True)
#將訓練集拆分成訓練集和驗證集
print('train:', len(train_db), 'test:', len(test_db))                              #train: 60000 test: 10000
train_db, val_db = torch.utils.data.random_split(train_db, [50000, 10000])
print('db1:', len(train_db), 'db2:', len(val_db))                                  #db1: 50000 db2: 10000
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)
val_loader = torch.utils.data.DataLoader(val_db, batch_size=batch_size, shuffle=True)
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.model = nn.Sequential(         #定義網絡的每一層,
            nn.Linear(784, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 10),
            nn.ReLU(inplace=True),
        )
    def forward(self, x):
        x = self.model(x)
        return x
net = MLP()
#定義sgd優化器,指明優化參數、學習率，net.parameters()得到這個類所定義的網絡的參數[[w1,b1,w2,b2,...]
optimizer = optim.SGD(net.parameters(), lr=learning_rate)
criteon = nn.CrossEntropyLoss()
for epoch in range(epochs):
    for batch_idx, (data, target) in enumerate(train_loader):
        data = data.view(-1, 28*28)          #將二維的圖片數據攤平[樣本數,784]
        logits = net(data)                   #前向傳播
        loss = criteon(logits, target)       #nn.CrossEntropyLoss()自帶Softmax
        optimizer.zero_grad()                #梯度信息清空
        loss.backward()                      #反向傳播獲取梯度
        optimizer.step()                     #優化器更新
        if batch_idx % 100 == 0:             #每100個batch輸出一次信息
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                       100. * batch_idx / len(train_loader), loss.item()))
    #驗證集用來檢測訓練是否過擬合
    val_loss = 0
    correct = 0
    for data, target in val_loader:
        data = data.view(-1, 28 * 28)
        logits = net(data)
        val_loss += criteon(logits, target).item()
        pred = logits.data.max(dim=1)[1]
        correct += pred.eq(target.data).sum()
    val_loss /= len(val_loader.dataset)
    print('\nVAL set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
        val_loss, correct, len(val_loader.dataset),
        100. * correct / len(val_loader.dataset)))
#測試集用來評估
test_loss = 0
correct = 0                                         #correct記錄正確分類的樣本數
for data, target in test_loader:
    data = data.view(-1, 28 * 28)
    logits = net(data)
    test_loss += criteon(logits, target).item()     #其實就是criteon(logits, target)的值，標量
    pred = logits.data.max(dim=1)[1]                #也可以寫成pred=logits.argmax(dim=1)
    correct += pred.eq(target.data).sum()
test_loss /= len(test_loader.dataset)
print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
    test_loss, correct, len(test_loader.dataset),
    100. * correct / len(test_loader.dataset)))

2.正則化

正則化可以解決過擬合問題。

2.1L2范數（更常用）

在定義優化器的時候設定weigth_decay，即L2范數前面的λ參數。

optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate, weight_decay=0.01)

2.2L1范數

Pytorch沒有直接可以調用的方法，實現如下：

3.動量（Momentum）

Adam優化器內置了momentum，SGD需要手動設置。

optimizer = torch.optim.SGD(model.parameters(), args=lr, momentum=args.momentum, weight_decay=args.weight_decay)

4.學習率衰減

torch.optim.lr_scheduler 中提供了基于多種epoch數目調整學習率的方法。

4.1torch.optim.lr_scheduler.ReduceLROnPlateau：基于測量指標對學習率進行動態的下降

torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, verbose=False, threshold=0.0001, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-08)

訓練過程中，optimizer會把learning rate 交給scheduler管理，當指標（比如loss）連續patience次數還沒有改進時，需要降低學習率，factor為每次下降的比例。

scheduler.step(loss_val)每調用一次就會監聽一次loss_val。

4.2torch.optim.lr_scheduler.StepLR：基于epoch

torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)

當epoch每過stop_size時，學習率都變為初始學習率的gamma倍。

5.提前停止（防止overfitting）

基于經驗值。

6.Dropout隨機失活

遍歷每一層，設置消除神經網絡中的節點概率，得到精簡后的一個樣本。

torch.nn.Dropout(p=dropout_prob)

p表示的示的是刪除節點數的比例（Tip：tensorflow中keep_prob表示保留節點數的比例，不要混淆）

測試階段無需使用dropout，所以在train之前執行net_dropped.train()相當于啟用dropout，測試之前執行net_dropped.eval()相當于不啟用dropout。

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

在Pytorch中使用樣本權重(sample_weight)的正確方法
Pytorch 如何實現常用正則化
PyTorch 實現L2正則化以及Dropout的操作
Python深度學習pyTorch權重衰減與L2范數正則化解析

標簽：成都江蘇常州蘭州宿遷六盤水駐馬店山東

巨人網絡通訊聲明：本文標題《Pytorch中的數據集劃分&正則化方法》，本文關鍵詞 Pytorch,中的,數據,集,劃分,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《Pytorch中的數據集劃分&正則化方法》相關的同類信息！

Pytorch中的數據集劃分&正則化方法

1.訓練集驗證集測試集訓練集：訓練數據驗證集：驗證不同算法（比如利用網格搜索對超參數進行調整等），檢驗哪種更有效測試集：正確評估分類器的性能正常流程：驗證集會記錄...

10-18

現在最火的餐飲加盟項目有哪些？你覺得現在餐飲行業好做嗎？

2018年最火的餐飲加盟店之貝克士漢堡現在社會的生活方式都是快節奏的，人們會為了節省更多的時間而去選擇快餐。然而漢...

12-14

電銷顧客資源怎么找？

電銷顧客資源怎么找？在電話銷售過程中，正確的尋找到意向顧客是我們做電話銷售人員的關鍵的一步。電話銷售人員在每...

10-24

干洗商標該如何選擇合適的類別呢？

所謂三百六十五行行行出狀元，現在社會工種也是特別多，只要想的出到，都是有市場的，很多人買的衣服都是品牌，自己又...

10-23

有準確率很高的空號檢測軟件嗎？

怎么解決手機空號這一麻煩事呢，用手機空號檢測就能解決，現在手機空號檢測的軟件在網上一搜出來的太多，一時之間不知...

12-03

淺談400電話企業客服的有力工具

現在各行各業的發展都離不開互聯網，企業更是如此，現在越來越多的企業開始了網絡營銷的征程，都想讓自己的業務在互聯...

12-22

嘉興不封號呼叫中心軟件多少錢,呼叫中心軟件辦理費用-信譽保證

嘉興不封號呼叫中心軟件多少錢,呼叫中心軟件辦理費用預計電銷機器人將會大規模運用，智能電銷機器人的市場份額將逐步...

12-17

建立品牌美謄度的策略

品牌競爭是市場競爭在經歷了價格、質量、服務等各方面的較量之后進入的一個新階段。品牌與產品不同，它強調系統性和全...

10-23

商標注冊人的權利和義務

（一）商標注冊人的權利商標注冊人的權利主要是指對注冊商標所享有的專用權。我國《商標法》規定：經商標局核準注冊...

10-23

陽江智能外呼系統（ai智能外呼系統銷售）

本文目錄一覽： 1、自動外呼系統是什么，使用自動外呼營銷系統違法嗎？ 2、什么是智能外呼營銷系統？求詳細解答 3、自動...

11-24

手機坐席與PC端云呼叫中心有哪些區別

疫情期間坐席受制于網絡條件或者沒帶電腦，手機坐席是坐席居家辦公的一種新方式，適合沒有電腦或者更愿意使用手機的坐...

12-07

電銷機器人未來趨勢圖分析（機器人銷售前景）

本文目次一覽： 1、AI智能電銷呆板人阛阓前景如何樣？ 2、德律風發售將來的走向是什么？ 3、中科嘉智電銷呆板人將來的發...

11-26

電銷卡公司封號咋辦

對于電話銷售人員來說，他們每天都要使用手機卡撥打電銷電話，可以說呼出頻率是非常高的，如果使用三大運營商發行的手...

12-16

精確定位店位置多少錢？精確定位位置？

北京現代4s店裝gps定位多少錢？如果需要可以去汽配城和GPS公司安裝，記著要軟件客戶端、賬號和密碼。你可以貨比三家，一...

11-26

10-23

一鍵呼救911呼叫中心！Uber推出呼叫功能提高救援效率

據境外媒體報道，讓報警電話時用戶的定位變得更準確，這不僅是在優化應急流程，更可能是在生死關頭提高救援效率。FC...

10-19

大理州電銷機器人培訓（電銷機器人話術劇情）

本文目錄一覽： 1、學習工業機器人到哪里學??？2、電銷機器人究竟多少錢？價格往來不斷怎樣這么大3、有誰用過電銷機器...

04-22

400電話漏接短信功能意義有多大?

當企業漏接掉一個電話，400電話客服會在一定時間給企業發去漏接短信，這就很大程度上降低了企業漏接電話而造成的損失。...

12-22

windows2000下C盤權限設置

1.選取整個硬盤： system：完全控制 administrator：完全控制 (允許將來自父系的可繼承性權限傳播給對象) 2/programfiles/commonfiles：...

10-20

客服中心服務量話量預測入門

服務預測與排班是大部分服務行業有效管理的關鍵環節，尤其是客服中心，對服務預測準確度要求高，對排班的舒適性和效率...

10-22

消費級物聯網專用卡14103怎么激活（電信物聯卡14104激活）

141號段是電信物聯卡號段，作為目前物聯網市場上最大的物聯卡運營商，電信物聯卡其卡片的穩定性和質量得到的一致好評。...

11-07

400電話辦理一年多少錢？解析金錢背后的談判技巧、價格構成、影響因素和節省策略-400電話辦

在商業社會中，電話交流作為最直接的聯系方式，一直被視為商業合作的重要手段。而在以客戶為中心的營銷模式中，400電話...

07-21

在正規平臺辦理電銷卡的好處

選擇電話營銷時，重要的及時電話卡了，但是使用普通的電話卡因為電話的數量較多就很容易被封，那么就需要去辦理電銷卡...

12-04

AI電話機器人是騙局嗎（ai電話智能機器人）

本文目錄一覽：1、ai電話詐騙是怎么回事兒?2、如何預防利用AI電話詐騙的騙局?3、ai電話詐騙,是真的嗎?4、江蘇鎮江一騙子用...

06-20

廊坊電銷卡好用嗎

廊坊電銷卡好用嗎 "本公司是一家專業做電銷卡的通訊公司！十年行業經驗為為您保駕護航！卡種多，歸屬地齊全。滿足不同...

12-15

Python基礎之hashlib模塊詳解

目錄一、hashlib簡介二、hash對象的方法三、hashlib實際操作四、小小案例一、hashlib簡介 1.什么叫hash: hash是一種算法（不同...

10-18

智能外呼系統對接網關（智能外呼系統對接網關有什么用）

今天給各位分享智能外呼系統對接網關的知識，其中也會對智能外呼系統對接網關有什么用進行解釋，如果能碰巧解決你現在...

11-06

400電話的智能網平臺是怎么回事

對于400電話這樣的一種業務，很多人是不了解的，甚至不知道這樣一種業務的存在，畢竟自己從來沒有接觸過這樣一種類型的...

05-16

西安5G電話線路詳情-專業服務

西安5G電話線路詳情因此，對于從事電銷業的企業，或對某些從事電話銷售的企業來說，智能電銷機器人是一個好的選擇。目...

01-15

靚車spavip會所企業彩鈴錄音

您好，歡迎致電靚車spavip會所。我們以專業的技術，為您的愛車提供汽車美容、精品裝具、鍍晶、鍍膜、防爆膜、封釉等專業...

11-27

聯通116114為廣交會客商提供無憂服務

第109屆廣交會期間，廣東聯通整合了116114業務的酒店機票預訂、交通顧問等服務，為廣交會客商提供無憂服務。據悉，1161...

10-19

電銷行業大革命，電銷機器人到底帶來了什么

電銷領域革命，電銷機器人究竟帶給了哪些在2017年電銷領域早已進入了一個乏力的環節：大家抵觸電銷的電話，只需已接...

01-15

辦400電話需要多少錢開通一個400電話需要多少錢？

400電話由主電話和被電話分擔，即400電話承擔市政電話接入費，被電話承擔所有400電話接聽費。影響400電話價格的因素很多...

01-12

重慶電銷機器人代勞

匯港通自決研制鑒于大數據、云計劃的產物。扶助大中小企業提率，提高管理，優化運維。移動crm經過大數據、云計劃調整云...

10-31

寧波教育AI電話機器人辦理價格-放心省心

寧波教育AI電話機器人辦理價格進員工難以跟進。流失率居高不下：銷售工作單調乏味，流失率居高不下?，F在對于很多的傳...

01-16

突發：剛剛，美國官方宣布“封殺”中國移動！??！移動公司重磅回應...

12-04

巨人科技如何來管理員工

任何公司對自己員工的管理工作都是非常重要的，只有我們真正的做好各個方面的管理，你就會發現其實所有的事情都能夠有...

05-15

什么是客服外包，怎么挑選靠譜公司合作？

什么是客服外包？客服外包，是指企業將客服工作交由其他企業負責，客服外包類型主要有：售前咨詢、售后服務等。這對...

01-16

win7升級win8.1后360瀏覽器打不開了怎么辦？

原先安裝win7系統換為win8.1update（win8應該適用），之前安裝在D盤的360極速/安全瀏覽器無法打開，可使用此方法。軟件名稱：...

10-20

電話智能機器人怎么樣，到底有沒有效果

人工客服收到工作時間、效率以及工作量的限制，已經無法完全適應部分企業的呼叫業務。通過AI智能軟件系統的協助，完成...

07-12

福州房產電話呼叫軟件在哪可以辦理,電銷系統-[熱門]

福州房產電話呼叫軟件在哪可以辦理,電銷系統因為電話營銷機器人可以更好的進行智能交流，所以就會讓廣大客戶的好感度...

12-17

合肥智能電銷網絡線路辦理服務商-誠信合作

合肥智能電銷網絡線路辦理服務商它不只能提高企業的營銷效率，還能幫助企業提高服務效率，除此之外，企業搭建智能電銷...

01-16

ai外呼電話機器人（ai外呼機器人費用）

本文目錄一覽： 1、這個獵星AI智能外呼機器人好用嗎？2、ai智能電話機器人有什么作用？3、AI語音機器人有哪些好處4、智...

11-27

上半年重慶市服務外包執行額達4.7億美元增長169%

重慶頻道消息 6月30日,記者從"2013重慶市服務貿易工作會"上獲悉,今年上半年我市服務外包執行額達4.7億美元,同比增長169%。此...

10-22

云外呼系統質量

外呼系統是一種具有完善防封功能以及客戶管理后臺的系統，目前電銷行業現在面臨的問題就是現在封號問題嚴重，不管用哪...

11-27

viewport.exe進程是什么意思

進程文件： viewport or viewport.exe 進程名稱： ATI/Appian HydraVision Desktop Manager 進程類別：存在安全風險的進程英文描述： viewpo...

10-19

win8圖片庫加入圖片的方法介紹

Win8系統中的Metro界面真是灰常漂亮啊，我就喜歡在這界面下用不過可以用的軟件真是少。Metro界面中的相片下的圖片庫，你打...

10-20

易才博普奧為全球最大中文書籍零售商提供整體人力資源外包服務

CTI論壇(ctiforum)6月30日消息（記者楊佳林）：人力資源外包專家、服務外包產業專業人才租賃供應商---北京易才博普奧管理顧...

10-19

重慶高院終審判決假冒“簡單搜索”網站賠償百度80萬元

來源：中國知識產權資訊網一個域名為“baidu”的搜索網站，卻被法院判決賠償百度公司80萬元。這究竟是為何？ “百度推...

10-23

Ruby中的block、proc、lambda區別總結

在規則引擎中，Ruby 的閉包使用特別頻繁，而且有 block，Proc和 lambda 等后幾種形式的用法，很讓人困惑。為了深入理解代碼，...

10-18

銀川智能外呼系統價格（外呼系統收費）

本文目錄一覽： 1、外呼體系裝置須要哪些用度？ 2、召喚焦點或外呼體系哪種又廉價又好的啊 3、智能外呼體系幾何錢？ 4、...

11-26

Pytorch中的數據集劃分&正則化方法

10-18

本頁收集關于Pytorch中的數據集劃分&正則化方法的相關信息資訊供網民參考！

推薦文章

上一篇：Pytorch 如何實現常用正則化

下一篇：讓文件路徑提取變得更簡單的Python Path庫

一起分享吧

婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

Pytorch中的數據集劃分&正則化方法

1.訓練集驗證集測試集

2.正則化

2.1L2范數（更常用）

2.2L1范數

3.動量（Momentum）

4.學習率衰減

4.1torch.optim.lr_scheduler.ReduceLROnPlateau：基于測量指標對學習率進行動態的下降

4.2torch.optim.lr_scheduler.StepLR：基于epoch

5.提前停止（防止overfitting）

6.Dropout隨機失活