CNTK 中的 BrainScript epochSize

發行項
03/10/2017

如需 Python 使用者，請參閱這裡。

每個 epoch 中的動態座標軸) (張量的標籤樣本數目。 epochSizeCNTK 中的是卷標範例數目，之後會採取特定的其他動作，包括

您可以從這裡重新開機儲存檢查點模型 (定型)
交叉驗證
學習速率控制
minibatch-scaling

請注意，標籤樣本數目的定義類似于用於 minibatchSize (minibatch_size_in_samples) 的樣本數目。的定義 epochSize 與 minitbatchSizeepochSize 卷標樣本的定義不同，而不是輸入樣本。

因此，重要的是，對於循序資料，範例是序列的個別專案。因此，CNTK epochSize不會參考數個序列，而是構成迷你批次之序列卷標上的序列專案。

同樣重要的是，它是標籤樣本，而不是輸入樣本，而每個序列的標籤數目不一定是輸入樣本的數目。例如，每個序列都有一個標籤，每個序列都有一個標籤，而且每個序列都有許多樣本 (， epochSize 在此情況下會像序列數目) 一樣，而且每個樣本都有一個標籤，在此案例 epochSizeminibatchSize 中，每個樣本 (不是序列) 的計算方式完全相同。

對於較小的資料集大小， epochSize 通常會設定為等於資料集大小。在 BrainScript 中，您可以指定 0 來表示。在 Python 中，您可以為此指定 cntk.io.INFINITELY_REPEAT 。在 Python 中，您也可以將它設定為 cntk.io.FULL_DATA_SWEEP 處理會在整個資料大小的一次之後停止的位置。

針對大型資料集，您可以透過檢查點來引導您選擇的 epochSize。例如，如果您想要在發生電源中斷或網路問題時遺失最多 30 分鐘的計算，您會想要每隔 30 分鐘建立一個檢查點， (定型可以繼續) 。選擇 epochSize 為大約需要 30 分鐘計算的樣本數目。

共用方式為

CNTK 中的 BrainScript epochSize

其他資源