CNTK 中的 BrainScript epochSize
如需 Python 使用者,請參閱 這裡。
每個 epoch 中的動態座標軸) (張量的 標籤 樣本數目。 epochSize
CNTK 中的 是卷標範例數目,之後會採取特定的其他動作,包括
- 您可以從這裡重新開機儲存檢查點模型 (定型)
- 交叉驗證
- 學習速率控制
- minibatch-scaling
請注意,標籤樣本數目的定義類似于 用於 minibatchSize (minibatch_size_in_samples) 的樣本數目。 的定義 epochSize
與 minitbatchSize
epochSize
卷 標 樣本的定義不同,而不是輸入樣本。
因此,重要的是,對於循序資料,範例是序列的個別專案。
因此,CNTK epochSize
不會參考數個序列,而是構成迷你批次之序列卷標上的序列專案。
同樣重要的是,它是 標籤 樣本,而不是輸入樣本,而每個序列的標籤數目不一定是輸入樣本的數目。 例如,每個序列都有一個標籤,每個序列都有一個標籤,而且每個序列都有許多樣本 (, epochSize
在此情況下會像序列數目) 一樣,而且每個樣本都有一個標籤,在此案例 epochSize
minibatchSize
中,每個樣本 (不是序列) 的計算方式完全相同。
對於較小的資料集大小, epochSize
通常會設定為等於資料集大小。 在 BrainScript 中,您可以指定 0 來表示。 在 Python 中,您可以為此指定 cntk.io.INFINITELY_REPEAT
。 在 Python 中,您也可以將它設定為 cntk.io.FULL_DATA_SWEEP
處理會在整個資料大小的一次之後停止的位置。
針對大型資料集,您可以透過檢查點來引導您選擇的 epochSize。 例如,如果您想要在發生電源中斷或網路問題時遺失最多 30 分鐘的計算,您會想要每隔 30 分鐘建立一個檢查點, (定型可以繼續) 。 選擇 epochSize
為大約需要 30 分鐘計算的樣本數目。