共用方式為


CNTK 中的 BrainScript epochSize

如需 Python 使用者,請參閱 這裡

每個 epoch 中的動態座標軸) (張量的 標籤 樣本數目。 epochSizeCNTK 中的 是卷範例數目,之後會採取特定的其他動作,包括

  • 您可以從這裡重新開機儲存檢查點模型 (定型)
  • 交叉驗證
  • 學習速率控制
  • minibatch-scaling

請注意,標籤樣本數目的定義類似于 用於 minibatchSize (minibatch_size_in_samples) 的樣本數目。 的定義 epochSizeminitbatchSizeepochSize 樣本的定義不同,而不是輸入樣本。

因此,重要的是,對於循序資料,範例是序列的個別專案。 因此,CNTK epochSize不會參考數個序列,而是構成迷你批次之序列卷上的序列專案

同樣重要的是,它是 標籤 樣本,而不是輸入樣本,而每個序列的標籤數目不一定是輸入樣本的數目。 例如,每個序列都有一個標籤,每個序列都有一個標籤,而且每個序列都有許多樣本 (, epochSize 在此情況下會像序列數目) 一樣,而且每個樣本都有一個標籤,在此案例 epochSizeminibatchSize 中,每個樣本 (不是序列) 的計算方式完全相同。

對於較小的資料集大小, epochSize 通常會設定為等於資料集大小。 在 BrainScript 中,您可以指定 0 來表示。 在 Python 中,您可以為此指定 cntk.io.INFINITELY_REPEAT 。 在 Python 中,您也可以將它設定為 cntk.io.FULL_DATA_SWEEP 處理會在整個資料大小的一次之後停止的位置。

針對大型資料集,您可以透過檢查點來引導您選擇的 epochSize。 例如,如果您想要在發生電源中斷或網路問題時遺失最多 30 分鐘的計算,您會想要每隔 30 分鐘建立一個檢查點, (定型可以繼續) 。 選擇 epochSize 為大約需要 30 分鐘計算的樣本數目。