分割資料表與索引
SQL Server支援資料表和索引分割。 資料分割資料表和索引的資料,已分成可以在資料庫中的多個檔案群組之間分佈的單位。 資料是以水平方式分割,因此資料列的群組可對應至個別的資料分割。 單一索引或資料表的所有分割區必須在同一個資料庫中。 在資料上執行查詢或更新時,資料表或索引會被視為單一邏輯實體。 每個版本的 MicrosoftSQL Server 都無法使用資料分割資料表和索引。 如需 SQL Server 版本所支援的功能清單,請參閱2014 SQL Server 版本支援的功能。
重要
SQL Server 2014 預設支援最多 15,000 個分割區。 在 SQL Server 2012 之前的版本中,根據預設,分割區數目限制為 1,000。在 x86 型系統上,可以建立具有超過 1000 個數據分割的資料表或索引,但不受支援。
資料分割的優點
對大型資料表或索引進行資料分割,可以具有下列管理能力和效能優點。
您可以快速並有效率地傳送或存取資料子集,同時維護資料集合的完整性。 例如,將資料從 OLTP 載入至 OLAP 系統這類作業只需要數秒的時間,而不用像未對資料進行資料分割時,需要數分鐘或數小時的時間才能執行作業。
您可以更快速地對一個或多個分割區執行維護作業。 作業只處理這些資料子集,而非整個資料表,因此會更有效率。 例如,您可以選擇壓縮一個或多個分割區中的資料,或是重建索引的一個或多個分割區。
您可以提升查詢效能,不過這要視您經常執行的查詢類型和硬體組態而定。 例如,因為您可以聯結分割區本身,則在資料表中的分割資料行相同時,查詢最佳化工具可以更快速地處理兩個以上資料分割資料表之間的等聯結 (Equi-Join) 查詢。
當SQL Server執行 I/O 作業的資料排序時,它會先依分割區排序資料。 SQL Server一次存取一個磁片磁碟機,這可能會降低效能。 若要改善資料排序效能,請設定 RAID,以將分割區的資料檔案分割到多個磁碟上。 如此一來,雖然SQL Server仍依分割區排序資料,但它可以同時存取每個分割區的所有磁片磁碟機。
此外,您可以啟用分割區層級的鎖定擴大 (而非整個資料表) 來提升效能。 這可以減少資料表上的鎖定競爭。
元件和概念
下列詞彙適用於資料表和索引資料分割。
分割區函數
一種資料庫物件,可定義資料表或索引的資料列如何根據某些資料行 (稱為分割資料行) 的值對應至資料分割集。 也就是說,分割區函數會定義資料表擁有的分割區數目,以及分割區界限的定義方式。 例如,如果資料表包含銷售訂單資料,您可能想要根據 datetime
資料行 (例如銷售日期) 將資料表分割為 12 個 (每月) 分割區。
分割區配置
將分割區函數的資料分割對應至一組檔案群組的資料庫物件。 將分割區放在不同檔案群組的主要理由是可以確保能夠對分割區獨立執行備份作業。 這是因為您可以對個別檔案群組執行備份。
資料分割資料行
分割區函數用於分割資料表或索引的資料表或索引資料行。 參與分割區函數的計算資料行必須明確地標示為 PERSISTED。 所有適用於做為索引資料行的資料類型都可以做為分割資料行,但 timestamp
除外。 無法指定 ntext
、text
、image
、xml
、varchar(max)
、nvarchar(max)
或 varbinary(max)
資料類型。 此外,也無法指定 Microsoft .NET Framework Common Language Runtime (CLR) 使用者定義型別及別名資料類型資料行。
對齊的索引
在與對應資料表相同的分割區配置上建立的索引。 資料表與其索引對齊時,SQL Server 可以在維護資料表及其索引之分割區結構的同時,快速且有效地切換分割區。 索引不需要參與相同的具名分割區函數,即可對齊其基底資料表。 不過,索引和基底資料表的分割區函數本質上必須相同,也就是說 1) 這兩種分割區函數的引數具有相同的資料類型,2) 它們都定義相同數目的分割區,3) 對分割區都定義相同的界限值。
非對齊的索引
與其對應資料表分開進行資料分割的索引。 亦即,索引具有不同的分割區配置,或放在與基底資料表不同的檔案群組中。 在下列情況中,設計非對齊的資料分割索引可能十分有用:
尚未對基底資料表進行資料分割。
索引鍵是唯一的,並且不含資料表的分割資料行。
您希望使用不同的聯結資料行,讓基底資料表參與具有多個資料表的共置聯結。
分割區刪除
查詢最佳化工具用來只存取相關分割區以滿足查詢篩選準則的程序。
效能方針
15,000 個分割區中新的且較高的限制會影響記憶體、資料分割索引作業、DBCC 命令和查詢。 此節描述將分割區數目增加為超過 1,000 個的效能含意,並視需要提供解決方案。 具有最大分割區數目增加為 15,000 的限制,就可以較長時間地儲存資料。 不過,您只應該保留必要的資料,並維護效能與資料分割數目之間的平衡。
記憶體使用量和方針
如果正在使用大量分割區,則建議您至少使用 16 GB 的 RAM。 如果系統的記憶體不足,則資料操作語言 (DML) 陳述式、資料定義語言 (DDL) 陳述式和其他作業可能會因記憶體不足而失敗。 RAM 為 16 GB 且執行許多記憶體密集處理序的系統,可能會在針對大量分割區執行的作業時記憶體不足。 因此,記憶體愈多 (超過 16 GB),發生效能和記憶體問題的機會可能就愈少。
記憶體限制會影響 SQL Server 建立資料分割索引的效能或能力。 如果資料表有適用的叢集索引,當索引沒有對齊基底資料表或沒有對齊叢集索引時,特別會發生這種狀況。
資料分割索引作業
記憶體限制會影響 SQL Server 建立資料分割索引的效能或能力。 這特別適用於非對齊索引。 您可以對包含超過 1,000 個分割區的資料表,建立及重建不以資料表為準的索引,但不予支援。 此做法可能會導致在作業期間效能降低或耗用過多記憶體。
建立和重建對齊索引所需的執行時間,可能會隨著分割區數目的增加而增加。 建議您不要同時執行多個建立和重建索引命令,這樣做可能會造成效能和記憶體問題。
SQL Server 執行排序以建立資料分割索引時,會先對每個分割區建立一個排序表。 接著會在每個分割區的個別檔案群組中建立排序表,而如果指定 SORT_IN_TEMPDB 索引選項,則會在 tempdb
中建立排序表。 每個排序表都需要最小量的記憶體才能建立。 當您在建立對齊基底資料表的資料分割索引時,會使用少量記憶體一次建立一個排序表。 不過,當您在建立非對齊資料分割索引時,則會同時建立排序表。 因此,必須有足夠的記憶體才能處理這些並行排序作業。 分割區的數量越大的話,則需要越多記憶體。 對每個分割區來說,每個排序表的大小下限為 40 個頁面,而每一頁都為 8 KB。 例如,具有 100 個分割區的非對齊資料分割索引,需要足夠的記憶體,才能同時連續排序 4,000 (40 * 100) 頁。 如果有可用的記憶體,則建立作業會成功,但效能會變差。 如果無法使用這個數量的記憶體,建立作業會失敗。 此外,具有 100 個分割區的對齊資料分割索引只需要足夠排序 40 頁的記憶體,因為並不會同時執行排序作業。
若為對齊和非對齊索引,如果 SQL Server 將平行處理原則的程度套用至多處理器電腦上的建立作業,則記憶體需求會比較大。 這是因為平行處理原則的程度越大,則記憶體需求也越大。 例如,如果 SQL Server 將平行處理原則的程度設為 4,則具有 100 個分割區的非對齊資料分割索引需要四個處理器的足夠記憶體,才能同時排序 4,000 頁或 16,000 頁。 如果已對齊資料分割索引,則記憶體需求會降低為四個處理器排序 40 頁,或 160 (4 * 40) 頁。 您可以使用 MAXDOP 索引選項,以手動方式降低平行處理原則的程度。
DBCC 命令
如果具有較大的分割區數目,則 DBCC 命令所需的執行時間可能會隨著分割區數目的增加而增加。
查詢
使用分割區刪除的查詢,可能會具有較大分割區數目的可比較或改善效能。 未使用分割區刪除的查詢,所需執行時間可能會隨著分割區數目的增加而增加。
例如,假設資料表有 1 億個資料列和資料行 A
、 B
和 C
。 在案例 1 中,資料表的資料行 A
上分成 1000 個分割區。 在案例 2 中,資料表的資料行 A
上分成 10,000 個資料分區。 資料表上具有篩選資料行 A
之 WHERE 子句的查詢,會執行資料分割刪除,並掃描一個資料分割。 在案例 2 中,因為分割區中要掃描的資料列較少,所以這個相同查詢的執行速度會較快。 具有篩選資料行 B 之 WHERE 子句的查詢會掃描所有分割區。 在案例 1 中,因為要掃描的分割區較少,所以此查詢的執行速度會比案例 2 還要快。
如果查詢在分割資料行以外的資料行上使用類似 TOP 或 MAX/MIN 的運算子,則可能會因為資料分割而遇到效能降低的情況,因為所有分割區都必須評估。
資料分割索引作業期間統計資料計算的行為變更
從 SQL Server 2012 開始,建立或重建分割索引時,不會掃描資料表中的所有資料列來建立統計資料。 反之,查詢最佳化工具會使用預設的採樣演算法來產生統計資料。 升級具有分割區索引的資料庫之後,可能會注意到這些索引之長條圖資料的差異。 此行為變更可能不會影響查詢效能。 如果要在掃描資料表中所有資料列時取得分割區索引的統計資料,請使用 CREATE STATISTICS 或 UPDATE STATISTICS 搭配 FULLSCAN 子句。
相關工作
工作 | 主題 |
描述如何建立分割區函數和分割區配置,然後將它們套用至資料表和索引。 | 建立分割區資料表及索引 |
相關內容
您可能會發現下列資料分割資料表和索引策略和實作白皮書十分有用。