共用方式為


使用數字發明將數據大眾化

煤炭、石油和人類潛力是工業革命期間三大衍生資產。 這些資產製造了公司、轉移市場,最終改變了國家。 在數字經濟中,有三個同樣重要的創新資產:數據、裝置和人類潛力。 這些資產具有巨大的創新潛力。 對於現代的任何創新努力,數據是新的石油。

在每個公司中,都有可用來尋找並符合客戶需求的數據。 不幸的是,採礦數據以推動創新的程式可能代價高昂且耗時,因此不會探索需求,也不會建立解決方案。 數據民主化可以解決此問題。

什麼是數據民主化? 這是將數據放入正確手以推動創新的過程。 這種民主化程式可能採用數種形式,但通常包括內嵌或整合原始數據、集中化數據、共用數據及保護數據的解決方案。 當數據大眾化時,公司周圍的專家可以使用數據來形成和測試假設。 在許多情況下,雲端採用小組只能 使用數據與客戶同理心 來建置,以快速滿足客戶需求。

將數據大眾化的方式

有各種方式可將數據大眾化,但大部分方法包括收集、集中、控管及共享數據的方法。 下列各節說明其中一些方法。 當您建置客戶假設的解決方案時,應該評估是否要將數據大眾化、在何種程度和操作方式上。

用於將數據大眾化的程式,顯示這些程式:控管、集中、收集和共享數據。

分享資料

當您以客戶同理心建置時,客戶需求會引導解決方案。 如果需求是數據,解決方案可讓客戶直接詢問、分析及報告數據,而IT人員不支援。

許多成功的創新從最低可行產品 (MVP) 開始,以將數據傳遞給客戶。 MVP 是產品版本,其功能剛好可供客戶使用。 它會顯示產品可能的潛力,以便收集客戶的意見反應。 在此指引模型中,員工是數據取用者。 該員工使用數據來協助客戶。 每次客戶參與手動支援時,都可以測試並驗證假設。 這種方法通常是在大量投資整合式解決方案之前,先測試以客戶為中心的假設的符合成本效益的方法。

直接與數據取用者共享數據的主要工具包括自助報告或內嵌在其他體驗中的數據,使用 Power BI 之類的工具。

注意

在共享數據之前,請確定您已閱讀下列各節。 共享數據可能需要控管,才能為數據提供保護。 此外,如果數據跨越多個雲端,則可能需要集中化。 如果資料位於應用程式內,您必須加以收集才能共用。

控管數據

共用數據可快速產生客戶交談中使用的最低可行產品。 不過,若要將共用數據轉換成實用且可採取動作的知識,通常需要更多知識。

透過數據共用驗證假設之後,下一個階段的開發通常是數據控管。

數據控管是一個廣泛的主題,可能需要自己的專用架構,而此主題不在 雲端採用架構 範圍之外。

當您驗證客戶假設時,有數個數據控管層面需要考慮。 例如:

  • 共用數據是否機密?在公開共享數據之前,應該先分類數據,以保護客戶和公司的利益。
  • 如果數據是機密的,是否已受到保護? 敏感數據的保護是民主化數據的必須。 保護數據解決方案中所討論的範例工作負載提供一些保護數據的參考。
  • 數據是否已編錄? 識別共用數據的性質有助於長期數據管理。 記錄數據的工具,例如 Azure 資料目錄,可讓此程式在雲端更加容易。 有關 數據 批註和 數據源 文件的相關指引可以加速此程式。

當數據民主化對於以客戶為主的假設很重要時,請確定共用數據的控管位於發行計劃中。 這可保護客戶、數據取用者和公司。

集中處理數據

數據集中化會導致更有意義的報告、確保整個組織都有相同的數據可供使用,並增加您的ROI。 當數據分散到IT環境時,創新的機會可能會受到極大的限制、昂貴且耗時。 雲端提供集中數據的新機會。 當需要集中化多個數據源以 客戶同理心建置時,雲端可以加速假設的測試。

警告

數據集中化代表任何創新程式中的風險點。 當數據集中化是技術尖峰,而不是客戶價值的來源時,我們建議您延遲集中化,直到客戶假設經過驗證為止。

當您集中化時,您需要適用於集中式數據的適當數據存放區。 在雲端中建立數據倉儲是很好的作法。 這個可調整的選項提供所有數據的中央位置。 這種類型的解決方案可在在線分析處理 (OLAP) 或巨量數據選項中使用。

OLAP巨量數據解決方案的參考架構可協助您在 Azure 中選擇最適當的集中化解決方案。 如果需要混合式解決方案,擴充 內部部署數據的 參考架構也有助於加速解決方案開發。

重要

對於某些客戶需求和解決方案,簡單的方法可能就足夠了。 雲端架構設計人員應挑戰小組考慮低成本解決方案,以驗證客戶假設,特別是在早期開發期間。 本節將討論可能針對您的情況建議不同解決方案的案例。

收集資料

數據收集的兩個主要形式是 整合擷取

整合: 位於現有數據存放區中的數據可以使用傳統的數據移動技術,整合至集中式數據存放區。 這特別適用於涉及多重雲端數據記憶體的案例。 這些技術涉及從現有的數據存放區擷取數據,然後將它載入中央數據存放區。 在此程式中的某個時間點,數據通常會轉換成在中央存放區中更可用且更相關。

雲端式工具已將這些技術轉換成按使用量付費的工具,以減少數據收集和集中化的進入障礙。 Azure 資料移轉服務和 Azure Data Factory 等工具有兩個範例。 具有 OLAP 資料存放區的 Data Factory 參考架構是這類解決方案的範例。

擷取: 某些數據不在現有的數據存放區中。 當此暫時性數據是創新的主要來源時,您會想要考慮替代方法。 暫時性數據可在各種現有來源中找到,例如應用程式、API、數據流、IoT 裝置、區塊鏈、應用程式快取、媒體內容,甚至是一般檔案。

您可以將這些各種形式的數據整合到 OLAP 或巨量資料解決方案上的中央資料存放區。 不過,對於建置-量值學習週期的早期反覆專案,在線交易處理 (OLTP) 解決方案可能足以驗證客戶假設。 OLTP 解決方案不是任何報告案例的最佳選項。 不過,當您 以客戶同理心建置時,專注於客戶需求比技術工具決策更重要。 大規模驗證客戶假設之後,可能需要更合適的平臺。 OLTP 資料存放區的參考架構可協助您判斷哪一個資料存放區最適合您的解決方案。

虛擬化: 數據整合和擷取有時可能會使創新變慢。 當數據虛擬化的解決方案已可供使用時,它可能代表更合理的方法。 擷取和整合可以重複儲存和開發需求、新增數據延遲、增加受攻擊面區、觸發質量問題,以及增加治理工作。 數據虛擬化是一個更當代的替代方案,會將原始數據留在單一位置,並建立源數據的傳遞或快取查詢。

SQL Server 2017 和 Azure SQL 數據倉儲都支援 PolyBase,這是最常在 Azure 中使用的數據虛擬化方法。

下一步

有了將資料大眾化的策略,您接下來會想要評估應用程式開發的方法。