Freigeben über


迷思止步 - 系列七:倚靠 BI 分析,料事如神不是夢

環顧近幾年全球商業市場,屢屢教人看得怵目驚心,看似穩若泰山的百年金融巨擘,可能瞬間土崩瓦解,而原本名不見經傳的初生之犢,也可能扶搖直上躍為市場寵兒,是勝是負,端賴企業是否體察趨勢、洞燭機先;面對愈趨高漲的兵棋推演需求,任何企業顯然都需要好的商業智慧(BI)工具作為輔助。

回顧 2012 年,若欲推選 IT 熱門話題,大家理應不會否認,「海量資料(Big Data)」絕對名列前茅;經過一整年,人們接收的相關訊息、參與過的論壇,可謂不知凡幾,也因而有所體悟,大量非結構化資料裡頭果真的蘊藏無窮瑰寶,企業一旦善加分析運用,便可從中挖掘出關鍵數據,發揮點石成金之妙效,制定出一擊奏效的商業決策。

然而一缸子對海量資料多所吹捧的素材,其間縱使夾雜令人稱奇的案例,但畢竟那是別人家的成功故事,與普羅大眾的認知情境,似乎仍有一段不小距離,談得再多,也像是高來高去的神話,尚不足以內化為閱聽者的基本能量;尤其海量資料分析一事,不時牽涉諱莫如深的技術門檻,以及龐大的 IT 運算資源需求,無疑更讓不少人倒抽涼氣,直嘆眼前的成功之路,真的不太好走。

所幸在若干廠商的努力下,海量資料這個堪稱玄妙的黑盒子,已一步步地獲得拆解,對於有心擷取商機資訊的企業來說,著實是莫大福音。

生活週遭,盡是絕佳演繹

在過去幾個月內,無論富商巨賈、市井小民,都曾關注兩件大事,一是由歐巴馬與羅姆尼聯手上演的白宮寶座爭奪戰,另一則是強片如雲的第 85 屆奧斯卡金像獎。這兩大盛事即使南轅北轍,但都是萬眾矚目的焦點,甚至圍繞於多數民眾之生活週遭,成為驅動喜怒哀樂的重要元素。

可以想見,如果能將海量資料分析技術,套用於美國總統大選、奧斯卡得獎名單之預測,不僅可因饒富趣味讓人融入其中,其間抽絲剝繭的分析歷程,對於尚在修習 Big Data 學分的商業人士,也會是一場絕佳的示範與演繹,稱得上是珍貴教材。有鑑於此,微軟研究院決定把握難得機會,從運用 SQL Server 的商業智慧技術著手,分析大量非結構性資料,為世人提前預測兩場盛事的結果。

正所謂世事無絕對,未來的局勢如何演變,沒人說得準,因此不論是預測下屆白宮主人,抑或小金人得主,皆須征服許多變幻莫測的因子,難度甚高,所以對於微軟研究院,兩場預測絕非只是炫技,而是極其嚴苛的考驗,甚至稱得上是華麗的豪賭,預測準確度的高低,不僅影響世人對於 SQL Server 的信賴,亦牽動企業對於海量資料的投入熱忱。

面對 2012 年總統大選,微軟研究院先是採用一個通用的資料驅動模型,接著運用以往的投票結果,佐以就業率及經濟指標等數據,建立一套基線,再切換至大量市場預測及民調數字,甚至納入 Xbox Live 數據進行即時分析,據以預測全美 50 州暨哥倫比亞特區的投票結果;結果針對這 51 個地域,命中了其中的 50 個,準確率高達 98%,打出漂亮一役。

相較於總統大選,奧斯卡獎項的預測難度可說更高,只因其缺乏歷史票選紀錄或經濟指標等具參考效力的數據,所以微軟研究院決定採用票房收入、電影評選等這類非統計數據,並大量使用「預測市場(Predict Market)」網站的資訊,以及網友在各個社群媒體上討論的內容,試圖深入探究入圍影片與各類討論主題之相互關聯,作為主要的分析依據,更與微軟 Office 團隊合作開發「奧斯卡票選預測 App」。由此觀之,此次仍由 SQL Server 擔綱演出的奧斯卡預測任務,更像是名符其實的海量資料分析大秀。

微軟研究院所提出的預測結果,分別是最佳影片的「亞果出任務」(機率 92%)、最佳導演的「林肯」史蒂芬史匹柏(機率 89%)、最佳男主角的「林肯」丹尼爾戴路易斯(機率 99%),以及最佳女主角的「派特的幸福劇本」珍妮佛勞倫斯(機率 71%);最終謎底揭曉,4 項大獎命中率達 75%,雖因漏失台灣之光李安而小有遺憾,但瑕不掩瑜,已足夠教人為之折服。

資訊匯聚應用高潮迭起

歷經兩場神乎其技的預測,等於是昭告世人,運用傳統資料庫處理結構化資料的時代,真的已經過去,只因伴隨著數位裝置及網路應用的發達,舉凡圖片、影音、網頁留言、發票採購、簡報檔等無法透過數字化儲存分析的內容大肆崛起,這些內容埋藏著掌握商業脈動的重要訊息,企業唯有善加彙整與分析,方能萃取商業價值,並發展成具決策導向的重要資訊!

值此時刻,企業需要一個穩健可靠的分析工具,藉以輕鬆駕馭結構化、非結構化的資料訊息。以名列 Gartner 2012「商業智慧」領導者象限的微軟而論,不僅在其 Office、SQL Server、SharePoint 等高普及率產品中,持續導入商業智慧功能服務,並推出以雲端為基礎的資料市集(DataMarket),俾使用戶能直接存取、購買、分析任何儲存在託管雲或公有雲裡的資料,進而彈性調整 IT 運算資源,提升商務決策的參考價值及穩定性,凡此種種,都有助於資訊匯聚(Information Aggregation)之技術應用推向另一高峰,協助孕育更多「料事如神」的企業。

Comments

  • Anonymous
    October 17, 2014
    系列一:Big Data 淘金,就得砸大錢蓋礦場?

    全球最大零售業者 Wal-Mart 運用 Hadoop 技術,針對駐留於 Facebook 或 Twitter 等社群媒體的商品討論訊息