在BI出現(xiàn)之前,數(shù)據(jù)分析領(lǐng)域幾乎被傳統(tǒng)的報表軟件所籠罩,隨著時間及客戶需求的增長,這些報表軟件逐漸顯現(xiàn)出以下不足:
1. 報表速度慢、顯示形式單一,同時不支持流行的分析手段,如KPI、平衡計分卡等等
記得當(dāng)時有件很有意思的事,就是每天上班之后,先把報表打開,這樣下午就可以看了。雖然未免有點夸張,但傳統(tǒng)報表速度慢卻是不爭的事實。傳統(tǒng)報表大都利用SQL對關(guān)系數(shù)據(jù)庫進(jìn)行查詢,但隨著數(shù)據(jù)庫數(shù)據(jù)量的急劇膨脹,并且每個SQL查詢都從最低粒度數(shù)據(jù)進(jìn)行匯總,難免速度變慢。
同時傳統(tǒng)的報表展現(xiàn)形式很單一,主要是表格和常規(guī)的圖表。隨著分析需求的增長,人們希望從更多的角度及更多的形式來分析數(shù)據(jù),包括將數(shù)值分析轉(zhuǎn)換為狀態(tài)和趨勢分析的KPI,分析各指示之間關(guān)系的平衡計分卡,以及GIS分析和更豐富的圖表、儀表盤分析等等。
2. 展現(xiàn)的數(shù)據(jù)量有限
傳統(tǒng)的報表展現(xiàn)形式能夠展現(xiàn)的數(shù)據(jù)量非常有限,只能展現(xiàn)報表定義時所定義的數(shù)據(jù)項。當(dāng)有新的分析需求時,則不得不開發(fā)新的報表,導(dǎo)致報表量增加,統(tǒng)計局每年發(fā)布的年鑒已達(dá)500多頁。
傳統(tǒng)的報表展現(xiàn)的數(shù)據(jù)固定,無法根據(jù)分析者的思想發(fā)生變化,從而很大程度上限制了數(shù)據(jù)分析者的思想。
3. 不支持?jǐn)?shù)據(jù)挖掘,無法通過數(shù)學(xué)算法找到規(guī)律
傳統(tǒng)數(shù)據(jù)分析只能完成數(shù)據(jù)的展現(xiàn),而數(shù)據(jù)背后的規(guī)律只能依賴于分析者的創(chuàng)造,而普通的分析者卻不具備這樣的能力。這樣,傳統(tǒng)的數(shù)據(jù)分析只能流浮于數(shù)字表面。
在這種背景下,BI為分析者帶來了希望。BI的含義是提供更加快速、靈活和豐富的數(shù)據(jù)支撐。這正好對應(yīng)于傳統(tǒng)數(shù)據(jù)分析的三個問題:
1. 報表---更加快速及更多的展現(xiàn)形式
1) 數(shù)據(jù)源為多維數(shù)據(jù)集,并提供緩存機制
多維數(shù)據(jù)集采取預(yù)運算機制,匯總數(shù)據(jù)在多維數(shù)據(jù)集中已經(jīng)有了實際的存儲,而不需要在每次查詢時從最低粒度進(jìn)行匯總,再加上新的報表軟件提供的緩存機制,從而使報表的展現(xiàn)速度變得非?臁
2) 一定的鉆取、跳轉(zhuǎn)以及多報表之間的聯(lián)動
新的報表展現(xiàn)與傳統(tǒng)報表相比變得更加靈活,包括更豐富的篩選器、一定層次的鉆取、跳轉(zhuǎn)以及多報表之間的聯(lián)動。
但報表仍不如多維數(shù)據(jù)分析更加靈活。
3) 更多的展現(xiàn)形式
新的報表展現(xiàn)目前已經(jīng)可以實現(xiàn)KPI展現(xiàn)、儀表盤、樹形大綱視圖、更豐富的圖表以及更多的自定義展現(xiàn)形式。
2. 多維數(shù)據(jù)分析---靈活
1) 報表及圖表各元素的靈活定制
多維數(shù)據(jù)分析最大的特點就是報表及圖表的各元素可以隨意定制,我們可以很輕松的設(shè)定放置在行或列上的維度或量度,從而實現(xiàn)隨心所欲的報表。
2) 新成員、新指標(biāo)的快速創(chuàng)建
多維數(shù)據(jù)分析工具一般都提供了新的維度成員或新指標(biāo)的快速創(chuàng)建的方法,從而實現(xiàn)在分析者不了解后臺數(shù)據(jù)結(jié)構(gòu)的情況下,也可以隨意創(chuàng)建出自己想要的計算成員或集合等,這一點更清晰的體現(xiàn)出其靈活的特點。
3) 隨意的鉆取及鉆透
隨意的鉆取,尤其是跨維度的鉆取是多維數(shù)據(jù)分析非常重要的一項功能,正因為具有這樣的功能,所以多維數(shù)據(jù)分析所展現(xiàn)的數(shù)據(jù)可以隨著分析者的思想而發(fā)生變化,例如從產(chǎn)品分析到銷售分析的跳躍性思維,多維數(shù)據(jù)分析都可以實現(xiàn)相應(yīng)的數(shù)據(jù)支撐。
4) 數(shù)據(jù)訪問范圍的擴大
多維數(shù)據(jù)分析可以訪問的數(shù)據(jù)范圍幾乎可以實現(xiàn)全部數(shù)據(jù),尤其是一些新技術(shù)出現(xiàn)之后(例如SQL Server 2005的UDM)。
3. 數(shù)據(jù)挖掘---豐富
將分析者的思想與數(shù)據(jù)算法相結(jié)合,利用數(shù)據(jù)算法,分析者更容易從海量數(shù)據(jù)中找到規(guī)律,同時分析者的思維也賦予數(shù)據(jù)算法更多的活力,使其更貼近于行業(yè)規(guī)則。
數(shù)據(jù)挖掘為分析者帶來了從數(shù)字表面無法發(fā)現(xiàn)的規(guī)律,提供更加豐富的分析,將數(shù)據(jù)分析延伸到了新的領(lǐng)域。
數(shù)據(jù)挖掘更為重要的是提供了預(yù)測的功能,這意味著我們在未來到來之前,已經(jīng)獲得了未來的數(shù)據(jù),可以說報表和多維數(shù)據(jù)分析讓我們更清晰的了解過去,而數(shù)據(jù)挖掘則讓我們感受到了未來的氣息。
BI附加價值:
1. 改善數(shù)據(jù)質(zhì)量
2. 業(yè)務(wù)流程規(guī)范
3. 觸發(fā)更多分析需求
BI項目的實施是對企業(yè)數(shù)據(jù)質(zhì)量及業(yè)務(wù)流程的最好的檢驗,可以暴露很多以往很難發(fā)現(xiàn)的問題。同時,它也可以觸發(fā)更多的分析需求,分析師可以通過BI系統(tǒng)獲取更多的靈感,提供更多更、更好的數(shù)據(jù)分析結(jié)果。
綜述,數(shù)據(jù)分析=分析的思想+BI技術(shù)。其中,分析的思想占70%,BI技術(shù)占30%,足見分析思想在數(shù)據(jù)分析過程中的重要性,而技術(shù)則是提供更好的支撐。
BI的真正含義是“利用各種不同的應(yīng)用程序和技術(shù),收集、存儲、分析、共享數(shù)據(jù)并提供數(shù)據(jù)訪問,從而幫助企業(yè)用戶更容易的、更快速的獲取更豐富的數(shù)據(jù),以做出更好的業(yè)務(wù)決策!