《BI商務智能--數據迷霧中(PPT 46)》由會員分享,可在線閱讀,更多相關《BI商務智能--數據迷霧中(PPT 46)(46頁珍藏版)》請在裝配圖網上搜索。
1、,*,來自中國最大的資料庫下載 中國最大的資料庫下載 中國最大的資料庫下載,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,單擊此處編輯母版標題樣式,“電子技術到來以后,人延伸出(或者說在體外建立了)一個活生生的中樞神經系統。,麥克盧漢,理解媒介,1,數據迷霧中,迷茫,2,一個平常飲料店的故事,1993年前,店里賣的飲料只有啤酒、可口可樂和北冰洋汽水,進貨出貨老板在一個舊本子上記錄,一個平常飲料店的故事,1995年,生意大了,各處開了分號,飲料多了,酒也多了,有幾十種。,店里裝了自動柜員機,柜員機里記的賬天天都打印出來送給老板。,老板看不過來,加個總數就算了,但生意該怎么做,老板還算
2、清楚。,一個平常飲料店的故事,1998年,經營的品種過了百,店里連了網,用上了財務軟件。,1999年又上了互聯網,客人來自四面八方。賬單每天打出厚厚一堆,老板瞧著密密麻麻的數字楞神,直嚷嚷生意難做。,數據迷霧鋪天蓋地,美國MCI是跨國的電信公司,長途電話客戶2億,電腦里數據存了5TB,每月還增加300GB。,據美國加州一所大學研究,世界上每個人,不管死活,已經產生或將要產生250MB的數據,每年全球數據凈增21010GB。,如何應對?,商務智能,7,什么是商務智能,商業智能是對商業信息的搜集、管理和分析過程,目的是使企業的各級決策者獲得知識或洞察力,促使他們做出對企業更有利的決策。,商業智能一
3、般由數據倉庫(或數據場)、數據分析、數據挖掘、在線分析、數據備份和恢復等局部組成。,什么是商務智能,商務智能是從累計的原始數據中提取有用信息的過程,商務智能為決策者在正確的時間,地點提供關于企業運營情況的各項信息使之能夠做出準確的決定,背景,商業智能(BI)的概念最早是Gartner Group于1996年提出,執行信息系統(EIS),決策支持系統(DSS)。,為什么需要商務智能,促進銷售,加深客戶關系,改進產品,提供更好的效勞,協調企業運營,降低本錢,提高決策水平,Business Intelligence helps track what really works and what doe
4、snt.,Bill Gates,Chairman,Microsoft,通過BI幫助我們,提高企業效益,建立忠實的顧客群,增進企業效率,做出明智的決策,商務智能內容,產品分析,哪種產品贏利情況最好?,哪種產品贏利最差卻賣的最快?,哪種產品組合對一定收入的家庭最有吸引力?,商務智能內容,銷售分析,一家已開張兩年的分店銷售趨勢如何?,附近地區是否存在競爭者?,哪種產品的贏利有向上的趨勢及哪類顧客購置了這些產品?,商務智能內容,顧客分析,提供頭10%利潤的顧客有什么特點?,購置產品或效勞三個月后顧客的流失率是多少?,過去六個月里比平均消費額高兩個百分點的都是誰?,眾多行業積極尋求BI解決方案的,零售、
5、保險、銀行、通信、離散制造、政府、醫療、分銷、流程制造、教育等。,商務智能如何工作,數據:把不同來源的數據匯總為一個數據倉庫,內涵:商務智能工具通過分析這些數據來幫助人們更好地了解企業情況,行動:通過分析來更有效地分配資源,商務智能系統結構,數據倉庫(Data Warehouse,DW),聯機分析處理(On-Line Analytical Processing,OLAP),數據挖掘(Data Mining,DM),數據倉庫(DW),數據倉庫,是在數據庫已經大量存在的情況下,為了進一步挖掘數據資源、為了決策需要而產生的,它決不是所謂的“大型數據庫。,W.H.Inmon關于數據倉庫的定義:面向主題
6、的、集成的、與時間相關且不可修改的數據集合。,面向主題,傳統數據庫主要是為應用程序進行數據處理,未必按照同一主題存儲數據,數據倉庫側重于數據分析工作,是按照主題存儲的,與時間相關,數據庫保存信息的時候,并不強調一定有時間信息,數據倉庫則不同,出于決策的需要,數據倉庫中的數據都要標明時間屬性,不可修改,數據庫處理的是日常事務數據,有的需要不斷更新,數據倉庫反映的是歷史信息,可以添加,但不可更改。,數據倉庫生成,Extract,Transfer,and Load(ETL),Model,Integrate,Data,ETL,Data warehouse,數據展現,面向高層決策者的主管信息系統(EIS
7、),面向決策分析者的聯機分析系統(OLAP),決策者上的即席查詢系統(Ad Hoc),靈活報表系統(Reporting),數據展現采用多種靈活的方式,比方C/S模式或B/S模式,聯機分析處理(OLAP),OLAP委員會的定義:是使分析人員、管理人員或執行人員能夠從多種角度對從原始數據中轉化出來的、能夠真正為用戶所理解的、并真實反映企業維特性的信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟件技術。,OLAP的目標:是滿足決策支持或多維環境特定的查詢和報表需求,它的技術核心是“維這個概念,因此OLAP也可以說是多維數據分析工具的集合。,開展背景,60年代,關系數據庫之父E.F.
8、Cdd提出了關系模型,促進了聯機事務處理(OLTP)的開展(數據以表格的形式而非文件方式存儲)。,1993年,E.F.Cdd提出了多維數據庫和多維分析的概念,即OLAP,OLAP多維數據結構,超立方結構(Hypercube),多立方結構(Multicube),OLAP多維數據分析,切片和切塊(Slice and Dice):在多維數據結構中,按二維進行切片,按三維進行切塊,可得到所需要的數據,OLAP多維數據分析,鉆取(Drill):鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)/上卷(Roll-up)操作,OLAP多維數據分析,旋轉(Rotate)/轉軸(Pivot)
9、:通過旋轉可以得到不同視角的數據,數據挖掘(DM),一方面規模龐大、紛繁復雜的數據體系讓使用者漫無頭緒、無從下手;,另一方面在這些大量數據的背后卻隱藏著很多具有決策意義的有價值的信息。,數據挖掘(DM),如何發現這些有用的知識,使之為管理決策和經營戰略開展效勞?,數據挖掘(Data Mining)。,DM應用實例(購物環境設計),某超市,需要設計一個吸引客人購置商品的最正確環境。通過對客人的采購路線和消費記錄的挖掘發現:美國女性的視線高度是150cm左右,而男性是163cm左右,最適宜的視線角度是視線高度以下15度。因此,最好的貨品擺設位置是在130到135厘米之間。,按照DM找出的特別信息,
10、該超市里的主打產品,總是擺在最容易發現的高度區內。,DM應用實例(客戶購置模式識別),Safeway是英國的第三大連鎖超市,年銷售額超過一百億美元,運用傳統的方法降低價位、擴充店面以及增加商品種類,若想在競爭中取勝已經越來越困難了,必須以客戶為導向,了解六百萬客戶所做的每一筆交易以及這些交易彼此之間的關聯性,DM應用實例(客戶購置模式識別),Safeway首先根據客戶的相關資料,將客戶分為150類,再用關聯(Association)的技術列出產品相關度的清單。,比方:“在購置烤肉炭的客戶中,75%的人也會購置打火機燃料。,DM應用實例(客戶購置模式識別),Safeway還需要對商品的利潤進行細
11、分。例如,Safeway發現某一種乳酪產品雖然銷售額排名第209位,可是消費額最高的客戶中有25%都常常買這種乳酪。,Safeway 知道客戶每次采購時會買哪些產品以后,就可以利用Data Mining中的 Sequence Discovery 功能,找出長期的經常性購置行為,進而促銷。,數據挖掘(DM)學科背景,統計學,計算機科學,人工智能領域的廣泛運用,數據挖掘(DM)常用方法,分類(classification):依照所分析對象的屬性分門別類、加以定義、建立類組(class)。,比方,將信用卡申請人分為低、中、高風險群,或是將顧客分到事先定義好的族群。,數據挖掘(DM)常用方法,估計(e
12、stimation):根據既有的連續性數值相關屬性資料,求得某一屬性的未知值。,比方,估計家中小孩的數量、一個家庭的總收入或是不動產的價值。,所使用的技巧有相關分析、回歸分析及類神經網絡方法。,數據挖掘(DM)常用方法,預測(prediction):根據對象屬性過去的觀察值來估計此屬性未來的值。,比方,預測哪些顧客會在未來的半年內取消該公司的效勞,或是預測哪些電話用戶會申請增值效勞,如三方通話、語音信箱等。,所使用的技巧有回歸分析、時間序列分析及類神經網絡方法。,數據挖掘(DM)常用方法,關聯分組(affinity grouping):從所有對象來決定哪些相關對象應該放在一起。,比方,在超市中
13、,哪些物品會一起被購置,零售商可以利用關聯分組來規劃店內商品的擺設位置,把會被一起購置的商品擺在一起。,在客戶的營銷系統上,此種功能可用來確認交叉銷售(cross-selling)的時機以設計出更吸引人的產品群組。,聚類、群集化(clustering):將不同的母體區隔為較具同構型的群組(cluster),換句話說,其目的是將組與組之間的差異分辨出來,并對個別組內的相似樣本進行挑選。在群集化技術中,沒有預先定義好的類別和訓練樣本存在,所有紀錄都根據彼此相似程度來加以歸類。,比方,在市場營銷調查前,先將顧客群集化,再來分析每群顧客最喜歡哪一類促銷,而不是對每個顧客都用相同的標準規則來分析。,所使
14、用的技巧有k-means法及agglomeration法。,SCORING&MODELING,PORTALS,DSS,EIS,ANALYSESQUERIESSCORES,APPLICATIONS,DATA HANDLE,DATASTORES,LOAD,TRANSFORM,EXTRACT,STANDARD TEMPLATE,OLAP,Agent,DM,WAREHOUSE,CRM ERP SCM Policy F&A Other,商務智能體系結構,客戶分類和特點分析,市場營銷策略分析,經營本錢與收入分析,欺詐行為分析和預防,商務智能的應用前景,市場預測,根據IDC分析,從1997年到2002年,整個數據倉庫市場(軟件、效勞、效勞器和存儲)以平均每年20.5的速度增長。,IDC的另一項調查結果說明,企業用于商務智能的投資回報率平均2.3年高達400。一項來自美國MetaGroup的市場分析指出,92的企業將在今后3年內使用數據倉庫。,謝謝大家!,