發(fā)布時間:2022-06-05 文章來源:深度系統(tǒng)下載 瀏覽:
網絡技術是從1990年代中期發(fā)展起來的新技術,它把互聯(lián)網上分散的資源融為有機整體,實現(xiàn)資源的全面共享和有機協(xié)作,使人們能夠透明地使用資源的整體能力并按需獲取信息。資源包括高性能計算機、存儲資源、數據資源、信息資源、知識資源、專家資源、大型數據庫、網絡、傳感器等。 當前的互聯(lián)網只限于信息共享,網絡則被認為是互聯(lián)網發(fā)展的第三階段。 數據倉庫和數據挖掘是兩個比較大的概念,在國外已經非常成熟,在國內隨著前幾年企業(yè)數據的累計、ERP的成熟,數據倉庫和數據挖掘開始起步。 如何建立數據倉庫和數據挖掘是個不斷值得探討和優(yōu)化的問題,不僅僅在技術上,在商業(yè)應用上也是如此。隨著新的技術和觀念的不斷引入,傳統(tǒng)的數據倉庫技術方法有了很大的改變,基于數據倉庫的應用也有了新的發(fā)展。每個企業(yè)的數據倉庫根據企業(yè)特點不同,可以采用非常靈活的選型方法進行選型設計、實施。本文根據一些比較新的技術特點,談談數據倉庫和數據挖掘的架構。 從成熟的數據倉庫架構入手來看,建立EDW(Enterprise Data Warehouse)是個比較好的選擇。EDW是企業(yè)數據倉庫,對整個企業(yè)數據有一個完整的不冗余的保留關鍵歷史變化信息的唯一視圖;贓DW可以建立不同主題的數據集市Data Mart,數據集市不同的企業(yè)有不同的要求,基本上可以分用戶主題,業(yè)務流主題,產品主題等等,在EDW的基礎上可以有非常多的主題應用,如何建立EDW是個比較重要的問題。 建立EDW的關鍵是要把握數據倉庫的本質,提供關鍵歷史變化信息,可以真實還原企業(yè)數據的關鍵歷史視圖。也就是現(xiàn)在提到比較多的DSS層,在DSS層之下有ODS層做當前數據視圖,有緩沖層做增量數據視圖,利用增量數據視圖和DSS層數據視圖結合起來,利用緩慢變化維或者代理鍵技術,從理論上就可以實現(xiàn)DSS層的任何數據歷史變化。但是在實際實施DSS層時候,一個能提供高性能計算的數據庫和選擇一個切合業(yè)務發(fā)展的增量時間頻率是兩個關鍵點。 緩慢變化維從具體實施過程的可以維護性出發(fā),比較統(tǒng)一通用的方法可以采用增加快照開始時間和快照結束時間,結合業(yè)務系統(tǒng)的主鍵,就可以完成DSS層真實企業(yè)數據關鍵歷史快照視圖。在實施過程中關鍵要把握增量數據緩沖層中三種集合數據,純粹新增的數據A,關鍵歷史信息發(fā)生變化的數據B,關鍵歷史信息沒有發(fā)生變化的數據C。對集合A,B都需要增加快照記錄,對集合C則采用更新快照記錄。這個過程的重點是高性能計算和商業(yè)需求。 在DSS層之上,根據EDW方案種數據庫不同,可以采用建立數據集市。數據集市基本上可以采用星型模型建立,便于多維分析。 成熟EDW是用來支持商業(yè)應用的,EDW之上的一個比較重要的應用是數據挖掘,從EDW海量數據中尋找有用的信息,支持企業(yè)的發(fā)展。這里不具體到數據挖掘廠商,從一般性的概念上理解更加重要,數據挖掘需要EDW能夠基于DSS層的企業(yè)數據關鍵歷史視圖,重新組合成商業(yè)上決策因素集合。結合數據挖掘的一些成熟的算法,把EDW里面的海量數據處理成為信息決策源。在實施數據挖掘過程中,需要注意的是一定要根據企業(yè)本身的業(yè)務來制定模型,任何脫離企業(yè)業(yè)務的理論模型在具體實施過程中失敗的可能性很大。 談完了數據倉庫和數據挖掘的本質,那么目前可以值得選擇的一些廠商和技術是什么呢? 隨著商業(yè)智能,數據倉庫的成熟,進入這個領域的廠商越來越多,評測也是各有千秋。在EDW方面,根據數據倉庫的容量,計算復雜度,實時性要求,在低端可以考慮微軟的SQL Sserver ,目前SQL Sserver 2005在商業(yè)智能上有顯著增強。在中端可以考慮Oracle 的DW 解決方案,Sybase IQ在數據量不是非常大的時候性能還是不錯的。如果要做超大型的DW,那么需要考慮一些高端專業(yè)的DW解決方案,目前TERADATA和IBM的Share Nothing架構的高端數據倉庫在海量數據處理,復雜商業(yè)計算,實時數據處理方面擴展性比較好,但是投入非常大。 數據倉庫和數據挖掘,從幾年前比較抽象的層次逐漸清晰起來,在企業(yè)決策和業(yè)務流程優(yōu)化中發(fā)揮的作用越來越大,一個好的數據倉庫和數據挖掘方案是一個開始,更重要的是推動商業(yè)思想上從傳統(tǒng)的拍腦袋到精細化營銷和依靠數據做決策方面來。商業(yè)和技術是兩個互相推進的因素,商業(yè)是驅動,但是好的技術也可以推動商業(yè)的發(fā)展,適合的技術用在需要的商業(yè)驅動上才能發(fā)揮好作用。 網絡的神奇作用吸引著越來越多的用戶加入其中,正因如此,網絡的承受能力也面臨著越來越嚴峻的考驗―從硬件上、軟件上、所用標準上......,各項技術都需要適時應勢,對應發(fā)展,這正是網絡迅速走向進步的催化劑。 |
上一篇:FMC在6大因素驅動下前進
下一篇:基于藍牙技術的公共接入網絡的研究