取消
清空記錄
歷史記錄
清空記錄
歷史記錄
需要是發明之母。近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是存在大量數據,可以普遍使用,并且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以普遍用于各種應用,包括商務管理,生產控制,市場分析,工程設計和科學探索等。
數據挖掘是人工智能和數據庫領域研究的熱點問題,所謂數據挖掘是指從數據庫的大量數據中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,作出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,作出正確的決策。知識發現過程由以下三個階段組成:
①數據準備;
②數據挖掘;
③結果表達和解釋。數據挖掘可以與用戶或知識庫交互。
數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術,主要有數據準備、規律尋找和規律表示三個步驟。數據準備是從相關的數據源中選取所需的數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含的規律找出來;規律表示是盡可能以用戶可理解的方式(如可視化)將找出的規律表示出來。數據挖掘的任務有關聯分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。
近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是存在大量數據,可以普遍使用,并且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以普遍用于各種應用,包括商務管理、生產控制、市場分析、工程設計和科學探索等。數據挖掘利用了來自如下一些領域的思想:
①來自統計學的抽樣、估計和假設檢驗;
②人工智能、模式識別和機器學習的搜索算法、建模技術和學習理論。數據挖掘也迅速地接納了來自其他領域的思想,這些領域包括最優化、進化計算、信息論、信號處理、可視化和信息檢索。一些其他領域也起到重要的支撐作用。
特別地,需要數據庫系統提供有效的存儲、索引和查詢處理支持。源于高性能(并行)計算的技術在處理海量數據集方面常常是重要的。分布式技術也能幫助處理海量數據,并且當數據不能集中到一起處理時更是至關重要。
相關新聞