數(shù)據(jù)挖掘原理與算法

出版時(shí)間:2009-8  出版社:科學(xué)出版社  作者:邵峰晶 等編著  頁數(shù):412  
Tag標(biāo)簽:無  

前言

數(shù)據(jù)挖掘經(jīng)過十幾年的蓬勃發(fā)展,產(chǎn)生了豐碩的理論和應(yīng)用成果。作為一門應(yīng)用性較強(qiáng)的學(xué)科,數(shù)據(jù)挖掘技術(shù)已經(jīng)滲透到國民經(jīng)濟(jì)的各個(gè)領(lǐng)域,引起學(xué)術(shù)界和產(chǎn)業(yè)界的極大關(guān)注,取得了廣泛的應(yīng)用,為各行各業(yè)的管理者提供了有價(jià)值的決策依據(jù)。這些都使我們迫切感覺到要對本書第一版進(jìn)行大的修訂,補(bǔ)充最新的理論和應(yīng)用成果,以適應(yīng)當(dāng)前學(xué)科發(fā)展的需要。本書自第一版出版以來,我們把其作為高年級學(xué)生和研究生學(xué)習(xí)數(shù)據(jù)挖掘課程的教材,取得了不少的教學(xué)經(jīng)驗(yàn),也發(fā)現(xiàn)了原書中的個(gè)別錯(cuò)誤以及敘述不清楚的地方。第二版在原書的基礎(chǔ)上,對原稿進(jìn)行了改正并做了較大的更新,對內(nèi)容進(jìn)行了重新組織和整理,對數(shù)據(jù)挖掘中新出現(xiàn)的關(guān)鍵技術(shù)進(jìn)行了介紹,詳細(xì)描述了部分典型新算法;并根據(jù)作者近年來的研究成果增添了數(shù)據(jù)挖掘的應(yīng)用章節(jié),對數(shù)據(jù)挖掘的應(yīng)用成果進(jìn)行了論述;同時(shí),對數(shù)據(jù)挖掘的最新進(jìn)展進(jìn)行了介紹和概括總結(jié)。這些有助于讀者系統(tǒng)學(xué)習(xí)數(shù)據(jù)挖掘理論、技術(shù)和方法,通過應(yīng)用實(shí)例的介紹能夠給讀者更加深刻的認(rèn)識(shí)。我們希望本書第二版的出版,不僅給學(xué)習(xí)數(shù)據(jù)挖掘課程的高年級學(xué)生和研究生提供一本內(nèi)容比較全面的教材,而且也為開發(fā)數(shù)據(jù)挖掘相關(guān)系統(tǒng)的高級軟件開發(fā)人員和從事該項(xiàng)技術(shù)的各個(gè)領(lǐng)域的科技工作者提供一本可讀性較好的參考書,有助于進(jìn)一步推動(dòng)我國的數(shù)據(jù)挖掘研究與應(yīng)用的深入開展。本書的編寫得到了中國工程院李德毅院士的關(guān)注和指導(dǎo),作者在此表示衷心的感謝。青島大學(xué)的隋毅、龐傳軍、紀(jì)俊、柯爽、楊坤等研究生也為本書的完成做了大量的工作,在此,一并表示衷心的感謝。在數(shù)據(jù)挖掘蓬勃發(fā)展的今天,該項(xiàng)技術(shù)涉及了很多學(xué)科領(lǐng)域,由于我們的理論水平和實(shí)踐經(jīng)驗(yàn)都具有局限性,本書還存在不少不足之處,敬請讀者在閱讀本書時(shí)能夠給我們提出寶貴建議,并對相關(guān)內(nèi)容進(jìn)行批評指正。

內(nèi)容概要

本書第一版是國內(nèi)第一本對數(shù)據(jù)挖掘技術(shù)基礎(chǔ)算法進(jìn)行詳細(xì)描述的實(shí)用性教材。第二版在第一版基礎(chǔ)上進(jìn)行了較多的修訂和補(bǔ)充。在系統(tǒng)闡述數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)技術(shù)的產(chǎn)生、發(fā)展,以及相關(guān)概念、原理、基本方法的基礎(chǔ)上,從實(shí)用的角度出發(fā),對數(shù)據(jù)挖掘中的關(guān)聯(lián)、分類、聚類、序列等算法和技術(shù)進(jìn)行了剖析,對每種技術(shù)均提供了代表性算法。同時(shí),結(jié)合作者近年來所做的研究,對數(shù)據(jù)挖掘的應(yīng)用問題進(jìn)行了分類論述。最后,對目前數(shù)據(jù)挖掘的最新進(jìn)展、應(yīng)用趨勢等進(jìn)行了總結(jié)。    本書可作為計(jì)算機(jī)、管理等專業(yè)高年級本科生與研究生課程的教材,也可作為數(shù)據(jù)挖掘領(lǐng)域的高級軟件開發(fā)人員的參考書。

書籍目錄

第二版前言第一版前言第1章  導(dǎo)論  1.1  數(shù)據(jù)挖掘的社會(huì)需求  1.2  什么是數(shù)據(jù)挖掘  1.3  數(shù)據(jù)挖掘的數(shù)據(jù)來源  1.4  數(shù)據(jù)挖掘的分類    1.4.1  分類分析    1.4.2  聚類分析    1.4.3  關(guān)聯(lián)分析    1.4.4  序列分析及時(shí)問序列    1.4.5  孤立點(diǎn)分析    1.4.6  其他分析  1.5  數(shù)據(jù)挖掘的體系結(jié)構(gòu)與運(yùn)行過程    1.5.1  數(shù)據(jù)挖掘的體系結(jié)構(gòu)    1.5.2  數(shù)據(jù)挖掘的步驟    1.5.3  實(shí)例    1.5.4  數(shù)據(jù)挖掘的過程模型    1.5.5  數(shù)據(jù)挖掘主要廠商和產(chǎn)品  1.6  數(shù)據(jù)挖掘與其他相關(guān)技術(shù)    1.6.1  數(shù)據(jù)挖掘與數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)    1.6.2  數(shù)據(jù)挖掘與聯(lián)機(jī)分析處理    1.6.3  數(shù)據(jù)挖掘與信息檢索    1.6.4  數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)    1.6.5  數(shù)據(jù)挖掘與數(shù)據(jù)融合    1.6.6  數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)    1.6.7  數(shù)據(jù)挖掘與專家系統(tǒng)    1.6.8  數(shù)據(jù)挖掘與決策支持系統(tǒng)    1.6.9  數(shù)據(jù)挖掘與客戶關(guān)系管理    1.6.10  軟硬件發(fā)展對數(shù)據(jù)挖掘的影響    1.6.11  XML與面向Web的數(shù)據(jù)挖掘技術(shù)  1.7  數(shù)據(jù)挖掘工具的評價(jià)標(biāo)準(zhǔn)  1.8  數(shù)據(jù)挖掘的應(yīng)用  1.9  數(shù)據(jù)挖掘的要求及挑戰(zhàn)第2章 數(shù)據(jù)倉庫技術(shù)  2.1  數(shù)據(jù)倉庫概述    2.1.1 數(shù)據(jù)倉庫的定義    2.1.2 數(shù)據(jù)倉庫查詢系統(tǒng)    2.1.3  OLTP與OLAP      2.1.4 數(shù)據(jù)倉庫與數(shù)據(jù)集市    2.1.5 數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu)    2.1.6 數(shù)據(jù)倉庫中的元數(shù)據(jù)管理  2.2  數(shù)據(jù)倉庫的建模    2.2.1 星型模型    2.2.2 雪花模型    2.2.3 混合模型    2.2.4 多維數(shù)據(jù)模型  2.3 聯(lián)機(jī)分析處理    2.3.1  OLAP的功能及體系結(jié)構(gòu)    2.3.2  OLAP數(shù)據(jù)組織模型    2.3.3  OLAP的Web結(jié)構(gòu)    2.3.4  OLAP數(shù)據(jù)查詢機(jī)制  2.4  海威數(shù)據(jù)倉庫系統(tǒng)簡介    2.4.1 Highway Decision Center V1.0系統(tǒng)結(jié)構(gòu)    2.4.2 Highway Decision Center V2.0系統(tǒng)結(jié)構(gòu)    2.4.3 海威數(shù)據(jù)倉庫網(wǎng)絡(luò)結(jié)構(gòu)  2.5  數(shù)據(jù)倉庫應(yīng)用舉例    2.5.1 信用卡資信分析    2.5.2 貸款分析第3章 數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理  3.1 概論  3.2 數(shù)據(jù)預(yù)處理的基本步驟  3.3  數(shù)值屬性的離散化與特征選擇    3.3.1  Chi2算法簡介    3.3.2 舉例  …… 第4章  關(guān)聯(lián)規(guī)則第5章  數(shù)據(jù)分類第6章  聚類分析第7章  序列模式與時(shí)間序列第8章  空間多維數(shù)據(jù)訪問與可視化第9章  開放式的數(shù)據(jù)挖掘系統(tǒng)第10章  數(shù)據(jù)挖掘應(yīng)用第11章  數(shù)據(jù)挖掘新進(jìn)展參考文獻(xiàn)

章節(jié)摘錄

插圖:第1章 導(dǎo)論1.1 數(shù)據(jù)挖掘的社會(huì)需求一切新事物的產(chǎn)生都是由需求驅(qū)動(dòng)。讓計(jì)算機(jī)能夠自動(dòng)、智能地分析數(shù)據(jù)庫中的大量數(shù)據(jù)以獲取信息是推動(dòng)挖掘型工具產(chǎn)生并發(fā)展的強(qiáng)大動(dòng)力。從生產(chǎn)成本的角度看,公司的人工費(fèi)用在不斷提升,產(chǎn)品與服務(wù)的價(jià)格持續(xù)下降,激烈的市場競爭迫使決策者想辦法降低成本及擴(kuò)大產(chǎn)品與服務(wù)的銷售量來提高公司的競爭力。從計(jì)算機(jī)應(yīng)用角度看,無論硬件與網(wǎng)絡(luò)性能的提高,還是軟件技術(shù)與功能的提高,都要求軟件從單純的管理功能向綜合的分析功能轉(zhuǎn)變。從數(shù)據(jù)管理角度看,歷史數(shù)據(jù)是一筆寶貴的財(cái)富,而且這些數(shù)據(jù)正以幾何級數(shù)或指數(shù)方式增長。從軟件技術(shù)發(fā)展方向看,海量數(shù)據(jù)的智能分析對原來各個(gè)領(lǐng)域的技術(shù)都帶來了極大的挑戰(zhàn),需要采用綜合性的技術(shù)來迎接這些挑戰(zhàn)。 隨著數(shù)據(jù)庫技術(shù)的飛速發(fā)展以及人們獲取數(shù)據(jù)手段的多樣化,人類所擁有的數(shù)據(jù)急劇增加,隨著大容量、高速度、低價(jià)格的存儲(chǔ)設(shè)備相繼問世,當(dāng)今數(shù)據(jù)庫的容量越來越大,已經(jīng)達(dá)到TB(i),甚至PB的水平,但能夠?qū)@些數(shù)據(jù)進(jìn)行有效分析處理的工具卻很少。數(shù)據(jù)庫系統(tǒng)往往只對已有數(shù)據(jù)進(jìn)行存取和簡單操作,人們很難通過這些操作獲取數(shù)據(jù)隱含的深層語義,而這些描述數(shù)據(jù)整體特征和發(fā)展趨勢的信息在決策制定過程中具有更加重要的價(jià)值和意義,它們可以指導(dǎo)政府、企業(yè)決策以獲取更大的社會(huì)效益和經(jīng)濟(jì)效益。

編輯推薦

《數(shù)據(jù)挖掘原理與算法(第2版)》由科學(xué)出版社出版。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘原理與算法 PDF格式下載


用戶評論 (總計(jì)6條)

 
 

  •   數(shù)據(jù)挖掘原理與算法值得擁有。
  •   本書內(nèi)容全面、詳細(xì),既有理論,又有實(shí)際應(yīng)用。是數(shù)據(jù)挖掘方面一本很好的教材
  •   墮入了凡塵
  •   書不錯(cuò)!正是我想要的!
  •   紙張不錯(cuò),看著非常舒服
  •   書紙質(zhì)量很好,
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7