SQL Server數(shù)據(jù)挖掘與商業(yè)智能基礎(chǔ)及案例實(shí)戰(zhàn)

簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書全面介紹了數(shù)據(jù)挖掘與商業(yè)智能的基本概念與原理,包括經(jīng)典理論與趨勢發(fā)展,并深入敘述了各種數(shù)據(jù)挖掘的技術(shù)與典型應(yīng)用。通過本書的學(xué)習(xí),讀者可以對數(shù)據(jù)挖掘與商業(yè)智能的整體結(jié)構(gòu)、概念、原理、技術(shù)和發(fā)展有深入的了解和認(rèn)識。
本書共四部分:第一部分介紹數(shù)據(jù)倉庫、數(shù)據(jù)挖掘與商業(yè)智能之間的關(guān)系;第二部分對Microsoft SQL Server的整體架構(gòu)進(jìn)行介紹,并詳細(xì)闡述直接與數(shù)據(jù)挖掘相關(guān)的兩個(gè)服務(wù):分析服務(wù)和報(bào)表服務(wù);第三部分逐一闡述Microsoft SQL Server中包含的九種數(shù)據(jù)挖掘模型;第四部分提供四個(gè)數(shù)據(jù)挖掘的案例以及數(shù)據(jù)挖掘模型的評估,通過模仿練習(xí),讀者可獲得實(shí)際的數(shù)據(jù)挖掘經(jīng)驗(yàn),稍加修改就能在自己所處的領(lǐng)域中加以應(yīng)用。
本書配有案例的相關(guān)素材文件,讀者可以從萬水書苑以及中國水利水電出版社網(wǎng)站下載,網(wǎng)址為:http://www.hzxbc.cn和http://www.waterpub.com.cn/softdown/。
本書為經(jīng)臺(tái)灣碁峰資訊股份有限公司獨(dú)家授權(quán)發(fā)行的中文簡體版。本書中文簡體字版在中國大陸之專有出版權(quán)屬中國水利水電出版社所有。在沒有得到本書原版出版者和本書出版者書面許可時(shí),任何單位和個(gè)人不得擅自摘抄、復(fù)制本書的一部分或全部以任何方式包括(資料和出版物)進(jìn)行傳播。本書原版版權(quán)屬碁峰資訊股份有限公司。版權(quán)所有,侵權(quán)必究。
Microsoft商業(yè)智能中一項(xiàng)重要的技術(shù)為數(shù)據(jù)挖掘的分析技術(shù),主要是在大量數(shù)據(jù)庫中尋找有意義或有價(jià)值的信息的過程。透過機(jī)器學(xué)習(xí)技術(shù)或是統(tǒng)計(jì)分析方法論,根據(jù)整合的資料加以分析探索,發(fā)掘出隱含在數(shù)據(jù)中的特性,通過專業(yè)領(lǐng)域知識(Domain Know-how)整合及解釋,從中找出合理且有用的信息,經(jīng)過相關(guān)部門針對該模型的評估后,再提供給相關(guān)決策單位加以運(yùn)用。
近年來,數(shù)據(jù)量的增加速度越來越快,加上商業(yè)智能的運(yùn)用早已受到企業(yè)的重視。將企業(yè)累積的數(shù)據(jù)庫,透過大量的信息與相關(guān)信息的分析,更能找出顧客區(qū)分、消費(fèi)行為、業(yè)務(wù)成本與效率等對企業(yè)極為重要的信息。通過商業(yè)智能的應(yīng)用,使之更深入了解客戶,并可協(xié)助業(yè)務(wù)的開發(fā)以及增加在顧客管理上的有效性。
隨著知識經(jīng)濟(jì)時(shí)代來臨,企業(yè)間的競爭模式從傳統(tǒng)的采用壓低成本與價(jià)格的殺價(jià)流血競爭,到近來倡導(dǎo)以創(chuàng)新為核心競爭力。不論哪一種策略模式,都是不斷在技術(shù)研發(fā)、制造生產(chǎn)、營銷銷售、客戶服務(wù)或資源分配等相關(guān)問題上,尋求問題的發(fā)生原因并嘗試找出解決方案。在不同運(yùn)營階段,陸續(xù)累積的龐大數(shù)據(jù),往往就是答案的隱身之所。因此,如何善用數(shù)據(jù),從運(yùn)營的歷史記錄中,挖掘出深藏其中的寶貴經(jīng)驗(yàn)(金礦),就是數(shù)據(jù)挖掘(Data Mining)的目的。
相對于其他數(shù)據(jù)庫系統(tǒng)或數(shù)據(jù)挖掘軟件,微軟最新推出的數(shù)據(jù)庫系統(tǒng)Microsoft SQL Server 2014可為您的關(guān)鍵任務(wù)應(yīng)用程序提供突破性的性能、可用性和可管理性。SQL Server 2014 還針對在線事務(wù)處理(OLTP)和數(shù)據(jù)倉庫提供了把核心數(shù)據(jù)庫內(nèi)置于內(nèi)存中 (In-Memory)的新功能,完善了現(xiàn)有數(shù)據(jù)倉庫和商業(yè)智能的功能。借助這些功能,極大提升了企業(yè)在商業(yè)智能處理方面的性能與效率。然而如何充分發(fā)揮Microsoft SQL Server在商業(yè)智能應(yīng)用中的效力,則需要一定的專業(yè)知識和學(xué)習(xí)過程。針對業(yè)界實(shí)務(wù)上的需求,我們編寫了這本教程,以期在實(shí)務(wù)應(yīng)用和理論方法之間搭建一座橋梁。讓讀者迅速掌握現(xiàn)代商業(yè)智能應(yīng)用的主要內(nèi)容。
Chapter 1 緒論 2
1-1 商業(yè)智能 3
1-1-1 什么是商業(yè)智能 3
1-1-2 商業(yè)智能作用及意義 3
1-1-3 商業(yè)智能架構(gòu) 4
1-1-4 商業(yè)智能中的挑戰(zhàn) 6
1-2 數(shù)據(jù)挖掘 7
1-3 大數(shù)據(jù) 9
1-3-1 何謂大數(shù)據(jù) 9
1-3-2 大數(shù)據(jù)的應(yīng)用 9
1-4 云計(jì)算 10
Chapter 2 數(shù)據(jù)倉庫 13
2-1 數(shù)據(jù)倉庫定義 14
2-2 數(shù)據(jù)倉庫特性 14
2-3 數(shù)據(jù)倉庫架構(gòu) 15
2-4 創(chuàng)建數(shù)據(jù)倉庫的目的 17
2-5 數(shù)據(jù)倉庫的運(yùn)用 18
2-6 數(shù)據(jù)倉庫的管理 19
2-7 No SQL數(shù)據(jù)庫 19
2-7-1 Key-Value型數(shù)據(jù)庫 20
2-7-2 內(nèi)存數(shù)據(jù)庫(In-memory Database) 20
2-7-3 文件數(shù)據(jù)庫(Document Database) 20
2-7-4 圖形數(shù)據(jù)庫(Graph Database) 20
2-8 Hadoop 21
Chapter 3 數(shù)據(jù)挖掘簡介 22
3-1 數(shù)據(jù)挖掘的定義 23
3-2 數(shù)據(jù)挖掘的重要性 23
3-3 數(shù)據(jù)挖掘的功能 23
3-4 數(shù)據(jù)挖掘的步驟 24
3-5 數(shù)據(jù)挖掘建模的標(biāo)準(zhǔn)CRISP-DM 25
3-6 數(shù)據(jù)挖掘的應(yīng)用 27
3-7 數(shù)據(jù)挖掘軟件介紹 28
3-8 數(shù)據(jù)挖掘與Excel 30
Chapter 4 數(shù)據(jù)挖掘的主要方法 31
4-1 回歸分析(Regression Analysis) 32
4-1-1 簡單線性回歸分析(Simple Linear
Regression Analysis) 32
4-1-2 多元回歸分析(Multiple Regression
Analysis) 32
4-1-3 脊回歸分析(Ridge Regression
Analysis) 32
4-1-4 邏輯回歸分析(Logistic Regression
Analysis) 34
4-2 關(guān)聯(lián)規(guī)則(Association Rule) 34
4-3 聚類分析(Cluster Analysis) 34
4-4 判別分析(Discriminant Analysis) 36
4-5 神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network) 37
4-6 決策樹(Decision Tree) 39
4-7 其他分析方法 40
Chapter 5 數(shù)據(jù)挖掘與相關(guān)領(lǐng)域的關(guān)系 42
5-1 數(shù)據(jù)挖掘與統(tǒng)計(jì)分析 43
5-2 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫 43
5-3 數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(KDD) 44
5-4 數(shù)據(jù)挖掘與OLAP 45
5-5 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) 46
5-6 數(shù)據(jù)挖掘與Web數(shù)據(jù)挖掘 46
5-7 數(shù)據(jù)挖掘、云計(jì)算與大數(shù)據(jù) 47
PART II Microsoft SQL Server概述
Chapter 6 Microsoft SQL Server中的商業(yè)智能 49
6-1 Microsoft SQL Server入門 50
6-2 關(guān)系數(shù)據(jù)倉庫 50
6-3 SQL Server 2014概述 51
6-4 SQL Server 2014技術(shù) 52
6-5 SQL Server 2014新增功能 54
Chapter 7 Microsoft SQL Server中的
數(shù)據(jù)挖掘功能 56
7-1 創(chuàng)建商業(yè)智能應(yīng)用程序 57
7-2 Microsoft SQL Server數(shù)據(jù)挖掘功能
的優(yōu)勢 59
7-2-1 易于使用 59
7-2-2 簡單而豐富的API 59
7-2-3 可伸縮性 60
7-2-4 數(shù)據(jù)挖掘算法 60
7-3 Microsoft SQL Server數(shù)據(jù)挖掘算法 61
7-4 Microsoft SQL Server可擴(kuò)展性 62
7-5 Microsoft SQL Server是數(shù)據(jù)挖掘與
商業(yè)智能的結(jié)合 62
7-5-1 數(shù)據(jù)分析 62
7-5-2 報(bào)告 63
7-6 使用數(shù)據(jù)挖掘可以解決的問題 63
7-6-1 構(gòu)建挖掘模型 63
7-6-2 構(gòu)建數(shù)據(jù)挖掘應(yīng)用程序 64
7-6-3 DMX范例 65
Chapter 8 Microsoft SQL Server的分析服務(wù)
(Analysis Services) 67
8-1 創(chuàng)建多維數(shù)據(jù)集的結(jié)構(gòu) 68
8-2 建立和部署多維數(shù)據(jù)集 69
8-3 從模板創(chuàng)建自定義的數(shù)據(jù)庫 69
8-4 統(tǒng)一維度模型 70
8-5 基于屬性的維度 71
8-6 維度類型 72
8-7 量度組和數(shù)據(jù)視圖 72
8-8 計(jì)算效率 73
8-9 MDX腳本 74
8-10 存儲(chǔ)過程 75
8-11 關(guān)鍵績效指標(biāo)(KPI) 75
8-12 實(shí)時(shí)商業(yè)智能 76
Chapter 9 Microsoft SQL Server的報(bào)表服務(wù)
(Reporting Services) 78
9-1 為何使用報(bào)表服務(wù) 79
9-2 報(bào)表服務(wù)的功能 80
9-2-1 制作報(bào)表 80
9-2-2 管理報(bào)表 80
9-2-3 提交報(bào)表 81
Chapter 10 Microsoft SQL Server的整合服務(wù) 83
10-1 SSIS介紹 84
10-1-1 DTS與SSIS 84
10-1-2 DTS升級到Integration Services
重點(diǎn) 84
10-1-3 SSIS版本 85
10-1-4 SSIS(SQL Server Integration
Service)架構(gòu)圖 85
10-1-5 Integration Service數(shù)據(jù)流 85
10-1-6 SSIS Designer 87
10-1-7 數(shù)據(jù)流 87
10-1-8 控制流 88
10-2 操作示例 92
10-2-1 將Excel數(shù)據(jù)表導(dǎo)入SQL數(shù)據(jù)庫
中的數(shù)據(jù)表 92
10-2-2 對數(shù)據(jù)進(jìn)行抽樣 103
Chapter 11 Microsoft SQL Server的
DMX語言 114
11-1 DMX語言介紹 115
11-2 DMX函數(shù) 117
11-2-1 模型建立 117
11-2-2 模型訓(xùn)練 118
11-2-3 模型使用(預(yù)測) 118
11-2-4 其他函數(shù)語法 119
11-3 DMX語法 122
11-3-1 決策樹 123
11-3-2 貝葉斯概率分類 124
11-3-3 關(guān)聯(lián)規(guī)則 125
11-3-4 聚類分析 126
11-3-5 時(shí)序聚類分析 127
11-3-6 線性回歸分析 127
11-3-7 邏輯回歸 128
11-3-8 神經(jīng)網(wǎng)絡(luò) 129
11-3-9 時(shí)序 130
11-4 DMX操作實(shí)例 131
11-4-1 分類(classification) 132
11-4-2 評估(estimation) 133
11-4-3 預(yù)測(prediction) 134
11-4-4 關(guān)聯(lián)分組(affinity grouping) 135
11-4-5 聚類分組(clustering) 136
PART III Microsoft SQL Server 中的數(shù)據(jù)挖掘模型
Chapter 12 決策樹模型 138
12-1 基本概念 139
12-2 決策樹與判別函數(shù) 139
12-3 計(jì)算方法 140
12-4 操作范例 142
Chapter 13 貝葉斯分類器 152
13-1 基本概念 153
13-2 操作范例 155
Chapter 14 關(guān)聯(lián)規(guī)則 166
14-1 基本概念 167
14-2 關(guān)聯(lián)規(guī)則的種類 168
14-3 關(guān)聯(lián)規(guī)則的算法:Apriori算法 168
14-4 操作范例 169
Chapter 15 聚類分析 179
15-1 基本概念 180
15-2 層級聚類法與動(dòng)態(tài)聚類法 180
15-3 操作范例 185
Chapter 16 時(shí)序聚類 197
16-1 基本概念 198
16-2 主要算法 198
16-3 操作示例 200
Chapter 17 線性回歸模型 210
17-1 基本概念 211
17-2 一元回歸模型 212
17-2-1 模型假設(shè)及推估 212
17-2-2 回歸模型測試 215
17-3 多元回歸模型 216
17-3-1 回歸效果的評估 216
17-3-2 回歸變量的選擇 218
17-4 操作范例 219
Chapter 18 邏輯回歸模型 228
18-1 基本概念 229
18-2 logit變換與logistic分布 229
18-3 邏輯回歸模型 231
18-4 操作范例 232
Chapter 19 人工神經(jīng)網(wǎng)絡(luò)模型 242
19-1 基本概念 243
19-2 神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn) 245
19-3 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)劣比較 245
19-4 操作范例 247
Chapter 20 時(shí)序模型 257
20-1 基本概念 258
20-2 時(shí)序的構(gòu)成 260
20-3 簡單時(shí)序的預(yù)測 266
20-4 包含趨勢與季節(jié)成分的時(shí)序預(yù)測 268
20-5 參數(shù)化的時(shí)序預(yù)測模型 270
20-6 操作范例 274
PART IV Microsoft SQL Server數(shù)據(jù)挖掘應(yīng)用實(shí)例
Chapter 21 決策樹模型實(shí)例 285
Chapter 22 邏輯回歸模型實(shí)例 293
22-1 回歸模型實(shí)例一:腎細(xì)胞癌轉(zhuǎn)移
的回歸模型 294
22-2 回歸模型實(shí)例二:高中升學(xué)數(shù)據(jù)
的回歸模型 300
22-3 回歸模型實(shí)例三 306
Chapter 23 神經(jīng)網(wǎng)絡(luò)模型實(shí)例 312
23-1 實(shí)例一:腎細(xì)胞癌轉(zhuǎn)移的神經(jīng)
網(wǎng)絡(luò)模型 313
23-2 實(shí)例二:電信行業(yè)神經(jīng)網(wǎng)絡(luò)模型 319
Chapter 24 時(shí)序模型實(shí)例 332
24-1 實(shí)例一:電力負(fù)載的時(shí)序模型 333
24-2 實(shí)例二:進(jìn)出品貨物價(jià)值的
時(shí)序模型 338
Chapter 25 如何評估數(shù)據(jù)挖掘模型 344
25-1 評估圖節(jié)點(diǎn)Evaluation Chart
Node介紹 345
25-2 在SQL Server中如何評估模型 348
25-3 規(guī)則度量:支持度與可信度 353
25-4 結(jié)論 355
- 零基礎(chǔ)玩轉(zhuǎn)國產(chǎn)大模型DeepSeek [徐永冰 張帥 編著]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統(tǒng)項(xiàng)目管理師考試32小時(shí)通關(guān)(適用第4版考綱) [薛大龍]
- 信息系統(tǒng)管理工程師考試32小時(shí)通關(guān)(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實(shí)訓(xùn) [洪曉江 達(dá)則曉麗 錢波]
- 科技信息檢索與論文寫作實(shí)用教程 [李振華]
- 傳統(tǒng)山水畫論解讀與實(shí)踐 [陳鈉 著]
- Python數(shù)據(jù)庫編程 [主編 殷樹友 邢 翀]
- 計(jì)算機(jī)基礎(chǔ)實(shí)訓(xùn)指導(dǎo) [主編 袁春萍 朱妮]
- 嵌入式人工智能技術(shù)應(yīng)用(數(shù)字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術(shù) [桂存兵 著]
- 變頻器與伺服應(yīng)用 [陳剛 葉云飛]
- 物聯(lián)網(wǎng)工程設(shè)計(jì)與實(shí)踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運(yùn)營與管理 [鐘肖英 陳瀟]
- Java面向?qū)ο蟪绦蛟O(shè)計(jì) [主編 姜春磊 陳虹潔]
- 信息技術(shù)基礎(chǔ)(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應(yīng)用 [主編 陳 萍 劉培培 陳孟軍]
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo) [主編 劉志堅(jiān)]
- 高級辦公應(yīng)用項(xiàng)目教程 [主編 屈晶 趙成麗]
- 微信小程序開發(fā)項(xiàng)目實(shí)戰(zhàn)(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業(yè)檔案工作實(shí)戰(zhàn)寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計(jì)算機(jī)網(wǎng)絡(luò)原理及應(yīng)用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學(xué)生創(chuàng)業(yè)基礎(chǔ) [主編 王麗莉 王 楊]
- 船舶輔機(jī) [主編 王連海 于洋 姜淑翠]
- 大學(xué)生就業(yè)指導(dǎo) [主編 王麗莉 董宴廷]
- 系統(tǒng)架構(gòu)設(shè)計(jì)師章節(jié)習(xí)題與考點(diǎn)特訓(xùn) [主編 薛大龍 鄒月平]
- 高校學(xué)生工作探索與實(shí)踐 [郭亮 著]
- 大學(xué)生情商管理 [方雄 著]
- 2023年長沙市會(huì)展業(yè)發(fā)展報(bào)告 [主編 周棟良]