HBase分布式存儲系統(tǒng)應(yīng)用

-
【作 者】胡鑫喆 張志剛
【I S B N 】978-7-5170-6891-4
【責(zé)任編輯】張玉玲
【適用讀者群】本專通用
【出版時間】2018-10-15
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數(shù)】192
【千字?jǐn)?shù)】292
【印 張】12
【定 價】¥32
【叢 書】普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材
【備注信息】
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書通過原理加案例的方式系統(tǒng)講解了HBase分布式存儲系統(tǒng)應(yīng)用,精心安排了HBase原理和架構(gòu)分析、環(huán)境搭建、案例開發(fā)、優(yōu)化策略等環(huán)節(jié),使讀者對解決相關(guān)問題有清晰的思路。
全書共8章:前7章系統(tǒng)講解HBase模型和系統(tǒng)架構(gòu)、數(shù)據(jù)讀寫流程、環(huán)境搭建、HBase Shell、程序開發(fā)、高級特性;第8章是HBase MapReduce實例,通過實例幫助讀者進一步理解HBase應(yīng)用和MapReduce編程。全書脈絡(luò)清晰,實例新穎實用,內(nèi)容詳實。
本書可作為普通高校大數(shù)據(jù)相關(guān)專業(yè)的HBase教材,可供深入了解HBase編程的讀者參考,還可作為相關(guān)培訓(xùn)班的培訓(xùn)教材。
本書通過原理加案例的方式系統(tǒng)講解HBase分布式存儲系統(tǒng)應(yīng)用,精心安排了HBase原理和架構(gòu)分析、環(huán)境搭建、案例開發(fā)、優(yōu)化策略等環(huán)節(jié),全書脈絡(luò)清晰,案例新穎實用,道理直觀,內(nèi)容詳實。
大數(shù)據(jù)帶來了各種各樣繁雜的數(shù)據(jù),我們不僅要呈現(xiàn)世界,更重要的是通過呈現(xiàn)來處理更龐大的數(shù)據(jù),理解各種各樣的數(shù)據(jù)集合,表現(xiàn)多維數(shù)據(jù)之間的關(guān)聯(lián)。換句話說,就是歸納數(shù)據(jù)內(nèi)在的模式、關(guān)聯(lián)和結(jié)構(gòu)。
由于大數(shù)據(jù)的存儲量極大,因此其存儲設(shè)備需要具有高擴展性、高可用性、自動容錯和低成本等特點。常見的存儲形式有分布式文件系統(tǒng)和分布式數(shù)據(jù)庫,分布式文件系統(tǒng)采用大規(guī)模的分布式存儲節(jié)點來滿足存儲大量文件的需求,而分布式的非關(guān)系型數(shù)據(jù)庫則為大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)的處理和分析提供支持。
目前常見的非關(guān)系型數(shù)據(jù)庫主要有Redis、Tokyo Cabinet、MongoDB、CouchDB、Cassandra、Voldemort和HBase等。本書將對HBase進行深入研究和探討,其他非關(guān)系型數(shù)據(jù)庫讀者可以參考相關(guān)書籍。本書共8章,具體內(nèi)容如下:
第1章介紹關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫的區(qū)別、HBase的使用場景。
第2章介紹HBase的邏輯模型、物理模型和系統(tǒng)架構(gòu)。
第3章詳細(xì)講解HRegionServer、HRegion和HBase數(shù)據(jù)讀寫流程。
第4章介紹HBase的分布式環(huán)境搭建。
第5章介紹如何通過HBase Shell完成表的管理、數(shù)據(jù)的增刪改查和數(shù)據(jù)遷移。
第6章介紹創(chuàng)建表、數(shù)據(jù)插入、數(shù)據(jù)查詢等基本操作,然后對Scan查詢、Filter過濾、行數(shù)統(tǒng)計、NameSpace開發(fā)、計數(shù)器、協(xié)處理器和HBase快照等高級應(yīng)用進行介紹。
第7章介紹HBase表設(shè)計、列族設(shè)計優(yōu)化、讀寫性能優(yōu)化策略、HBase集群規(guī)劃。
第8章講解HBase MapReduce編程實例。
本書的編寫得到北京百知教育科技有限公司的大力支持,在此表示感謝。
由于時間倉促及編者水平有限,書中難免有疏漏甚至錯誤之處,懇請廣大讀者批評指正。
編 者
2018年7月
1.1 面向行和面向列存儲對比 1
1.1.1 面向行存儲的數(shù)據(jù)庫 1
1.1.2 面向列存儲的數(shù)據(jù)庫 2
1.1.3 兩種存儲方式的對比 2
1.2 HDFS分布式存儲的特點 3
1.3 HBase的使用場景 5
1.4 本章小結(jié) 6
第2章 HBase模型和系統(tǒng)架構(gòu) 7
2.1 HBase的相關(guān)概念 7
2.2 HBase的邏輯模型 8
2.3 HBase的物理模型 10
2.4 HBase的特點 10
2.5 HBase的系統(tǒng)架構(gòu) 11
2.5.1 Client 11
2.5.2 ZooKeeper 12
2.5.3 HMaster 12
2.5.4 HRegionServer 12
2.5.5 HRegion 13
2.6 本章小結(jié) 13
第3章 HBase數(shù)據(jù)讀寫流程 15
3.1 HRegionServer詳解 15
3.1.1 WAL 16
3.1.2 MemStore 17
3.1.3 BlockCache 18
3.1.4 HFile 18
3.1.5 HRegionServer的恢復(fù) 23
3.1.6 HRegionServer的上線下線 24
3.2 HRegion 24
3.2.1 HRegion分配 25
3.2.2 HRegion Split 25
3.2.3 HRegion Compact 25
3.3 HMaster上線 26
3.4 數(shù)據(jù)讀流程 26
3.5 數(shù)據(jù)寫流程 28
3.6 刪除數(shù)據(jù)流程 28
3.7 本章小結(jié) 28
第4章 HBase環(huán)境搭建 30
4.1 ZooKeeper的安裝 30
4.2 HBase的安裝 31
4.3 本章小結(jié) 35
第5章 HBase Shell 36
5.1 HBase Shell啟動 36
5.2 表的管理 37
5.3 表數(shù)據(jù)的增刪改查 44
5.4 HBase數(shù)據(jù)遷移的importtsv的使用 48
5.5 本章小結(jié) 49
第6章 HBase程序開發(fā) 50
6.1 表的相關(guān)操作 50
6.2 創(chuàng)建Configuration對象 54
6.3 創(chuàng)建表 55
6.3.1 開發(fā)環(huán)境配置 56
6.3.2 創(chuàng)建表 58
6.4 數(shù)據(jù)插入 60
6.5 數(shù)據(jù)查詢 67
6.6 數(shù)據(jù)刪除 71
6.7 Scan查詢 75
6.8 Filter過濾 84
6.9 行數(shù)統(tǒng)計 105
6.10 NameSpace開發(fā) 107
6.11 計數(shù)器 111
6.12 協(xié)處理器 115
6.13 HBase快照 126
6.14 本章小結(jié) 131
第7章 HBase高級特性 132
7.1 HBase表設(shè)計 132
7.2 列族設(shè)計優(yōu)化 136
7.3 寫性能優(yōu)化策略 138
7.4 讀性能優(yōu)化策略 139
7.4.1 HBase客戶端優(yōu)化 139
7.4.2 HBase服務(wù)器端優(yōu)化 140
7.4.3 HDFS相關(guān)優(yōu)化 141
7.5 HBase集群規(guī)劃 142
7.5.1 集群業(yè)務(wù)規(guī)劃 142
7.5.2 集群容量規(guī)劃 143
7.5.3 Region規(guī)劃 144
7.5.4 內(nèi)存規(guī)劃 145
7.6 本章小結(jié) 149
第8章 MapReduce On HBase 150
8.1 HBase MapReduce 150
8.2 編程實例 151
8.2.1 使用MapReduce操作HBase 151
8.2.2 從HBase獲取數(shù)據(jù)上傳至HDFS 154
8.2.3 MapReduce生成HFile入庫
到HBase 156
8.2.4 同時寫入多張表 160
8.2.5 從多個表讀取數(shù)據(jù) 164
8.2.6 通過讀取HBase表刪除Hbase
數(shù)據(jù) 166
8.2.7 通過讀取HBase表數(shù)據(jù)復(fù)制到
另外一張表 169
8.2.8 建立HBase表索引 170
8.2.9 將MapReduce輸出結(jié)果到MySQL 174
8.2.10 利用MapReduce完成MySQL
數(shù)據(jù)讀寫 179
8.3 本章小結(jié) 182
附錄 MySQL安裝 183
- 零基礎(chǔ)玩轉(zhuǎn)國產(chǎn)大模型DeepSeek [徐永冰 張帥 編著]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統(tǒng)項目管理師考試32小時通關(guān)(適用第4版考綱) [薛大龍]
- 信息系統(tǒng)管理工程師考試32小時通關(guān)(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實訓(xùn) [洪曉江 達(dá)則曉麗 錢波]
- 科技信息檢索與論文寫作實用教程 [李振華]
- 傳統(tǒng)山水畫論解讀與實踐 [陳鈉 著]
- Python數(shù)據(jù)庫編程 [主編 殷樹友 邢 翀]
- 計算機基礎(chǔ)實訓(xùn)指導(dǎo) [主編 袁春萍 朱妮]
- 嵌入式人工智能技術(shù)應(yīng)用(數(shù)字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術(shù) [桂存兵 著]
- 變頻器與伺服應(yīng)用 [陳剛 葉云飛]
- 物聯(lián)網(wǎng)工程設(shè)計與實踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運營與管理 [鐘肖英 陳瀟]
- Java面向?qū)ο蟪绦蛟O(shè)計 [主編 姜春磊 陳虹潔]
- 信息技術(shù)基礎(chǔ)(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應(yīng)用 [主編 陳 萍 劉培培 陳孟軍]
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo) [主編 劉志堅]
- 高級辦公應(yīng)用項目教程 [主編 屈晶 趙成麗]
- 微信小程序開發(fā)項目實戰(zhàn)(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業(yè)檔案工作實戰(zhàn)寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計算機網(wǎng)絡(luò)原理及應(yīng)用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學(xué)生創(chuàng)業(yè)基礎(chǔ) [主編 王麗莉 王 楊]
- 船舶輔機 [主編 王連海 于洋 姜淑翠]
- 大學(xué)生就業(yè)指導(dǎo) [主編 王麗莉 董宴廷]
- 系統(tǒng)架構(gòu)設(shè)計師章節(jié)習(xí)題與考點特訓(xùn) [主編 薛大龍 鄒月平]
- 高校學(xué)生工作探索與實踐 [郭亮 著]
- 大學(xué)生情商管理 [方雄 著]
- 2023年長沙市會展業(yè)發(fā)展報告 [主編 周棟良]
- 云計算原理
- Python數(shù)據(jù)分析
- 大數(shù)據(jù)技術(shù)導(dǎo)論
- HBase分布式存儲系統(tǒng)應(yīng)用(第二版)
- Hive編程技術(shù)與應(yīng)用(第二版)
- Python 語言程序設(shè)計實踐指導(dǎo)
- Spark大數(shù)據(jù)處理技術(shù)
- 數(shù)據(jù)清洗
- R語言基礎(chǔ)及應(yīng)用
- 數(shù)據(jù)庫原理及應(yīng)用(MySQL版)
- 大數(shù)據(jù)導(dǎo)論
- 大數(shù)據(jù)可視化技術(shù)
- Python語言程序設(shè)計
- Java編程基礎(chǔ)
- Java編程基礎(chǔ)實踐指導(dǎo)
- 深度學(xué)習(xí)—卷積神經(jīng)網(wǎng)絡(luò)算法原理與應(yīng)用