Hadoop框架：單服務下偽分佈式集羣搭建

2020-09-17 由亓官天亦發佈於科技

環境：centos7Hadoop版本：2.7.2jdk版本：1.8

bin目錄：存放對Hadoop的HDFS,YARN服務進行操作的腳本
etc目錄：Hadoop的相關配置文件目錄
lib目錄：存放Hadoop的本地庫，提供數據壓縮解壓縮能力
sbin目錄：存放啓動或停止Hadoop相關服務的腳本
share目錄：存放Hadoop的依賴jar包、文檔、和相關案例

vim /etc/profile# 添加環境export JAVA_HOME=/opt/jdk1.8export PATH=$PATH:$JAVA_HOME/binexport HADOOP_HOME=/opt/hadoop2.7export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin# 退出刷新配置source /etc/profile

以下配置文件所在路徑：/opt/hadoop2.7/etc/hadoop，這裏是Linux環境，腳本配置sh格式。

root# vim hadoop-env.sh# 修改前export JAVA_HOME=# 修改後export JAVA_HOME=/opt/jdk1.8

文件結構概覽

NameNode的地址

fs.defaultFShdfs://127.0.0.1:9000

數據存放目錄：Hadoop運行時產生文件的存儲目錄。

hadoop.tmp.dir/opt/hadoop2.7/data/tmp

文件結構和上述一樣，配置hdfs副本個數，這裏偽環境，配置1個即可。

dfs.replication1

export JAVA_HOME=/opt/jdk1.8

指定YARN的ResourceManager的地址

yarn.resourcemanager.hostname192.168.72.132

指定map產生的中間結果傳遞給reduce採用的機制是shuffle

yarn.nodemanager.aux-servicesmapreduce_shuffle

export JAVA_HOME=/opt/jdk1.8

將mapred-site.xml.template重新命名為mapred-site.xml。

指定MapReduce程序資源調在度集羣上運行。如果不指定為yarn，那麼MapReduce程序就只會在本地運行而非在整個集羣中運行。

mapreduce.framework.nameyarn

Hdfs相關

格式化NameNode

第一次啓動時執行該操作。

[hadoop2.7]# bin/hdfs namenode -format

格式化NameNode，會產生新的clusterID,導致NameNode和DataNode的集羣id不一致，集羣找不到已往數據。所以，格式NameNode時，一定要停止相關進程，刪除data數據和log日誌，然後再格式化NameNode。clusterID在如下目錄中的VERSION文件裏，可自行查看對比。

/opt/hadoop2.7/data/tmp/dfs/name/current/opt/hadoop2.7/data/tmp/dfs/data/current

啓動NameNode

[hadoop2.7]# sbin/hadoop-daemon.sh start namenode

啓動DataNode

[hadoop2.7]# sbin/hadoop-daemon.sh start datanode

jps查看狀態

[root@localhost hadoop2.7]# jps2450 Jps2276 NameNode2379 DataNode

Web界面查看

需要Linux關閉防火牆和相關安全增強控制（這裏很重要）。

IP地址:50070

Yarn相關

啓動ResourceManager

[hadoop2.7]# sbin/yarn-daemon.sh start resourcemanager

啓動NodeManager

[hadoop2.7]# sbin/yarn-daemon.sh start nodemanager

Web界面查看

IP地址:8088/cluster

MapReduce相關

文件操作測試

創建一個測試文件目錄

[root@localhost inputfile]# pwd/opt/inputfile[root@localhost inputfile]# echo "hello word hadoop" > word.txt

HDFS文件系統上創建文件夾

[hadoop2.7] bin/hdfs dfs -mkdir -p /opt/upfile/input

上傳文件

[hadoop2.7]# bin/hdfs dfs -put /opt/inputfile/word.txt /opt/upfile/input

查看文件

[hadoop2.7]# bin/hdfs dfs -ls /opt/upfile/input

執行文件分析

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /opt/upfile/input /opt/upfile/output

查看分析結果

bin/hdfs dfs -cat /opt/upfile/output/*

結果：每個單詞各自出現一次。

刪除分析結果

bin/hdfs dfs -rm -r /opt/upfile/output

MapReduce的JobHistoryServer，這是一個獨立的服務，可通過 web UI 展示歷史作業日誌。

mapreduce.jobhistory.address192.168.72.132:10020mapreduce.jobhistory.webapp.address192.168.72.132:19888

[hadoop2.7]# sbin/mr-jobhistory-daemon.sh start historyserver

IP地址:19888

日誌聚集概念：應用服務運行完成以後，將運行日誌信息上傳到HDFS系統上。方便的查看到程序運行詳情，方便開發調試。

開啓日誌聚集功能之後，需要重新啓動NodeManager 、ResourceManager和HistoryManager。

關閉上述服務

[hadoop2.7]# sbin/yarn-daemon.sh stop resourcemanager[hadoop2.7]# sbin/yarn-daemon.sh stop nodemanager[hadoop2.7]# sbin/mr-jobhistory-daemon.sh stop historyserver

修改yarn-site

yarn.log-aggregation-enabletrueyarn.log-aggregation.retain-seconds604800

修改完之後再次啓動上述服務器。再次執行文件分析任務。

查看Web端

轉載請註明： Hadoop框架：單服務下偽分佈式集羣搭建 - 楠木軒

中秋、國慶期間，本市公安交警系統服務窗口對外辦公時間調整

發佈於: 綜合2020-09-26標籤: 中秋節服務期間交警

根據國務院和市政府的有關安排，2020年中秋、國慶假期安排為10月1日至8日。為方便羣眾選擇適當時間辦事，現將中秋、國慶期間全市交警系統服務窗口對外辦公時間通知如下：1、10月1日（週四）至8日（週四

日本泡温泉3個“隱形”規定，最後一個，遊客受不了

發佈於: 休閒2020-09-24標籤: 温泉旅行服務中年

日本泡温泉3個“隱形”規定，最後一個，遊客直呼受不了眾所周知，中國國內最近幾年的發展，是大家有目共睹的，發展不僅表現在經濟上，旅遊業以及其他服務行業，也進入了高速發展階段。中國人們生活突飛猛進，更多遊

新都心將規劃交通銀行網點目前正在選擇合規房源

發佈於: 財經2020-09-24標籤: 交通銀行交通服務

青島新聞網9月24日訊（記者李倍）銀行網點的分佈情況與百姓生活息息相關，而網點少、排隊長也會對百姓生活造成不便。今天下午，交通銀行青島分行黨委委員、副行長徐芝清做客民生在線直播間，就交行在青島的網點

全班學生都是班幹部，不妨試一試再評論

發佈於: 經典2020-09-24標籤: 班級班幹部服務人人都

9月21日，四川達州。宣漢縣胡家初級中學一班級62名學生每人都是班幹部，班級李老師稱一開始讓大家報名班幹部積極性不是很高，後來就讓每個學生都參與到班級管理去。有電燈、風扇和所在樓層男女廁所管理員等職

為什麼飛機空姐上下班拉個皮箱，裏面到底裝了什麼？

發佈於: 奇聞2020-09-24標籤: 飛機上面皮箱上下班服務

乘坐過飛機的小夥們，不知道看到過這樣的一個景象沒有，就是空姐無論是在上班，還是在下班的時候，都會拉着一個皮箱，按照常人的想法，空姐在飛機上面都有自己的休息室，為什麼還需要拉着一個皮箱呢？裏面到底都裝了

天洋控股挪用捨得酒業資金無法償債，聲稱服務酒業供應鏈的保理公司資金流向天洋房地產，曾佈局P2P等互聯網金融業務

發佈於: 財經2020-09-22標籤: 捨得酒業應收賬款互聯網金融服務

因間接控股股東天洋控股集團有限公司（下稱“天洋控股”）未能按時還款，9月21日，捨得酒業（SH.600702）被要求暫時停牌一天，9月22日起實施其他風險警示，股票簡稱將變為“ST捨得”，日漲跌幅限制

“十四五”時期數字經濟發展趨勢與治理重點

發佈於: 財經2020-09-22標籤: 治理時期數字服務

本文轉自【光明日報】；近十年來，我國數字經濟快速發展。中國信息通信研究院研究顯示，數字經濟增加值已由2011年的9.5萬億元增加到2019年的35.8萬億元，佔GDP比重從20.3%提升到36.2%。

申通快遞：8月快遞服務業務收入同比減少10.95%

發佈於: 綜合2020-09-22標籤: 業務收入申通快遞服務同比

36氪獲悉，申通快遞發佈《2020 年8月經營簡報》，該簡報顯示，8月，公司實現快遞服務業務收入16.61億元，同比減少10.95%；完成業務量7.88億票，同比增長16.74%；快遞服務單票收入2.

朱翠紅：服務於國際貿易的最前沿

發佈於: 經典2020-09-22標籤: 青浦服務出證認證企業

作為青浦貿促支會的秘書長，朱翠紅和同事們一起，做好貿促系統日常出證認證業務。今年疫情期間，青浦貿促支會加大推動企業原產地證明書自主打印服務和提供快遞服務，讓數據多跑路，讓企業少跑腿，實現不見面辦公，大

店易火獲得千萬美元融資，為中小餐飲企業提供一站式服務

發佈於: 科技2020-09-21標籤: 服務融資中年商户

近日，店易火宣佈一年內連續完成了兩輪融資，獲得了分別來自GGV紀源資本和紅點中國近千萬美元A輪融資，以及CCV創世夥伴資本領投、GGV紀源資本和紅點中國跟投的千萬美元A+輪融資。據悉，店易火成立於20

大數據跑腿 “銀髮經濟”潛力大

發佈於: 綜合2020-09-21標籤: 伯克利數據中心數據服務

本文轉自【todayguizhou.com】；老人們或散步，或鍛鍊身體；茶餘飯後，還可以打打牌、看看電視......地處白雲區剛玉街的貴鋁智慧幸福苑養老機構自投用以來，受到不少老人青睞，其中不乏海南、

【發現最美鐵路】8年列車工作她始終把旅客當家人——記G421次列車長孫雪

發佈於: 綜合2020-09-21標籤: 列車長 G421 中年服務

　　中國青年網南寧9月21日電（見習記者陳子君）在北京西開往南寧東的G421次列車上，總能看到一道忙碌的身影不定時出現在各個車廂進行巡檢工作。身影主人優雅的舉止、甜美的微笑與胸前亮眼的“四星”胸章交

商務部：自貿區全新佈局進一步服務國家戰略

發佈於: 財經2020-09-21標籤: 王受文佈局利於進一服務

　　經濟日報-中國經濟網北京9月21日訊近日國務院印發北京、湖南、安徽自由貿易試驗區總體方案和浙江自由貿易試驗區擴展區域方案。按照黨中央、國務院決策部署，我國已經陸續建立了上海、廣東、天

亞洲漁港響應餐飲行業發展趨勢，打造特色化餐飲供應鏈

發佈於: 財經2020-09-21標籤: 餐飲餐飲行業供應鏈服務

2019年上半年，餐飲收入21279億元，同比增長9.4%，到2020年，全國餐飲收入預計將超過5萬億元。從宏觀環境的角度來看，政策、經濟、社會、技術各個方面都在影響餐飲市場的發展。消費升級在持續推進

原來飛機上有三項隱藏服務，只要你敢開口要求，空姐都不會拒絕你

發佈於: 休閒2020-09-21標籤: 民用航空服務高薪中薪

如今在很多城市中都能看到機場的身影，它的速度很快，乘坐的體驗很不錯，更重要的是它的時間很快，無需多少時間就能快速到達終點，給大家的出行帶來便利。只要不是高峯期間出行，機票會有很大的折扣力度，甚至比高鐵