• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      搭建Hadoop實(shí)驗(yàn)平臺

      2016-11-26 05:19:18
      網(wǎng)絡(luò)安全和信息化 2016年5期
      關(guān)鍵詞:格式化進(jìn)程集群

      引言:網(wǎng)上有很多介紹如何搭建Hadoop的文章,有的步驟不甚詳細(xì),有的按其方法搭建會出現(xiàn)莫名其妙的問題。本文盡量細(xì)化步驟、簡化配置,并已將容易導(dǎo)致錯誤的部分提前修改,為初學(xué)者學(xué)習(xí)搭建Hadoop完全分布式集群環(huán)境提供方便。

      實(shí)驗(yàn)材料

      1、VMware Workstation;

      2、ubuntu14.04.3桌面版64位操作系統(tǒng)

      3、jdk8u 65 64位4、hadoop2.7.1

      實(shí)驗(yàn)過程

      用VMware Workstation創(chuàng)建4臺ubuntu虛擬機(jī)

      Windows平臺下安裝好VMware Workstation虛擬機(jī)軟件。從ubuntu官方網(wǎng)站www.ubuntu.com下 載ubuntu14.04.3桌面版64位操作系統(tǒng),通過VMware Workstation創(chuàng)建一臺ubuntu虛擬機(jī)。用戶名 hadoop,口令 hadoop,如圖1所示。

      安裝 jdk和 hadoop,并配置環(huán)境變量

      1、安裝jdk和hadoop:

      圖1 創(chuàng)建ubuntu虛擬機(jī)

      圖2 安裝jdk和ubuntu

      圖3 測試jdk安裝是否成功

      2、配置 jdk的環(huán)境變量

      3、配置hadoop的環(huán)境量

      如果顯示如圖4所示,則表示hadoop安裝成功。

      以該虛擬機(jī)為模板,克隆出3臺虛擬機(jī)

      Hadoop集群各節(jié)點(diǎn)信息如下:

      圖4 測試hadoop安裝是否成功

      圖5 hosts文件內(nèi)容

      修改4臺ubuntu虛擬機(jī)的主機(jī)名:sudo vim /etc/hostname,hostname均為hadoop。

      修改hosts文件,解析主機(jī)名:sudo vim /etc/hosts

      hosts文件內(nèi)容如圖5所示。

      重啟虛擬機(jī)后主機(jī)名和hosts解析生效。

      配置SSH無密鑰登錄

      在4臺虛擬機(jī)上,安裝openssh-server安全連接軟件

      4臺上均生成密鑰對:ssh-keygen t rsa,其位于家目錄下的隱藏目錄~/.ssh

      修改 core-site.xml、hdfssite.xml、mapred-site.xml、yarn-site.xml及 slaves,為 4臺虛擬機(jī)分配不同角色,以組成hadoop完全分布式集群

      4個文件位于/usr/soft/hadoop-2.7.1/etc/hadoop/目錄下

      由于每4臺主機(jī)的xml文件配置必須相同,所以只需在master主機(jī)上修改這4個xml文件,然后遠(yuǎn)程拷貝到其余3臺主機(jī)即可。

      特別說明:默認(rèn)的hadoop集群啟動臨時文件存放在/tmp/目錄下,每次重新開機(jī)就會被清空,與此同時namenode的格式化信息就會丟失。為避免hadoop集群啟動時出現(xiàn)namenode進(jìn)程丟失故障,需在master主機(jī)上建立一個永久的臨時文件存放目錄:mkdir /home/hadoop/hadoop_tmp。

      同時打開所有的xml文件:gedit *-site.xml。

      1、core-site.xml用于配置namenode節(jié)點(diǎn),修改后內(nèi)容為

      3、mapred-site.xml需 從mapred-site.xml.template模板復(fù)制而來,修改后內(nèi)容為

      4、yarn-site.xml用于配置resourcemanager,本實(shí)驗(yàn)中resourcemanager由namenode節(jié)點(diǎn)兼任,修改后內(nèi)容為

      將上述4個xml文件從master上copy到其它3個節(jié)點(diǎn),或者直接拷貝hadoop目錄,使4臺主機(jī)的xml文件相同。

      另 外,需 在master和slave3節(jié)點(diǎn)上配置slaves文件,用于指定集群中的datanode節(jié)點(diǎn)是哪幾個。slaves文件內(nèi)容如圖6所示。

      至此,已完成hadoop集群的所有必需的配置工作。

      格式化hdfs文件系統(tǒng),啟動 hadoop集群

      格式化hdfs文件系統(tǒng):hadoop namenode format

      圖6 slaves文件內(nèi)容

      圖7 master節(jié)點(diǎn)進(jìn)程信息

      圖8 slave1 節(jié)點(diǎn)進(jìn)程信息

      圖9 slave1 節(jié)點(diǎn)進(jìn)程信息

      圖10 slave3 節(jié)點(diǎn)進(jìn)程信息

      提示Storage directory/home/hadoop/hadoop_tmp /dfs/name has been successfully formatted.

      表示hdfs格式化成功。

      啟 動hadoop集 群:start-all.sh

      查看各節(jié)點(diǎn)的hadoop進(jìn)程信息,使用命令:jps

      master節(jié)點(diǎn)進(jìn)程信息如圖7所示。slave1節(jié)點(diǎn)進(jìn)程信息如 圖8所示。

      slave2節(jié)點(diǎn)進(jìn)程信息如圖9所示。

      slave3節(jié)點(diǎn)進(jìn)程信息如圖10所示。

      如果以上顯示都正常,則表示hadoop集群啟動成功。

      測試java程序以驗(yàn)證hadoop是否能進(jìn)行數(shù)據(jù)分析

      本實(shí)驗(yàn)將測試jdk自帶的wordcount程序。

      先在master節(jié)點(diǎn)本地創(chuàng)建測試用例:vim test.txt

      文本內(nèi)容:

      在hdfs文件系統(tǒng)下新建 input目 錄:hadoop fs-mkdir /input

      查看新建目錄是否成功:hadoop fs ls /

      顯示有input目錄了

      將test.txt從本機(jī)上傳到hdfs文件系統(tǒng):hadoop fs put test.txt /input

      啟動java的wordcount程序

      上述語句是一條完整的命令。

      啟動了mapreduce,統(tǒng)計文本中單詞出現(xiàn)的次數(shù),將結(jié)果輸出至output目錄。

      查看結(jié)果:用瀏覽器打開 http://master:50070,有 了output目 錄,內(nèi) 有2個文件_SUCCESS和part-r-00000。

      圖11 查看wordcount統(tǒng)計結(jié)果

      查看wordcount統(tǒng)計結(jié)果:hadoop fs cat/output/part-r-00000,如果顯示結(jié)果如圖11所示,則表示mapreduce運(yùn)算正常。

      經(jīng)驗(yàn)總結(jié)

      Hadoop集群的resource manager、namenode、secondary namenode、datanode、nodemanager等角色搭配比較靈活,也是經(jīng)常困擾初學(xué)者的地方。

      幾種角色要依賴4個xml文件和slaves來配置,弄清楚這個問題將對進(jìn)一步學(xué)習(xí)Hadoop至關(guān)重要。

      猜你喜歡
      格式化進(jìn)程集群
      現(xiàn)代人守則:昏死之前請把手機(jī)格式化
      債券市場對外開放的進(jìn)程與展望
      中國外匯(2019年20期)2019-11-25 09:54:58
      海上小型無人機(jī)集群的反制裝備需求與應(yīng)對之策研究
      一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計
      電子制作(2018年11期)2018-08-04 03:25:40
      Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
      勤快又呆萌的集群機(jī)器人
      格式化
      詩林(2016年5期)2016-10-25 07:51:39
      社會進(jìn)程中的新聞學(xué)探尋
      我國高等教育改革進(jìn)程與反思
      萍乡市| 玉林市| 旌德县| 望谟县| 酒泉市| 靖边县| 固阳县| 迁安市| 太原市| 右玉县| 凌海市| 密山市| 洮南市| 巴彦淖尔市| 曲阜市| 沾益县| 澄城县| 恩施市| 乐至县| 通山县| 东莞市| 剑河县| 河池市| 阳信县| 临武县| 揭阳市| 漳平市| 红桥区| 钦州市| 东丽区| 峨山| 泸州市| 法库县| 甘肃省| 金乡县| 紫金县| 莱州市| 温宿县| 汽车| 上饶市| 镇远县|