婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > linux下hadoop配置過程

linux下hadoop配置過程

熱門標簽:智能外呼系統的選購 各種地圖標注 地圖標注員騙局 福州營銷電銷機器人招商 地圖標注不在現場怎么上傳門頭標 400電話申請商客通 企業電話機器人靠譜嗎 河北點撥外呼系統哪家公司做的好 文德數慧科技有限公司
1,安裝linux
本文假設從裸機開始,所以要先裝linux。本人是ubuntu對支持者,所以裝的是ubuntu,廢話沒有,很容易就裝好了。在安裝過程中,要注意所有節點對主機名應該有規律,比如node0, node1, node2 ...
2,準備
下面對軟件對安裝,全都使用了apt,這個軟件需要互聯網鏈接,如果你對網速極慢,或者根本鏈接不到外部網絡(這個現象在教育網內很常見),可以從一個能上網對ubuntu電腦上的/var/cache/apt/archives文件夾里deb文件出來安裝(什么?你問我這個文件夾里為什么沒有想要的包,這個文件夾是apt對緩存文件夾,想要里面有你想要對東西,不用我提醒你應該怎么辦了吧)。
ubuntu默認已經裝好了openssh-client,需要安裝openssh-server。命令如下:

復制代碼
代碼如下:

sudo apt-get install openssh-server

然后是jdk:

復制代碼
代碼如下:

sudo apt-get install default-jdk


3,配置網絡
如果你的節點們可以通過dhcp服務器獲得ip,我個人建議,這樣做,原因是簡單,不用怎么配置就搞定了。或者可以使用靜態ip,作為一個牛b的linux大牛,應該可以通過一行命令來設置靜態ip,但是我不會。我通常都是在gnome提供的網絡管理器來設ip對。如果你用對linux里沒有圖形界面,那樣請google。
設置好了ip地址之后,記憶在/etc/hosts文件中給每個節點起個名字,最好就是各自對主機名,這樣有利于下面對配置和管理。
hadoop要求各節點間可以不需要輸入密碼就能用ssh互相登錄。我使用了比官方方法簡單一點方法來設置,但是據說安全性有點兒問題。下面是方法:
在某個節點上執行如下命令:

復制代碼
代碼如下:

rm -rf ~/.ssh


復制代碼
代碼如下:

ssh-keygen -t rsa

這個命令之后需要多按幾次回車,知道再次出現命令提示符。當然,這個做法也不是很安全,里面有個輸入key的地方,官方的建議是,輸入一首歌的歌詞,呵呵,這個建議很搞笑。當然在我的步驟中,這個key就是空值了。

復制代碼
代碼如下:

cat ~/.ssh/id_rsa.pub >> authorized_keys

然后把整個.ssh文件夾考到所有對節點上,具體方法可以使用scp命令,具體命令由于和具體環境有關,下面不寫。

這樣網絡就設置對差不多了。
4,安裝hadoop
解壓,這個比較簡單,命令不寫。解壓對位置最好每個hadoop都一樣,不一樣有什么后果,我沒試過。
之后要進行一些配置,首先進入解壓后目錄對conf文件夾,要修改對配置文件包括hadoop-env.sh hadoop-site.xml masters slaves
hadoop-env.sh中要uncomment下面一行:


復制代碼
代碼如下:

export JAVA_HOME=/home/hadoop/jdk1.6.0_16/

當然具體的值,也要根據具體情況進行更改。
接下來是hadoop-site.xml,下面是我的文件內容。

復制代碼
代碼如下:

configuration>
property>
name>fs.default.name/name>
value>hdfs://node0:6000/value>
/property>
property>
name>mapred.job.tracker/name>
value>node0:6001/value>
/property>
/configuratiron>

這個例子很直白,不解釋。

masters里面是jobtracker和namenode所在節點的主機名或者ip地址,我的masters文件里只有一行,當然如果你想要設置多個節點作為主節點,也可以。
slaves里面是所有tasktracker和datanode對主機名或ip地址。
5,運行
先進入hadoop安裝文件夾。然后依次運行如下命令:

復制代碼
代碼如下:

bin/hadoop namenode -format
bin/start-all.sh

不出意外的話,現在hadoop就可以使用了。

Hadoop是一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有著高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streaming access)文件系統中的數據。

標簽:新余 潛江 鎮江 雞西 長沙 南陽 曲靖 鎮江

巨人網絡通訊聲明:本文標題《linux下hadoop配置過程》,本文關鍵詞  linux,下,hadoop,配置,過程,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《linux下hadoop配置過程》相關的同類信息!
  • 本頁收集關于linux下hadoop配置過程的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 边坝县| 长沙市| 广丰县| 凤凰县| 寿光市| 同仁县| 陆良县| 尼木县| 屏山县| 和硕县| 海原县| 宽甸| 民乐县| 德安县| 都江堰市| 化州市| 阜康市| 辽宁省| 潮州市| 收藏| 城固县| 长泰县| 双鸭山市| 谢通门县| 乐东| 荆州市| 襄汾县| 商都县| 三亚市| 商河县| 丰镇市| 夏邑县| 峨山| 昭通市| 封丘县| 那曲县| 景洪市| 广宗县| 札达县| 康定县| 郯城县|