Related Posts Plugin for WordPress, Blogger...

2015年4月22日 星期三

巨量資料Cloudera單機初體驗

如果要體驗巨量資料分析工具,
Cloudera的單機快速啟動,
可以讓快速的體驗巨量資料資料處理功能



步驟簡單講只要三個動作
下載,開啟,執行

Step1.下載

由下載連結中,
把VM整個下載回來
http://www.cloudera.com/content/cloudera/en/downloads/quickstart_vms/cdh-5-3-x.html
右下角的那個藍色按扭 Download for VMware,
按了之後去看個電影、打個藍球、星海II打個二場,
3.1G的檔案cloudera-quickstart-vm-5.3.0-0-vmware.7z,
彈指間就下載完了



Step2.開啟
話說下載了半天後,
總算拿到了檔案,
解壓縮後,
馬上就用VMware把她開起來

打開了之後,
就可以看看CentOS的作業系統畫面



Step3.執行
想必到這個這個階段,
成功就在不遠的前方,
要如何開如使用Cloudera呢?
上面的FireFox點下去,
就看到了許多貼心的瀏覽器標籤
馬上左至右點項目通通都點一次,
看看大致上的功能,

結論是:不錯~~~有趣~~~

但是點了 Hue 這個看似權限頁面,
這個密密的帳號/密碼是什麼呢?
就是~~~cloudera/cloudera
廣告成份重的帳密

完成登入後就來試試第一個查詢吧,
這個查詢功能呢, 
就叫做 Impala 隱趴啦,
意思是秘密的宴會(PS:個人翻譯,請忽推廣)
進入重點,
接著點了 Query Editors 後,
出現了下拉項目,
馬上加入宴會,
點選 Impala 就出現了下面的視窗
再點選 Saved Queries 範本指令,

SELECT sample_07.description, sample_07.salary
FROM
  sample_07
WHERE
( sample_07.salary > 100000)
ORDER BY sample_07.salary DESC
LIMIT 1000

選取了第一項,
功能是計算業績最高的員工,
接著點選Execute執行,
下面就是成功執行查詢的結果

恭喜你,你成功了!!Yeah!!










沒有留言:

張貼留言

頁次