Hi mọi người, em mới tìm hiểu qua về bigdata. Em cũng tự dựng được 1 cluster Cloudera Hadoop để làm thử, nhằm mục đích hiểu rõ hơn. Em đã dựng 3 máy ảo 1 master và 2 slave theo doc của cloudera
http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/installation_installation.html
Em có câu hỏi mong mọi người giúp đỡ.
Hiện tại em muốn xem tính chất lưu trữ phân tán của hadoop thì em nên thực hiện example thế nào ?
Theo lý thuyết thì nếu upfile lên hdfs (Hadoop Distributed File System) thì sẽ chia thành các khối 64MB tên là blk-xxxxxx được lưu trên các host khác nhau trong cluster.
a) Up file sử dụng command của hadoop hay có cách nào khác nữa
b) Khi up thành công xong thì có thể tìm các block đó ở đâu ?
Anh @ltd biết anh nào có kinh nghiệm giới thiệu em với ạ.
Mong mọi người giúp đỡ người mới bắt đầu.