博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据的基本概念和Haoop环境搭建
阅读量:5262 次
发布时间:2019-06-14

本文共 1615 字,大约阅读时间需要 5 分钟。

一、大数据的基本概念:

        大数据简言之就是处理数据的技术

        大数据的特点:1.价值密度低、2.快速化、3.多样化、4.数据量大

         分布式:分布式主要是指:多个进程协同在一起完成一个任务,构成了一个整体。

二、分布式的图片:

 

三、Hadoop安装    

         1、解压到/soft下

               tar -xzvf hadoop-2.7.3.tar.gz -C /soft/
        2、建立符号链接 hadoop
               ln -s hadoop-2.7.3 hadoop
        3、修改环境变量 HADOOP_HOME
          注意:bin目录和sbin目录都需要放在PATH下
                 # hadoop环境变量
                  export HADOOP_HOME=/soft/hadoop
                 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

      4、生效环境变量

                source /etc/profile
     5、验证
                hadoop version

 四、Hadoop的伪分布式的搭建

   0、修改hosts文件 /etc/hosts

            添加    192.168.159.100  s100
 1、修改core-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://s100</value>
</property>
</configuration>

2、修改hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

3、修改mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
4、修改yarn-site.xml
<?xml version="1.0"?>
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>s100</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
5、修改hadoop-env.sh
将第25行改为
export JAVA_HOME=/soft/jdk
6、修改slaves文件
将localhost改成s100
7、格式化hdfs文件系统
hdfs namenode -format
8、启动hadoop进程
start-all.sh
9、关闭hadoop进程
stop-all.sh

转载于:https://www.cnblogs.com/yang-1yang/p/10092556.html

你可能感兴趣的文章
Leetcode Balanced Binary Tree
查看>>
Leetcode 92. Reverse Linked List II
查看>>
九.python面向对象(双下方法内置方法)
查看>>
go:channel(未完)
查看>>
[JS]递归对象或数组
查看>>
LeetCode(17) - Letter Combinations of a Phone Number
查看>>
Linux查找命令对比(find、locate、whereis、which、type、grep)
查看>>
路由器外接硬盘做nas可行吗?
查看>>
python:从迭代器,到生成器,再到协程的示例代码
查看>>
Java多线程系列——原子类的实现(CAS算法)
查看>>
在Ubuntu下配置Apache多域名服务器
查看>>
多线程《三》进程与线程的区别
查看>>
linux sed命令
查看>>
html标签的嵌套规则
查看>>
[Source] Machine Learning Gathering/Surveys
查看>>
HTML <select> 标签
查看>>
类加载机制
查看>>
tju 1782. The jackpot
查看>>
湖南多校对抗赛(2015.03.28) H SG Value
查看>>
hdu1255扫描线计算覆盖两次面积
查看>>