news 2026/4/27 15:38:18

PySpark on Linux系统配置 Hadoop3.1.3+Spark3.4.4(PySpark3)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PySpark on Linux系统配置 Hadoop3.1.3+Spark3.4.4(PySpark3)

https://www.apache.org/dyn/closer.lua/spark/spark-3.4.4/spark-3.4.4-bin-hadoop3.tgz

https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

1.安装vmworkstation 15.5

2. 安装linux-centos7

3.配置网络,ip静态化

ip静态化:

vim /etc/sysconfig/network-scripts/ifcfg-ens33

配置网络ip

对本机ip进行修改.

这里一定要改,不然moba连接不上

配置开机激活网络

vim /etc/sysconfig/network

重启网络服务即可生效

systemctl restart network service

4.配置主机,修改主机名

更改主机名

配置主机 ip及名字

5.配置主机与ip映射关系

这里暂时做伪分布式,就不配了

6.关闭虚拟机防火墙

systemctl status firewalld.service

状态已关闭,不必继续关了

7.安装jdk配置环境变量

export JAVA_HOME=/root/meituan/jdk1.8.0_121

export PATH=$JAVA_HOME/bin:$PATH

查看环境变量配置

vim /etc/profile

8.配置免秘钥登录

ssh-keygen -t rsa

把当前密钥追加到

cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys
设置权限

chmod 600 ~/.ssh/authorized_keys

600 6=4+2 自己可读可写,不可执行

此时重启一下电脑

9.上传hadoop3.1.3

tar -zxvf hadoop-3.1.3.tar.gz

mv hadoop-3.1.3 hadoop

10. 配置Hadoop环境变量

  1. 配置环境变量

vi /etc/profile

export HADOOP_HOME=/root/soft/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HDFS_NAMENODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export HDFS_DATANODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

配置完,刷新一下

source /etc/profile

检查一下环境变量是否配置成功

hadoop version

11.需要修改Hadoop的核心配置文件包括:共7个

配置文件所在位置/root/soft/hadoop/etc/hadoop

vimhadoop-env.sh

export JAVA_HOME=/root/meituan/jdk1.8.0_121

yarn-env.sh

export JAVA_HOME=/root/meituan/jdk1.8.0_121

3.core-site.xml、

添加内容如下:

<configuration>

<!-- 设置namenode内部通信端口 hdfs://主机名:端口号 -->

<property>

<name>fs.defaultFS</name>

<value>hdfs://tonymin:9820</value>

</property>

<!-- 设置hadoop数据存储的临时文件夹 -->

<property>

<name>hadoop.tmp.dir</name>

<value>/root/soft/hadoop/tmp</value>

</property>

</configuration>

4.hdfs-site.xml、

<configuration>

<!--设置hdfs的副本数-->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<!--设置namenode文件存储路径-->

<property>

<name>dfs.name.dir</name>

<value>/root/soft/hadoop/tmp/hdfs/name</value>

</property>

<!--设置datanode文件存储路径-->

<property>

<name>dfs.data.dir</name>

<value>/root/soft/hadoop/tmp/hdfs/data</value>

</property>

<!-- namenode的web端访问地址:主机名:端⼝号 -->

<property>

<name>dfs.namenode.http-address</name>

<value>tonymin:9870</value>

</property>

<!-- secondarynamenode的web端访问地址:主机名:端⼝号-->

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>tonymin:9868</value>

</property>

</configuration>

装Hive

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 4:25:19

C++二分细节敲定规则

闭区间 循环条件&#xff1a;left<right 操作边界时&#xff0c;leftmid1,rightmid-1 返回值&#xff1a;当left>right时终止&#xff0c;返回什么根据求最大值或最小值而定&#xff0c;若求最大值&#xff0c;返回right&#xff0c;因为右界始终是可取值&#xff1b;反之…

作者头像 李华
网站建设 2026/4/25 11:05:48

中国电子科技集团公司第三十二研究所安卓开发工程师职位深度解析与技术能力构建

中国电子科技集团公司第三十二研究所 安卓开发工程师 职位信息 岗位职责: 1.参与项目需求分析,进行APP相关的设计、开发、调试等; 2.按需求完成界面、逻辑功能、网络通信等设计; 3.配合其他开发人员、测试人员,完成产品设计和发布; 4.编写相关开发文档、技术资料等。 任…

作者头像 李华
网站建设 2026/4/23 10:47:42

例说FPGA:可直接用于工程项目的第一手经验【1.1】

1.4 FPGA应用领域 目前FPGA虽然还受制于较高的开发门槛以及器件本身昂贵的价格&#xff0c;并从应用的普及率上来看和ARM、DSP还是有一定的差距&#xff0c;但是在非常多的应用场合&#xff0c;工程师们还是要别无选择地使用它。FPGA所固有的灵活性和并行性是其他芯片所不具备…

作者头像 李华
网站建设 2026/4/23 10:48:47

DevOps是什么?

DevOps是什么&#xff1f; 本文主要介绍 DevOps 核心概念、诞生背景、关键实践、工具链以及它对现代软件交付的意义等多个维度。 一、 核心定义与核心理念 DevOps 是 Development&#xff08;开发&#xff09; 和 Operations&#xff08;运维&#xff09; 两个词的组合。但它…

作者头像 李华
网站建设 2026/4/23 10:49:08

YOLO26最新创新改进系列:Involution新卷积网络算子融合于YOLO网络,从经典的图像滤波方法中汲取灵感,更大的空间范围中总结上下文信息,有效涨点!

YOLO26最新创新改进系列&#xff1a;Involution新卷积网络算子融合于网络&#xff0c;从经典的图像滤波方法中汲取灵感&#xff0c;更大的空间范围中总结上下文信息&#xff0c;有效涨点&#xff01; 购买相关资料后畅享一对一答疑&#xff01; 畅享超多免费持续更新且可大幅…

作者头像 李华