PySpark on Linux系统配置 Hadoop3.1.3+Spark3.4.4（PySpark3）-深圳市維司達科技有限公司

https://www.apache.org/dyn/closer.lua/spark/spark-3.4.4/spark-3.4.4-bin-hadoop3.tgz

https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

1.安装vmworkstation 15.5

2. 安装linux-centos7

3.配置网络，ip静态化

ip静态化：

vim /etc/sysconfig/network-scripts/ifcfg-ens33

配置网络ip

对本机ip进行修改.

这里一定要改，不然moba连接不上

配置开机激活网络

vim /etc/sysconfig/network

重启网络服务即可生效

systemctl restart network service

4.配置主机，修改主机名

更改主机名

配置主机 ip及名字

5.配置主机与ip映射关系

这里暂时做伪分布式，就不配了

6.关闭虚拟机防火墙

systemctl status firewalld.service

状态已关闭，不必继续关了

7.安装jdk配置环境变量

export JAVA_HOME=/root/meituan/jdk1.8.0_121

export PATH=$JAVA_HOME/bin:$PATH

查看环境变量配置

vim /etc/profile

8.配置免秘钥登录

ssh-keygen -t rsa

把当前密钥追加到

cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys
设置权限

chmod 600 ~/.ssh/authorized_keys

600 6=4+2 自己可读可写，不可执行

此时重启一下电脑

9.上传hadoop3.1.3

tar -zxvf hadoop-3.1.3.tar.gz

mv hadoop-3.1.3 hadoop

10. 配置Hadoop环境变量

配置环境变量

vi /etc/profile

export HADOOP_HOME=/root/soft/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HDFS_NAMENODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export HDFS_DATANODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

配置完，刷新一下

source /etc/profile

检查一下环境变量是否配置成功

hadoop version

11.需要修改Hadoop的核心配置文件包括：共7个

配置文件所在位置/root/soft/hadoop/etc/hadoop

vimhadoop-env.sh

export JAVA_HOME=/root/meituan/jdk1.8.0_121

yarn-env.sh

export JAVA_HOME=/root/meituan/jdk1.8.0_121

3.core-site.xml、

添加内容如下：

<name>fs.defaultFS</name>

<value>hdfs://tonymin:9820</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/root/soft/hadoop/tmp</value>

</property>

</configuration>

4.hdfs-site.xml、

<name>dfs.replication</name>

</property>

<value>/root/soft/hadoop/tmp/hdfs/name</value>

</property>

<value>/root/soft/hadoop/tmp/hdfs/data</value>

</property>

<name>dfs.namenode.http-address</name>

<value>tonymin:9870</value>

</property>

<name>dfs.namenode.secondary.http-address</name>

<value>tonymin:9868</value>

</property>

</configuration>

装Hive

RabbitMQ 灰度发布方案详解：从零到一掌握灰度策略（附 Spring Boot 实战代码）

视频看了几百小时还迷糊？关注我，几分钟让你秒懂！在微服务架构中，消息队列（如 RabbitMQ）作为系统解耦、异步通信的核心组件，其稳定性直接关系到整个业务链路的可靠性。而随着业务迭代加快&#x…

李华

中国电子科技集团公司第三十二研究所安卓开发工程师职位深度解析与技术能力构建

中国电子科技集团公司第三十二研究所安卓开发工程师职位信息岗位职责： 1.参与项目需求分析，进行APP相关的设计、开发、调试等； 2.按需求完成界面、逻辑功能、网络通信等设计； 3.配合其他开发人员、测试人员，完成产品设计和发布； 4.编写相关开发文档、技术资料等。任…

李华

例说FPGA：可直接用于工程项目的第一手经验【1.1】

1.4 FPGA应用领域目前FPGA虽然还受制于较高的开发门槛以及器件本身昂贵的价格，并从应用的普及率上来看和ARM、DSP还是有一定的差距，但是在非常多的应用场合，工程师们还是要别无选择地使用它。FPGA所固有的灵活性和并行性是其他芯片所不具备…

李华

DevOps是什么？

DevOps是什么？ 本文主要介绍 DevOps 核心概念、诞生背景、关键实践、工具链以及它对现代软件交付的意义等多个维度。一、核心定义与核心理念 DevOps 是 Development（开发） 和 Operations（运维） 两个词的组合。但它…

李华

YOLO26最新创新改进系列：Involution新卷积网络算子融合于网络，从经典的图像滤波方法中汲取灵感，更大的空间范围中总结上下文信息，有效涨点！ 购买相关资料后畅享一对一答疑！ 畅享超多免费持续更新且可大幅…

李华

PySpark on Linux系统配置 Hadoop3.1.3+Spark3.4.4（PySpark3）

1.安装vmworkstation 15.5

2. 安装linux-centos7

3.配置网络，ip静态化

ip静态化：

配置网络ip

4.配置主机，修改主机名

5.配置主机与ip映射关系

6.关闭虚拟机防火墙

7.安装jdk配置环境变量

8.配置免秘钥登录

9.上传hadoop3.1.3

10. 配置Hadoop环境变量

11.需要修改Hadoop的核心配置文件包括：共7个

装Hive

RabbitMQ 灰度发布方案详解：从零到一掌握灰度策略（附 Spring Boot 实战代码）

C++二分细节敲定规则

中国电子科技集团公司第三十二研究所安卓开发工程师职位深度解析与技术能力构建

例说FPGA：可直接用于工程项目的第一手经验【1.1】

DevOps是什么？

YOLO26最新创新改进系列：Involution新卷积网络算子融合于YOLO网络，从经典的图像滤波方法中汲取灵感，更大的空间范围中总结上下文信息，有效涨点！