京公网安备 11010802034615号
经营许可证编号:京B2-20210330
hadoop是使用Java语言开发的并且Hadoop运行需要有Java环境的支持,因此在安装hadoop之前需要安装Java开发环境即JDK(Java Development Kit)。安装前首先向大家介绍以一下本文会用到的几个词:
JAVA_HOME:
一是为了方便引用,比如,JDK安装在/usr/lib/jvm/java-7-openjdk-i386目录里,则设置JAVA_HOME为该目录路径, 那么以后要使用这个路径的时候, 只需输入$JAVA_HOME即可, 避免每次引用都输入很长的路径串;
二则是归一原则, 当JDK路径改变的时候, 仅需更改JAVA_HOME的变量值即可, 否则,就要更改任何用绝对路径引用JDK目录的文档, 要是万一没有改全, 某个程序找不到JDK, 后果是可想而知的----系统崩溃!
三则是第三方软件会引用约定好的 JAVA_HOME 变量, 不然, 你不能正常使用该软件。
path 变量
path 变量使得我们能够在系统中的任何地方运行java等应用程序,比如 javac、java、javah 等等,这就要找到我们安装JDK 的目录,
假设我们的JDK安装在/usr/lib/jvm/java-7-openjdk-i386 目录下,那么在 /usr/lib/jvm/java-7-openjdk-i386/bin目录下就是我们常用的 java 应用程序,我们就需要把 这个目录加到 path 环境变量里面。
classpath 变量
classpath 环境变量,是当我们在开发java程序时需要引用别人写好的类时,要让 java 解释器知道到哪里去找这个类。通常,sun 为我们提供了一些额外的丰富的类包,一个是 dt.jar,一个是 tools.jar,这两个 jar 包都位于 /usr/lib/jvm/java-7-openjdk-i386\lib 目录下,所以通常我们都会把这两个 jar 包加到我们的 classpath 环境变量中。
JRE(Java Runtime Enviroment) 是 Java 的运行环境。面向 Java 程序的使用者,而不是开发者。如果你仅下载并安装了JRE,那么你的系统只能运行 Java 程序。JRE 是运行Java 程序所必须环境的集合,包含JVM标准实现及 Java核心类库。它包括 Java 虚拟机、Java 平台核心类和支持文件。它不包含开发工具(编译器、调试器等)。
JDK(Java Development Kit) 又称 J2SDK(Java2 Software Development Kit),是 Java 开发工具包,它提供了 Java 的开发环境(提供了编译器javac 等工具,用于将 java 文件编译为 class 文件)和运行环境(提 供了 JVM 和 Runtime 辅助包,用于解析 class 文件使其得到运行)。如果你下载并安装了 JDK,那么你不仅可以开发 Java 程序,也同时拥有了运行 Java 程序的平台。JDK 是整个 Java 的核心,包括了Java运行环境(JRE),一堆 Java 工具 tools.jar 和 Java 标准类库 (rt.jar)。
1、JDK安装方式及版本介绍
JDK在Ubuntu下的常用安装方式有两种:一种是使用apt-get等类似软件包管理工具在线安装,另一种方式为离线安装:将编译好的软件代码先下载然后安装。JDK的版本有许多,常用的是jdk1.7、jdk1.8,为了简化安装过程我们本次采用apt-get在线方式安装jdk1.7版本。
2、安装
首先启动ubuntu系统的终端,然后在终端中输入java -version来查看系统是否已安装jdk。结果如下图所示,未安装jdk。
在Linux中既可以使用apt进行软件包管理,也可以使用apt-get下载安装软件包。
为了获得最新软件包版本,我们使用apt-get安装jdk之前需先执行apt-get update来更新软件源信息。
执行apt-get 命令需要较高的权限,因此命令前需加sudo命令
sudo apt-get update
经过一段时间的更新与下载之后,软件源信息更新完成。
下面开始安装JDK,安装jdk的命令为:sudo apt-get install default-jdk。
软件下载、安装需要一定的空间,安装程序会提示是否继续执行,输入Y然后按回车键即可。
软件下载及安装需要一定时间,耐心等待即可无需其他操作。执行到下图出现done表示已经完成安装。
此时可以通过执行java -version命令查看JDK安装版本。
3、系统环境变量配置
有些软件运行需要用到系统变量JAVA_HOME CLASS_PATH因此我们还需要讲安装好的JDK进行配置。首先可以通过命令sudo find / -name javac来查找jdk的安装位置。如下图所示jdk的安装位置为:/usr/lib/jvm/java-7-openjdk-i386
我们可以通过ls命令查看jdk下面都有哪些文件,如下图所示jdk下面有bin、jre、lib等文件目录,其中bin目录下有java常用开发编译工具如javac等,而jre/bin下有java程序的运行环境如java程序等。lib目录在文章开始的时候也提到了,里面有java开发常用的类库。
我们执行cd命令可以直接回到用户主目录下
接下来我们配置一下环境变量,在用户主目录下执行 vim ./bashrc,在该文件中输入下图信息并保存。
刷新一下系统配置文件,使用命令source ./bashrc
我们可以通过命令:echo 变量名 方式查看配置的环境变量是否成功。
如上图所示,显示的信息与我们实际配置是一致的,jdk安装完成。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14