
hadoop是使用Java语言开发的并且Hadoop运行需要有Java环境的支持,因此在安装hadoop之前需要安装Java开发环境即JDK(Java Development Kit)。安装前首先向大家介绍以一下本文会用到的几个词:
JAVA_HOME:
一是为了方便引用,比如,JDK安装在/usr/lib/jvm/java-7-openjdk-i386目录里,则设置JAVA_HOME为该目录路径, 那么以后要使用这个路径的时候, 只需输入$JAVA_HOME即可, 避免每次引用都输入很长的路径串;
二则是归一原则, 当JDK路径改变的时候, 仅需更改JAVA_HOME的变量值即可, 否则,就要更改任何用绝对路径引用JDK目录的文档, 要是万一没有改全, 某个程序找不到JDK, 后果是可想而知的----系统崩溃!
三则是第三方软件会引用约定好的 JAVA_HOME 变量, 不然, 你不能正常使用该软件。
path 变量
path 变量使得我们能够在系统中的任何地方运行java等应用程序,比如 javac、java、javah 等等,这就要找到我们安装JDK 的目录,
假设我们的JDK安装在/usr/lib/jvm/java-7-openjdk-i386 目录下,那么在 /usr/lib/jvm/java-7-openjdk-i386/bin目录下就是我们常用的 java 应用程序,我们就需要把 这个目录加到 path 环境变量里面。
classpath 变量
classpath 环境变量,是当我们在开发java程序时需要引用别人写好的类时,要让 java 解释器知道到哪里去找这个类。通常,sun 为我们提供了一些额外的丰富的类包,一个是 dt.jar,一个是 tools.jar,这两个 jar 包都位于 /usr/lib/jvm/java-7-openjdk-i386\lib 目录下,所以通常我们都会把这两个 jar 包加到我们的 classpath 环境变量中。
JRE(Java Runtime Enviroment) 是 Java 的运行环境。面向 Java 程序的使用者,而不是开发者。如果你仅下载并安装了JRE,那么你的系统只能运行 Java 程序。JRE 是运行Java 程序所必须环境的集合,包含JVM标准实现及 Java核心类库。它包括 Java 虚拟机、Java 平台核心类和支持文件。它不包含开发工具(编译器、调试器等)。
JDK(Java Development Kit) 又称 J2SDK(Java2 Software Development Kit),是 Java 开发工具包,它提供了 Java 的开发环境(提供了编译器javac 等工具,用于将 java 文件编译为 class 文件)和运行环境(提 供了 JVM 和 Runtime 辅助包,用于解析 class 文件使其得到运行)。如果你下载并安装了 JDK,那么你不仅可以开发 Java 程序,也同时拥有了运行 Java 程序的平台。JDK 是整个 Java 的核心,包括了Java运行环境(JRE),一堆 Java 工具 tools.jar 和 Java 标准类库 (rt.jar)。
1、JDK安装方式及版本介绍
JDK在Ubuntu下的常用安装方式有两种:一种是使用apt-get等类似软件包管理工具在线安装,另一种方式为离线安装:将编译好的软件代码先下载然后安装。JDK的版本有许多,常用的是jdk1.7、jdk1.8,为了简化安装过程我们本次采用apt-get在线方式安装jdk1.7版本。
2、安装
首先启动ubuntu系统的终端,然后在终端中输入java -version来查看系统是否已安装jdk。结果如下图所示,未安装jdk。
在Linux中既可以使用apt进行软件包管理,也可以使用apt-get下载安装软件包。
为了获得最新软件包版本,我们使用apt-get安装jdk之前需先执行apt-get update来更新软件源信息。
执行apt-get 命令需要较高的权限,因此命令前需加sudo命令
sudo apt-get update
经过一段时间的更新与下载之后,软件源信息更新完成。
下面开始安装JDK,安装jdk的命令为:sudo apt-get install default-jdk。
软件下载、安装需要一定的空间,安装程序会提示是否继续执行,输入Y然后按回车键即可。
软件下载及安装需要一定时间,耐心等待即可无需其他操作。执行到下图出现done表示已经完成安装。
此时可以通过执行java -version命令查看JDK安装版本。
3、系统环境变量配置
有些软件运行需要用到系统变量JAVA_HOME CLASS_PATH因此我们还需要讲安装好的JDK进行配置。首先可以通过命令sudo find / -name javac来查找jdk的安装位置。如下图所示jdk的安装位置为:/usr/lib/jvm/java-7-openjdk-i386
我们可以通过ls命令查看jdk下面都有哪些文件,如下图所示jdk下面有bin、jre、lib等文件目录,其中bin目录下有java常用开发编译工具如javac等,而jre/bin下有java程序的运行环境如java程序等。lib目录在文章开始的时候也提到了,里面有java开发常用的类库。
我们执行cd命令可以直接回到用户主目录下
接下来我们配置一下环境变量,在用户主目录下执行 vim ./bashrc,在该文件中输入下图信息并保存。
刷新一下系统配置文件,使用命令source ./bashrc
我们可以通过命令:echo 变量名 方式查看配置的环境变量是否成功。
如上图所示,显示的信息与我们实际配置是一致的,jdk安装完成。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13