当前位置: 首页 > 产品大全 > CentOS系统离线环境下安装Cloudera Manager 5与CDH5(5.1.3)详细指南

CentOS系统离线环境下安装Cloudera Manager 5与CDH5(5.1.3)详细指南

CentOS系统离线环境下安装Cloudera Manager 5与CDH5(5.1.3)详细指南

在企业生产环境中,由于安全要求或网络限制,常需在离线环境下部署大数据平台。Cloudera Manager(CM)与CDH(Cloudera's Distribution Including Apache Hadoop)作为业界广泛使用的大数据平台解决方案,其离线安装需要系统化的准备与步骤。本文将详细阐述在CentOS系统中离线安装Cloudera Manager 5及CDH 5.1.3的全过程。

一、 安装前环境准备

  1. 系统要求
  • 操作系统:CentOS 6.x 或 7.x(64位)。CDH 5.1.3对CentOS 6.x系列支持更佳,建议使用CentOS 6.8或6.9。
  • 所有节点需配置静态IP,并确保主机名解析正确(可通过/etc/hosts文件配置)。
  • 关闭所有节点的防火墙(或配置相应端口规则)和SELinux。
  • 确保所有节点间SSH免密登录已配置。
  • 确保系统时间同步(NTP)。
  1. 软件包准备(关键离线资源)
  • Cloudera Manager 5 安装包cloudera-manager-el6-cm5.1.3<em>x86</em>64.tar.gz(对应CentOS 6,若为CentOS 7则寻找el7版本)。
  • CDH 5.1.3 Parcel文件:这是核心的软件分发包。需要准备三个文件:
  • CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel(主软件包)
  • CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.sha1(校验文件,需重命名为.sha
  • manifest.json(清单文件)
  • JDK 1.7:Oracle JDK 1.7u67的Linux x64 RPM包(jdk-7u67-linux-x64.rpm)。
  • MySQL JDBC驱动mysql-connector-java-5.1.xx-bin.jar(用于CM元数据库)。
  • 依赖RPM包:在有网环境中,通过yum installrepotrack工具下载所有必需的依赖RPM包(如MySQL Server/Client, Python等),并创建本地YUM仓库。

二、 主要安装步骤

  1. 基础环境配置
  • 在所有节点上安装准备好的基础依赖RPM包(通过创建的本地YUM仓库)。
  • 在所有节点上安装Oracle JDK 1.7。
  • 选择一台节点作为Cloudera Manager Server主机,安装并配置MySQL数据库作为CM的元数据库。
  1. 安装Cloudera Manager Server
  • 在Server节点上,解压CM安装包:tar -xzvf cloudera-manager-el6-cm5.1.3<em>x86</em>64.tar.gz -C /opt/
  • 运行初始化脚本:cd /opt/cm-5.1.3/share/cmf/schema/ && ./scm<em>prepare</em>database.sh mysql cm -hlocalhost -uroot -p密码 --scm-host localhost scm scm scm
  • 将MySQL JDBC驱动JAR文件复制到/usr/share/java/目录(并重命名为mysql-connector-java.jar)和/opt/cm-5.1.3/share/cmf/lib/目录。
  • 启动CM Server服务:service cloudera-scm-server start
  • 通过浏览器访问 http://<server-host>:7180,默认用户名/密码:admin/admin
  1. 配置Parcel本地分发仓库
  • 在CM Web界面,进入“管理”->“设置”->“Parcel”。
  • 将准备好的CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel、重命名后的.sha文件及manifest.json文件,放置在一个可通过HTTP访问的目录下(例如,使用Apache/Nginx搭建一个简单的静态文件服务器,或直接使用CM Server节点的/opt/cloudera/parcel-repo/目录)。
  • 在CM设置中,将“远程Parcel存储库URL”指向此本地HTTP地址(例如http://<server-host>/cdh-parcels/)。
  1. 通过Cloudera Manager安装CDH
  • 在CM Web界面,点击“群集”->“添加群集”,按照向导步骤操作。
  • 在“指定主机”环节,手动输入或通过搜索添加所有已安装好CM Agent的节点主机名。
  • 在“选择存储库”环节,选择“使用Parcel”,系统应能检测到本地仓库中的CDH 5.1.3 Parcel。
  • 下载、分配并激活Parcel。
  • 运行主机检查,并根据向导选择要安装的服务(如HDFS, YARN, ZooKeeper, Hive, HBase等),完成配置与启动。

三、 注意事项与故障排查

  • 版本一致性:确保CM版本、CDH Parcel版本、操作系统版本、JDK版本完全匹配,这是离线安装成功的关键。
  • 依赖完整性:离线环境下的RPM依赖必须完整,任何缺失都可能导致服务安装或启动失败。建议使用yum deplist命令仔细检查。
  • 磁盘与内存:确保所有节点有足够的磁盘空间存放Parcel包和日志,以及足够的内存运行服务。
  • 日志排查:安装过程中遇到问题,首要查看各节点的/var/log/cloudera-scm-agent/和Server节点的/var/log/cloudera-scm-server/目录下的日志文件。

通过以上系统化的步骤,即使在完全离线的CentOS环境中,也能成功搭建起一个由Cloudera Manager统一管理的CDH 5.1.3大数据平台,为后续的数据处理与分析任务奠定坚实基础。

如若转载,请注明出处:http://www.bj-lysc.com/product/75.html

更新时间:2026-02-24 16:02:25

产品大全

Top