手动安装最新版本DataX方法
准备环境
ubuntu-24.04
JDK 1.8
Python 3.10
Apache Maven 3.x (Compile DataX)
- 根目录新建data文件夹
cd /
sudo mkdir data
cd data
- 下载DataX 首先,前往DataX的官方下载页面 下载最新版本。 可以使用
wget
命令直接下载:
sudo wget https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz
- 解压下载的文件
将下载的压缩包解压:
sudo tar -xzvf datax.tar.gz
- 配置环境变量:
DataX通常需要配置环境变量供系统识别和使用。可以编辑/etc/profile
或者你的用户配置文件~/.bashrc
或~/.bash_profile
以增加环境变量配置:
sudo nano /etc/profile
# 或者
sudo nano ~/.bashrc
在文件末尾添加以下内容:
export DATAX_HOME=/data/datax # 根据实际路径调整
export PATH=$DATAX_HOME:$PATH
保存并关闭文件,然后让配置文件生效:
source /etc/profile
# 或者
source ~/.bashrc
- 运行DataX:
你可以通过执行DataX目录中的脚本来启动DataX任务,可以运行DataX的启动脚本,确认DataX运行无误:
python /data/datax/bin/datax.py /data/datax/job/job.json
如果一切正常,以上命令将会执行一个默认的DataX任务,并输出相应的日志信息。
2024-11-17 13:42:54.889 [job-0] INFO JobContainer -
任务启动时刻 : 2024-11-17 21:42:44
任务结束时刻 : 2024-11-17 21:42:54
任务总计耗时 : 10s
任务平均流量 : 253.91KB/s
记录写入速度 : 10000rec/s
读出记录总数 : 100000
读写失败总数 : 0
请确保你对DataX配置文件和任务配置文件做了相应的修改以适应你的业务需要,自定义的任务可以通过编辑相应的JSON文件来配置数据源、目的地和其他参数。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。