手动安装最新版本DataX方法

准备环境

ubuntu-24.04
JDK 1.8
Python 3.10
Apache Maven 3.x (Compile DataX)
  1. 根目录新建data文件夹
cd /
sudo mkdir data
cd data
  1. 下载DataX 首先,前往DataX的官方下载页面 下载最新版本。 可以使用wget命令直接下载:
sudo wget https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz
  1. 解压下载的文件
    将下载的压缩包解压:
sudo tar -xzvf datax.tar.gz
  1. 配置环境变量
    DataX通常需要配置环境变量供系统识别和使用。可以编辑/etc/profile或者你的用户配置文件~/.bashrc~/.bash_profile以增加环境变量配置:
sudo nano /etc/profile  

# 或者

sudo nano ~/.bashrc

在文件末尾添加以下内容:

export DATAX_HOME=/data/datax  # 根据实际路径调整
export PATH=$DATAX_HOME:$PATH

保存并关闭文件,然后让配置文件生效:

source /etc/profile  
# 或者
source ~/.bashrc
  1. 运行DataX
    你可以通过执行DataX目录中的脚本来启动DataX任务,可以运行DataX的启动脚本,确认DataX运行无误:
python /data/datax/bin/datax.py /data/datax/job/job.json

如果一切正常,以上命令将会执行一个默认的DataX任务,并输出相应的日志信息。

2024-11-17 13:42:54.889 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2024-11-17 21:42:44
任务结束时刻                    : 2024-11-17 21:42:54
任务总计耗时                    :                 10s
任务平均流量                    :          253.91KB/s
记录写入速度                    :          10000rec/s
读出记录总数                    :              100000
读写失败总数                    :                   0

请确保你对DataX配置文件和任务配置文件做了相应的修改以适应你的业务需要,自定义的任务可以通过编辑相应的JSON文件来配置数据源、目的地和其他参数。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。