手动安装最新版本DataX方法

准备环境
ubuntu-24.04
JDK 1.8
Python 3.10
Apache Maven 3.x (Compile DataX)
- 根目录新建data文件夹
cd /
sudo mkdir data
cd data
- 下载DataX 首先,前往DataX的官方下载页面 下载最新版本。 可以使用
wget命令直接下载:
sudo wget https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz
- 解压下载的文件
将下载的压缩包解压:
sudo tar -xzvf datax.tar.gz
- 配置环境变量:
DataX通常需要配置环境变量供系统识别和使用。可以编辑/etc/profile或者你的用户配置文件~/.bashrc或~/.bash_profile以增加环境变量配置:
sudo nano /etc/profile
# 或者
sudo nano ~/.bashrc
在文件末尾添加以下内容:
export DATAX_HOME=/data/datax # 根据实际路径调整
export PATH=$DATAX_HOME:$PATH
保存并关闭文件,然后让配置文件生效:
source /etc/profile
# 或者
source ~/.bashrc
- 运行DataX:
你可以通过执行DataX目录中的脚本来启动DataX任务,可以运行DataX的启动脚本,确认DataX运行无误:
python /data/datax/bin/datax.py /data/datax/job/job.json
如果一切正常,以上命令将会执行一个默认的DataX任务,并输出相应的日志信息。
2024-11-17 13:42:54.889 [job-0] INFO JobContainer -
任务启动时刻 : 2024-11-17 21:42:44
任务结束时刻 : 2024-11-17 21:42:54
任务总计耗时 : 10s
任务平均流量 : 253.91KB/s
记录写入速度 : 10000rec/s
读出记录总数 : 100000
读写失败总数 : 0
请确保你对DataX配置文件和任务配置文件做了相应的修改以适应你的业务需要,自定义的任务可以通过编辑相应的JSON文件来配置数据源、目的地和其他参数。
声明:本站资源均整理自互联网,版权归原作者所有,仅供学习交流使用,请勿直接商用,若需商用请购买正版授权。因违规使用产生的版权及法律责任由使用者自负。部分资源可能包含水印或引流信息,请自行甄别。若链接失效可联系站长尝试补链。若侵犯您的权益,请邮件(将 # 替换为 @)至 feedback#tgoos.com,我们将及时处理删除。转载请保留原文链接,感谢支持原创。
