博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
高效工作之ETL数据抽取
阅读量:6293 次
发布时间:2019-06-22

本文共 1358 字,大约阅读时间需要 4 分钟。

  hot3.png

ETL定义

ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

ETL使用

在笔者的工作环境中,存在N多个测试环境,因为整套环境有50多套,每次版本都统一发布。然后笔者每次测试都需要建立对应的测试数据,业务复杂啊。所以笔者随机找了一个可以5分钟使用ETL工具。

scriptella使用介绍

实现目标

例子项目地址

  1. 引入maven依赖
1.1
com.javaforge.scriptella
scriptella-core
${scriptella.version}
com.javaforge.scriptella
scriptella-drivers
${scriptella.version}
com.javaforge.scriptella
scriptella-tools
${scriptella.version}
com.oracle
ojdbc6
11.2.0.1.0
  1. 编写etl.xml脚本(官网例子缺少driver属性)
SELECT * FROM Product WHERE category='software';
  1. 编写java类
EtlExecutor.newExecutor(new File("etl.xml")).execute(); //Execute etl.xml file

转载于:https://my.oschina.net/huotui/blog/1549930

你可能感兴趣的文章
《锋利的SQL(第2版)》——1.7 常用函数
查看>>
jquery中hover()的用法。简单粗暴
查看>>
线程管理(六)等待线程的终结
查看>>
spring boot集成mongodb最简单版
查看>>
DELL EqualLogic PS存储数据恢复全过程整理
查看>>
《Node.js入门经典》一2.3 安装模块
查看>>
《Java 开发从入门到精通》—— 2.5 技术解惑
查看>>
Linux 性能诊断 perf使用指南
查看>>
实操分享:看看小白我如何第一次搭建阿里云windows服务器(Tomcat+Mysql)
查看>>
Sphinx 配置文件说明
查看>>
数据结构实践——顺序表应用
查看>>
python2.7 之centos7 安装 pip, Scrapy
查看>>
机智云开源框架初始化顺序
查看>>
Spark修炼之道(进阶篇)——Spark入门到精通:第五节 Spark编程模型(二)
查看>>
一线架构师实践指南:云时代下双活零切换的七大关键点
查看>>
ART世界探险(19) - 优化编译器的编译流程
查看>>
玩转Edas应用部署
查看>>
music-音符与常用记号
查看>>
sql操作命令
查看>>
zip 数据压缩
查看>>