多应用+插件架构,代码干净,二开方便,首家独创一键云编译技术,文档视频完善,免费商用码云13.8K 广告
# **DataPipeline部署要求** [toc] ## **一、部署环境要求** <table> <tr bgcolor="#CCCCCC"> <td colspan="2"><b>名称</b></td> <td><b>要求</b></td> <td><b>备注</b></td> </tr> <tr> <td colspan="2">服务器数量</td> <td>集群版3台或以上;单机版1台;</td> <td>推荐集群版配置,单机版无法测试性能;</td> </tr> <tr> <td rowspan="3">硬件配置</td> <td>cpu</td> <td>至少四核,推荐八核及以上;</td> <td>无</td> </tr> <tr> <td>内存</td> <td>至少16G,推荐32G及以上;</td> <td>无</td> </tr> <tr> <td>硬盘</td> <td>阿里云高性能云盘同等性能,容量200G及以上,建议使用SSD硬盘;</td> <td>1.所需容量取决于拟测试的同步任务数据量。建议至少准备拟同步任务总数据量*2大小的数据盘;<br /> 2.最好用空白硬盘单独挂在到服务器,单独为DataPipeline使用;<br /> 3.文件系统为XFS的需要开启ftype,命令如下:mkfs.xfs -n ftype=1 /path/to/your/device(磁盘设备);</td> </tr> <tr> <td colspan="2">操作系统</td> <td>CentOS 7.4 以上;<br /> RHEL 7.4以上;<br /> Ubuntu 16.04及以上;</td> <td>必须要有yum源或apt-get源;</td> </tr> <tr> <td colspan="2">网络/端口</td> <td>1.部署服务器与数据源及数据目的地的特定端口可达(例如mysql的3306、sqlserver的1433);
<br />2.Web服务器对用户访问终端IP开放80和5000端口;<br /> 3.如是集群版,需保证集群服务器之间所有网络端口可达;</td> <td>实际部署环境的可开放端口如有调整,请联系DataPipeline工程师修改产品配置文件,或根据实际端口调整网络安全策略;</td> </tr> </table> <br /><br /> ## **二、数据库配置要求** ### **1、数据源** &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;DataPipeline默认会全速进行同步,可能会造成源和目的地,尤其是目的地较大的压力。如果需要对源和目的地进行资源保护,请咨询DataPipeline技术人员修改部署脚本中的限速参数,使之符合业务环境的要求。 <br/>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;关于数据源和数据目的地的基本配置要求详见下文。 <table> <tr bgcolor="#CCCCCC"> <td><b>数据源类型</b></td> <td><b>版本要求</b></td> <td colspan="2"><b>用户权限要求</b></td> <td colspan="2"><b>其他要求</b></td> </tr> <tr bgcolor="#EDEDED"> <td>MySQL(实时)</td> <td>5.5 、 5.6 、 5.7 、8.0 版本的非只读数据库(当前只支持INNODB引擎,集群架构只支持MHA)</td> <td colspan="2">相关视图和表的 select 权限,<br />replication slave,<br />replication client</td> <td colspan="2">1.BINLOG修改为ROW模式:<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;MYSQL BINLOG MODE = 'ROW'<br />&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;BINLOG_ROW_IMAGE = 'FULL'(此参数在mysql5.6及以上版本需要设置)
<br />2.BINlOG保留时间建议>=72小时
;<br />3.不支持只读从库;<br /><a href="../mysql-binlog-config.md">查看 BINLOG配置手册</a></td></td> </tr> <tr> <td>MySQL(定时)</td> <td>5.5 、 5.6 、 5.7 、8.0 版本(只支持INNODB引擎)</td> <td colspan="2">相关视图和表的 select 权限</td> <td colspan="2">要求需要同步的表拥有增量识别字段,用于同步增量数据。选择的字段必须为可排序,例如数字或时间类型,推荐的字段类型一般为随数据更新而自增的字段,如:更新序列号 (例:SequenceID),更新时间戳 (例: UpdatedAt)</td> </tr> <tr bgcolor="#EDEDED"> <td>Oracle(实时)-Logminer</td> <td>LOGMINER模式下支持 ORACLE 11.2.0.4单实例非只读数据库、12C的 NON CDB单实例非只读数据库;<br /></td> <td colspan="2">select any transaction,<br />logmining,<br />execute on dbms_logmnr_d,<br />execute on dbms_logmnr,<br />execute on dbms_flashback, <br />create session,<br />resource,<br />select any dictionary,<br />flashck any table,<br />execute_catalog_role,<br />以及相关视图和表的select权限</td> <td colspan="2">1、提供Oracle Logminer;<br />2、12c以下版本不需要logmining权限;<br />3、日志补全至少需要开启primary key、all、unique级别的日志级别;<br />4、Archive LOG保留时间建议>=72小时;<br />5、不支持Oracle只读实例;<br /><a href="../oracle-log-miner-config.md">查看 LOGMINER配置手册</a></td> </tr> <tr> <td>Oracle(实时)-Agent</td> <td>AGENT模式下支持 ORACLE 12c NON CDB单实例非只读数据库、ORACLE 11g单实例非只读数据库, ADG模式下,只支 持基于归档的解析(时延较大);<br /></td> <td colspan="2">alter database add supplemental log data;<br />alter database add supplemental log data(all,primary key,unique) columns;<br />create role FZS_role,<br />grant connect to FZS_role,<br />grant lock any table to FZS_role,<br />grant select any table to FZS_role,<br />grant select any dictionary to FZS_role,<br />grant alter system to FZS_role,<br />grant execute on dbms_flashback to FZS_role,<br />grant FZS_role to FZS,<br />grant select on v_$locked_object to FZS_role,<br />grant select on dba_objects to FZS_role,<br />grant select on v_$database to FZS_role<br /></td> <td colspan="2">以上授权可在FZS配置页面上进行</td> </tr> <tr> <td>Oracle(定时)</td> <td>ORACLE 10G、11G、12C版本的 NON CDB数据库</td> <td colspan="2">相关视图和表的 select 权限</td> <td colspan="2">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;要求需要同步的表拥有增量识别字段,用于同步增量数据。<br />选择的字段必须为可排序,例如数字或时间类型,推荐的字段类型一般为随数据更新而自增的字段,<br />如:<br />更新序列号 (例:SequenceID),更新时间戳 (例: UpdatedAt)</td> <tr> <tr bgcolor="#EDEDED"> <td>SQLServer(实时)</td> <td>SQLSERVER 2008、2012、2014版本的单实例非只读数据库</td> <td colspan="2">select on table;<br />view change tracking on table;<br />view change tracking on schema</td> <td colspan="2">1、如果default schema为dbo,可以直接授权select和view change tracking权限:<br />grant select on schema::dbo to user;<br />grant view change tracking on schema::dbo to user;<br />2、如果主体模式不是dbo就需要按照表为单位进行view change tracking的授权,比如:<br />grant view change tracking on object::rpt.表名 to user;<br />3、SQLServer Change Tracking不支持只读数据库;<br /><a href="../sql-server-change-tracking-config.md">查看Change Tracking配置手册</a></td></td> </tr> <tr> <td>SQLServer(定时)</td> <td>SQLSERVER 2008、2012、2014版本</td> <td colspan="2">select on schema</td> <td colspan="2">要求需要同步的表拥有增量识别字段,用于同步增量数据。<br />选择的字段必须为可排序,例如数字或时间类型,推荐的字段类型一般为随数据更新而自增的字段,如:更新序列号 (例:SequenceID),更新时间戳 (例: UpdatedAt)</td> </tr> <tr bgcolor="#EDEDED"> <td>PostgreSQL(实时)</td> <td>WAL2JSON:POSTGRESQL 9.4、9.5、9.6版本的单实例非只读数据库;<br />DECODERBUFS:POSTGRESQL 9.6版本的单实例非只读数据库;</td> <td colspan="2">PostgreSQL replication角色、PostgreSQL login角色,需要同步的表的select/update权限;</td> <td colspan="2">PostgreSQL-decoderbufs、PostgreSQL-wal2json两种插件满足实时同步,无法支持PostgreSQL RDS</td> </tr> <tr> <td>PostgreSQL(定时)</td> <td>POSTGRESQL 9.4、9.5、9.6版本</td> <td colspan="2">相关视图和表的 select 权限</td> <td colspan="2">要求需要同步的表拥有增量识别字段,用于同步增量数据;选择的字段必须为可排序,例如数字或时间类型,推荐的字段类型一般为随数据更新而自增的字段,如:更新序列号 (例:SequenceID),更新时间戳 (例: UpdatedAt)</td> </tr> <tr bgcolor="#EDEDED"> <td>FTP</td> <td>无</td> <td colspan="2">登录、访问和写入权限</td> <td colspan="2">无</td> </tr> <tr> <td>AWS S3</td> <td>无</td> <td colspan="2">相关视图和表的 select 权限</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>API</td> <td>无</td> <td colspan="2">无</td> <td colspan="2">无</td> </tr> <tr> <td>Apache Kafka</td> <td> 0.10.x、0.11.x、1.x.y、2.0.x、2.1.x、2.2.x; 0.9.x 只 支持JSON和String格式</td> <td colspan="2">无</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>Apache Hive</td> <td> 1.x.y、2.x.y LDAP认证模式只适配1.2.y(支持的格式:PARQUET、CSV)</td> <td colspan="2">需要hive home 目录的读写权限</td> <td colspan="2">无</td> </tr> <tr> <td>阿里云OSS</td> <td>无</td> <td colspan="2">无</td> <td colspan="2">无</td> </tr> </table> ### **2、数据目的地** <table> <tr bgcolor="#CCCCCC"> <td><b>数据目的地类型</b></td> <td><b>版本要求</b></td> <td colspan="2"><b>用户权限要求</b></td> <td colspan="2"><b>其他要求</b></td> </tr> <tr bgcolor="#EDEDED"> <td>Oracle</td> <td>ORACLE 10G、11G、12C版本的NON CDB数据库;</td> <td colspan="2">create session,<br />resource,<br />select on v$session</td> <td colspan="2">授予SELECT ON V_$SESSION权限用于处理死锁导致的任务中断;</td> </tr> <tr> <td>MySQL</td> <td>MySQL 5.5 或5.6或5.7(只支持InnoDB引擎)</td> <td colspan="2">select/create object/insert/update/delete</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>SQLServer</td> <td>SQLServer 2008、2012、2014版本</td> <td colspan="2">insert/update/delete/alter/exec/create/references/select on schema/alter any connection</td> <td colspan="2">授予ALTER ANY CONNECTION权限用于处理死锁导致的任务中断;</td> </tr> <tr> <td>AWS RedShift</td> <td>无</td> <td colspan="2">无</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>Apache Kafka</td> <td> 0.8.x、0.9.x、0.10.x、0.11.x、1.x,y、2.0.x、 2.1.x、2.2.x</td> <td colspan="2">无</td> <td colspan="2">无</td> </tr> <tr> <td>FTP</td> <td>无</td> <td colspan="2">登录、访问和写入权限</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>Apache Hive</td> <td> 1.x.y、2.x.y(支持的格式:PARQUET、CSV、LZO、ORC、AVRO)</td> <td colspan="2">需要hive home 目录的读写权限;</td> <td colspan="2">不同版本兼容情况未知,需要注意不同版本兼容问题; </td> </tr> <tr> <td>GreenPlum</td> <td> 4.x.y、5.x.y、6.x.y</td> <td colspan="2">select/create object/insert/update/delete</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>Aliyun AnalyticDB for PostgreSQL</td> <td>HybridDB 4.3版本</td> <td colspan="2">select/create object/insert/update/delete</td> <td colspan="2">需要阿里云后台调整max_stack_depth>=4MB</td> </tr> <tr> <td>TIDB</td> <td> 2.x.y</td> <td colspan="2">select/create object/insert/update/delete</td> <td colspan="2">无</td> </tr> <tr bgcolor="#EDEDED"> <td>HBase</td> <td> 2.1.x</td> <td colspan="2">写入表的最大控制权限(包括读和写)</td> <td colspan="2">无</td> </tr> <tr> <td>HDFS</td> <td> 2.6.x、2.7.x</td> <td colspan="2">对应目录的读写权限</td> <td colspan="2">无</td> </tr> </table> **北京数见科技有限公司 | www.datapipeline.com** <br/> <br/> <br/>