CDP参数配置说明


注意:
    CDP功能的使用,一般要求备端的可用空间是当前所需保护数据的3.5倍及以上,特殊需求如想要保留连续半年甚至更长时间的连续CDP数据,则需更高的空间要求。在配置CDP规则之前,需确认备端环境是否满足上述要求。
      另外,因不同的CDP规则配置直接影响空间占用情况,因此,在配置规则前,还需要对所需空间进行估算,确认所想要的配置需求多少倍空间。
      如果您不清楚CDP所需空间估算方法,请参考如下文章。
请点击 FAQ #400052:如何估算CDP数据磁盘占用空间


一、不开启baseline策略的情况下,主要参数说明如下:

1、连续CDP保留天数 n——可以恢复到n+1天内任意时间点(jnl文件);

2、按天合并保留天数 m——第n+2天,合并最早一天的jnl为delta文件,最多保留m个delta。大于n+1天,小于m+n天,只能恢复到一天的固定时间点,超出m+n天,不能恢复,只能再往前到baseline。




注意:
   1、 不开启baseline的情况下,CDP产生的数据会持续累积。随着时间的推移,数据将越来越多,并且,CDP数据不允许删除,一旦删除了其中某一个时间点的数据,都将会影响该时间点之后的数据恢复。如,删除8号的数据,则6号和7号以及更早的数据恢复不会受到影响,但8号往后的,9号、10号等日期,数据恢复功能将不可使用;
    2、如果CDP规则不开启baseline策略且备机空间有限的场景,企业的运维人员需要根据实际情况,定期停止规则,清除CDP数据,重新开启规则以自动重建baseline,来释放空间。否则,数据量会持续增长;
    3、建议保护非结构化数据,且初始数据量比较大的情况,不要开启baseline策略;
    4、如需要CDP保护的数据是数据库数据,则必须开启baseline策略。

    5、创建baseline 副本选项一般不勾选。但如果是不开启baseline策略的规则,该项是否开启可酌情考虑。勾选后,会在初始baseline创建完成后自动创建一个副本,要占用空间。该选项的作用是,做数据恢复时,节约数据合并时间(说明:因数据恢复时,会在灾备机先拷贝一次baseline,然后在这个基础上去做数据合并。而此时如果备机有程序创建的baseline副本,则可省去baseline拷贝的时间,直接进入数据合并计算阶段,从而可提升恢复效率)




二、开启baseline策略的情况下,主要参数说明如下:

1、连续CDP保留天数 n——可以恢复到n+1天内任意时间点(jnl文件);

2、按天合并保留天数 m——第n+2天,处理最早一天的jnl文件,合并连续的CDP操作为逻辑delta文件,最多保留m个delta。大于n+1天,小于m+n天,只能恢复到一天的固定时间点,超出m+n天,不能恢复,只能再往前到baseline。

3、指定生成Baseline(全备份)的策略  ——达到生成条件,会根据当前数据情况自动创建一个全备份。当产生baseline的日期满足距离最早一个baseline生成日期之间的差值大于等于m+n的值时,则最早的baseline数据,以及其临近baseline之间的增量数据文件(jnl、jidx、namelist)都将在这一次baseline生成后的2小时内被全部删除。当有首次baseline被删除时,备机可见baseline剩余个数则作为baseline删除的循环条件。如,首次baseline删除后,剩余baseline个数是3,那么,第二个baseline删除的时间,将是下次baseline产生后的第m+n+1天。备机的CDP目录下,将始终保持最多4个baseline,最少3个baseline的状态。



        配置baseline生成策略是为了加快恢复的速度、提高数据安全指数(由产生多份baseline数据来达到提高安全指数的目的,新生成的baseline总是比旧的可靠)。


注意:
    1、数据库备份,必须勾选baseline策略;
      2、做CDP保护,需保证备机有源端数据量的至少3.5倍以上空间,说明见文章开头的注意事项;
      3、CDP目录不能与数据保护目录有包含关系。如保护目录是/data/data_1,CDP目录不能是/data/data_1/cdp;
    4、创建baseline 副本选项一般不勾选。勾选的效果只是多一份baseline,占用着空间而实际又没有什么作用,因此一般不勾选;
      5、页面中的baseline保留个数配置项并不能唯一控制最终baseline保留个数,最终baseline生成的最大数量主要受CDP配置页面的其他参数共同影响,详细说明请见第六条说明。当配置的baseline保留个数小于其他制约因素决定的最大baseline保留数时,该数值相当于无效。而当配置的数值大于其他制约因素决定的最大保留个数时,则会生效。从使用角度考虑,通常情况下,保存baseline个数项,请如上图所示配置1即可;
    6、baseline最终保留个数(循环因子),并不由界面上的任何一个参数来直接控制,而是由baseline周期设置(t)、连续保留的CDP个数(n)、按天合并保留个数(m)共同决定,计算公式为:
                 baseline最多保留个数 = Math.ceiling[ (m+n+t) / t ]

说明:
        Math.ceiling是向上取整函数,只要整除结果中小数位是非0的数字,结果都向上取整(也即:结果+1为最终结果),例如:
Math.Ceiling(6.2)=7Math.Ceiling(6.0)=6    
特殊的,当配置的“保存baseline个数”项大于上述公式所计算出的数值时,则实际的保留个数应该为所配置的值。比如,配置的保存个数是5,而根据其他配置项计算出来的最大保留数是3时,则实际生效的是5,而不是3。    

7、自动删除baseline的条件是:
(1)当前系统已经存在baseline个数大于等于“baseline最多保留个数”(也即baseline删除的最小循环个条件);
(2)日期最新的一个baseline之后有至少m+n天的增量和连续数据。

注意:
    baseline删除的时机为每一个baseline周期,也即,即使当前日期满足删除条件,但如果当前日期不是界面配置的baseline产生时间的话,将会等到临近的一个baseline生成日期进行删除操作。



 8、baseline自动删除时,会删除的数据有:
(1)符合删除条件的baseline;
(2)其邻近baseline所对应的生成日期之前的所有增量数据文件(jnail)。  

9、每天增量文件较大的情况(几百个GB及以上),或者基本数据量比较大(几个TB)的情况,不适合使用CDP进行数据保护。特别是每日增量较大的情况,建议配置快照方式来保护数据。


10、正常运行的情况下,同一条规则,一天之中只会生成一个baseline。

eg.
    早晨9点提交CDP规则,配置每天12点生成baseline,则提交后会自动产生一个初始baseline,但当天12点不再生成。



三、配置baseline策略与不配置的区别
    baseline策略配置后,因会根据baseline周期,产生多份baseline文件,因此,在恢复数据时,就能够以恢复点最近的一份baseline数据为基准点做数据合并计算,反之,如果规则没有配置baseline,则是以首次baseline为基准做数据合并计算。
   由上可知,在未配置baseline策略的情况下,在恢复数据时,离首次配置规则的时间越久,合并计算量越大,需要花费的时间就会越多。而配置了baseline的情况,则能够减少合并计算量,耗时更少。
  综上所述,配置baseline策略的缺点是更多的空间消耗,但优点是更小的恢复时间开销。



四、数据库CDP保护推荐配置
1、以下推荐的配置可满足一周内的数据恢复(4天任意时间点恢复+3天固定时间点恢复),最多会有3个baseline生成,始终会有2个baseline被保留。



2、以下推荐的配置可满足最多一个月内的数据恢复(4天任意时间点恢复+12天固定时间点恢复+baseline恢复),最多会有3个baseline生成,始终会有2个baseline被保留。