加入收藏 | 设为首页 | 会员中心 | 我要投稿 鹰潭站长网 (https://www.0701zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

基础数据平台迁移大数据平台的一些参考

发布时间:2022-11-02 16:00:22 所属栏目:大数据 来源:未知
导读: 背景
1.基础数据平台能力诉求:业务迅速增长,业务数据量不断膨胀,重要业务场景越来越多大数据存储架构,对于基础数据平台的服务和支持能力提出了更高的要求。
2.数据时效诉求:业务部门经

背景

1.基础数据平台能力诉求:业务迅速增长,业务数据量不断膨胀,重要业务场景越来越多大数据存储架构,对于基础数据平台的服务和支持能力提出了更高的要求。

2.数据时效诉求:业务部门经营分析、决策支持对数据时效要求越来越高。

3.计算、存储资源瓶颈: Oracle一体机存储和计算资源存在瓶颈(有效空间140TB,已使用空间132TB),始终保持约90%高水位运行

设备老旧:Oracle一体机硬件设备已使用7至10年,接近或超过8年强制替换周期,存在设备老旧故障率升高的风险

原厂支持服务结束:Oracle一体机上Oracle数据库版本为12.2.0.1,原厂支持服务于2022年3月结束,后续无新增补丁存在运行风险

软硬件维保策略风险: Oracle一体机原厂软硬件维保策略存在风险,2022年Oracle表示不再单独销售开发测试环境一体机软件维保

4.信创工作规划:基于国产软硬件基础设施,搭建自主可控大数据平台,实现数据的整合、加工、共享,对海量结构化和非结构化数据的存储、加工及访问。

目标:

1.实现Oracle一体机到大数据平台的技术栈切换

2.缓解我行在用的Oracle一体机运维风险。

3.高可用、弹性扩展的系统架构,支持在线扩容,在线升级

架构设计:

1.架构定位与原来保持一致,基于大数据平台重构

2.基础层改造:原ODS的表,配合改造从基础层O层取数进行加工;数仓的表,配合改造从整合层I取数加工;集市的表,通过集群间授权进行访问.

3.时效提高:结合大数据技术生态特性,针对时效要求高的重要业务场景贴源数据加工,如开业报表、零售有效户等,提高时效性

方案:

1.应用主题分类 结合大数据平台整合层数据主题组织方式,重新梳理集市的数据输出,面向主题对集市进行归纳、分类,整理成一级主题、二级主题,三级主题,整体划分为5个一级主题、12个二级主题、51个三级主题。

2.部分报表改从其他系统取数,不进行迁移

3.迁移映射 3层变为4层,基础层—加工层—应用层贴源层->贴源层、整合层、加工层、应用层

4.生命周期保留策略管理 对一些特殊场景的,有使用一年的历史数据,需保留。

5.技术栈切换设计 应用迁移,数据迁移,开发和测试,投产验证(主健比对、记录数比对、全字段比对),并行切换(并行三个月,分批下游切换)

性能:

1.存储容量: Oracle一体机集市目前有7T表空间,预留30%业务增长空间,(表与数据文件)压缩比为1:7;新FI集群按两副本存储,压缩比1:2;大数据单节点可存储36T, 所以需要7*1.3/7/2/(36/2)≈2台(BDS型号物理机)

2.计算资源:当前旧FI集群运行流程3.6万个,CPU共4.4万核,平均消耗的CPU=3.6/4.4 ≈ 1.2核/每个流程。共迁移664个流程,需要CPU=664*1.2 ≈ 797核,每台BDS服务器80核,因此需要大数据节点服务器为797/80≈10台。

3.保障措施 a.资源隔离 b.批次规划

经费:

1.主办应用系统实施费用

2.关联应用系统实施费用

3.软件费用

4.硬件费用

(编辑:鹰潭站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!