首页 > 数据中心 > 如何在7天内跨数据中心迁移1PB文件
2020
06-28

如何在7天内跨数据中心迁移1PB文件

千淘万漉博客阿里云大使推广链接


你知道吗?

通信科技发展到今天,当数据量达到TB级,网络传输的效率其实还不如快递。百兆光纤宽带看似很快,但在遇到真正的“大数据”时,高速公路也会秒变停车场。

我们来算一笔账:

如图片无法显示,请刷新页面

从时间成本来看,离线数据的物理迁移看似原始实则非常高效。

就像钞票比钱包值钱,数据比存储设备更值钱,设备坏了可以再买,数据丢了那就是天要塌了。企业初期基本采用单数据中心运营,但业务规模上来以后,数据中心里的服务器和存储设备越来越多,数据量也大了,这时候就要考虑建设灾备中心,构建主备协同的双中心架构。在不影响业务的前提下,如何将生产数据中心的PB级规模数据备份到灾备数据中心呢?

按照上面的计算,完成1 PB数据的全部备份耗时近3年,这个方案没法接受。

C:\Users\carol\AppData\Roaming\DingTalk\676274749_v2\ImageFiles\68\lALPBE1Xb-SeMwbNAvTNB74_1982_756.png

图1.常规数据同步方案

杉岩的数据离线迁移服务,就是用来解决这个问题的。

普通的离线迁移一般是用中转磁盘的方式实现,如果是将对象数据拷贝到磁盘的文件系统,会造成标签等元数据的信息丢失,虽然数据主体是备份了,但实际上降低了数据质量。杉岩中转集群的方案不存在这个缺点,利用服务器搭建高密度中转集群,同步主数据和元数据,整个方案实施过程只有3步,7天即可完成。

1、部署中转集群

根据数据量配置服务器,搭载杉岩MOS海量对象存储软件以构建中转集群。服务器的网络接口规格根据数据量以及客户对迁移时间的要求,灵活选择千兆或万兆网卡。若迁移1 PB数据,客户仅需配置1台中转服务器,选配万兆网卡,带宽可达4 GB/s。

2、数据从生产数据中心同步到中转集群

在可视化管理界面上配置同步策略,将数据从生产数据中心同步到中转集群,这一步只要3天就可以完成。数据同步完成之后,将中转服务器打包快递至灾备数据中心。视路程远近,这一步可以在1到3天内完成。

3、数据从中转集群同步到灾备数据中心

中转服务器送达后,按同样方式反向操作即可将数据同步到灾备中心,这一步也只要3天就可以完成。至此,数据迁移全部完成,耗时最短只要7天。

C:\Users\carol\AppData\Roaming\DingTalk\676274749_v2\ImageFiles\53\lALPBFDk7omLT9_NAxzNCBQ_2068_796.png

图2.数据离线迁移方案

采用杉岩离线迁移服务充分发挥分布式集群的带宽优势,迁移效率可提升100倍以上。数据迁移前后,完整保留文件的标签、多版本等数据属性,不存在信息丢失问题,数据质量有保证;而且中转服务器运送过程全程监控,保障设备和数据安全,总体成本可节约50%以上,这套方案已经在保险公司等金融行业客户应用过,效果十分显著。

计算机领域老前辈、Minix的作者Andrew S. Tanenbaum的这句话仍然没有过时:“永远不要低估一辆满载着磁带在高速公路上飞驰的旅行车的带宽。”


本文》有 0 条评论

留下一个回复