美国 飞康 软件 公司 环境适应性容灾 解决方案 中 国 区 技术总监 颜军

38
美美美美美美美美 美美美美美美美美美美美 美美美美美美美 美美

description

美国 飞康 软件 公司 环境适应性容灾 解决方案 中 国 区 技术总监 颜军. 美国 飞康 公司 简介. 成立于 2000 ,主要成员来自 原 美国 Cheyenne Software ( 夏恩软件)的 专业团队 成功 创 立 ARCserve 为 基于 服务器备份软件的第一品牌 1996 年被 Computer Associates (CA) 以 12 亿美金 (US$1.2Billion) 收购 公司总部设在美国纽约州的 Melville 全球销售及支持体系,在十五个主要国家设有办事机构 全球超过 300 名员工 中国分部近七十人,分布北京及上海 - PowerPoint PPT Presentation

Transcript of 美国 飞康 软件 公司 环境适应性容灾 解决方案 中 国 区 技术总监 颜军

美国飞康软件公司环境适应性容灾解决方案

中国区技术总监 颜军

美国飞康公司简介

成立于 2000 ,主要成员来自原美国 Cheyenne Software ( 夏恩软件 ) 的专业团队

成功创立 ARCserve 为基于服务器备份软件的第一品牌 1996 年被 Computer Associates (CA) 以 12 亿美金 (US$1.2Billion) 收购

公司总部设在美国纽约州的 Melville 全球销售及支持体系,在十五个主要国家设有办事机构 全球超过 300 名员工 中国分部近七十人,分布北京及上海

基于网络存储的架构,为企业数据的高可用性提供最佳解决方案 已拥有全球近千家企业级用户 创新的数据保护技术获得业界的公认并被广泛采纳 美国 NASDAQ 上市公司,市值 超过 3 亿美金,股票代码为 : FALC

2005 年销售额增长 69%

全球策略联盟伙伴

业务连续性管理

一个危机应急的框架,涵盖

-- 风险管理

-- 供应链管理

--IT容灾和恢复-- 环境设施管理

-- 安全管理

重要的业务连续性指标

(1). 数据恢复点目标 RPO ( RECOVERY POINT OBJECTIVE ):体现为该流程在灾难 发生后,恢复运转时数据丢失的可容忍程度;如丢失 1 小时数据称 RPO=1 小时。

(2). 恢复时间目标 RTO ( RECOVERY TIME OBJECTIE ):体现为该流程在灾难发生后,需要恢复的紧迫性也即多久能够得到恢复的问题;如业务停止 1 小时称 RTO=1 小时

主机系统故障

存储设备故障

突然断电

计划内停机

人为误操作导致数据丢失

自然灾害

火灾

恐怖活动 。。。。

IT 系统潜在的系统风险评估

容灾系统

容灾的一种分级方式

数据级容灾--确保 RPO的有效性,确保数据的完整性

应用级容灾--确保 RPO和 RTO的有效性,确保交易的连续性

远程备份--通过 vaulting等方式实现磁带远程存放

容灾的几种模式

同步

异步--连续异步方式--Delta增量异步方式

Savings ($)

IAIA

V

A

I

L

A

B

I L

I T

Y99.999999.9999

99.99999.999

99.9999.99

99.999.9

99.599.5

99.099.0

98.098.0

95.095.0

%%UptimeUptime

450+ hours450+ hours

180+ hours180+ hours

87.6 hours87.6 hours

43.7 hours43.7 hours

8.75 hours8.75 hours

52 minutes52 minutes

5 minutes5 minutes

30 seconds30 seconds

每年宕机时间每年宕机时间

IT 系统高可用 HA 的级别

常规容灾的技术手段Offsite tape storage

难于管理 耗费人工 需要漫长的恢复手段 磁带恢复的可靠性?

Host-to-host replication

SD

Select Unload

HEWLETTPACKARD SureStore DLT70

SD

Select Unload

HEWLETTPACKARD SureStore DLT70

SD

Select Unload

HEWLETTPACKARD SureStore DLT70

SD

COMPAQPROLIANT 1500

SD

COMPAQPROLIANT 1500

SD

COMPAQPROLIANT 1500

多个管理点 OS 内需要专用软件 影响主机的处理能力 缺少数据库的特别支持体系 主机必须为同一系统

Disk array-to-disk array replication 无法跨设备复制,形成设备瓶颈 需要加接远程传输设备 缺少数据库的特别支持体系

SD

COMPAQPROLIANT 1500

SD

COMPAQPROLIANT 1500

SD

SPARCserver 2000Sun

SD

COMPAQPROLIANT 1500

SD

COMPAQPROLIANT 1500

SD

SPARCserver 2000Sun

IP WANApplicationservers

Site A Site B

Applicationservers

SD

COMPAQPROLIANT 1500

SD

COMPAQPROLIANT 1500

SD

COMPAQPROLIANT 1500

Vendor A Storage Same Storage,Vendor A

IP WAN

磁盘阵列 A

FC Switch FC Switch

Tape Library

OracleLinux

SQLWindows

SQLCluster Windows

Oracle RACBackup Server+Backup Software

LAN LAN

SAN Backup Stream

远程复制

P

Exchange

IP 远程连接

一个典型的用户现有环境和 DR 环境

磁盘阵列 B

问题

容灾中心设备选择

-- 容灾中心的设备选择能否开放?

-- 生产中心的原有主机系统和存储系统能否保留?

恢复指标

-- 数据库数据一致性如何保证?

-- 人为的误操作能够恢复吗?

-- 本地恢复的速度有多快?

建置本地系统的 HA 时,主机与存储之间没有依赖关系,但建置容灾( DR 时,是否也能如同 HA 般无相关性?还是被强置要求一定要连同主机、存储设备一起进行对称性建设? --- (异构设备间的容灾)

除了部署异地灾备系统以避免火灾,水灾,地震,停电等天灾外,能否保护长期潜在的病毒、黑客、人员误操作等带来的人祸呢?

--- (渐变式灾难的保护)

问题

一个典型的 Exchange 系统恢复时间

恢复步骤 Time

确认恢复磁带或存档 ? 分钟

安装 Windows 操作系统 60 分钟

安装 Service Pack 及安全性更新

50 分钟

执行 Exchange Disaster Recovery 模式安装

20 分钟

安装 Exchange Service Pack and Patch

20 分钟

还原 130GB 数据 ? 小时

运行观察 ?小时

一个典型的误操作恢复时间

恢复步骤 Time

从备份系统确认恢复磁带或存档磁带

? 分钟

数据库全恢复 120 分钟

找到丢失记录,进行回写 20 分钟

如果是当天生成的文件记录丢失,恢复时间

???无法恢复

能否满足我的环境和我的要求?

能否一劳永逸,建立全部灾难的防御系统?

能够通过本地系统就能解决大量的故障恢复?

问题

C: D:C: D:

Hostnot on SAN

(DASD)

飞康公司的 CDP+DR 解决方案

Key Benefits 任意存储之间 增量级别的复制(时间增量、数据增量) 重点在于最佳的 RTO (minutes) 连续复制,并且提供 256 个快照拷贝能力

DiskSafe

C: D:C: D:

C: D:C: D:

TM-1TM-1

TM-2TM-2

飞康公司的几种保护模式 In-band

很小的性能影响,释放主机和存储负荷 提供强大的服务功能 智能 cache 提速

Side-band 旁路型 不占用数据通路 使用低级别存储 保护生产系统,最小改动

PP PP SS

Host

IPStor

PrimaryStorage

SecondaryStorage

In-Band Side-Band

SANFabric

Replication

CacheCache

Replication

DiskSafe

飞康公司的复制模式--连续复制模式--Delta增量复制模式

--同步 mirror--异步 mirror

面向高速恢复的快照技术

IP Switch

LD1LD1

LD2LD2

LD1LD1*

数据影像

M-LD1M-LD1*

M-LD1M-LD1 M-LD1M-LD1*

M-LD1M-LD1*

M-LD1M-LD1*

10:00 11:00 12:00 12:15

Group1

09:30 10:00 10:30 11:00

AutomaticHourly

Snapshots

SnapshotStorage Area

Original Source Data Volume

9am

Initial Snapshot(contains no data)

10am

11am

12pm

147

10

258

11

369

12

NewData

Blocksadded

10:00-10:59

147

10

258

11

369

12

11:00-11:59

NewData

Blocksadded

147

10

258

11

369

12

StorageBlocks

Containdata

9:00-9:59

147

10

258

11

369

12

NewData

Blocksadded

26

7

910

1

12

2 6 7

9 10

1 12

Old data blocks are stored in the

Snapshot Storage Area

26

7

26

7 910

不同时间点的自动快照

如何恢复? 检查 11:00 快照保护的数据

直接选择时间点数据

LD1LD1

LD2LD2

EthernetSwitch

LD1LD1*

T-11T-11SnapshotTime-View Disk

M-LD1M-LD1

M-LD2M-LD2

M-LD1M-LD1*

M-LD1M-LD1*

M-LD1M-LD1*

M-LD1M-LD1*

M-LD1M-LD1*

10:00 11:00 12:00 12:15

Group1

M-LD1M-LD1

M-LD2M-LD2

M-LD1M-LD1

M-LD2M-LD2

M-LD1M-LD1

M-LD2M-LD2

M-LD1M-LD1

M-LD2M-LD2

10:00 12:00 14:00 16:00

T-11T-11*

T-11T-11*

更为精密的快照技术

MON

TUE

WED

典型用例:各分公司的应用服务器保护系统

M1-3M1-3

M1-2M1-2

M1-1M1-1

M1-3M1-3

M1-2M1-2

IP Switch

D1D1

D2D2

D1D1

M1-1M1-1

MD1MD1Continuous Mode AM10:30

AM11:00

AM11:30

DiskSafe

DiskSafe

DAS DiskSafeMirror Disk

Mirror DiskSnapshot

DDnn MDMDnn

MD1MD1

Mn-sMn-s

MD1MD1 Periodic Mode

M2-3M2-3

M2-2M2-2

M2-1M2-1

MD2MD2

AM09:00AM10:30

AM11:00

PM01:00

持续同步

两小时同步一次

D1D1

DiskSafe

分公司服务器

Internet/WAN

M1-3M1-3

M1-2M1-2

M1-1M1-1

MD1MD1 Periodic Mode

每天同步一次

网络流量控制

备份服务器

Hyper Trac

TM1TM1

TM1TM1

采用飞康方案,实现 Exchange 系统恢复

FalconStor CDP Time

检查快照 2 分鐘

远程启动 5 分鐘

登录系统,直接上线 5 分鐘

恢复运行后,反向同步本机硬盘,恢复。

飞康公司 DiskSafe 保护体系

避免服务器负荷

占用最小 CPU System Kernel Filter Driver–, 3-5% CPU

最小的内存占用保护 1TB 磁盘约使用 32MB 内存

适用于各种网络带宽可控制使用的网络流量

远程复制 over IP

IP NetworkFC-SAN@

Primary Site

FC-SAN@

DR Site

DB SnapshotAgent

Delta ReplicationDelta Replication

连续复制和增量复制模式任意的存储设备快照技术确保瞬间恢复能够适应现有环境

IPStor Appliance

IPStor Appliance

只对差异数据初始化

飞康采用的 MicroScan 技术,极少的传输量

Application Small-block Writes(2x512 byte sectors)

File-system Writes4K Block Size

MicroScan Transfers2x512 Bytes

Block 级,较多的传输量

Microscan, 最小的传输量

IPStor DR 解决方案概览

ApplicationHost

ApplicationHost

Local-CachePrimary

Primary

CiscoSANtap

Local-Cache

ApplicationHost

Primary

ApplicationHost

PrimarySplit-Mirror

e.g. BCV

Backup Server

VTL Storage

Application Host withDiskSafe or FileSafe

Primary Local-Cache

FC/iSCSI SAN

Service Provider

Application Host withDiskSafe or FileSafe

Primary

IP Network

Application HostLocal mirror

Local-Cache Primary

IPStor 企业级网络存储解决方案 存储整合

存储的集中管理 异构存储设备的整合 SAN & NAS 的统一

数据容灾及业务持续性 渐变式灾难后的快速数据恢复 灾难恢复

备份的整合与加速 VTL虚拟磁带库

成 功 案 例

Exchange 服务 OK

三台 Exchange 服务器,超过 1000 个信箱,130GB以上数据量

原有的 Exchange 的灾难恢复经验备份软件恢复时间无法保障

从原先的五小时缩短到 15 分钟操作系统五分钟启动不需要数据恢复,系统直接上线运行架构简单IT 人员可在短时间自行维护

英华达的分享“ 既然无法避免邮件服务器宕机的可能,我们希望至少在宕机发生后,可以在最短的时间内恢复回来,恢复正常运行。”

IDC A IDC BRouter Router

台湾中华电信 -- 存储整合及容灾

Oracle/Sybase/SQL/DB2Solaris/NT/AIX

澳洲教育网( Catholic Education Office )– 80 个应用主机到 SAN 的远程备份 / 容灾

飞康的容灾解决方案为您的环境而设计 任意的存储设备和传输协议 涵盖风险防御的所有方面 节省主机开销 无与伦比的存储服务能力,有限的资金获得无限的能力

不仅针对生产主机,同时可以为整个办公系统服务

轻松的单点图形管理,容灾不再是难事 瞬间恢复能力

谢谢,问题时间 ----