Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant...

49
<Insert Picture Here> 정보 시스템 구축을 위한 필요충분 조건과 ILM 운영 전략 정보 시스템 구축을 위한 필요충분 조건과 ILM 운영 전략 나정옥 부장 / Data Warehouse / Technical Solution Consulting 부장 / Data Warehouse / Technical Solution Consulting Oracle Korea

Transcript of Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant...

Page 1: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

<Insert Picture Here>

정보 시스템 구축을 위한 필요충분 조건과 ILM 운영 전략정보 시스템 구축을 위한 필요충분 조건과 ILM 운영 전략

나 정 옥부장 / Data Warehouse / Technical Solution Consulting부장 / Data Warehouse / Technical Solution ConsultingOracle Korea

Page 2: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Agenda

T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary

Page 3: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Trends of the Information System by period

1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 / 2007

정보계구축 ---> Data Warehouse 구축 DW 리모델링 / 고도화 / 재구축

콜센터 구축

통합 CRM 구축

분석/운영 CRM 연계

현업에서의 활용성보다,DW구축하기위한 프로젝트에 집중

체계화된 데이터 구조를

데이터 축적 E D W 실영업지원 시스템 구축

eCRM 구축각 고객 접점 채널별

기반으로, 현업의 활용성을극대화한 DW체계를갖추기 위한 재구축

기개발된 고객접점채널을 통합하고, 이를 분석CRM과연동하는데 초점

데이터 축적 E D W 실시

고객 분석모델 개발

고객 세그멘테이션

각 고객 접점 채널별,최적화된 채널구축에집중

R

T

E분석위주 인프라

시간

고객 LTV모델 개발

Page 4: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Today’s Information SystemReal-Time Data Warehouse

[실시간 데이터처리 요건]

전략적 질의[기존DW업무]

-데이터 적재

-정형/비정형 질의

[실시간 데이터처리 요건]

-실시간+지속적 데이터 갱신

-대량사용자 + 동시작업

-OLAP + OLTP 업무

동시수행

정형 / 비정형 질의

배치작업

배치작업복잡한 정형질

복잡한비정형질의

OLTP성 전략적 질의

일괄변경

데이터 갱신

지속적인변경작업

-정형/비정형 질의

-주기적인 배치작업

정형질의

배치작업

배치작업대량 데이터적재

비정형질의

데이터 적재

배치작업의일괄변경

변경작업

OLAP+OLTP

O i l D S

대량 적재 작업

질의 수행 속도

배치작업

Row level Locking

Trickle Feeds (지속적에이터 반영)

OLAP+OLTP 서버 및 데이터의물리적 구성방안은?

Operational Data Store질의 수행 속도

주기적인 배치 작업 메타 데이터 관리 24 * 365 지원부하분산 관리

Page 5: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Single View with Enterprise-wide integrated Data

고객 영역 (기간업무,홈페이지…) 분석영역(EDW,DM…)

채널경로 우수고객 발신자번호 고객등급

고객구분 고객분석

고객 정보

관계정보분석 정보고객 채널경

로우수고

객발신자번

고객명주민/사업자번호

찾기찾기지움지움고객등

급계약건수개인고객구

직원여부 고객만

족도

고객사항

개인고객개인고객 법인고객법인고객 세대정보세대정보 가망고객가망고객고객의소리고객의소리e 서비스e-서비스팩스발송팩스발송메일발송메일발송

고객구분 고객분석

연락처 주소소재지

접촉포인트

고객정보관계정보

분석 정보관계

연락처

고객 통계정보

고객분석정보

채널경로 우수고객 발신자번호

고객명주민/사업자번호

찾기지움계약건수

개인고객구분

직원여부고객만족도

고객사항개인고객 법인고객 세대정보 가망고객 고객의소리 e-서비스 팩스발송 메일발송

연락처 주소소재지

접촉

포인트고객

계약 정보(기간업무) 캠페인관리 시스템

휴대폰자택전

화Fax

직장전화

Fax전자우

수신거부

자택주소

직장주소

항연락처 주소

계약사항 캠페인

접촉이력 지원/상담내역

계약 캠페인

포인트

반응정보휴대폰

자택전화 Fax

직장전화 Fax

전자우편 수신거부

자택주소

직장주소

계약사항 캠페인

계약/계좌 캠페인

고객 고객

Account

접촉이력 서비스

거래내역

반응정보

캠페인

실시간실시간 배치배치

접촉이력 지원/상담내역

접촉이력 서비스

통합된데이터 고객

접촉이력(콜센터,홈페이지… ) 영업지원 시스템

고객영업서비스

실시간실시간 + + 배치배치 실시간실시간 + + 배치배치

접촉이력 서비스

고객 + 계좌(상품) + 분석 + 접촉 + 상담 + 서비스접촉이력 상담내역 서비스요청

데이터데이터 통합통합 => => Data Integration ? Consolidation? Federation?Data Integration ? Consolidation? Federation?

Page 6: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Data Warehouse in the overall Business Analytics Market

Industry-Standard Best Practice:The Data Warehouse is the Foundation

of Business Intelligence and Performance Managementof Business Intelligence and Performance Management

Page 7: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Why a Data Warehouse?“Data Warehouse: Essential to BI ““Data Warehouse: Essential to BI “Data Warehouse: Essential to BI Data Warehouse: Essential to BI

Adapted from customer-BT presentation on their DW/BI strategy

Page 8: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle #1 for Data Warehousing

USD $1.8B

Source: IDC 2007 Data Warehouse Platform Tools 2006 Vendor Shares

Total Market = USD $4.4BSource: IDC, 2007 – Data Warehouse Platform Tools 2006 Vendor Shares

Page 9: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

The Magic Quadrant is copyrighted 10 October 2007 by Gartner, Inc. and is reused with permission. The Magic Quadrant is a graphical representation of aMagic Quadrant is a graphical representation of a marketplace at and for a specific time period. It depicts Gartner's analysis of how certain vendors measure against criteria for that marketplace, as defined by Gartner. Gartner does not endorse any vendor, product or service depicted in the Magic Quadrant and does not advise technology users toQuadrant, and does not advise technology users to select only those vendors placed in the "Leaders" quadrant. The Magic Quadrant is intended solely as a research tool, and is not meant to be a specific guide to action. Gartner disclaims all warranties, express or implied, with respect to this research, including any warranties of merchantability or fitness for a particular purpose.

This Magic Quadrant graphic was published by Gartner, Inc. as part of a larger research note and should be evaluated in the context of the entireshould be evaluated in the context of the entire report. The Gartner report is available upon request from Oracle.

Source: Gartner, Inc., “Magic Quadrant for Data Warehouse Database Management Systems, 2007” b D ld F i b M k A B 10 O t bby Donald Feinberg, Mark A. Beyer, 10 October 2007.

Page 10: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Agenda

T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SSystemOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary

Page 11: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Hot Issues of the Information System

중요 정보의

“Real-Time DW”

Staging/ODS Layer

Data Warehouse

Layer

Data Mart Layer

Data Source

User Access

Enterprise Data WarehouseOLTP System BI Application

< < 기간계기간계 –– 정보계정보계 –– BI BI 시스템시스템 논리적논리적 구성구성 >>중요 정보의

실시간 모니터링및 KPI 요소들의상시 관리 체제

구축

< < Top10 DW Trend in NowTop10 DW Trend in Now >>

① Remodeling or

Rebuilding or 고도화

Staging/ODS

y

E

T

L

Data Warehouse

OLTP

실시간

ETL

실시간

가공

검색

MART 2

MART 1

ERP

② 데이터 소스의 확산

③ 실시간 분석 및 처리

④ CRM과의 밀접한 연계가공

MART 3실시간

가공 실행

분석 정보를

채널시스템

⑤ 분석요소의 증가

⑥ 최종사용자 증가 및 성장

⑦ 더욱 복잡해진 질의

Meta Data Management / Warehouse Administration

필요 시분석 요약 정보를

분석 정 를활용하여

곧 바로 후속업무 지시 및

실행< 핵심 가치 >“정보 전달 체인의 시스템적 연결을 통한

⑧ 데이터 통합

⑨ 대용량 데이터 처리

⑩ 데이터 품질 및 표준화분석 요약 정보를운영계로 반영(실시간ETL과

동일한 방안으로)

정보 전달 체인의 시스템적 연결을 통한업무 처리 주기 단축 및 회전율의 증대”

*ODS: Operational Data Store*BI: Business Intelligence

Page 12: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Real-Time Data Warehouse with Oracle “RTE“RTE는는 DW DW 환경에환경에 전략적전략적 변곡점변곡점을을 제공”제공”

Oracle의

실시간 대응성

Oracle의

실시간 대응성기존 DW 전용시스템

의 RTE 대응 문제점기존 DW 전용시스템

의 RTE 대응 문제점RTE가 필요로 하는

새로운 DW 요구 조건RTE가 필요로 하는

새로운 DW 요구 조건

• 입증된 OLTP+OLAP 성능 제공

• OLTP+OLAP 동시수행대응 미비

• 실시간 ETL 요구 조건• 소스 정보의 변경 내용을실시간으로 즉각 반영하 •#1 in OLTP market

•#1 in TPC-H

• Multi-Version Read Consistency(MVRC)를

• Dirty read 허용으로 인한 data consistency의보장 불가

• Row-level locking의 지원 부재로 인한 성능 저하문제

실시간으로 즉각 반영하기를 요구

• 기존의 daily batch 뿐만아니라 적절한 주기로 데이터 변경분 반영하여 즉시&정확한 분석을 요구 y( )

통한 OLTP+OLAP 동시수행의 차질 없는 지원

• Oracle-to-Oracle 실시간 CDC 기능의 대폭 강화

• 불안정한 병렬 처리 구조의 문제

• 실시간 ETL 대응 미비• 정보 변경 분의 실시간 적

• OLTP + OLAP 동시 처리 요구 조건

• 데이터 적재(Upsert)와정보 분석(Select)의 동시 실행 필요 간 CDC 기능의 대폭 강화

• RAC을 통한 병렬 처리•어떤 노드가 다운되어도전체 서비스는 계속 수행을 보장하는 가용성

용 기능을 지원하지 못함으로 인한 실시간 대응 미비의 문제 발생

• Back to the Basic : ‘Locking’과 ‘Consistency’의

시 실행 필요

• 동시 사용자 증가• 전사적인 EDW의 경우 전직원이 수준별로 접근/활용 을 보장하는 가용성Locking 과 Consistency 의

중요성

Page 13: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Necessary and Sufficient Conditions 술술For RealFor Real--Time DW Time DW -- 아키텍쳐아키텍쳐 / / 서버구성서버구성 / / 요소기술요소기술

아키텍쳐 구성 데이터베이스 서버 구성 요소 기술11 22 33

실시간 Single RTE를 위한실시간데이터 통합

SingleDatabase

RTE를 위한요소기술

ODS RAC Row level LockingODS(Operational Data Store

or Online Data Store)

RAC(Real Application Cluster)

Row level LockingRead Consistency

CDC(Change Data Capture)

• ODS란 ? • RAC(병렬서버) 란 ? • CDC란 ?ODS란 ?

• 왜 필요한가 ?

• 구성방안은 ?

• 활용방안은 ?

RAC(병렬서버) 란 ?

• 왜 필요한가 ?

• 구성방안은 ?

• 활용방안은 ?

CDC란 ?

• 왜 필요한가 ?

• 구성방안은 ?

• 활용방안은 ?

RT-EDW Infrastructure = ODS + RAC + CDC + row level locking + read consistency

RT-EDW Infrastructure = ODS + RAC + CDC + row level locking + read consistency read consistency read consistency

Page 14: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Necessary and Sufficient Conditions 아키텍쳐아키텍쳐 구성구성 방안방안 구성구성 및및 역할역할아키텍쳐아키텍쳐 구성구성 방안방안 : : ODS ODS 구성구성 및및 역할역할

구축방식-1 구축방식-2 (with ODS) 구축방식-3 (통합ODS를 통한 확장형 구조)

11

목적DB

업무계업무계

목적DB

업무계업무계

ODS업무계업무계

ODS업무계업무계

목적DB

목적DB

업무계업무계

업무계업무계

목적DB

목적DB

ODS

데이터마트 주제별 DW EDW(전사DW)

DB

목적DB

업무계업무계 ODS업무계업무계

DB

목적DB

업무계업무계

DB

목적DB

EDW 아키텍쳐 ODS의 역할

O li

업무정보

ODS 영역 DW영역 DM영역

EDW 아키텍쳐 ODS의 역할

Online Store: 최근 이슈화 되고 있는 실시간 처리를 위한 영역으로 활용Operational Store: 통합ODS를 구축함으로써, 운영데이터와분석데이터의 통합을 기반으로 확장 가능한 구조

OnlineStore

Operational DW Data

ETL

ET

ET

EAI정보

고객정보

발생/저장위주의 운영데이터 통합영역

분석데이터의 통합을 기반 확장 가능한 구고객ODS: 최신의 고객관련정보제공 및 CRM과 연계

ODS의 활용

Store

고객ODS

DWMartT

L

TL

EAI

채널정보

대외

발생/저장위주의 운영데이터 통합영역보다 상세수준의 데이터를 분석하고자 하는 현업 담당자들의요구사항에 대응DW변화관리를 효율적으로 대처할 수 있는 영역DW의 다차원모델로 충족되지 못한 정보의 보완실시간 데이터의 통합 (고객정보, 접촉정보, 로그정보 등)

ODSA대외

정보

실시간 데이터의 통합 ( 객정 , 접촉정 , 정 등)데이터 표준화 (이기종 시스템, 분산 시스템, 중복데이터, 항목, 데이터값)

Page 15: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Necessary and Sufficient Conditions 아키텍쳐아키텍쳐 구성구성 방안방안 별별 시스템시스템 구성구성 특징특징 비교비교아키텍쳐아키텍쳐 구성구성 방안방안 : : CaseCase별별 시스템시스템 구성구성 특징특징 비교비교11

[ [ CaseCase--1 ] Staging + DW(ER1 ] Staging + DW(ER모델모델l) l) [ [ CaseCase--2 ] Staging + DW(2 ] Staging + DW(다차원모델다차원모델) )

데이터소스

DW MartMart

Mart 데이터소스

DW

[ [ CaseCase--3 ] ODS + DW(SBT) 3 ] ODS + DW(SBT)

데이터소스

ODS DW MartMart

Mart

SAM필요에 따라이기종 MDB구축

SAM SAM 필요에 따라MDB구축

MartMart

Case-1 특징정규화된 ER모델로 구성

Mart

MartMart

Mart

MartMart

Mart

MartMart

Mart

Case-2 특징다차원모델의 집합

Case-3 특징ER 다차원모델로 구성정규화된 ER모델로 구성

운영계 구조와 흡사한 모델필요시 이기종 데이터마트 구축ODS는 없으며, 주로 SAM 처리방식분석위주 업무 수행

다차원모델의 집합분석주제별로 Big데이터마트 구축데이터 중복 발생 여지 있음ODS는 없으며, 필요시 Oracle DB사용분석위주 업무 수행

ER+다차원모델로 구성ODS는 staging+통합+운영데이터업무담당DW는 주제영역별 다차원모델로 구성OLTP+OLAP 수행 가능한 구조따라서, 운영+분석업무 수행

ER모델: Entity Relationship Diagram(정규화 모델)MDB: Multi-Dimensional DBMS (다차원DBMS)SBT: Subject Base Table (다차원 모델기반 주제테이블)

석위주 무 수행 따라서, 영 석 무 수행

Page 16: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Necessary and Sufficient Conditions 데이터베이스데이터베이스 서버서버 구성구성 방안방안 싱글싱글 데이터베이스데이터베이스 기반기반 병렬서버병렬서버 구성구성데이터베이스데이터베이스 서버서버 구성구성 방안방안 : : 싱글싱글 데이터베이스데이터베이스 기반기반 병렬서버병렬서버 구성구성22

EDW 시스템Data소스

ODS 영역 DW영역 DM영역

[ RT-EDW 를 고려한 서버+DB 구성 방안 ]

EDW 아키텍쳐 물리적 구성 (Single Database)

ODS서버

DW/DM서버ETL

EAI

ODS 영역 DW영역 DM영역업무정보

고객

OnlineStore

ETL

ETL

정보

채널정보

ODS DWDataMart

Si l D t b

① Single Database를 기반으로한 ETL 작업 최소화

EAI 서버 및 데이터의물리적 구성방안

은?대외정보

고객ODS

Staging/ODS

고객ODS DW Data

Mart

Single Database

① Single Database를 기반으로한 ETL 작업 최소화

② 각 서버별 역할분담 및 장애대비 구성 (장애대비 포함)

③ 데이터 중복 방지 및 개발 및 관리의 효율성 (Single Database)

Page 17: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Necessary and Sufficient Conditions 싱글싱글 데이터베이스를데이터베이스를 기반으로기반으로 한한 온라인온라인 분석업무분석업무 동시처리동시처리 구조구조 ((RAC R lRAC R l싱글싱글 데이터베이스를데이터베이스를 기반으로기반으로 한한 온라인온라인++분석업무분석업무 동시처리동시처리 구조구조 ((RAC: Real RAC: Real Application Cluster)Application Cluster)

22

기간 업무 영역 (기간계) 서버구성 솔루션

[ DW시스템 > 수집/온라인/분석업무 작업 분산 ]

RTE-DW 를 고려한 서버+DB 구성

Unix

Oracle온라인 업무위주 처리

분석 업무위주 처리

병렬서버를 사용하여

온라인과 분석업무 분산

11

22

로그를 통한변경분 추출/전송(EAI 사용)

[ DW시스템-> 수집/온라인/분석업무 작업 분산 ]

[ODS서버] [DW서버]

Staging/ODS데이터 수집/통합온라인데이터반영데이터 정제

고객/상품/실적 분석정형/비정형질의배치작업OLAP질의

Row레벨 Locking

일관성 보장

22

33

변경분 추출/전송 또는 배치

[ODS서버] [DW서버]

업무데이터

데이터 정제주기적ETL작업

OLAP질의

UNIX

기타 업무 영역 (지원시스템) 모든 서버(노드)는 각각Read/Write 가능

44

(Read/Write 가)능 (Read/Write 가능)

RAC(Real Application Cluster)

Oracle 데이터 공유기능을 통한추출/전송 자동화 기능

장애대비 시스템 구성55

로그를 통한변경분 추출/전송(DBMS CDC기능)

Staging 고객 Data

Single Database

장애대비 시스템 구성

( 24 * 365 체제) 변경분 추출/전송 또는 배치

Staging/ODS

고객ODS DW Data

Mart업무데이터

채널통합고객

Page 18: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Necessary and Sufficient Conditions RTRT EDWEDW를를 위한위한 업무요건업무요건 및및 요소기술요소기술

업무 요건

RTRT--EDWEDW를를 위한위한 업무요건업무요건 및및 요소기술요소기술

오라클 대응방안

33

온라인 TX 처리( Lock관리 및

수시 데이터 변경)

수시로 변경되는 업무요건에 따른 지연요소가 없어야 함여러세션 동시작업 발생에 따른 Lock 발생 처리해야 함Table 수준 Locking에 따른 업무지연 배제Dirty Read 사용 배제

OLTP 기능/성능이 검증된 DBMS

온라인/분석업무동시처리 성능

업무간섭 최소화 및 응답속도 보장해야 함즉, 대량데이터 일괄처리작업과, 응답속도를 보장해야하는 온라인 업무가 동일한 데이터베이스에서 실행

병렬DBMS(RAC)를 사용한동시처리 성능(응답시간 보장)

하는 온라인 업무가 동일한 데이터베이스에서 실행따라서, DB의 물리적/논리적 분할이 요구됨

업무분산 (업무간섭 최소화)

대용량 데이터 관리(파티션/보안)

과도한 Summary 테이블 생성 배제해당 영업점 데이터만 관리할 수 있는 기능해당 영업점 데이터만 질의되는 보안기능

파티션 테이블의 사용VPD(Virtual Private Database)-> 개별 레코드 및 컬럼 보안

데이터 동기화 기능(추출/전송 자동화)

수시로 변경되는 데이터를 실시간 반영해야 함소량 데이터의 지속적이 반영과 대량데이터의 주기적반영이 요구됨 (이에 따른 업무지연 배제)

다양한 동기화 기능(Streams, Materialized View,External Table, Replication,

변경된 데이터의 자동 추출/전송 기능이 요구됨 Transportable Tablespace)

Page 19: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Agenda

T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary

Page 20: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle Data Warehouse Product Portfolio

I d t l di f d l bilitOracle DatabaseO l P titi iIndustry-leading performance and scalability Oracle PartitioningOracle Real Application Clusters

Deep integrated analytics Oracle OLAPOracle Data Miningg

Oracle Warehouse Builder (OWB)

Embedded data quality and integrationOracle Warehouse Builder (OWB)OWB Enterprise ETLOWB Data QualityOWB Connectors

“Best-of-breed database platform for Business Intelligence and Data Warehousing”Business Intelligence and Data Warehousing

Page 21: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

파티션기능 추가

Oracle Database DW Function Roadmap New Features for BI/DW

Oracle 7.3O l 8 0

파티션기능 추가(List, Range+List)테이블압축 기능External Table 기능분석합수 추가

DW를 위한다양한 기능 반영됨

VLDB• Composite Range-Range• Composite List-Range• Composite List-List

SQL• SQL Pivot and Unpivot• Continuous Query Notification

OLAP

Partitioned Tables and IndexesPartition Pruning

Oracle 8.0

H h d C it P titi iOracle9iOracle8i

Change Data Capture기능ETL기능(확장 SQL 등)

자가관리 DB기능RAC기능향상CDC 기능향상분석함수 기능향상보안기능 향상

• Composite List-Hash• REF Partitioning• Virtual Column Partitioning• Compression enhancements

OLAP• Continued database integration

- Cube metadata in the Data Dictionary- Materialized view refresh and SQL rewrite

Fine grained data sec rit on c besPartition PruningParallel Index ScansParallel Insert, Update, DeleteParallel Bitmap Star QueryParallel ANALYZE

Hash and Composite PartitioningResource ManagerProgress MonitorAdaptive Parallel QueryServer-based Analytic Functions

Oracle9iList and Range-List PartitioningT bl C i Oracle10g

보안기능 향상. . . .

Performance• Query Result Cache

Data loading• Change data capture enhancements

- Fine-grained data security on cubes• Simplified application development

- Fully declarative cube calculations- Cost-Based Aggregation

Si l l l ti d fi itiParallel ANALYZEParallel Constraint EnablingServer Managed Backup/RecoveryPoint-in-Time Recovery

yMaterialized ViewsTransportable TablespacesDirect Loader APIFunctional IndexesPartition-wise Joins

Table CompressionBitmap Join IndexSelf-Tuning Runtime Memory New Analytic Functions

Oracle10gSelf-tuning SQL OptimizationSQL Access Advisor

• Materialized view refresh enhancementsManageability

• Partition Advisor• Interval Partitioning

SQL Pl M t

- Simpler calculation definitionsData Mining

• Simplified development and deployment of models- Supermodels: data preparation combined with Partition wise Joins

Security Enhancementsy

Grouping SetsExternal TablesMERGEMulti-Table Insert

SQL Access AdvisorAutomatic Storage ManagerSelf-tuning MemoryChange Data Capture

파티션기능(Range)병렬처리(DML)

• SQL Plan Management• Automatic SQL Tuning with Self-Learning Capabilities• Enhanced Optimizer Statistics Maintenance• Multi-Column Optimizer Statistics• ASM Fast Resync Fast VLDB Startup and other

mining model- Additional packaged predictive analytics - Integration in database dictionary

• New algorithms: “General Linear Models”Multi-Table InsertProactive Query GoverningSystem Managed Undo

SQL ModelsSQL Frequent ItemsetsSQL Partition Outer JoinsSt ti ti l f ti

파티션기능 추가(Hash, Composite)병렬처리 향상Materialized View기능분석합수 기능

• ASM Fast Resync, Fast VLDB Startup and other enhancements - Encapsulates several widely used analytic

methods- Multivariate linear regression; logistic regression

Statistical functionsand much more ...

분석합수 기능

Page 22: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle DBMS DW Function Architecture

[ 데이터 변환 ] [ 구축/운영 ][데이터추출 및 적재]

Mainframe Unix

[ 데이터 변환 ]Merge(Upsert)

Multitable InsertTable Function

Parallel DDL/DML

[ 구축/운영 ]3rd Normal Form

Multi-Dimensional ModelMaterialized View

Partition table

[데이터추출 및 적재]SQL*Loader

Transportable TablespaceExternal table

Change Data Capture Parallel ProcessingAnalytical Function

Compress

StreamsMaterialized ViewOracle Gateway

GatewayStaging/ODS

TargetDWERP

[ ETL관리 ]: Oracle Warehouse Builder[ DB 관리 ]: Oracle Enterprise Manager

ODS DWTransformation

ERPSystem

[ 데이터 설계 ]Oracle Designer

orOther Case Tool

[ 데이터 설계 ]Oracle Designer

orOther Case Tool

[ 데이터 파티셔닝 ]Partition table

Partition Exchange LoadingCompressOther Case Tool Other Case Tool

Page 23: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Key Features for VLDB

파티션파티션 데이터데이터 요약요약 병렬병렬 데이터데이터

대용량 데이터의 처리

파티션테이블/인덱스

파티션테이블/인덱스

데이터압축

데이터압축

요약View요약View

병렬프로세싱

병렬프로세싱

데이터공유

데이터공유

• 다양한 분할기법• 디스크 장애 시 해당

Partition만 영향• 개별 Partition 단위의

• 블록내의 중복제거• 질의성능 향상• 스토리지 절약• 테이블 및 테이블스

• 질의성능향상 및 복제를 위한 기능

• 자주 쓰이는 유형의데이터 Set을 미리 수

• Parallel Query• Parallel Load (with

SQL*Loader Utility)• Parallel DDL, DML

• 변경데이터를 정보분석요구주기에 따라곧바로 적용할 수 있는 다양한

관리 기능(DML, Load, Import, Export, Exchange 등) 지원

• 사용자 질의시 해당되는 파티션만

페이스, 파티션레벨에서 압축 지정가능

• Materialized View도압축 가능

행 한 후 테이블에 저장

• Query Rewrite기능• 주기적인 요약정보갱신 가능

• Parallel Recovery• Parallel Analyze• Parallel Read from

External table• Parallel Propagation

CDC(Change Data Capture) 기능 제공

• SAM File을 곧바로DBMS의 테이블처럼인식하여 SQL을 적Access

• 로드 밸런싱

• 7*24 작업가능

(Replication)• Parallel-wise Join• Parallel Server (with

RAC)

인식하여 SQL을 적용할 수 있는 기능 제공

• 소스시스템의 상황에따라 적용할 수 있는다양한 ETL 기능 제공

Page 24: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Large-Scale Data Warehouse FeaturesFeature Usage

Compression

Parallel Exec

Partitioning

Read Only

VPD

MV Use

DB Res Mgr

RMAN

ASM

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Partitioning, parallelism, and compression are the foundation for large-scale data warehousing

Source: TB Club Report: A survey of 30 multi-TB Oracle DW’s – data July 2006

Page 25: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Embedded AnalyticsIn-Database Analysis

Oracle 10Oracle 10gg DBDB REGIONPRODUCT

Data Warehousing

ETL

질의 처리 및 보고Oracle BI SEBI Beans

TIME

다차원 정보 분석OLAP OptionSpreadsheet Add-In

OLAP

D t Mi i

Statistics

p

Data Mining

데이터 마이닝

ETL 처리Oracle Warehouse Builder

Oracle Data Mining OptionSpreadsheet Add-InStatisticsText Mining내장된 통계 기능

Oracle ETL Option내장된 통계 기능

Various Built-In Statistics Functions

Page 26: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

What is Oracle Warehouse Builder?Data integration and data quality tool embedded within Oracle Database

Integrate data from disparate data sources• High performance (ELT & ETL architecture) optimized for Oracle Database• Extreme scalability with support for RAC• Declarative highly productive drag and drop design capabilities• Declarative, highly productive drag and drop design capabilities• ERP/CRM connectivity (EBS, Siebel, SAP and PeopleSoft)

Improve enterprise data quality• Name and Address cleansing• Fuzzy matching and merging• Data Profiling and data auditing• Business rule support in profiling and ETLBusiness rule support in profiling and ETL

Provide data modeling capabilities for Oracle• Relational (tables, views, MVs, UDT, etc.)• Dimensional (slowly changing dimenions, OLAP support, etc.)

Enterprise metadata management• End-to-end attribute level lineage and impact analysisEnd to end attribute level lineage and impact analysis• Extensible repository to hold any metadata

Page 27: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle Warehouse Builder주요주요 특징특징 및및 구성구성

Oracle Warehouse Builder는 편리한 위저드 기능, 대화식 연결 기능, 영향 분석기, 메타데이터에 대한 신속한응답을 지원하는 변경 전파기 등이 포함되어 있어 전사적인 데이터 웨어하우스를 다양한 환경에서 구축할수 있게 합니다

Mapper Process Editor ExpertsData Modeller

수 있게 합니다.

Runtime AuditControl Center Repository Acc. Data Profiler

SchedulerDependenciesChange ManagerData Viewer

Page 28: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

What is the Oracle OLAP Option? Embedded, manageable, enterpriseEmbedded, manageable, enterprise--readyready

A multidimensional calculation and aggregation ‘engine’• Multidimensional data types: Cubes and dimensions• An OLAP API for cube definition and multidimensional queries• A SQL interface to OLAP Cubes and dimensions• OLAP-based materialized views

Embedded in the Oracle Database• Runs within Oracle instance on same server• Runs within Oracle instance on same server • OLAP cubes are stored in Oracle data files• OLAP metadata in the Oracle Data Dictionary

All key database functionality extends to OLAP• Security: Object and data security• Scalability: Real Application Clustersy pp• Availability: Backup-Recovery, Disaster Recovery, RAC• Administration: Enterprise Manager

Page 29: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle OLAP Option

Oracle OLAP 서비스는 단일 플랫폼 환경에서 관계형 데이터와 다차원 데이터를 저장할 수

다다차원차원 데이터데이터 분석분석

있는 통합 분석 환경을 구축할 수 있는 기반 환경을 제공

Oracle database와 Oracle OLAP 기술을 통합하여 더 진보된 분석 서비스를 제공

• Multidimensional Data Model의 복잡한 분석 질의를 지원

• Forecasting, Model, 시나리오 관리와 같은 Predictive 분석 기능을 지원

• 분석 질의를 위한 빠른 조회 응답시간을 보장

• 동시에 많은 분석 애플리케이션 사용자를 지원• 동시에 많은 분석 애플리케이션 사용자를 지원

• Multi-terabyte 분석시스템 지원

• 데이터가 Relational Table에 저장되어 있을 때, 고객은 SQL 기반 애플리케이션과 Oracle OLAP 애플리케이션 모두를 사용할 수 있다.

• Oracle Database의 사용자 인증, 승인, 데이터 접근 방법으로 분석 애플리케이션과 데이터웨어하우스를위한 통합된 보안모델 제공

• 데이터 웨어하우스와 Multidimensional Modeling의 통합이 분석을 위한 데이터 웨어하우스의 처리를더욱 능률적으로 해 준다.더욱 능률적으로 해 준다.

• Oracle Database의 고 가용성 기능들을 이용하면 Oracle OLAP에 의해 사용되는 데이터 웨어하우스를24x7x365 의 가용성 지원

Page 30: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

What is Data Mining?

Data Mining• 대량의 데이터 안에서 숨겨진 패턴들과 새로운 통찰적 지식을

찾아가는 프로세스

Data Mining이 제공할 수 있는 가치

• 목표 속성과 밀접히 연관된 요인들의 파악 (Attribute Importance)• 고객 행위의 예측 (Classification)• 목표 고객 혹은 물품의 프로화일 구축

(Decision Trees)(Decision Trees)• 샘플 정보의 세그먼트화 (Clustering)• 대상체 내에 존재하는 중요한 관련성의 탐색 (Associations)• 사기 등과 같은 드문 사건의 파악 (Anomaly Detection)

Page 31: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

What is the Oracle Data Mining Option? Embedded, manageable, enterpriseEmbedded, manageable, enterprise--readyready

A complete data-mining solution• 10+ data-mining algorithms: addresses every business scenario• Oracle Data Miner: Graphical user-interface for analysts• A Data Mining Java API for application developersA Data Mining Java API for application developers• A Data Mining PL/SQL API for database developers

Embedded in the Oracle DatabaseR ithi O l i t• Runs within Oracle instance on same server

• Data Mining algorithms execute directly on database tables• Data Mining models and metadata stored within Oracle database

All key database functionality extends to Data Mining• Scalability: Parallelism, Real Application Clusters• Security: Object and data securityy j y• Administration: Enterprise Manager• Portability: All major platforms

Page 32: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle Data Mining

편리하게 사용할 수 있도록 향상된 사용자인터페이스 제공

Oracle inOracle in--Database Mining EngineDatabase Mining Engine

• 데이터 마이닝 모델의 구축, 평가 및 적용을 위한 GUI 제공(Wizards 방식, Mining 가이드 지원)

응용 개발을 위한 SQL & Java 코드 생성을 지원응용 개발을 위한 SQL & Java 코드 생성을 지원• 데이터 마이닝을 통해 얻은 지식을 다른 BI 도구 및

애플리케이션과 연계시켜 줌

O l i i l fOracle mining platform• PL/SQL API• Java API• Oracle Data Miner (GUI)• Spreadsheet Add-In

지원하는 알고리즘• Structured & unstructured data• Attribute importance• Classification, regression & prediction• Anomaly detection • Association rules • Clustering • Nonnegative matrix factorization • BLAST

Page 33: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Embedded Statistics & SQL AnalyticsIncluded in Oracle EE & SEIncluded in Oracle EE & SEIncluded in Oracle EE & SEIncluded in Oracle EE & SE

Page 34: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Agenda

T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemO l D t W h P d t P tf liOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary

Page 35: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

ILM(Information Lifecycle Management)

시간에 따른 데이터 증가 및 사용빈도시간이 경과될수록 데이터는 축적되며

This Month This Year Previous Years

시간이 경과될수록 데이터는 축적되며증가함그러나, Active데이터에 대해 사용자가집중되며, Access가 많이 일어남현재 및 과거 데이터에 대한 관리 필요

Data Lifecycle

ArchiveHistoricalLess ActiveActive

필요 조건은 ?

DIGITAL DATA STORAGE

필요 조건은 ?라이프사이클별 데이터 분할데이터 분할에 따른 효율적인스토리지 사용 계획데이터베이스에서의 적용방안데이터 접근 제어 방안

High PerformanceStorage Tier

Low CostStorage Tier

HistoricalStorage Tier

Page 36: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

ILM(Information Lifecycle Management)데이터데이터 분할기법을분할기법을 사용한사용한 테이블테이블++스토리지스토리지 관리관리

With P titi iWith P titi iWith t P titi iWith t P titi i With PartitioningWith Partitioning

Tablespace File Disk

Without PartitioningWithout Partitioning

TablespaceFileDisk

Table

분할기법을 사용한 테이블+스토리지 관리한 테이블을 시점별 분할분할데이터 Tablespace-File-Disk 관리원하는 시점의 데이터를 원하는 디스크에 관리

일반적인 테이블+스토리지 관리하나의 테이블은 하나의 테이블스페이스에 관리시점별 데이터 관리하지 못함원하는 디스크로 관리하지 못함

Page 37: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

ILM(Information Lifecycle Management)

Data Lifecycle Oracle10g ILM 특징

Oracle10g ILM Oracle10g ILM 관리관리 ((예제예제) : ) : Management+Performance+Cost SavingManagement+Performance+Cost Saving

Data Lifecycle

HistoricalLess ActiveActive

Oracle10g ILM 특징하나의 테이블을 분할하여 관리분할영역별 데이터관리(접근/이동/변경)분할영역 단위 데이터압축Read only TBS 적용Read only TBS는 한번의 백업만 필요

매출 테이블

1996 / 10 ~ 2006 / 10

High PerformanceStorage Tier

Low CostStorage Tier

HistoricalStorage Tier

Read only TBS는 적은 메모리사용(속도향상 측면)사용자별/데이터별 접근제어(보안측면)

2005 / 12 2005 / 11 2005 / 102006 / 10 1996 / 12 1996 / 11 1996 / 10 시점별 데이터 분할

2005 / 12 2005 / 11 2005 / 102006 / 10

Read/Write 테이블스페이스

1996 / 12 1996 / 11 1996 / 10과거 데이터 압축

2005 / 12 2005 / 11 2005 / 102006 / 10

Read/Write 테이블스페이스

1996 / 12 1996 / 11 1996 / 10

“Read only” 테이블스페이스Read/Write 테이블스페이스

“ Read Only ”테이블스페이스 적용

“ 온라인백업 ” “ 주기적 배치백업 ” “ 한번의 백업 (Read only) ”

Page 38: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Agenda

T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemO l D t W h P d t P tf liOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary

Page 39: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Oracle Multi-Terabyte DW CustomersExamplesExamples

Acxiom 16 TB HP France Tele 65+ TB HPAcxiom 16 TB HPAllstate 20 TB Sun (RAC)Amazon 70 TB HP (RAC)AT&T 60 TB HP

France Tele 65+ TB HPKTF 20+ TB HPMastercard 40 TB IBM (RAC)NASDAQ 35 TB Sun

British Telecom 16 TB HPCellcom 12 TB HPCenturyTel 10 TB HP

NYSE Euronext 93 TB HP (RAC)Reliance Ltd 13 TB SunStarwood 12 TB HP

Chase Card 40 TB IBM (RAC)Choicepoint 14 TB SunCingular/AT&T 25 TB HPClaria 38 TB Sun

Sprint/Nextel 110 TB HPTelecom Italia 12 TB HP (RAC)Turkcell 23 TB Sun (RAC)UBS AG 15 TB SunClaria 38 TB Sun

Colgate-Palm 10 TB IBMExperian 14 TB Sun

UBS AG 15 TB SunUPS 10 TB HPYahoo! 250 TB Fujitsu

Page 40: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국내 – 사례분석)KK은행은행 -- 실시간실시간 고객분석고객분석 CRM DW : NCR WinCRM DW : NCR Win--back back 사례사례

K은행 CRM DW Reference 개요K은행 CRM DW Reference 개요

• 프로젝트 개요

- 제목 : 전사 통합 CRM 시스템 개발

주관사 : HP Consulting 사업부User LAN Gigabit

1ports

CRM DW CRM DW 시스템시스템 구성도구성도

- 주관사 : HP Consulting 사업부

- 기간 : 2005.7.1 – 12.31 (6 months)• 주요 목표

- 단일 뷰로 고객 정보 통합

DB # 2hp Superdome 32 Way1 2GHz

DB # 1hp Superdome 32Way 1 2GHz

DLM /Heartbeat

Gigabit 3ports APA

Backbone Switch

1ports

단일 뷰로 고객 정보 통합

- 기존 운영 CRM과 분석 CRM의유기적인 통합

- 분석 CRM의 신규 요구 조건을만족하는 모듈 추가

1.2GHz16 Processor / 32 Core64GB MemoryInt. Disk : 73GB x 8ea1000Base-SX x 6ea

32Way 1.2GHz16 Processor / 32 Core64GB MemoryInt. Disk : 73GB x 8ea1000Base-SX x 6ea HA

ClientSQL Plus

만족하는 모듈 추가개발(OLTP+OLAP). 신규 요구조건의 핵심은 본점 및 영업점에서공히 고객을 위한 최적 상품을설계하여 우수 고객을

1000Base SX x 6ea HA

2GB FC x 16ea 2GB FC x 16ea설계하여 우수 고객을분석/파악하고(OLAP) 즉시 캠페인을실행(OLTP)할 수 있는 체제를구축하는 것임

EMC DMX1000Usable 40TB

2GB FC x 16ea 2GB FC x 16ea

Oracle 10g R2 RACVersion 10.2.0.1

• 시스템 데이터 규모 : 35TB+

Page 41: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국내 – 사례분석)

Oracle Consulting 사업부 주관으로 전사 PI 프로젝트 및 실시간 조업 DW 구축

PP사사 –– 전사전사 ERPERP와와 연계한연계한 실시간실시간 EDW EDW 구축구축

전사 공통 핵심 업무영역 일반관리 전 부문으로 확대 MES 관련 업무영역

단계 PI 1기 PI 2기 MES2001.7 2003.02 현재

구구 매매

환경환경//에너지에너지

재무재무//자금자금

노노 무무

설비설비//투자투자

기기 술술

판판 매매 원가원가//수익성수익성

출자사출자사 인인 사사

생생 산산

물물 류류

품품 질질

출출 하하

ABMABM구축

내용

전사 공통 핵심 업무영역 일반관리 전 부문으로 확대 MES 관련 업무영역

P사 DW의 특징

부서별 상이한 지표명 산출기준 및 관리 차원을 통합

DW 활용 현황

Staff 부서 등 주 활용 인원의 61% 활용 ( 2.2 / 3.6 천명 ) 부서별 상이한 지표명, 산출기준 및 관리 차원을 통합

- MES부문: 1,154/1,532 종 (75% 통합/표준화)

동일한 기준에 의한 상호 비교 평가를 통해 업무의 상향 평

준화를 유도

- 활용 인원: 매월 평균 2,200명은 항시 사용 (주활

용 인원의 61%)

MES DW가동 시점(’05.1)부터 인당 활용횟수 증가: 인당

전 직원이 DW의 사용자 (19000명)

보증된 데이터를 기반으로 ABM(원가),SCP(계획),BSC(성

과) 정보의 자동 연결

26회

- Portal 활용실적: 주간단위 35명 (100회)

동시 접속자수: 60명 (MES기준), 향후 C/S전환시 110명

예상예상

Page 42: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국내 – 사례분석)

Oracle Consulting 사업부 주관 하에 전체 DW 프로젝트 진행

P j t 총괄 O l C lti 사업부 PMO SDS

SS사사 -- LCDLCD 실시간실시간 MES DWMES DW

• Project 총괄 : Oracle Consulting 사업부, PMO : SDS• 적용 솔루션

- Oracle Database RACOracle Wareho se B ilder- Oracle Warehouse Builder

- 실시간 CDD : Materialized View- Oracle Portal

구축효과: ODS를 통한 Shift 일 마감 시간 단축 및 생산실적 집계 표준화 구현구축효과: ODS를 통한 Shift,일 마감 시간 단축 및 생산실적 집계 표준화 구현

TOTO--BEBEASAS--ISIS

생산 생산분석 생산 ODS

시스템마감

WEB 표준일보 작성

30분

시스템마감

5분

WEB 표준일보 작성

부서/담당자 별 (Excel)일보 작성: 2시간 표준화된 일보 조회 및 OLAP 분석: 5분

Page 43: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국내 – 사례분석)KK통신통신 –– Infobank Infobank 고객고객//영업영업//마케팅마케팅 CRM DWCRM DW

구축 효과• 데이터 분석 인프라로서 사용자에게 일관적인 View 및 분석 기능 제공

• 일매출 데이터 제공 : 일단위 / 월단위 가매출 데이터 분석 정보 제공

• 가입자 중심의 전사적 통신멍 분석 데이터를 제공하여 가입자 통화 품질의 체계적인 관리 개선 및 가입자유치에 필요한 데이터 제공유치에 필요한 데이터 제공

• 초급 분석가들을 위한 정형화된 분석 기능 제공

• 현황 및 성과지표 제공 : 기간계 시스템에서 제공하기 어려운 통계성 리포트와 성과지표를 손쉽게 조회할수 있도록 정보 제공

구축 솔루션• 주관사 : 1차 IBM GBS,

2차 고도화 프로젝트 HP ConsultingH/W IBM P690

ⓘBada

Staging/ODS

Staging/ODS Layer

Data Warehouse Layer

Data Sour

ce

User Access

E

T

L

InfobankOLTP System

Data Warehouse

WISE

CReaM

MECA

ERP

SAS

P

O

R

T

A

L

ETL

Active

InfobankInfobank

Active

• H/W: IBM P690 • Database : Oracle 9i RAC• Data Size: 20TB+

SAS

기타

… L

SAN Switch

Oracle 9i RAC 2 Nodes

Staging/ODS L

Data Warehouse LayerInfobank

Storage

LayerStage/O

DS

DW일별/월별계약

일별부가서비스가입일별부가서비스가입통화통화

수미납수미납

일매출일매출

.….

고객고객청구청구CDKCDK

…..

대리점대리점

청구방법청구방법

재판매구분재판매구분

부가코드부가코드

BANBAN

요금종류요금종류

연령연령

업종업종일별해지분석

…..

월별

매출

월별청구

서비스매출

D 1 Batch

ETL

D-1 Batch

Page 44: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국외 – 사례분석)

Amazon.com의 EDW 시스템은 2005년35TB Clickstream DW Data를 25TB Query

61 TB production Query Data Warehouses• Amazon runs 2 identical 61 TB+ query DWs

Amazon.com - 최대 규모의 온라인 서점 EDW 시스템 구축

35TB Clickstream DW Data를 25TB Query DW로 통합

현재 Query DW의 데이터 크기는 61TB+ 로증가

Amazon runs 2 identical 61 TB+ query DWs loaded concurrently. Config for each is:

- 16 node RAC/Linux cluster- Oracle10gR1 RAC using ASM on Red Hat

Enterprise Linux 3증가

(Source: www.wintercorp.com)- 16 HP DL580, 4 CPU 3-GHz, 14GB RAM- 80 HP StorageWorks MSA1000- 8 32-port Brocade switches- 1 Gigabit interconnectDW Staging

16 TB production ETL/Staging Data Warehouse• Amazon runs 2 identical 10 TB+ ETL DWs

loaded concurrently. Config for each is:8 d RAC/Li l t

#Nodes x #cpus

16 x 4 8 x 4

Total DB 61 TB 10 TB- 8 node RAC/Linux cluster - Oracle10gR1 RAC using ASM on Red Hat

Enterprise Linux 3- 8 HP DL580, 4 CPU 3-GHz, 14 GB RAM- 36 HP StorageWorks MSA1000

Data 51 TB 7 TB

Index 2 TB 1-2 TB36 HP StorageWorks MSA1000

- 8 16-port Brocade switches- 1 Gigabit interconnect

• DW Metrics- Each is 16 TB total database size

Disk 71 TB 36 TB

- Each has only 1-2 TB index- 36 TB disk for each

Page 45: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국외 – 사례분석)

적용된 Oracle DW Key Features• RAC

Amazon.com - 최대 규모의 온라인 서점 EDW 시스템 구축

• RAC• ASM• Partitioning (incl. Partition-wise joins)• Parallel Operations (Query, DML)

Supply Supply ChainChain

Planning Planning AppsApps

Financial Financial AnalysisAnalysis

EDW 시스템 구조도

• MERGE• External Tables• Hash joins• Analytic functions

FulfillmeFulfillment Centersnt Centers

Analytic functions

24시간 데이터 적재 및 쿼리 작업 동시수행

C t l d d i (24 7 i )

Data Data WarehouseWarehouse

CustomersWeb Web

ServersServersPartnersPartners

• Concurrent loads and queries (24x7 queries)

80% 이상의 쿼리가 hit detail tables로 부터 발생• Detail queries originate from

PersonalizatioPersonalizationn

Campaign Campaign GeneratioGeneratio Email Email

Internal Internal End End

UsersUsers

- DSS Adhoc tool (proprietary)- Direct access SQL statements

• Primary detail data는 Order, Ships, Clickstream, Item dimensions을 포함하고 있음

Content Content ServersServers

nn ServersServers

Page 46: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

DW References(국외 – 사례분석)

프로젝트 기간• 2000년 3월 ~ 2001년 10월 DW CRM system 구축

프로젝트 결과

• 매우 안정적인 명실상부한 대용량의 전사 EDW 시스템

France Telecom - 최대 규모의 통신 EDW 시스템 구축

2000년 3월 2001년 10월, DW, CRM system 구축

• 2002년 6월 ~ 2003년 2월, Phase 1 Migration Project, Extend CRM

프로젝트 내용• 4 개 부문의 현장 서비스를 하나의 시스템으로 통합

• 매우 안정적인 명실상부한 대용량의 전사 EDW 시스템구축

• Performance 기대 목표치 만족

- 모든 표준 온라인 CDR질의가 4초내 완성을 요구했고결과 시스템은 이 기준을 만족

• 고객에게 단일 관점의 View를 제공하기 위한 DW 시스템 구축

• Oracle 9i 적용

Consulting by OracleDW S t DW M d li T i DBA

결과 시스템은 이 기준을 만족

- 표준 질의는 날짜와 발신자번호 또는 수신자번호를지정

- 1800억CDR 이상의 데이터를 저장하고 있는데이터베이스에서 많은 동시 질의를 4초내로 처리

• DW System : DW Modeling, Tuning , DBA• CRM System : Business Consulting(Strategy,

Requirement Analysis, Implementation)저장 공간• Disk Size : 80 TB

- 분석가들과 파워유저들을 위한 비정형 즉석질의( ad hoc query) 지원

• 부정사용(fraud) 방지 용도로 성공적인 사용이 이루어짐

• Disk Size : 80 TB • DB Size : 65 TB• Raw Data Size : 25 TB • 65 TB production data warehouse - Statistics

- Largest table = 47 TB with 18 TB raw datag- 2nd largest table = 14 TB with 5.4 TB raw data- Average raw load/day 70 GB/day 180 GB

total 3 GB/hr avg -> 8 GB/hr total DB size growth/daySystem can load all 70 GB in 3 hr window- System can load all 70 GB in 3-hr window

23.3 GB/hr in 3-hr window

Page 47: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Agenda

T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemO l D t W h P d t P tf liOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary

Page 48: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007

Summary Why Oracle Database for Data Warehousing?Why Oracle Database for Data Warehousing?

Best-of-breed for data warehouses and data martsConsolidation platform• eliminates the costs and inefficiencies of multiple data stores

Complete, integrated ELT and data-quality capabilitiesUnmatched analytic capabilities• embedded OLAP, data-mining and statistics all accessible via SQL

Next-generation BI with integrated OLTP and DSSFoundation of Oracle Business Intelligence solutions

Page 49: Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007