Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant...
Transcript of Session2 나정옥선생.ppt [복구됨] - DBGuide.net · 2008-04-28 · Gartner: Magic Quadrant...
<Insert Picture Here>
정보 시스템 구축을 위한 필요충분 조건과 ILM 운영 전략정보 시스템 구축을 위한 필요충분 조건과 ILM 운영 전략
나 정 옥부장 / Data Warehouse / Technical Solution Consulting부장 / Data Warehouse / Technical Solution ConsultingOracle Korea
Agenda
T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary
Trends of the Information System by period
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 / 2007
정보계구축 ---> Data Warehouse 구축 DW 리모델링 / 고도화 / 재구축
콜센터 구축
통합 CRM 구축
분석/운영 CRM 연계
현업에서의 활용성보다,DW구축하기위한 프로젝트에 집중
체계화된 데이터 구조를
차
세
대
데이터 축적 E D W 실영업지원 시스템 구축
eCRM 구축각 고객 접점 채널별
기반으로, 현업의 활용성을극대화한 DW체계를갖추기 위한 재구축
기개발된 고객접점채널을 통합하고, 이를 분석CRM과연동하는데 초점
대
데이터 축적 E D W 실시
고객 분석모델 개발
고객 세그멘테이션
각 고객 접점 채널별,최적화된 채널구축에집중
R
T
E분석위주 인프라
시간
고객 LTV모델 개발
Today’s Information SystemReal-Time Data Warehouse
[실시간 데이터처리 요건]
전략적 질의[기존DW업무]
-데이터 적재
-정형/비정형 질의
[실시간 데이터처리 요건]
-실시간+지속적 데이터 갱신
-대량사용자 + 동시작업
-OLAP + OLTP 업무
동시수행
정형 / 비정형 질의
배치작업
배치작업복잡한 정형질
복잡한비정형질의
OLTP성 전략적 질의
일괄변경
데이터 갱신
지속적인변경작업
-정형/비정형 질의
-주기적인 배치작업
정형질의
배치작업
배치작업대량 데이터적재
비정형질의
데이터 적재
배치작업의일괄변경
변경작업
OLAP+OLTP
O i l D S
대량 적재 작업
질의 수행 속도
배치작업
Row level Locking
Trickle Feeds (지속적에이터 반영)
OLAP+OLTP 서버 및 데이터의물리적 구성방안은?
Operational Data Store질의 수행 속도
주기적인 배치 작업 메타 데이터 관리 24 * 365 지원부하분산 관리
Single View with Enterprise-wide integrated Data
고객 영역 (기간업무,홈페이지…) 분석영역(EDW,DM…)
채널경로 우수고객 발신자번호 고객등급
고객구분 고객분석
고객 정보
관계정보분석 정보고객 채널경
로우수고
객발신자번
호
고객명주민/사업자번호
찾기찾기지움지움고객등
급계약건수개인고객구
분
직원여부 고객만
족도
고객사항
개인고객개인고객 법인고객법인고객 세대정보세대정보 가망고객가망고객고객의소리고객의소리e 서비스e-서비스팩스발송팩스발송메일발송메일발송
고객구분 고객분석
연락처 주소소재지
접촉포인트
고객정보관계정보
분석 정보관계
연락처
고객 통계정보
고객분석정보
채널경로 우수고객 발신자번호
고객명주민/사업자번호
찾기지움계약건수
개인고객구분
직원여부고객만족도
고객사항개인고객 법인고객 세대정보 가망고객 고객의소리 e-서비스 팩스발송 메일발송
연락처 주소소재지
접촉
포인트고객
계약 정보(기간업무) 캠페인관리 시스템
휴대폰자택전
화Fax
직장전화
Fax전자우
편
수신거부
자택주소
직장주소
항연락처 주소
계약사항 캠페인
접촉이력 지원/상담내역
계약 캠페인
포인트
반응정보휴대폰
자택전화 Fax
직장전화 Fax
전자우편 수신거부
자택주소
직장주소
계약사항 캠페인
계약/계좌 캠페인
고객 고객
Account
접촉이력 서비스
거래내역
반응정보
캠페인
실시간실시간 배치배치
접촉이력 지원/상담내역
접촉이력 서비스
통합된데이터 고객
접촉이력(콜센터,홈페이지… ) 영업지원 시스템
고객영업서비스
실시간실시간 + + 배치배치 실시간실시간 + + 배치배치
접촉이력 서비스
고객 + 계좌(상품) + 분석 + 접촉 + 상담 + 서비스접촉이력 상담내역 서비스요청
데이터데이터 통합통합 => => Data Integration ? Consolidation? Federation?Data Integration ? Consolidation? Federation?
Data Warehouse in the overall Business Analytics Market
Industry-Standard Best Practice:The Data Warehouse is the Foundation
of Business Intelligence and Performance Managementof Business Intelligence and Performance Management
Why a Data Warehouse?“Data Warehouse: Essential to BI ““Data Warehouse: Essential to BI “Data Warehouse: Essential to BI Data Warehouse: Essential to BI
Adapted from customer-BT presentation on their DW/BI strategy
Oracle #1 for Data Warehousing
USD $1.8B
Source: IDC 2007 Data Warehouse Platform Tools 2006 Vendor Shares
Total Market = USD $4.4BSource: IDC, 2007 – Data Warehouse Platform Tools 2006 Vendor Shares
Gartner: Magic Quadrant for Data Warehouse Database Management Systems 2007Database Management Systems, 2007
The Magic Quadrant is copyrighted 10 October 2007 by Gartner, Inc. and is reused with permission. The Magic Quadrant is a graphical representation of aMagic Quadrant is a graphical representation of a marketplace at and for a specific time period. It depicts Gartner's analysis of how certain vendors measure against criteria for that marketplace, as defined by Gartner. Gartner does not endorse any vendor, product or service depicted in the Magic Quadrant and does not advise technology users toQuadrant, and does not advise technology users to select only those vendors placed in the "Leaders" quadrant. The Magic Quadrant is intended solely as a research tool, and is not meant to be a specific guide to action. Gartner disclaims all warranties, express or implied, with respect to this research, including any warranties of merchantability or fitness for a particular purpose.
This Magic Quadrant graphic was published by Gartner, Inc. as part of a larger research note and should be evaluated in the context of the entireshould be evaluated in the context of the entire report. The Gartner report is available upon request from Oracle.
Source: Gartner, Inc., “Magic Quadrant for Data Warehouse Database Management Systems, 2007” b D ld F i b M k A B 10 O t bby Donald Feinberg, Mark A. Beyer, 10 October 2007.
Agenda
T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SSystemOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary
Hot Issues of the Information System
중요 정보의
“Real-Time DW”
Staging/ODS Layer
Data Warehouse
Layer
Data Mart Layer
Data Source
User Access
Enterprise Data WarehouseOLTP System BI Application
< < 기간계기간계 –– 정보계정보계 –– BI BI 시스템시스템 논리적논리적 구성구성 >>중요 정보의
실시간 모니터링및 KPI 요소들의상시 관리 체제
구축
< < Top10 DW Trend in NowTop10 DW Trend in Now >>
① Remodeling or
Rebuilding or 고도화
Staging/ODS
y
E
T
L
Data Warehouse
OLTP
실시간
ETL
실시간
가공
검색
MART 2
MART 1
ERP
② 데이터 소스의 확산
③ 실시간 분석 및 처리
④ CRM과의 밀접한 연계가공
MART 3실시간
가공 실행
분석 정보를
채널시스템
⑤ 분석요소의 증가
⑥ 최종사용자 증가 및 성장
⑦ 더욱 복잡해진 질의
Meta Data Management / Warehouse Administration
필요 시분석 요약 정보를
분석 정 를활용하여
곧 바로 후속업무 지시 및
실행< 핵심 가치 >“정보 전달 체인의 시스템적 연결을 통한
⑧ 데이터 통합
⑨ 대용량 데이터 처리
⑩ 데이터 품질 및 표준화분석 요약 정보를운영계로 반영(실시간ETL과
동일한 방안으로)
정보 전달 체인의 시스템적 연결을 통한업무 처리 주기 단축 및 회전율의 증대”
*ODS: Operational Data Store*BI: Business Intelligence
Real-Time Data Warehouse with Oracle “RTE“RTE는는 DW DW 환경에환경에 전략적전략적 변곡점변곡점을을 제공”제공”
Oracle의
실시간 대응성
Oracle의
실시간 대응성기존 DW 전용시스템
의 RTE 대응 문제점기존 DW 전용시스템
의 RTE 대응 문제점RTE가 필요로 하는
새로운 DW 요구 조건RTE가 필요로 하는
새로운 DW 요구 조건
• 입증된 OLTP+OLAP 성능 제공
• OLTP+OLAP 동시수행대응 미비
• 실시간 ETL 요구 조건• 소스 정보의 변경 내용을실시간으로 즉각 반영하 •#1 in OLTP market
•#1 in TPC-H
• Multi-Version Read Consistency(MVRC)를
• Dirty read 허용으로 인한 data consistency의보장 불가
• Row-level locking의 지원 부재로 인한 성능 저하문제
실시간으로 즉각 반영하기를 요구
• 기존의 daily batch 뿐만아니라 적절한 주기로 데이터 변경분 반영하여 즉시&정확한 분석을 요구 y( )
통한 OLTP+OLAP 동시수행의 차질 없는 지원
• Oracle-to-Oracle 실시간 CDC 기능의 대폭 강화
• 불안정한 병렬 처리 구조의 문제
• 실시간 ETL 대응 미비• 정보 변경 분의 실시간 적
• OLTP + OLAP 동시 처리 요구 조건
• 데이터 적재(Upsert)와정보 분석(Select)의 동시 실행 필요 간 CDC 기능의 대폭 강화
• RAC을 통한 병렬 처리•어떤 노드가 다운되어도전체 서비스는 계속 수행을 보장하는 가용성
용 기능을 지원하지 못함으로 인한 실시간 대응 미비의 문제 발생
• Back to the Basic : ‘Locking’과 ‘Consistency’의
시 실행 필요
• 동시 사용자 증가• 전사적인 EDW의 경우 전직원이 수준별로 접근/활용 을 보장하는 가용성Locking 과 Consistency 의
중요성
용
Necessary and Sufficient Conditions 술술For RealFor Real--Time DW Time DW -- 아키텍쳐아키텍쳐 / / 서버구성서버구성 / / 요소기술요소기술
아키텍쳐 구성 데이터베이스 서버 구성 요소 기술11 22 33
실시간 Single RTE를 위한실시간데이터 통합
SingleDatabase
RTE를 위한요소기술
ODS RAC Row level LockingODS(Operational Data Store
or Online Data Store)
RAC(Real Application Cluster)
Row level LockingRead Consistency
CDC(Change Data Capture)
• ODS란 ? • RAC(병렬서버) 란 ? • CDC란 ?ODS란 ?
• 왜 필요한가 ?
• 구성방안은 ?
• 활용방안은 ?
RAC(병렬서버) 란 ?
• 왜 필요한가 ?
• 구성방안은 ?
• 활용방안은 ?
CDC란 ?
• 왜 필요한가 ?
• 구성방안은 ?
• 활용방안은 ?
RT-EDW Infrastructure = ODS + RAC + CDC + row level locking + read consistency
RT-EDW Infrastructure = ODS + RAC + CDC + row level locking + read consistency read consistency read consistency
Necessary and Sufficient Conditions 아키텍쳐아키텍쳐 구성구성 방안방안 구성구성 및및 역할역할아키텍쳐아키텍쳐 구성구성 방안방안 : : ODS ODS 구성구성 및및 역할역할
구축방식-1 구축방식-2 (with ODS) 구축방식-3 (통합ODS를 통한 확장형 구조)
11
목적DB
업무계업무계
목적DB
업무계업무계
ODS업무계업무계
ODS업무계업무계
목적DB
목적DB
업무계업무계
업무계업무계
목적DB
목적DB
ODS
데이터마트 주제별 DW EDW(전사DW)
DB
목적DB
업무계업무계 ODS업무계업무계
DB
목적DB
업무계업무계
DB
목적DB
EDW 아키텍쳐 ODS의 역할
O li
업무정보
ODS 영역 DW영역 DM영역
EDW 아키텍쳐 ODS의 역할
Online Store: 최근 이슈화 되고 있는 실시간 처리를 위한 영역으로 활용Operational Store: 통합ODS를 구축함으로써, 운영데이터와분석데이터의 통합을 기반으로 확장 가능한 구조
OnlineStore
Operational DW Data
ETL
ET
ET
EAI정보
고객정보
발생/저장위주의 운영데이터 통합영역
분석데이터의 통합을 기반 확장 가능한 구고객ODS: 최신의 고객관련정보제공 및 CRM과 연계
ODS의 활용
Store
고객ODS
DWMartT
L
TL
EAI
채널정보
대외
발생/저장위주의 운영데이터 통합영역보다 상세수준의 데이터를 분석하고자 하는 현업 담당자들의요구사항에 대응DW변화관리를 효율적으로 대처할 수 있는 영역DW의 다차원모델로 충족되지 못한 정보의 보완실시간 데이터의 통합 (고객정보, 접촉정보, 로그정보 등)
ODSA대외
정보
실시간 데이터의 통합 ( 객정 , 접촉정 , 정 등)데이터 표준화 (이기종 시스템, 분산 시스템, 중복데이터, 항목, 데이터값)
Necessary and Sufficient Conditions 아키텍쳐아키텍쳐 구성구성 방안방안 별별 시스템시스템 구성구성 특징특징 비교비교아키텍쳐아키텍쳐 구성구성 방안방안 : : CaseCase별별 시스템시스템 구성구성 특징특징 비교비교11
[ [ CaseCase--1 ] Staging + DW(ER1 ] Staging + DW(ER모델모델l) l) [ [ CaseCase--2 ] Staging + DW(2 ] Staging + DW(다차원모델다차원모델) )
데이터소스
DW MartMart
Mart 데이터소스
DW
[ [ CaseCase--3 ] ODS + DW(SBT) 3 ] ODS + DW(SBT)
데이터소스
ODS DW MartMart
Mart
SAM필요에 따라이기종 MDB구축
SAM SAM 필요에 따라MDB구축
MartMart
Case-1 특징정규화된 ER모델로 구성
Mart
MartMart
Mart
MartMart
Mart
MartMart
Mart
Case-2 특징다차원모델의 집합
Case-3 특징ER 다차원모델로 구성정규화된 ER모델로 구성
운영계 구조와 흡사한 모델필요시 이기종 데이터마트 구축ODS는 없으며, 주로 SAM 처리방식분석위주 업무 수행
다차원모델의 집합분석주제별로 Big데이터마트 구축데이터 중복 발생 여지 있음ODS는 없으며, 필요시 Oracle DB사용분석위주 업무 수행
ER+다차원모델로 구성ODS는 staging+통합+운영데이터업무담당DW는 주제영역별 다차원모델로 구성OLTP+OLAP 수행 가능한 구조따라서, 운영+분석업무 수행
ER모델: Entity Relationship Diagram(정규화 모델)MDB: Multi-Dimensional DBMS (다차원DBMS)SBT: Subject Base Table (다차원 모델기반 주제테이블)
석위주 무 수행 따라서, 영 석 무 수행
Necessary and Sufficient Conditions 데이터베이스데이터베이스 서버서버 구성구성 방안방안 싱글싱글 데이터베이스데이터베이스 기반기반 병렬서버병렬서버 구성구성데이터베이스데이터베이스 서버서버 구성구성 방안방안 : : 싱글싱글 데이터베이스데이터베이스 기반기반 병렬서버병렬서버 구성구성22
EDW 시스템Data소스
ODS 영역 DW영역 DM영역
[ RT-EDW 를 고려한 서버+DB 구성 방안 ]
EDW 아키텍쳐 물리적 구성 (Single Database)
ODS서버
DW/DM서버ETL
EAI
ODS 영역 DW영역 DM영역업무정보
고객
OnlineStore
ETL
ETL
정보
채널정보
ODS DWDataMart
Si l D t b
① Single Database를 기반으로한 ETL 작업 최소화
EAI 서버 및 데이터의물리적 구성방안
은?대외정보
고객ODS
Staging/ODS
고객ODS DW Data
Mart
Single Database
① Single Database를 기반으로한 ETL 작업 최소화
② 각 서버별 역할분담 및 장애대비 구성 (장애대비 포함)
③ 데이터 중복 방지 및 개발 및 관리의 효율성 (Single Database)
Necessary and Sufficient Conditions 싱글싱글 데이터베이스를데이터베이스를 기반으로기반으로 한한 온라인온라인 분석업무분석업무 동시처리동시처리 구조구조 ((RAC R lRAC R l싱글싱글 데이터베이스를데이터베이스를 기반으로기반으로 한한 온라인온라인++분석업무분석업무 동시처리동시처리 구조구조 ((RAC: Real RAC: Real Application Cluster)Application Cluster)
22
기간 업무 영역 (기간계) 서버구성 솔루션
[ DW시스템 > 수집/온라인/분석업무 작업 분산 ]
RTE-DW 를 고려한 서버+DB 구성
Unix
Oracle온라인 업무위주 처리
분석 업무위주 처리
병렬서버를 사용하여
온라인과 분석업무 분산
11
22
로그를 통한변경분 추출/전송(EAI 사용)
[ DW시스템-> 수집/온라인/분석업무 작업 분산 ]
[ODS서버] [DW서버]
Staging/ODS데이터 수집/통합온라인데이터반영데이터 정제
고객/상품/실적 분석정형/비정형질의배치작업OLAP질의
Row레벨 Locking
일관성 보장
22
33
변경분 추출/전송 또는 배치
[ODS서버] [DW서버]
업무데이터
데이터 정제주기적ETL작업
OLAP질의
UNIX
기타 업무 영역 (지원시스템) 모든 서버(노드)는 각각Read/Write 가능
44
(Read/Write 가)능 (Read/Write 가능)
RAC(Real Application Cluster)
Oracle 데이터 공유기능을 통한추출/전송 자동화 기능
장애대비 시스템 구성55
로그를 통한변경분 추출/전송(DBMS CDC기능)
Staging 고객 Data
Single Database
장애대비 시스템 구성
( 24 * 365 체제) 변경분 추출/전송 또는 배치
Staging/ODS
고객ODS DW Data
Mart업무데이터
채널통합고객
Necessary and Sufficient Conditions RTRT EDWEDW를를 위한위한 업무요건업무요건 및및 요소기술요소기술
업무 요건
RTRT--EDWEDW를를 위한위한 업무요건업무요건 및및 요소기술요소기술
오라클 대응방안
33
온라인 TX 처리( Lock관리 및
수시 데이터 변경)
수시로 변경되는 업무요건에 따른 지연요소가 없어야 함여러세션 동시작업 발생에 따른 Lock 발생 처리해야 함Table 수준 Locking에 따른 업무지연 배제Dirty Read 사용 배제
OLTP 기능/성능이 검증된 DBMS
온라인/분석업무동시처리 성능
업무간섭 최소화 및 응답속도 보장해야 함즉, 대량데이터 일괄처리작업과, 응답속도를 보장해야하는 온라인 업무가 동일한 데이터베이스에서 실행
병렬DBMS(RAC)를 사용한동시처리 성능(응답시간 보장)
하는 온라인 업무가 동일한 데이터베이스에서 실행따라서, DB의 물리적/논리적 분할이 요구됨
업무분산 (업무간섭 최소화)
대용량 데이터 관리(파티션/보안)
과도한 Summary 테이블 생성 배제해당 영업점 데이터만 관리할 수 있는 기능해당 영업점 데이터만 질의되는 보안기능
파티션 테이블의 사용VPD(Virtual Private Database)-> 개별 레코드 및 컬럼 보안
데이터 동기화 기능(추출/전송 자동화)
수시로 변경되는 데이터를 실시간 반영해야 함소량 데이터의 지속적이 반영과 대량데이터의 주기적반영이 요구됨 (이에 따른 업무지연 배제)
다양한 동기화 기능(Streams, Materialized View,External Table, Replication,
변경된 데이터의 자동 추출/전송 기능이 요구됨 Transportable Tablespace)
Agenda
T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary
Oracle Data Warehouse Product Portfolio
I d t l di f d l bilitOracle DatabaseO l P titi iIndustry-leading performance and scalability Oracle PartitioningOracle Real Application Clusters
Deep integrated analytics Oracle OLAPOracle Data Miningg
Oracle Warehouse Builder (OWB)
Embedded data quality and integrationOracle Warehouse Builder (OWB)OWB Enterprise ETLOWB Data QualityOWB Connectors
“Best-of-breed database platform for Business Intelligence and Data Warehousing”Business Intelligence and Data Warehousing
파티션기능 추가
Oracle Database DW Function Roadmap New Features for BI/DW
Oracle 7.3O l 8 0
파티션기능 추가(List, Range+List)테이블압축 기능External Table 기능분석합수 추가
DW를 위한다양한 기능 반영됨
VLDB• Composite Range-Range• Composite List-Range• Composite List-List
SQL• SQL Pivot and Unpivot• Continuous Query Notification
OLAP
Partitioned Tables and IndexesPartition Pruning
Oracle 8.0
H h d C it P titi iOracle9iOracle8i
Change Data Capture기능ETL기능(확장 SQL 등)
자가관리 DB기능RAC기능향상CDC 기능향상분석함수 기능향상보안기능 향상
• Composite List-Hash• REF Partitioning• Virtual Column Partitioning• Compression enhancements
OLAP• Continued database integration
- Cube metadata in the Data Dictionary- Materialized view refresh and SQL rewrite
Fine grained data sec rit on c besPartition PruningParallel Index ScansParallel Insert, Update, DeleteParallel Bitmap Star QueryParallel ANALYZE
Hash and Composite PartitioningResource ManagerProgress MonitorAdaptive Parallel QueryServer-based Analytic Functions
Oracle9iList and Range-List PartitioningT bl C i Oracle10g
보안기능 향상. . . .
Performance• Query Result Cache
Data loading• Change data capture enhancements
- Fine-grained data security on cubes• Simplified application development
- Fully declarative cube calculations- Cost-Based Aggregation
Si l l l ti d fi itiParallel ANALYZEParallel Constraint EnablingServer Managed Backup/RecoveryPoint-in-Time Recovery
yMaterialized ViewsTransportable TablespacesDirect Loader APIFunctional IndexesPartition-wise Joins
Table CompressionBitmap Join IndexSelf-Tuning Runtime Memory New Analytic Functions
Oracle10gSelf-tuning SQL OptimizationSQL Access Advisor
• Materialized view refresh enhancementsManageability
• Partition Advisor• Interval Partitioning
SQL Pl M t
- Simpler calculation definitionsData Mining
• Simplified development and deployment of models- Supermodels: data preparation combined with Partition wise Joins
Security Enhancementsy
Grouping SetsExternal TablesMERGEMulti-Table Insert
SQL Access AdvisorAutomatic Storage ManagerSelf-tuning MemoryChange Data Capture
파티션기능(Range)병렬처리(DML)
• SQL Plan Management• Automatic SQL Tuning with Self-Learning Capabilities• Enhanced Optimizer Statistics Maintenance• Multi-Column Optimizer Statistics• ASM Fast Resync Fast VLDB Startup and other
mining model- Additional packaged predictive analytics - Integration in database dictionary
• New algorithms: “General Linear Models”Multi-Table InsertProactive Query GoverningSystem Managed Undo
SQL ModelsSQL Frequent ItemsetsSQL Partition Outer JoinsSt ti ti l f ti
파티션기능 추가(Hash, Composite)병렬처리 향상Materialized View기능분석합수 기능
• ASM Fast Resync, Fast VLDB Startup and other enhancements - Encapsulates several widely used analytic
methods- Multivariate linear regression; logistic regression
Statistical functionsand much more ...
분석합수 기능
Oracle DBMS DW Function Architecture
[ 데이터 변환 ] [ 구축/운영 ][데이터추출 및 적재]
Mainframe Unix
[ 데이터 변환 ]Merge(Upsert)
Multitable InsertTable Function
Parallel DDL/DML
[ 구축/운영 ]3rd Normal Form
Multi-Dimensional ModelMaterialized View
Partition table
[데이터추출 및 적재]SQL*Loader
Transportable TablespaceExternal table
Change Data Capture Parallel ProcessingAnalytical Function
Compress
StreamsMaterialized ViewOracle Gateway
GatewayStaging/ODS
TargetDWERP
[ ETL관리 ]: Oracle Warehouse Builder[ DB 관리 ]: Oracle Enterprise Manager
ODS DWTransformation
ERPSystem
[ 데이터 설계 ]Oracle Designer
orOther Case Tool
[ 데이터 설계 ]Oracle Designer
orOther Case Tool
[ 데이터 파티셔닝 ]Partition table
Partition Exchange LoadingCompressOther Case Tool Other Case Tool
Key Features for VLDB
파티션파티션 데이터데이터 요약요약 병렬병렬 데이터데이터
대용량 데이터의 처리
파티션테이블/인덱스
파티션테이블/인덱스
데이터압축
데이터압축
요약View요약View
병렬프로세싱
병렬프로세싱
데이터공유
데이터공유
• 다양한 분할기법• 디스크 장애 시 해당
Partition만 영향• 개별 Partition 단위의
• 블록내의 중복제거• 질의성능 향상• 스토리지 절약• 테이블 및 테이블스
• 질의성능향상 및 복제를 위한 기능
• 자주 쓰이는 유형의데이터 Set을 미리 수
• Parallel Query• Parallel Load (with
SQL*Loader Utility)• Parallel DDL, DML
• 변경데이터를 정보분석요구주기에 따라곧바로 적용할 수 있는 다양한
관리 기능(DML, Load, Import, Export, Exchange 등) 지원
• 사용자 질의시 해당되는 파티션만
페이스, 파티션레벨에서 압축 지정가능
• Materialized View도압축 가능
행 한 후 테이블에 저장
• Query Rewrite기능• 주기적인 요약정보갱신 가능
• Parallel Recovery• Parallel Analyze• Parallel Read from
External table• Parallel Propagation
CDC(Change Data Capture) 기능 제공
• SAM File을 곧바로DBMS의 테이블처럼인식하여 SQL을 적Access
• 로드 밸런싱
• 7*24 작업가능
(Replication)• Parallel-wise Join• Parallel Server (with
RAC)
인식하여 SQL을 적용할 수 있는 기능 제공
• 소스시스템의 상황에따라 적용할 수 있는다양한 ETL 기능 제공
Large-Scale Data Warehouse FeaturesFeature Usage
Compression
Parallel Exec
Partitioning
Read Only
VPD
MV Use
DB Res Mgr
RMAN
ASM
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Partitioning, parallelism, and compression are the foundation for large-scale data warehousing
Source: TB Club Report: A survey of 30 multi-TB Oracle DW’s – data July 2006
Embedded AnalyticsIn-Database Analysis
Oracle 10Oracle 10gg DBDB REGIONPRODUCT
Data Warehousing
ETL
질의 처리 및 보고Oracle BI SEBI Beans
TIME
다차원 정보 분석OLAP OptionSpreadsheet Add-In
OLAP
D t Mi i
Statistics
p
Data Mining
데이터 마이닝
ETL 처리Oracle Warehouse Builder
Oracle Data Mining OptionSpreadsheet Add-InStatisticsText Mining내장된 통계 기능
Oracle ETL Option내장된 통계 기능
Various Built-In Statistics Functions
What is Oracle Warehouse Builder?Data integration and data quality tool embedded within Oracle Database
Integrate data from disparate data sources• High performance (ELT & ETL architecture) optimized for Oracle Database• Extreme scalability with support for RAC• Declarative highly productive drag and drop design capabilities• Declarative, highly productive drag and drop design capabilities• ERP/CRM connectivity (EBS, Siebel, SAP and PeopleSoft)
Improve enterprise data quality• Name and Address cleansing• Fuzzy matching and merging• Data Profiling and data auditing• Business rule support in profiling and ETLBusiness rule support in profiling and ETL
Provide data modeling capabilities for Oracle• Relational (tables, views, MVs, UDT, etc.)• Dimensional (slowly changing dimenions, OLAP support, etc.)
Enterprise metadata management• End-to-end attribute level lineage and impact analysisEnd to end attribute level lineage and impact analysis• Extensible repository to hold any metadata
Oracle Warehouse Builder주요주요 특징특징 및및 구성구성
Oracle Warehouse Builder는 편리한 위저드 기능, 대화식 연결 기능, 영향 분석기, 메타데이터에 대한 신속한응답을 지원하는 변경 전파기 등이 포함되어 있어 전사적인 데이터 웨어하우스를 다양한 환경에서 구축할수 있게 합니다
Mapper Process Editor ExpertsData Modeller
수 있게 합니다.
Runtime AuditControl Center Repository Acc. Data Profiler
SchedulerDependenciesChange ManagerData Viewer
What is the Oracle OLAP Option? Embedded, manageable, enterpriseEmbedded, manageable, enterprise--readyready
A multidimensional calculation and aggregation ‘engine’• Multidimensional data types: Cubes and dimensions• An OLAP API for cube definition and multidimensional queries• A SQL interface to OLAP Cubes and dimensions• OLAP-based materialized views
Embedded in the Oracle Database• Runs within Oracle instance on same server• Runs within Oracle instance on same server • OLAP cubes are stored in Oracle data files• OLAP metadata in the Oracle Data Dictionary
All key database functionality extends to OLAP• Security: Object and data security• Scalability: Real Application Clustersy pp• Availability: Backup-Recovery, Disaster Recovery, RAC• Administration: Enterprise Manager
Oracle OLAP Option
Oracle OLAP 서비스는 단일 플랫폼 환경에서 관계형 데이터와 다차원 데이터를 저장할 수
다다차원차원 데이터데이터 분석분석
있는 통합 분석 환경을 구축할 수 있는 기반 환경을 제공
Oracle database와 Oracle OLAP 기술을 통합하여 더 진보된 분석 서비스를 제공
• Multidimensional Data Model의 복잡한 분석 질의를 지원
• Forecasting, Model, 시나리오 관리와 같은 Predictive 분석 기능을 지원
• 분석 질의를 위한 빠른 조회 응답시간을 보장
• 동시에 많은 분석 애플리케이션 사용자를 지원• 동시에 많은 분석 애플리케이션 사용자를 지원
• Multi-terabyte 분석시스템 지원
• 데이터가 Relational Table에 저장되어 있을 때, 고객은 SQL 기반 애플리케이션과 Oracle OLAP 애플리케이션 모두를 사용할 수 있다.
• Oracle Database의 사용자 인증, 승인, 데이터 접근 방법으로 분석 애플리케이션과 데이터웨어하우스를위한 통합된 보안모델 제공
• 데이터 웨어하우스와 Multidimensional Modeling의 통합이 분석을 위한 데이터 웨어하우스의 처리를더욱 능률적으로 해 준다.더욱 능률적으로 해 준다.
• Oracle Database의 고 가용성 기능들을 이용하면 Oracle OLAP에 의해 사용되는 데이터 웨어하우스를24x7x365 의 가용성 지원
What is Data Mining?
Data Mining• 대량의 데이터 안에서 숨겨진 패턴들과 새로운 통찰적 지식을
찾아가는 프로세스
Data Mining이 제공할 수 있는 가치
• 목표 속성과 밀접히 연관된 요인들의 파악 (Attribute Importance)• 고객 행위의 예측 (Classification)• 목표 고객 혹은 물품의 프로화일 구축
(Decision Trees)(Decision Trees)• 샘플 정보의 세그먼트화 (Clustering)• 대상체 내에 존재하는 중요한 관련성의 탐색 (Associations)• 사기 등과 같은 드문 사건의 파악 (Anomaly Detection)
What is the Oracle Data Mining Option? Embedded, manageable, enterpriseEmbedded, manageable, enterprise--readyready
A complete data-mining solution• 10+ data-mining algorithms: addresses every business scenario• Oracle Data Miner: Graphical user-interface for analysts• A Data Mining Java API for application developersA Data Mining Java API for application developers• A Data Mining PL/SQL API for database developers
Embedded in the Oracle DatabaseR ithi O l i t• Runs within Oracle instance on same server
• Data Mining algorithms execute directly on database tables• Data Mining models and metadata stored within Oracle database
All key database functionality extends to Data Mining• Scalability: Parallelism, Real Application Clusters• Security: Object and data securityy j y• Administration: Enterprise Manager• Portability: All major platforms
Oracle Data Mining
편리하게 사용할 수 있도록 향상된 사용자인터페이스 제공
Oracle inOracle in--Database Mining EngineDatabase Mining Engine
• 데이터 마이닝 모델의 구축, 평가 및 적용을 위한 GUI 제공(Wizards 방식, Mining 가이드 지원)
응용 개발을 위한 SQL & Java 코드 생성을 지원응용 개발을 위한 SQL & Java 코드 생성을 지원• 데이터 마이닝을 통해 얻은 지식을 다른 BI 도구 및
애플리케이션과 연계시켜 줌
O l i i l fOracle mining platform• PL/SQL API• Java API• Oracle Data Miner (GUI)• Spreadsheet Add-In
지원하는 알고리즘• Structured & unstructured data• Attribute importance• Classification, regression & prediction• Anomaly detection • Association rules • Clustering • Nonnegative matrix factorization • BLAST
Embedded Statistics & SQL AnalyticsIncluded in Oracle EE & SEIncluded in Oracle EE & SEIncluded in Oracle EE & SEIncluded in Oracle EE & SE
Agenda
T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemO l D t W h P d t P tf liOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary
ILM(Information Lifecycle Management)
시간에 따른 데이터 증가 및 사용빈도시간이 경과될수록 데이터는 축적되며
This Month This Year Previous Years
시간이 경과될수록 데이터는 축적되며증가함그러나, Active데이터에 대해 사용자가집중되며, Access가 많이 일어남현재 및 과거 데이터에 대한 관리 필요
Data Lifecycle
ArchiveHistoricalLess ActiveActive
필요 조건은 ?
DIGITAL DATA STORAGE
필요 조건은 ?라이프사이클별 데이터 분할데이터 분할에 따른 효율적인스토리지 사용 계획데이터베이스에서의 적용방안데이터 접근 제어 방안
High PerformanceStorage Tier
Low CostStorage Tier
HistoricalStorage Tier
ILM(Information Lifecycle Management)데이터데이터 분할기법을분할기법을 사용한사용한 테이블테이블++스토리지스토리지 관리관리
With P titi iWith P titi iWith t P titi iWith t P titi i With PartitioningWith Partitioning
Tablespace File Disk
Without PartitioningWithout Partitioning
TablespaceFileDisk
Table
분할기법을 사용한 테이블+스토리지 관리한 테이블을 시점별 분할분할데이터 Tablespace-File-Disk 관리원하는 시점의 데이터를 원하는 디스크에 관리
일반적인 테이블+스토리지 관리하나의 테이블은 하나의 테이블스페이스에 관리시점별 데이터 관리하지 못함원하는 디스크로 관리하지 못함
ILM(Information Lifecycle Management)
Data Lifecycle Oracle10g ILM 특징
Oracle10g ILM Oracle10g ILM 관리관리 ((예제예제) : ) : Management+Performance+Cost SavingManagement+Performance+Cost Saving
Data Lifecycle
HistoricalLess ActiveActive
Oracle10g ILM 특징하나의 테이블을 분할하여 관리분할영역별 데이터관리(접근/이동/변경)분할영역 단위 데이터압축Read only TBS 적용Read only TBS는 한번의 백업만 필요
매출 테이블
1996 / 10 ~ 2006 / 10
High PerformanceStorage Tier
Low CostStorage Tier
HistoricalStorage Tier
Read only TBS는 적은 메모리사용(속도향상 측면)사용자별/데이터별 접근제어(보안측면)
2005 / 12 2005 / 11 2005 / 102006 / 10 1996 / 12 1996 / 11 1996 / 10 시점별 데이터 분할
2005 / 12 2005 / 11 2005 / 102006 / 10
Read/Write 테이블스페이스
1996 / 12 1996 / 11 1996 / 10과거 데이터 압축
2005 / 12 2005 / 11 2005 / 102006 / 10
Read/Write 테이블스페이스
1996 / 12 1996 / 11 1996 / 10
“Read only” 테이블스페이스Read/Write 테이블스페이스
“ Read Only ”테이블스페이스 적용
“ 온라인백업 ” “ 주기적 배치백업 ” “ 한번의 백업 (Read only) ”
Agenda
T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemO l D t W h P d t P tf liOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary
Oracle Multi-Terabyte DW CustomersExamplesExamples
Acxiom 16 TB HP France Tele 65+ TB HPAcxiom 16 TB HPAllstate 20 TB Sun (RAC)Amazon 70 TB HP (RAC)AT&T 60 TB HP
France Tele 65+ TB HPKTF 20+ TB HPMastercard 40 TB IBM (RAC)NASDAQ 35 TB Sun
British Telecom 16 TB HPCellcom 12 TB HPCenturyTel 10 TB HP
NYSE Euronext 93 TB HP (RAC)Reliance Ltd 13 TB SunStarwood 12 TB HP
Chase Card 40 TB IBM (RAC)Choicepoint 14 TB SunCingular/AT&T 25 TB HPClaria 38 TB Sun
Sprint/Nextel 110 TB HPTelecom Italia 12 TB HP (RAC)Turkcell 23 TB Sun (RAC)UBS AG 15 TB SunClaria 38 TB Sun
Colgate-Palm 10 TB IBMExperian 14 TB Sun
UBS AG 15 TB SunUPS 10 TB HPYahoo! 250 TB Fujitsu
DW References(국내 – 사례분석)KK은행은행 -- 실시간실시간 고객분석고객분석 CRM DW : NCR WinCRM DW : NCR Win--back back 사례사례
K은행 CRM DW Reference 개요K은행 CRM DW Reference 개요
• 프로젝트 개요
- 제목 : 전사 통합 CRM 시스템 개발
주관사 : HP Consulting 사업부User LAN Gigabit
1ports
CRM DW CRM DW 시스템시스템 구성도구성도
- 주관사 : HP Consulting 사업부
- 기간 : 2005.7.1 – 12.31 (6 months)• 주요 목표
- 단일 뷰로 고객 정보 통합
DB # 2hp Superdome 32 Way1 2GHz
DB # 1hp Superdome 32Way 1 2GHz
DLM /Heartbeat
Gigabit 3ports APA
Backbone Switch
1ports
단일 뷰로 고객 정보 통합
- 기존 운영 CRM과 분석 CRM의유기적인 통합
- 분석 CRM의 신규 요구 조건을만족하는 모듈 추가
1.2GHz16 Processor / 32 Core64GB MemoryInt. Disk : 73GB x 8ea1000Base-SX x 6ea
32Way 1.2GHz16 Processor / 32 Core64GB MemoryInt. Disk : 73GB x 8ea1000Base-SX x 6ea HA
ClientSQL Plus
만족하는 모듈 추가개발(OLTP+OLAP). 신규 요구조건의 핵심은 본점 및 영업점에서공히 고객을 위한 최적 상품을설계하여 우수 고객을
1000Base SX x 6ea HA
2GB FC x 16ea 2GB FC x 16ea설계하여 우수 고객을분석/파악하고(OLAP) 즉시 캠페인을실행(OLTP)할 수 있는 체제를구축하는 것임
EMC DMX1000Usable 40TB
2GB FC x 16ea 2GB FC x 16ea
Oracle 10g R2 RACVersion 10.2.0.1
• 시스템 데이터 규모 : 35TB+
DW References(국내 – 사례분석)
Oracle Consulting 사업부 주관으로 전사 PI 프로젝트 및 실시간 조업 DW 구축
PP사사 –– 전사전사 ERPERP와와 연계한연계한 실시간실시간 EDW EDW 구축구축
전사 공통 핵심 업무영역 일반관리 전 부문으로 확대 MES 관련 업무영역
단계 PI 1기 PI 2기 MES2001.7 2003.02 현재
구구 매매
환경환경//에너지에너지
재무재무//자금자금
노노 무무
설비설비//투자투자
기기 술술
판판 매매 원가원가//수익성수익성
출자사출자사 인인 사사
생생 산산
물물 류류
품품 질질
출출 하하
ABMABM구축
내용
전사 공통 핵심 업무영역 일반관리 전 부문으로 확대 MES 관련 업무영역
P사 DW의 특징
부서별 상이한 지표명 산출기준 및 관리 차원을 통합
DW 활용 현황
Staff 부서 등 주 활용 인원의 61% 활용 ( 2.2 / 3.6 천명 ) 부서별 상이한 지표명, 산출기준 및 관리 차원을 통합
- MES부문: 1,154/1,532 종 (75% 통합/표준화)
동일한 기준에 의한 상호 비교 평가를 통해 업무의 상향 평
준화를 유도
- 활용 인원: 매월 평균 2,200명은 항시 사용 (주활
용 인원의 61%)
MES DW가동 시점(’05.1)부터 인당 활용횟수 증가: 인당
전 직원이 DW의 사용자 (19000명)
보증된 데이터를 기반으로 ABM(원가),SCP(계획),BSC(성
과) 정보의 자동 연결
26회
- Portal 활용실적: 주간단위 35명 (100회)
동시 접속자수: 60명 (MES기준), 향후 C/S전환시 110명
예상예상
DW References(국내 – 사례분석)
Oracle Consulting 사업부 주관 하에 전체 DW 프로젝트 진행
P j t 총괄 O l C lti 사업부 PMO SDS
SS사사 -- LCDLCD 실시간실시간 MES DWMES DW
• Project 총괄 : Oracle Consulting 사업부, PMO : SDS• 적용 솔루션
- Oracle Database RACOracle Wareho se B ilder- Oracle Warehouse Builder
- 실시간 CDD : Materialized View- Oracle Portal
구축효과: ODS를 통한 Shift 일 마감 시간 단축 및 생산실적 집계 표준화 구현구축효과: ODS를 통한 Shift,일 마감 시간 단축 및 생산실적 집계 표준화 구현
TOTO--BEBEASAS--ISIS
생산 생산분석 생산 ODS
시스템마감
WEB 표준일보 작성
30분
시스템마감
5분
WEB 표준일보 작성
부서/담당자 별 (Excel)일보 작성: 2시간 표준화된 일보 조회 및 OLAP 분석: 5분
DW References(국내 – 사례분석)KK통신통신 –– Infobank Infobank 고객고객//영업영업//마케팅마케팅 CRM DWCRM DW
구축 효과• 데이터 분석 인프라로서 사용자에게 일관적인 View 및 분석 기능 제공
• 일매출 데이터 제공 : 일단위 / 월단위 가매출 데이터 분석 정보 제공
• 가입자 중심의 전사적 통신멍 분석 데이터를 제공하여 가입자 통화 품질의 체계적인 관리 개선 및 가입자유치에 필요한 데이터 제공유치에 필요한 데이터 제공
• 초급 분석가들을 위한 정형화된 분석 기능 제공
• 현황 및 성과지표 제공 : 기간계 시스템에서 제공하기 어려운 통계성 리포트와 성과지표를 손쉽게 조회할수 있도록 정보 제공
구축 솔루션• 주관사 : 1차 IBM GBS,
2차 고도화 프로젝트 HP ConsultingH/W IBM P690
ⓘBada
Staging/ODS
Staging/ODS Layer
Data Warehouse Layer
Data Sour
ce
User Access
E
T
L
InfobankOLTP System
Data Warehouse
WISE
CReaM
MECA
ERP
SAS
P
O
R
T
A
L
ETL
Active
InfobankInfobank
Active
• H/W: IBM P690 • Database : Oracle 9i RAC• Data Size: 20TB+
SAS
기타
… L
SAN Switch
Oracle 9i RAC 2 Nodes
Staging/ODS L
Data Warehouse LayerInfobank
Storage
LayerStage/O
DS
DW일별/월별계약
일별부가서비스가입일별부가서비스가입통화통화
수미납수미납
일매출일매출
.….
고객고객청구청구CDKCDK
…..
대리점대리점
청구방법청구방법
재판매구분재판매구분
부가코드부가코드
BANBAN
요금종류요금종류
연령연령
업종업종일별해지분석
…..
월별
매출
월별청구
서비스매출
D 1 Batch
ETL
D-1 Batch
DW References(국외 – 사례분석)
Amazon.com의 EDW 시스템은 2005년35TB Clickstream DW Data를 25TB Query
61 TB production Query Data Warehouses• Amazon runs 2 identical 61 TB+ query DWs
Amazon.com - 최대 규모의 온라인 서점 EDW 시스템 구축
35TB Clickstream DW Data를 25TB Query DW로 통합
현재 Query DW의 데이터 크기는 61TB+ 로증가
Amazon runs 2 identical 61 TB+ query DWs loaded concurrently. Config for each is:
- 16 node RAC/Linux cluster- Oracle10gR1 RAC using ASM on Red Hat
Enterprise Linux 3증가
(Source: www.wintercorp.com)- 16 HP DL580, 4 CPU 3-GHz, 14GB RAM- 80 HP StorageWorks MSA1000- 8 32-port Brocade switches- 1 Gigabit interconnectDW Staging
16 TB production ETL/Staging Data Warehouse• Amazon runs 2 identical 10 TB+ ETL DWs
loaded concurrently. Config for each is:8 d RAC/Li l t
#Nodes x #cpus
16 x 4 8 x 4
Total DB 61 TB 10 TB- 8 node RAC/Linux cluster - Oracle10gR1 RAC using ASM on Red Hat
Enterprise Linux 3- 8 HP DL580, 4 CPU 3-GHz, 14 GB RAM- 36 HP StorageWorks MSA1000
Data 51 TB 7 TB
Index 2 TB 1-2 TB36 HP StorageWorks MSA1000
- 8 16-port Brocade switches- 1 Gigabit interconnect
• DW Metrics- Each is 16 TB total database size
Disk 71 TB 36 TB
- Each has only 1-2 TB index- 36 TB disk for each
DW References(국외 – 사례분석)
적용된 Oracle DW Key Features• RAC
Amazon.com - 최대 규모의 온라인 서점 EDW 시스템 구축
• RAC• ASM• Partitioning (incl. Partition-wise joins)• Parallel Operations (Query, DML)
Supply Supply ChainChain
Planning Planning AppsApps
Financial Financial AnalysisAnalysis
EDW 시스템 구조도
• MERGE• External Tables• Hash joins• Analytic functions
FulfillmeFulfillment Centersnt Centers
Analytic functions
24시간 데이터 적재 및 쿼리 작업 동시수행
C t l d d i (24 7 i )
Data Data WarehouseWarehouse
CustomersWeb Web
ServersServersPartnersPartners
• Concurrent loads and queries (24x7 queries)
80% 이상의 쿼리가 hit detail tables로 부터 발생• Detail queries originate from
PersonalizatioPersonalizationn
Campaign Campaign GeneratioGeneratio Email Email
Internal Internal End End
UsersUsers
- DSS Adhoc tool (proprietary)- Direct access SQL statements
• Primary detail data는 Order, Ships, Clickstream, Item dimensions을 포함하고 있음
Content Content ServersServers
nn ServersServers
DW References(국외 – 사례분석)
프로젝트 기간• 2000년 3월 ~ 2001년 10월 DW CRM system 구축
프로젝트 결과
• 매우 안정적인 명실상부한 대용량의 전사 EDW 시스템
France Telecom - 최대 규모의 통신 EDW 시스템 구축
2000년 3월 2001년 10월, DW, CRM system 구축
• 2002년 6월 ~ 2003년 2월, Phase 1 Migration Project, Extend CRM
프로젝트 내용• 4 개 부문의 현장 서비스를 하나의 시스템으로 통합
• 매우 안정적인 명실상부한 대용량의 전사 EDW 시스템구축
• Performance 기대 목표치 만족
- 모든 표준 온라인 CDR질의가 4초내 완성을 요구했고결과 시스템은 이 기준을 만족
• 고객에게 단일 관점의 View를 제공하기 위한 DW 시스템 구축
• Oracle 9i 적용
Consulting by OracleDW S t DW M d li T i DBA
결과 시스템은 이 기준을 만족
- 표준 질의는 날짜와 발신자번호 또는 수신자번호를지정
- 1800억CDR 이상의 데이터를 저장하고 있는데이터베이스에서 많은 동시 질의를 4초내로 처리
• DW System : DW Modeling, Tuning , DBA• CRM System : Business Consulting(Strategy,
Requirement Analysis, Implementation)저장 공간• Disk Size : 80 TB
- 분석가들과 파워유저들을 위한 비정형 즉석질의( ad hoc query) 지원
• 부정사용(fraud) 방지 용도로 성공적인 사용이 이루어짐
• Disk Size : 80 TB • DB Size : 65 TB• Raw Data Size : 25 TB • 65 TB production data warehouse - Statistics
- Largest table = 47 TB with 18 TB raw datag- 2nd largest table = 14 TB with 5.4 TB raw data- Average raw load/day 70 GB/day 180 GB
total 3 GB/hr avg -> 8 GB/hr total DB size growth/daySystem can load all 70 GB in 3 hr window- System can load all 70 GB in 3-hr window
23.3 GB/hr in 3-hr window
Agenda
T d ’ I f ti S tToday’s Information SystemNecessary and Sufficient Conditions for Information SystemO l D t W h P d t P tf liOracle Data Warehouse Product PortfolioOracle ILM for Cost Saving with Management+PerformanceOracle DW ReferencesSummary
Summary Why Oracle Database for Data Warehousing?Why Oracle Database for Data Warehousing?
Best-of-breed for data warehouses and data martsConsolidation platform• eliminates the costs and inefficiencies of multiple data stores
Complete, integrated ELT and data-quality capabilitiesUnmatched analytic capabilities• embedded OLAP, data-mining and statistics all accessible via SQL
Next-generation BI with integrated OLTP and DSSFoundation of Oracle Business Intelligence solutions