TURKISH ORACLE USER GROUP

27
24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya TURKISH ORACLE USER GROUP Gürcan ORHAN Turkcell Teknoloji Ar. Ge. A.Ş. Yazılım Mimarı ve Deneyimli Yazılım Mühendisi http:// gurcanorhan.wordpress.com

description

TURKISH ORACLE USER GROUP. Gürcan ORHAN. Turkcell Teknoloji Ar. Ge. A.Ş. Yazılım Mimarı ve Deneyimli Yazılım Mühendisi. http://gurcanorhan.wordpress.com. BEN KİMİM ?. Uludağ Üniversitesi Endüstri Mühendisliği 1992 - 2000. Aktif iş hayatı - 1994. İlk DWH projesi Altınyıldız DWH - 2003. - PowerPoint PPT Presentation

Transcript of TURKISH ORACLE USER GROUP

Page 1: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

TURKISH ORACLE USER GROUP

Gürcan ORHANTurkcell Teknoloji Ar. Ge. A.Ş.Yazılım Mimarı ve Deneyimli Yazılım Mühendisi

http://gurcanorhan.wordpress.com

Page 2: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

BEN KİMİM ?

Uludağ Üniversitesi Endüstri Mühendisliği 1992 - 2000

İlk DWH projesi Altınyıldız DWH - 2003

Önemli projeler ;

Aktif iş hayatı - 1994

AVEA DWH Yeniden Yapılandırma Projesi

Tekstilbank DWH ve Siebel CRM

Turkcell NODI (Network Operations Data Infrastructure)

2008’den itibaren Turkcell, 2010’dan itibaren Turkcell Teknoloji

Önemli sunumlar ;

Oracle Open World 2010 – San Francisco (22.10.2010)

UKOUG Technology & E-Business Suite Conference – Birmingham (29.11.2010)

ODTUG Kaleidoscope ’11 – Long Beach, California (28.06.2011)

Page 3: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

NE KULLANIRIM ?

Oracle

Microsoft SQL Server

Veri tabanı sistemleri

Sybase ASE

Sybase IQ

MySQL

Oracle Data Integrator

Oracle Warehouse Builder

ETL

Informatica Business Objects DI

Sybase Power Designer

CA ERWIN

Model Tasarım

Page 4: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH & OLTP farkı nedir?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

DWH & DM farkı nedir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

GÜNÜN AJANDASI

Page 5: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

DATAWAREHOUSE (DWH) NEDİR ?

DWH tarihi• EIS (Enterprise Information Systems)• DSS (Desicion Support Systems)• Data Warehousing and Business Intelligence (DWH / BI)

Bir veri ambarı; yönetim kararlarını destekleyici, konu yönelimli, entegre, uçucu olmayan ve zaman değişkenli veri kümesidir. (Bill Inmon)

Teknik Avantajları• Paralel kullanımı (Parallelism)• Veri Kümelemesi (Partitioning)• Veri Sıkıştırması (Compressing)

İş Zekası, verinin bilgiye dönüşümü işlemidir. (Gartner Group)

DATA

INFORMATION

KNOWLEDGE

DECISION

Page 6: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 7: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

DATAMART (DM) NEDİR ?

Datamartlar• Konu yönelimli• Tümleşik• Genellikle tek kaynak sistemden beslenir

ÖZELİK DATA WAREHOUSE DATAMART

İçerik Kurumsal Departmansal

Konu Çok Tek özne, iş birimi odaklı

Veri Kaynağı Çoğul Tekil

Implementasyon Ay – Yıl Ay

Bağımlı veya bağımsız olabilirler.• Bağımlı DM : DWH’tan beslenen, kolay ETL, kurumsal planın parçası• Bağımsız DM : Ayrık, operasyonel maliyeti yüksek, harici veri

kaynaklarından beslenen, analitik ihtiyaçlara yönelik hazırlanan

Page 8: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 9: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

DWH & OLTP

ÖZELİK OPERASYONEL SİSTEM DATA WAREHOUSE

Yanıt Süresi Milisaniye / Saniye Saniye / Saat

Operasyon DML (Data Manipulation Language)

Öncelikli olarak salt-okunur

Veri doğası 30 – 60 gün Zamansal enstantane

Veri Organizasyonu Uygulama Öznel, zamansal

Veri Miktarı Küçük / Büyük Büyük / Çok Büyük

Veri Kaynağı Operasyonel, Dahili Operasyonel, Dahili, Harici

Aktiviteler Proses bazlı Analiz Bazlı

Page 10: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 11: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

DATAWAREHOUSE BİLEŞENLERİ

OPERASYONEL KAYITLAR

ARŞİV KAYITLARIDOSYALAR

OPERATIONAL DATA STORE

(ODS)DWH DM

METADATA REPOSITORY

KAYNAKSİSTEMLER

STAGINGKATMAN

KURUMSALKATMAN

SUNUMKATMANI

DWH Yazılım Yaklaşımları• Bing Bang Yaklaşımı• Artımsal Yaklaşım

• Yukarıdan aşağıya artımsal (top-down incremental)• Aşağıdan yukarıya artımsal (bottom-up incremental)

Page 12: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 13: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

ETL NE DEMEKTİR?

E-T-L (Extract – Transform – Load)

Extraction• Farklı kaynak sistemden, veri tabanından farklı formatlarla elde edilir.• Kaynak sistemlerrin canlı, arşiv, dahili ve harici verilerine erişebilir.

Transform• Veri hataları düzeltilir.• Genellikle staging area (remote/on site) kullanılır• Veri entegrasyonu sağlanır• İş kuralları verilere uygulanarak veri doğrulaması gerçekleştirilir• Veriler onaylanır• Verilere zaman entegre edilir.

Load• Elde edilen temizlenmiş veri DWH ortamına yazılır

Page 14: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 15: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

ETL ÇEŞİTLERİ

Incremental Update

• Kaynak sistemden elde edilen birincil anahtarlar (Primary Key) yardımı ile «yeni geleni ekle, mevcut olanı güncelle» yaklaşımı.

• Change Data Capture (CDC)

Slowly Changing Dimensions (SCD)

Truncate & Load

• Kaynak sistemden elde edilen verilerin tümünün silinerek yeniden yapılandırılması.

• Kaynak sistemden elde edilen veriler tarihsel olarak saklanarak hiçbir veri silinmez. Tarihsel yaklaşım.

Page 16: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

ETL PROBLEMLERİ

• Kaynak sistemdeki tablonun unusable olması

• Kaynak sistemdeki dosyaya erişilememe

• Yetersiz metadata

• Zayıf veya yetersiz analiz süreci

• Yetersiz yer (storage) planlama

• Kaynak sistemde yapısal değişiklikler

• Yetersiz veri validasyonu

• Hatalı mantıksal / fiziksel model dizaynı

• Veri tipi uyumsuzlukları

Page 17: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 18: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

MODELLEME

İş modelinin oluşturulması (Business Model)• Strateji analizinin yapılması• İş birimi tanımlarının ve kurallarının belirlenmesi• İş ihtiyaçlarının belirlenmesi

Mantıksal modelin oluşturulması (Logical Model)• İlişki ve ilişki tiplerinin belirlenmesi• Fact ve Dimension’ların tespit edilmesi• Sonuçların mantıksal olarak üretilerek konu alanlarının tespit edilmesi• Nesnelerin isim ve renk standartlarının belirlenmesi

Fiziksel modelin oluşturulması (Physical Model)• Donanım ihtiyaçlarının tespit edilmesi• Tablo ve index için disk kapasitesi ihtiyacının belirlenmesi• Partition stratejisinin belirlenmesi• Güvenlik stratejisinin belirlenmesi

Page 19: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

MODELLEME

Third Normal Form (3NF)

Page 20: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

MODELLEME

Star Schema

Page 21: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

MODELLEME

Snowflake Schema

Page 22: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 23: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

VERİ KALİTESİ NEDİR?

• Beklenen veri, beklenen yerde, beklenen şekilde bulunmaz ise veri kalitesi problemi ortaya çıkar.

• Farklı anlama gelen data

• Eksik bilgi, verinin farklı alanda olması

• Veri tipi farklılığı

• Veri boyutu farklılığı

• Veri doğrulama kurallarının olmaması

• Drill-Down olmaması

• İlişkisel bütünlüğün olmaması, öksüz kayıtların varlığı

• Veri duplikasyonu

Page 24: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

Veri Ambarı nedir, ne demektir?

Veri Kalitesi nedir, nasıl sağlanır?

DWH bileşenleri nelerdir?

ETL ne demektir?

ETL tipleri nelerdir?

Modelleme nedir, nasıl yapılmalıdır?

Veri Tabanı fiziksel yaklaşımları nelerdir?

DWH & OLTP farkı nedir?

DWH & DM farkı nedir?

GÜNÜN AJANDASI

Page 25: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

FİZİKSEL ORTAM

Fact tablo karakteristikleri• İş birimlerinin kullanacağı nümerik metrik değerleri içerir• Büyük miktarda veri içerir• Çabuk büyür, çok hızlı genişler• Stabil, Türetilmiş veya Özetlenmiş veri içerir• Genellikle ekleme yapılır• Genellikle dimension tablolarla foreign key ile ilişkilidir

Dimension tablo karakteristikleri• İş birimlerinin görmek istedikleri metin tipteki veriyi içerirler• Genellikle statik veri içerirler• Boyutları küçüktür• Truncate Load mekanizmasına uygundur

Slowly Changing Dimensions tablo karakteristikleri• Genellikle link tablolarıdır (Fact – Dimension linki)• Fact üzerindeki dimension’ın tarihçe bilgilerini tutarlar

Page 26: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

FİZİKSEL ORTAM

Partitioning• Range Partition• Hash Partition• List Partition• Index Partition• Composite Partition

Indexing• B-Tree Index• Bitmap Index• Function Based Index• Partitioned Index

Star • Genellikle link tablolarıdır (Fact – Dimension linki)• Fact üzerindeki dimension’ın tarihçe bilgilerini tutarlar

Materialized View• Fiziksel yer kaplayan, istendiği zaman refresh edilebilen view yapısı

Page 27: TURKISH  ORACLE USER GROUP

24.03.2011 – Gürcan Orhan @ Bilişim & Teknoloji Şöleni - Sakarya

TEŞEKKÜRLER

Gürcan ORHANhttp://gurcanorhan.wordpress.com