De 910HF3 DataExplorer Guide Ja

88
Informatica Data Explorer (参照項目 9.1.0 HotFix 3) ユーザーガイド

description

910HF3 DataExplorer Guide Ja

Transcript of De 910HF3 DataExplorer Guide Ja

Page 1: De 910HF3 DataExplorer Guide Ja

Informatica Data Explorer(参照項目 9.1.0 HotFix 3)

ユーザーガイド

Page 2: De 910HF3 DataExplorer Guide Ja

Informatica Data Explorer ユーザーガイド

参照項目 9.1.0 HotFix 312月 2011

著作権 1998-2011 Informatica. すべての権利を保留する.

本ソフトウェアおよびマニュアルには、Informatica Corporationの所有権下にある情報が収められています。これらは使用および開示の制限等を定めた使用許諾契約のもとに提供され、著作権法により保護されています。本ソフトウェアのリバースエンジニアリングは禁じられています。本マニュアルのいかなる部分も、いかなる手段(電子的複写、写真複写、録音など)によっても、Informatica Corporation の事前の承諾なしに複製または転載することは禁じられています。このソフトウェアは、米国および/または国際的な特許、およびその他の出願中の特許によって保護されています。

合衆国政府によるソフトウェアの使用、複製または開示は、DFARS 227.7202-1(a)および227.7702-3(a)(1995年)、DFARS252.227-7013(C)(1)(ii)(1988年10月)、FAR 12.212(a)(1995年)、FAR 52.227-19、またはFAR 52.227-14(ALT III)に記載されているとおりに、当該ソフトウェア使用許諾契約に定められた制限によって規制されます。

本製品または本書の情報は、予告なしに変更されることがあります。お客様が本製品または本書内に問題を発見された場合は、書面にて当社までお知らせください。

Informatica、Informatica Platform、Informatica Data Services、PowerCenter、PowerCenterRT、PowerCenter Connect、PowerCenterData Analyzer、PowerExchange、PowerMart、Metadata Manager、Informatica Data Quality、Informatica Data Explorer、InformaticaB2B Data Transformation、Informatica B2B Data Exchange、Informatica On Demand、Informatica Identity Resolution、InformaticaApplication Information Lifecycle Management、Informatica Complex Event Processing、Ultra Messaging、およびInformatica MasterData Managementは、Informatica Corporationの米国および世界中の管轄地での商標または登録商標です。その他のすべての企業名および製品名は、それぞれの企業の商標または登録商標です。

本ソフトウェアまたはドキュメントの一部は、次のサードパーティが有する著作権に従います(ただし、これらに限定されません)。Copyright DataDirect Technologies.All Rights Reserved.Copyright © Sun Microsystems.All Rights Reserved.Copyright © RSASecurity Inc. All Rights Reserved.Copyright © Ordinal Technology Corp. All rights reserved. Copyright © Aandacht c.v. Allrights reserved. Copyright Genivia, Inc. All rights reserved. Copyright Isomorphic Software. All Rights Reserved.Copyright ©

Meta Integration Technology, Inc. All rights reserved. Copyright © Intalio. All Rights Reserved.Copyright © Oracle. AllRights Reserved.Copyright © Adobe Systems Incorporated. All Rights Reserved.Copyright © DataArt, Inc. All rights reserved.Copyright © ComponentSource. All Rights Reserved.Copyright © Microsoft Corporation. All Rights Reserved.Copyright (C) RogueWave Software, Inc. All rights reserved. Copyright © Teradata Corporation. All Rights Reserved.Copyright © Yahoo! Inc. Allrights reserved. Copyright © Glyph & Cog, LLC. All Rights Reserved.Copyright (C) Thinkmap, Inc. All rights reserved. Copyright(C) Clearpace Software Limited. All Rights Reserved.Copyright (C) Information Builders, Inc. All rights reserved. Copyright(C) OSS Nokalva, Inc. All rights reserved. Copyright Edifecs, Inc. All rights reserved. Copyright Cleo Communications, Inc.All rights reserved.Copyright © International Organization for Standardization 1986. All Rights Reserved.Copyright © ej-technologies GmbH . All Rights Reserved.Copyright © Jaspersoft Corporation. All Rights Reserved.

本製品には、Apache Software Foundation(http://www.apache.org/)によって開発されたソフトウェア、およびApache License, Version2.0(「ライセンス」)の下に許諾されたその他のソフトウェアが含まれています。ライセンスのコピーはhttp://www.apache.org/licenses/LICENSE-2.0から入手することができます。適用法にて要求されないか書面にて合意されない限り、ライセンスの下に配布されるソフトウェアは「現状のまま」で配布され、明示的あるいは黙示的かを問わず、いかなる種類の保証も行われません。ライセンス下での許諾および制限を定める具体的文言については、ライセンスを参照してください。

本製品には、Mozilla(http://www.mozilla.org/)によって開発されたソフトウェア、ソフトウェアcopyright The JBoss Group, LLC, allrights reserved、ソフトウェアcopyright, Red Hat Middleware, LLC, all rights reserved、Copyright © 1999-2006 by Bruno Lowagieand Paulo SoaresおよびGNU Lesser General Public License Agreement(http://www.gnu.org/licenses/lgpl.htmlを参照)に基づいて許諾されたその他のソフトウェアが含まれています。資料は、Informaticaが無料で提供しており、一切の保証を伴わない「現状渡し」で提供されるものとし、Informatica Corporationは市場性および特定の目的の適合性の黙示の保証などを含めて、一切の明示的及び黙示的保証の責任を負いません。

>製品には、ワシントン大学、カリフォルニア大学アーバイン校、およびバンダービルト大学のDouglas C.Schmidtおよび同氏のリサーチグループが著作権を持つACE(TM)およびTAO(TM)ソフトウェアが含まれています。Copyright © 1993-2006, all rights reserved.

本製品には、OpenSSL Toolkitを使用するためにOpenSSL Projectが開発したソフトウェア(copyright The OpenSSL Project.All RightsReserved)が含まれています。また、このソフトウェアの再配布は、http://www.openssl.orgおよびhttp://www.openssl.org/source/license.htmlにある使用条件に従います。

本ソフトウェアには、CurlソフトウェアCopyright 1996-2007, Daniel Stenberg, <[email protected]>が含まれます。All Rights Reserved.本ソフトウェアに関する許諾および制限は、http://curl.haxx.se/docs/copyright.htmlにある使用条件に従います。すべてのコピーに上記の著作権情報とこの許諾情報が記載されている場合、目的に応じて、本ソフトウェアの使用、コピー、変更、ならびに配布が有償または無償で許可されます。

本製品には、ソフトウェアcopyright 2001-2005 (C) MetaStuff, Ltd. All Rights Reserved.が含まれます。本ソフトウェアに関する許諾および制限は、http://www.dom4j.org/license.htmlにある使用条件に従います。

製品には、ソフトウェアcopyright (C) 2004-2007, The Dojo Foundationが含まれます。All Rights Reserved.本ソフトウェアに関する許諾および制限は、http://dojotoolkit.org/licenseにある使用条件に従います。

本製品には、ICUソフトウェアcopyright International Business Machines Corporationおよび他のソフトウェアが含まれます。All RightsReserved.本ソフトウェアに関する許諾および制限は、http://source.icu-project.org/repos/icu/icu/trunk/license.htmlにある使用条件に従います。

本製品には、ソフトウェアcopyright © 1996-2006 Per Bothnerが含まれます。All Rights Reserved.お客様がこのようなソフトウェアを使用するための権利は、ライセンスで規定されています。http://www.gnu.org/software/kawa/Software-License.htmlを参照してください。

本製品には、OSSP UUIDソフトウェアCopyright (C) 2002 Ralf S. Engelschall, Copyright (C) 2002 The OSSP Project Copyright (C)2002 Cable & Wireless Deutschlandが含まれます。本ソフトウェアに関する許諾および制限は、http://www.opensource.org/licenses/mit-license.phpにある使用条件に従います。

Page 3: De 910HF3 DataExplorer Guide Ja

本製品には、Boost(http://www.boost.org/)によって開発されたソフトウェアまたはBoostソフトウェアライセンスの下で開発されたソフトウェアが含まれています。本ソフトウェアに関する許諾および制限は、http://www.boost.org/LICENSE_1_0.txtにある使用条件に従います。

本製品には、ソフトウェアcopyright © 1997-2007 University of Cambridgeが含まれます。本ソフトウェアに関する許諾および制限は、http://www.pcre.org/license.txtにある使用条件に従います。

本製品には、ソフトウェアcopyright (C) 2007 The Eclipse Foundationが含まれます。All Rights Reserved.本ソフトウェアに関する許諾および制限は、http://www.eclipse.org/org/documents/epl-v10.phpにある使用条件に従います。

本製品には、http://www.tcl.tk/software/tcltk/license.html、http://www.bosrup.com/web/overlib/?License、http://www.stlport.org/doc/license.html、http://www.asm.ow2.org/license.html、http://www.cryptix.org/LICENSE.TXT、http://hsqldb.org/web/hsqlLicense.html、http://httpunit.sourceforge.net/doc/license.html、http://jung.sourceforge.net/license.txt、http://www.gzip.org/zlib/zlib_license.html、http://www.openldap.org/software/release/license.html、http://www.libssh2.org、http://slf4j.org/license.html、http://www.sente.ch/software/OpenSourceLicense.html、http://fusesource.com/downloads/license-agreements/fuse-message-broker-v-5-3-license-agreement、http://antlr.org/license.html、http://aopalliance.sourceforge.net/、http://www.bouncycastle.org/licence.html、http://www.jgraph.com/jgraphdownload.html、http://www.jcraft.com/jsch/LICENSE.txt、http://jotm.objectweb.org/bsd_license.html、http://www.w3.org/Consortium/Legal/2002/copyright-software-20021231、http://www.slf4j.org/license.html、http://developer.apple.com/library/mac/#samplecode/HelpHook/Listings/HelpHook_java.html、http://www.jcraft.com/jsch/LICENSE.txt、http://nanoxml.sourceforge.net/orig/copyright.html、http://www.json.org/license.html、http://forge.ow2.org/projects/javaservice/、http://www.postgresql.org/about/licence.html、http://www.sqlite.org/copyright.html、http://www.tcl.tk/software/tcltk/license.html、http://www.jaxen.org/faq.html、http://www.jdom.org/docs/faq.html、およびhttp://www.slf4j.org/license.htmlの条項の下に許諾されたソフトウェアが含まれています。

本製品には、Academic Free License(http://www.opensource.org/licenses/afl-3.0.php)、Common Development Distribution License(http://www.opensource.org/licenses/cddl1.php)、Common Public License(http://www.opensource.org/licenses/cpl1.0.php)、SunBinary Code License Agreement Supplemental License Terms、BSD License(http://www.opensource.org/licenses/bsd-license.php)、MIT License(http://www.opensource.org/licenses/mit-license.php)、およびArtistic License(http://www.opensource.org/licenses/artistic-license-1.0)に基づいて許諾されたソフトウェアが含まれています。

本製品には、ソフトウェアcopyright © 2003-2006 Joe WaInes, 2006-2007 XStream Committersが含まれています。All Rights Reserved.本ソフトウェアに関する許諾および制限は、http://j.org/license.htmlにある使用条件に従います。本製品には、Indiana UniversityExtreme! Labによって開発されたソフトウェアが含まれています。詳細については、http://www.extreme.indiana.edu/を参照してください。

本ソフトウェアは、米国の特許番号5,794,246、6,014,670、6,016,501、6,029,178、6,032,158、6,035,307、6,044,374、6,092,086、6,208,990、6,339,775、6,640,226、6,789,096、6,820,077、6,823,373、6,850,947、6,895,471、7,117,215、7,162,643、7,254,590、7,281,001、7,421,458、7,496,588、7,523,121、7,584,422、7,720,842、7,721,270、および7,774,791、および国際的な特許、ならびにその他の出願中の特許によって保護されています。

免責: 本文書は、一切の保証を伴わない「現状渡し」で提供されるものとし、Informatica Corporationは他社の権利の非侵害、市場性および特定の目的への適合性の黙示の保証などを含めて、一切の明示的および黙示的保証の責任を負いません。Informatica Corporationでは、本ソフトウェアまたはドキュメントに誤りのないことを保証していません。本ソフトウェアまたはドキュメントに記載されている情報には、技術的に不正確な記述や誤植が含まれる場合があります。本ソフトウェアまたはドキュメントの情報は、予告なしに変更されることがあります。

特記事項

このInformatica製品(以下「ソフトウェア」)には、Progress Software Corporation(以下「DataDirect」)の事業子会社であるDataDirect Technologiesからの特定のドライバ(以下「DataDirectドライバ」)が含まれています。DataDirectドライバには、次の用語および条件が適用されます。

1.DataDirectドライバは、特定物として現存するままの状態で提供され、商品性の保証、特定目的適合性の保証および法律上の瑕疵担保

責任を含むすべての明示もしくは黙示の保証責任を負わないものとします。国または地域によっては、法律の強行規定により、保証責任

の制限が禁じられる場合、強行規定の制限を受けるものとします。

2.DataDirectまたは第三者は、予見の有無を問わず発生したODBCドライバの使用に関するいかなる直接的、間接的、偶発的、特別、ある

いは結果的損害に対して責任を負わないものとします。本制限事項は、すべての訴訟原因に適用されます。訴訟原因には、契約違反、保

証違反、過失、厳格責任、詐称、その他の不法行為を含みますが、これらに限るものではありません。

Part Number: IN-PRG-91000-HF3-0001

Page 4: De 910HF3 DataExplorer Guide Ja

目次

序文............................................... v

Informaticaのリソース. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Informaticaカスタマポータル. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Informaticaのマニュアル. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

InformaticaのWebサイト. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

Informatica How-To Library. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi

Informatica Knowledge Base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi

Informatica Multimedia Knowledge Base. . . . . . . . . . . . . . . . . . . . . vi

Informaticaグローバルカスタマサポート. . . . . . . . . . . . . . . . . . . . . . vi

第 I 部 : Informatica Data Explorerの概要......... 1

第 1 章 : Informatica Data Explorerの概要......... 2

Data Explorerの概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

Informatica Data Explorerのアーキテクチャ. . . . . . . . . . . . . . . . . . . . . . 3

データ検出プロセス. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

第 2 章 : データ検出............................... 7

データ検出の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

データプロファイルと分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

プロファイリングのコンポーネント. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

プロファイル結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

第 3 章 : カラムプロファイルの概念................ 11

カラムプロファイルの概念の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

カラムプロファイルオプション. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

ルール. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

スコアカード. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

第 II 部 : Informatica Analystを使用したデータ検出................................................ 13

第 4 章 : Informatica Analystのカラムプロファイル................................................ 14

Informatica Analystのカラムプロファイルの概要. . . . . . . . . . . . . . . . . . . 14

カラムプロファイリングプロセス. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

目次 i

Page 5: De 910HF3 DataExplorer Guide Ja

プロファイルオプション. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

プロファイル結果のオプション. . . . . . . . . . . . . . . . . . . . . . . . . 16

サンプリングのオプション. . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

ドリルダウンのオプション. . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Analystツールでのカラムプロファイルの作成. . . . . . . . . . . . . . . . . . . . . . 17

プロファイルの実行. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

フラットファイルデータオブジェクトの同期. . . . . . . . . . . . . . . . . . . . . . . 19

リレーショナルデータオブジェクトの同期. . . . . . . . . . . . . . . . . . . . . . . . 19

第 5 章 : Informatica Analystのカラムプロファイル結果............................................ 21

Informatica Analystのカラムプロファイル結果の概要. . . . . . . . . . . . . . . . 21

プロファイルのまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

カラムの値. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

カラムパターン. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

カラム統計. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

カラムプロファイルのドリルダウン. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

行データのドリルダウン. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

ドリルダウンデータへのフィルタの適用. . . . . . . . . . . . . . . . . . . . 26

Informatica Analystのプロファイルのエクスポートファイル. . . . . . . . . . . . 27

プロファイルのエクスポート結果のスプレッドシート. . . . . . . . . . . 27

Informatica Analystからのプロファイル結果のエクスポート. . . . . . 28

第 6 章 : Informatica Analystのルール............ 29

Informatica Analystのルールの概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

定義済みルール. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

定義済みルールのプロセス. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

定義済みルールの適用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

式ルール. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

式ルールのプロセス. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

式ルールの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

第 7 章 : Informatica Analystのスコアカード...... 34

Informatica Analystのスコアカードの概要. . . . . . . . . . . . . . . . . . . . . . . 34

Informatica Analystのスコアカードのプロセス. . . . . . . . . . . . . . . . . . . . 35

スコアカードへのカラムの追加. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

スコアカードの実行. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

スコアカードの表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

スコアカードの編集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

しきい値の定義. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

ii 目次

Page 6: De 910HF3 DataExplorer Guide Ja

スコアグループ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

グループの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

グループへのスコアの移動. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

グループの編集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

グループの削除. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

カラムのドリルダウン. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

傾向グラフの表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

第 III 部 : Informatica Developerを使用したデータ検出............................................ 42

第 8 章 : Informatica Developerのプロファイル................................................ 43

Informatica Developerのプロファイルの概要. . . . . . . . . . . . . . . . . . . . . . 43

Informatica Developerのプロファイルのビュー. . . . . . . . . . . . . . . . . . . . 44

第 9 章 : データオブジェクトプロファイル.......... 46

データオブジェクトプロファイルの概要. . . . . . . . . . . . . . . . . . . . . . . . . . 46

Informatica Developerのカラムプロファイル. . . . . . . . . . . . . . . . . . . . . . 47

フィルタリングオプション. . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

サンプリングのプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

プライマリキー検出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

プライマリキー推測のプロパティ. . . . . . . . . . . . . . . . . . . . . . . . 49

推測されるプライマリキーのプロパティ. . . . . . . . . . . . . . . . . . . . 49

キー違反のプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

機能依存性検出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

機能依存性推測のプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . 51

推測される機能依存性のプロパティ. . . . . . . . . . . . . . . . . . . . . . . 51

機能依存性違反のプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . 52

単一のデータオブジェクトプロファイルの作成. . . . . . . . . . . . . . . . . . . . . 52

複数のデータオブジェクトプロファイルの作成. . . . . . . . . . . . . . . . . . . . . 53

フラットファイルデータオブジェクトの同期. . . . . . . . . . . . . . . . . . . . . . . 54

リレーショナルデータオブジェクトの同期. . . . . . . . . . . . . . . . . . . . . . . . 54

第 10 章 : Informatica Developerのカラムプロファイル結果.......................................... 55

Informatica Developerのカラムプロファイル結果. . . . . . . . . . . . . . . . . . . 55

カラム値のプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

カラムパターンのプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

カラム統計のプロパティ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

Informatica Developerからのプロファイル結果のエクスポート. . . . . . . . . . 58

目次 iii

Page 7: De 910HF3 DataExplorer Guide Ja

第 11 章 : Informatica Developerのルール......... 59

Informatica Developerのルールの概要. . . . . . . . . . . . . . . . . . . . . . . . . . 59

Informatica Developerでのルールの作成. . . . . . . . . . . . . . . . . . . . . . . . . 60

Informatica Developerでのルールの適用. . . . . . . . . . . . . . . . . . . . . . . . . 60

第 12 章 : Informatica Developerのスコアカード................................................ 61

Informatica Developerのスコアカードの概要. . . . . . . . . . . . . . . . . . . . . . 61

スコアカードの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

第 13 章 : マプレットとマッピングのプロファイリング................................................ 63

マプレットとマッピングのプロファイリングの概要. . . . . . . . . . . . . . . . . . 63

マプレットまたはマッピングオブジェクトのプロファイリング. . . . . . . . . . . 64

マッピングまたはマプレットオブジェクトのプロファイルの比較. . . . . . . . . . 64

プロファイルからのマッピングの生成. . . . . . . . . . . . . . . . . . . . . . . . . . . 65

第 14 章 : プロファイルモデル..................... 66

プロファイルモデルの概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

プロファイルモデルの作成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

外部キー検出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

オブジェクトの親子関係の定義. . . . . . . . . . . . . . . . . . . . . . . . . 68

データオブジェクト間の外部キー関係の検出. . . . . . . . . . . . . . . . . 68

外部キー分析結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

結合分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

結合プロファイルの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

結合分析結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

結合プロファイル結果のファイルへのエクスポート. . . . . . . . . . . . 71

重複検出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

重複検出の結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

重複データの検出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

付録 A : 用語解説................................. 74

索引.............................................. 76

iv 目次

Page 8: De 910HF3 DataExplorer Guide Ja

序文

『Informatica Data Explorerガイド』は、Informatica AnalystおよびInformatica

Developerのユーザーを対象としています。 このガイドでは、プロファイルを使用してデ

ータの内容および構造を分析する方法について説明しています。

プロファイルを使用して、データセットのデータ品質に関する問題を検出したり、1つ以上

のデータセットのカラムの関係を把握したりします。

Informaticaのリソース

Informaticaカスタマポータル

Informaticaのユーザーとして、Informaticaカスタマポータルサイト

(http://mysupport.informatica.com)にアクセスできます。このサイトには、製品情

報、ユーザーグループ情報、ニュースレター、Informaticaカスタマサポート事例管理シス

テム(ATLAS)へのアクセス、Informatica How-To Library、Informatica Knowledge

Base、Informatica Product Documentation、Informaticaユーザーグループコミュニティ

へのアクセスが含まれています。

Informaticaのマニュアル

Informaticaのマニュアルチームは、正確で役に立つマニュアルの作成に努めています。こ

のマニュアルに関する質問、コメント、ご意見の電子メールの送付先は、Informaticaマニ

ュアルチーム([email protected])です。 お客様のフィードバック

は、マニュアルの改良に利用させていただきます。コメントに返信をご希望のお客様は、

その旨をお知らせください。

マニュアルチームは、必要に応じてマニュアルを更新します。製品の最新のマニュアルを

入手するには、http://mysupport.informatica.comから製品マニュアルにアクセスしま

す。

InformaticaのWebサイト

Informatica社のWebサイトは、http://www.informatica.comからアクセスできます。この

サイトでは、Informatica社の概要と沿革、今後のイベント、営業拠点などの情報を提供し

ています。また、製品情報やパートナー情報もあります。サービス関連のページには、テ

v

Page 9: De 910HF3 DataExplorer Guide Ja

クニカルサポート、トレーニングと教育、および実装に関するサービスの重要な情報を掲

載しています。

Informatica How-To Library

Informaticaのユーザーとして、Informatica How-To Library

(http://mysupport.informatica.com)にアクセスできます。How-To Libraryは、

Informaticaの製品および機能についての詳細を確認できるリソースのコレクションです。

一般的な問題に対するソリューションを提供したり、機能や動作を比較したり、特定の実

際のタスクを実行するための方法を示したりする記事やインタラクティブなデモンストレ

ーションが含まれています。

Informatica Knowledge Base

Informaticaのユーザーとして、Informatica Knowledge Base

(http://mysupport.informatica.com)にアクセスできます。このKnowledge Baseを利用

して、Informatica製品に関する既知の技術的問題の解決策を検索することができます。ま

た、FAQ(よくある質問)の答え、技術的ホワイトペーパー、技術的なヒントも得られま

す。Knowledge Baseに関する質問、コメント、ご意見の電子メールの送付先は、

Informatica Knowledge Baseチーム([email protected])です。

Informatica Multimedia Knowledge Base

Informaticaのユーザとして、Informatica Multimedia Knowledge Base

(http://mysupport.informatica.com)にアクセスできます。Multimedia Knowledge

Baseは、一般的な概念の理解を助け、具体的な各タスクの実行をガイドする教育用のマル

チメディアファイルの集まりです。 Multimedia Knowledge Baseに関する質問、コメン

ト、ご意見の電子メールの送付先は、Informatica Knowledge Baseチーム

[email protected])です。

Informaticaグローバルカスタマサポート

電話、またはオンラインサポートからカスタマサポートセンターに連絡できます。 オンラ

インサポートのご利用には、ユーザ名とパスワードが必要です。

http://mysupport.informatica.comから、ユーザー名とパスワードが入手できます。

電話によるInformaticaグローバルカスタマサポートへの問い合わせ先は次のとおりです。

北米/南米 ヨーロッパ/中東/アフ

リカ

アジア/オーストラ

リア

フリーダイヤル

ブラジル: 0800 891

0202

メキシコ: 001 888 209

8853

北米: +1 877 463 2435

フリーダイヤル

フランス: 0805 804632

ドイツ: 0800 5891281

イタリア: 800 915 985

オランダ: 0800 2300001

ポルトガル: 800 208 360

スペイン: 900 813 166

フリーダイヤル

オーストラリア: 1

800 151 830

ニュージーランド:

09 9 128 901

vi 序文

Page 10: De 910HF3 DataExplorer Guide Ja

北米/南米 ヨーロッパ/中東/アフ

リカ

アジア/オーストラ

リア

スイス: 0800 463 200

英国: 0800 023 4632

有料(標準料金)

ベルギー: +31 30 6022

797

フランス: +33 1 4138

9226

ドイツ:+49 1805 702 702

オランダ:+31 306 022

797

英国: +44 1628 511445

有料(標準料金)

インド:+91 80 4112

5738

まえがき vii

Page 11: De 910HF3 DataExplorer Guide Ja

viii

Page 12: De 910HF3 DataExplorer Guide Ja

パート I: InformaticaData Explorerの概要

この部には、以下の章があります。

¨ Informatica Data Explorerの概要, 2 ページ

¨ データ検出, 7 ページ

¨ カラムプロファイルの概念, 11 ページ

1

Page 13: De 910HF3 DataExplorer Guide Ja

第 1 章

Informatica Data Explorerの概要

この章では、以下の項目について説明します。

¨ Data Explorerの概要, 2 ページ

¨ Informatica Data Explorerのアーキテクチャ, 3 ページ

¨ データ検出プロセス, 5 ページ

Data Explorerの概要Informatica Data Explorerは、アプリケーション、スキーマ、またはエンタープライズ

のデータソースのコンテンツ、品質、および構造を検出するために使用できるデータ検出

製品です。データソースの内容には、値の頻度やデータ型が含まれます。データソースの

構造には、キーや機能依存性が含まれます。

検出プロセスの一環として、Data Explorerでプロファイルを作成して実行することができ

ます。プロファイルは、エンタープライズのデータソース間のデータの不整合や、データ

オブジェクトを危険にさらす隠れたデータの問題を検出および分析するリポジトリオブジ

ェクトです。Data Explorerを使用して現在のデータソースをプロファイリングすると、デ

ータやメタデータの強みと弱みを把握できます。

Data Explorerでは、AnalystツールとDeveloperツールを使用してソースデータやメタデ

ータを分析できます。アナリストと開発者は、これらのツールを使用して、連携しながら

データ品質の問題を特定し、データのリレーションを分析することができます。職務に基

づいて、AnalystツールまたはDeveloperツールのいずれかの機能を使用できます。実行で

きるプロファイリングのレベルは、使用するツールによって異なります。

DeveloperツールとAnalystツールのどちらでも実行できる作業は次のとおりです。

¨ カラムプロファイリングを実行する。これには、カラム内の一意の値とNULL値の数やデ

ータパターンの検出が含まれます。

¨ スコアカードを作成してデータ品質を確認する。

¨ タグを作成してデータオブジェクトに割り当てる。

2

Page 14: De 910HF3 DataExplorer Guide Ja

Developerツールで実行できる作業は次のとおりです。

¨ データソース内の2つのデータカラム間に見込まれる結合度を検出する。

¨ 1つまたは複数のデータソース内のカラムのペア間で発生している重複データの割合を

特定する。

¨ カラムプロファイリングの結果を比較する。

¨ プロファイルからマッピングオブジェクトを生成する。

¨ プロファイリングやデータ検出用のプロファイルモデルを作成する。

¨ データソース内のプライマリキーを検出する。

¨ 1つ以上のデータソースのセット内の外部キーを検出する。

¨ データソース内のカラム間の機能依存性を検出する。

Informatica Data Explorerのアーキテクチャ

Data Explorerのアーキテクチャを構成するコンポーネントは、ツール、サービス、および

データベースに分けられます。ツールコンポーネントは、クライアントアプリケーション

で構成されます。サービスコンポーネントには、ツールの管理、データ統合作業の実行、

およびプロファイルオブジェクトのメタデータの管理に必要なアプリケーションサービス

が含まれます。データベースコンポーネントは、モデルリポジトリとプロファイリングウ

ェアハウスで構成されます。

Informatica Data Explorerのアーキテクチャ 3

Page 15: De 910HF3 DataExplorer Guide Ja

次の図は、Informatica Data Explorerのコンポーネントを示したものです。

プロファイルを実行すると、Model Repository ServiceからAnalyst Serviceまたは

Developerツールにプロファイル定義が渡されます。次に、Analyst Serviceまたは

DeveloperツールからData Integration Serviceのプロファイリングプラグインが呼び出さ

れ、このプロファイリングプラグインによって、プロファイルジョブが処理されてData

Integration Serviceにサブミットされます。その後、Data Integration Serviceでプロ

ファイリング結果が生成され、プロファイリングウェアハウスに書き込まれます。

次の表に、Informatica Data Explorerのコンポーネントを示します。

コンポーネント 説明

Informatica Analyst データソースのデータやメタデータの

検出、分析、およびレポートに使用で

きるWebベースのクライアントアプリ

ケーション。

Informatica Developer 高度なデータ検出(プライマリキー、

外部キー、機能依存性など)を実行す

る場合に使用するクライアントアプリ

ケーション。

Analyst Service Analystツールを実行し、サービスコ

ンポーネントとAnalystツールユーザ

ー間の接続を管理するアプリケーショ

ンサービス。

4 章 1: Informatica Data Explorerの概要

Page 16: De 910HF3 DataExplorer Guide Ja

コンポーネント 説明

Model Repository Service モデルリポジトリを管理するアプリケ

ーションサービス。

Data Integration Service Analystツール、Developerツール、お

よび外部クライアントに対するデータ

統合作業を実行するアプリケーション

サービス。

モデルリポジトリ AnalystツールやDeveloperツールで作

成されるプロジェクトのメタデータを

格納するリレーショナルデータベー

ス。

プロファイリングウェアハウス プロファイリング結果やスコアカード

の結果など、プロファイリング情報を

格納するデータベース。

データ検出プロセスデータ統合プロジェクトでは、多くの場合、最初にプロファイリングを行います。プロフ

ァイルを作成することで、データソースの内容、品質、および構造を分析できるようにな

ります。プロファイリングプロセスの一環として、データソースのメタデータを検出しま

す。使用するプロファイルは、データ分析のタイプ(カラムプロファイリング、プライマ

リキー検出、機能依存性検出、外部キー検出、重複検出、結合の検証など)によって異な

ります。データ品質の問題については検出や文書化は行いません。

以下に、Data Explorerでの検出プロセスの手順を示します。

1. データソースからデータの内容を検出して分析します。これには、データ型、値の頻

度、パターンの頻度、データの統計(最小値や最大値など)が含まれます。

2. データの構造を検出します。これには、キー、機能依存性、外部キーが含まれます。

3. プロファイリング結果を確認します。

4. 参照データを作成します。

5. プロファイル結果をドリルダウンします。

6. データの問題を文書化します。

7. ルールを作成して実行します。

8. スコアカードを作成してデータ品質を監視します。

Data Explorerでは、次のツールを使用して検出プロセスを管理します。

Informatica Administrator

このツールは、ユーザー、グループ、特権、およびロールを管理するために使用しま

す。Analyst Serviceを管理したり、Informatica Analystのプロジェクトやオブジェ

データ検出プロセス 5

Page 17: De 910HF3 DataExplorer Guide Ja

クトに対する権限を管理したりできます。Informatica Developerのアクセス権限も

このツールで制御できます。

Informatica Developer

1つ以上のデータソースのメタデータを検出して分析するには(カラムの関係の検出な

ど)、このツールでプロファイルを作成して実行します。プロファイルはウィザード

を使用して作成します。

Informatica Analyst

Analystツールでは、データオブジェクトに対してカラムプロファイルを実行できま

す。プロファイルを使用してデータソースのデータ行をドリルダウンすることができ

ます。

6 章 1: Informatica Data Explorerの概要

Page 18: De 910HF3 DataExplorer Guide Ja

第 2 章

データ検出

この章では、以下の項目について説明します。

¨ データ検出の概要, 7 ページ

¨ データプロファイルと分析, 8 ページ

¨ プロファイリングのコンポーネント, 8 ページ

¨ プロファイル結果, 9 ページ

データ検出の概要データ検出は、ソースシステムのメタデータから内容と構造を検出するプロセスです。内

容とは、データの値、頻度、およびデータ型を指します。構造には、候補キー、プライマ

リキー、外部キー、および機能依存性が含まれます。プロファイルを作成して実行するこ

とで、データソースの内容と構造を検出することができます。

単一のデータオブジェクト内で、または複数のデータオブジェクト全体でデータを分析す

るようにプロファイルを定義できます。プロファイルにコメントを追加すると、プロファ

イリングプロセスを効果的に追跡することができます。

データ構造を評価し、データカラムに必要なタイプの情報が含まれていることを確認する

には、プロファイルを実行します。プロファイリングしたデータのデータ行をドリルダウ

ンできます。 プロファイル結果でデータに問題が見つかった場合は、ルールを適用して結

果セットを修正できます。ルールの適用前と適用後にスコアカードを作成して、データ品

質を追跡および測定することができます。プロファイルまたはスコアカードの外部ソース

メタデータに変更が発生する場合、Informatica Data Explorerで変更をそのデータオブ

ジェクトに同期させることができます。

7

Page 19: De 910HF3 DataExplorer Guide Ja

データプロファイルと分析プロファイルは、実行する必要がある分析のタイプに基づいて作成します。作成するプロ

ファイルのタイプは、実行する分析のタイプに対応しています。例えば、プライマリキー

分析を実行する場合は、プライマリキープロファイルを作成します。

以下のプロファイルを作成して、データの分析および検出を実行できます。

カラムプロファイル

テーブルまたはファイル内の選択したカラムのデータ品質を分析します。カラム分析

用のプロファイルは、AnalystツールおよびDeveloperツールで定義できます。

プライマリキープロファイル

テーブルまたはファイル内のカラム間のプライマリキー関係を検出します。プライマ

リキー分析用のプロファイルは、Developerツールで定義できます。

機能依存性プロファイル

テーブルまたはファイル内のカラム間の機能依存性を検出します。機能依存性分析用

のプロファイルは、Developerツールで定義できます。

外部キープロファイル

複数のテーブルまたはファイル全体のカラム間の外部キー関係を検出します。外部キ

ー分析用のプロファイルは、Developerツールで定義できます。

結合プロファイル

単一のデータソース内、または複数のデータソース全体のカラム間に見込まれる結合

度を特定します。結合分析用のプロファイルは、Developerツールで定義できます。結

果はベン図に表示されます。

重複検出

1つまたは複数のデータソース内のカラムのペア間で発生している重複データの割合を

特定します。重複検出タスクは、Developerツール内のプロファイルモデルから実行で

きます。結果の検証と表示は、ベン図で行うことができます。

注: Analystツールでプロファイルに加えた変更は、Developerツールのリポジトリへの接

続を更新するまでDeveloperツールには反映されません。 接続を更新するには、Developer

ツールでリポジトリから接続を切断し、再接続します。

プロファイリングのコンポーネントData Explorerのプロファイルには複数のコンポーネントがあり、それらを使用することで

データソースの内容と構造を効果的に分析することができます。

プロファイルのコンポーネントを次に示します。

フィルタ

元のデータソースから特定の条件を満たすサブセットを作成します。その後、そのサ

ンプルデータに対してプロファイルを実行することができます。

8 章 2: データ検出

Page 20: De 910HF3 DataExplorer Guide Ja

ルール

プロファイルの実行時にデータに適用される条件を定義するビジネスロジック。デー

タをクレンジング、変更、または検証するには、プロファイルにルールを追加しま

す。

タグ

ビジネス上の用途に基づいてモデルリポジトリ内のオブジェクトを定義するメタデー

タ。ビジネス上の用途に従ってオブジェクトをグループ化するには、タグを作成しま

す。

コメント

プロファイルに関する説明。コメントは、プロファイルに関する情報をAnalystツール

およびDeveloperツールの他のユーザーと共有する場合に使用します。

スコアカード

カラムの有効値またはプロファイル結果内のルールの出力を視覚的に表したもの。デ

ータ品質の進捗を測定するには、スコアカードを使用します。

プロファイル結果プロファイル結果はプロファイルの実行後に表示できます。プロファイルのカラムとルー

ルについて、概要、値、パターン、および統計を確認できます。プロファイルのカラムと

ルールのプロパティが表示され、プロファイルデータをプレビューできます。

以下の表に、各プロファイルタイプに対するプロファイル結果を示します。

プロファイルタイプ 結果

カラムプロファイル - カラム内の一意の値およびNULL値の

数と割合、カラム値の推測されるデ

ータ型。

- 選択したカラム内のデータ値の頻度

と文字パターン、そのカラムの統計

の概要。

- カラムデータの分析によって推測さ

れるデータ型。

- データに対する記述されているデー

タ型。

- 最大値と最小値。

- 最後にプロファイルを実行した日

時。

プライマリキープロファイル - 推測されるプライマリキー候補の一

意の値、重複する値、およびNULL値

の数と割合。

- 推測されるプライマリキー候補内の

キー違反の数。

プロファイル結果 9

Page 21: De 910HF3 DataExplorer Guide Ja

プロファイルタイプ 結果

機能依存性プロファイル - 推測される機能依存性。

- 機能依存性違反の数。

外部キープロファイル - 定義したプライマリキーと外部キー

の推測条件を満たすプライマリキー

カラムと外部キーカラム。

- プライマリキーと外部キーの間で一

致するデータ値の数(割合で表され

る)。

- プロファイルの実行前にプライマリ

キーカラムと外部キーカラムに対し

て定義したリレーションのタイプ。

結合プロファイル - カラム間のリレーションを示すベン

図。

- カラム内の孤立値、NULL値、および

結合値の数と割合。

重複検出 - 2つのカラム間の重複の割合。

- カラム間の重複を示すベン図。

10 章 2: データ検出

Page 22: De 910HF3 DataExplorer Guide Ja

第 3 章

カラムプロファイルの概念

この章では、以下の項目について説明します。

¨ カラムプロファイルの概念の概要, 11 ページ

¨ カラムプロファイルオプション, 12 ページ

¨ ルール, 12 ページ

¨ スコアカード, 12 ページ

カラムプロファイルの概念の概要カラムプロファイルによって、値の頻度、割合、パターンなど、データソースに含まれる

カラムの特性が決まります。

カラムプロファイリングでは、データに関する以下の情報が検出されます。

¨ カラムごとの一意の値とNULL値の数。数および割合として表されます。

¨ カラムごとのデータのパターン、およびそれらの値が出現する頻度。

¨ カラム値に関する統計。値の最大長さと最小長さや、各カラムの最初の値と最後の値な

ど。

プロファイルを作成するときは、カラムプロファイルのオプションを使用して、プロファ

イルを実行するカラムを選択し、データサンプリングのオプションを設定し、ドリルダウ

ンのオプションを設定します。

ルールは、プロファイルの実行時にソースデータに適用される条件を定義するビジネスロ

ジックです。プロファイルにルールを追加して、データをクレンジング、変更、または検

証できます。

データ品質を定期的に確認するには、スコアカードを作成します。カラムの有効値を視覚

的に表示できるように、プロファイルへのルールの適用前と適用後にスコアカードを作成

します。

11

Page 23: De 910HF3 DataExplorer Guide Ja

カラムプロファイルオプション[カラムプロファイリング]オプションを指定してプロファイルを作成すると、プロファ

イルウィザードを使用してフィルタおよびサンプリングのオプションを定義できます。こ

れらのオプションでは、プロファイルがデータセットから行を読み取る方法を決定しま

す。

プロファイルウィザードの手順が完了したら、プロファイルにルールを追加できます。こ

のルールにビジネスロジックを含めることで、カラムプロファイリングの前にデータに対

してデータトランスフォーメーション操作を実行することができます。

ルールプロファイル内でルールを作成して適用します。ルールは、プロファイルの実行時にデー

タに適用される条件を定義するビジネスロジックです。ルールを使用して、プロファイル

内のデータを詳細に検証したり、データ品質の進捗を測定します。

ルールはプロファイルの作成後に追加できます。AnalystツールまたはDeveloperツールの

どちらで作成したルールも、両方のツールで再利用することができます。再利用可能なル

ールを選択してプロファイルにルールを追加するか、式ルールを作成します。式ルールで

は、式関数とカラムの両方を使用してルールロジックを定義します。作成した式ルール

は、再利用可能なルールにすることができます。

式ルールはAnalystツールで作成します。Developerツールでは、マプレットを作成し、そ

のマプレットをルールとして検証できます。ルールの実行は、AnalystツールとDeveloper

ツールのどちらからでも行うことができます。

スコアカードスコアカードは、カラムの有効値またはプロファイル結果内のルールの出力を視覚的に表

したものです。データ品質の進捗を測定するには、スコアカードを使用します。プロファ

イルからスコアカードを作成し、データ品質の進捗を時系列で監視することができます。

スコアカードには、カラム、しきい値、グループなど、いくつかのコンポーネントがあり

ます。プロファイルの実行後に、スコアカードにカラムを追加し、カラムの有効値を設定

できます。しきい値では、レコード内のカラムで許容できる不良データの範囲を割合で指

定します。しきい値は、正常、許容可能、または許容不可のデータの範囲について設定す

ることができます。スコアカード内の関連するスコアを1つのまとまりとして分類するに

は、グループを使用します。

スコアカードを実行するときは、実データとステージングされたデータのどちらを対象に

スコアのカラムをドリルダウンするかを設定することができます。スコアカードを実行し

てスコアを表示したら、各カラムをドリルダウンして、有効なデータレコードと無効なレ

コードを識別できます。データ品質を効果的に追跡するには、傾向グラフを使用して一定

の期間におけるスコアの変化を監視します。

12 章 3: カラムプロファイルの概念

Page 24: De 910HF3 DataExplorer Guide Ja

パート II: InformaticaAnalystを使用したデータ検出

この部には、以下の章があります。

¨ Informatica Analystのカラムプロファイル, 14 ページ

¨ Informatica Analystのカラムプロファイル結果, 21 ページ

¨ Informatica Analystのルール, 29 ページ

¨ Informatica Analystのスコアカード, 34 ページ

13

Page 25: De 910HF3 DataExplorer Guide Ja

第 4 章

Informatica Analystのカラムプロファイル

この章では、以下の項目について説明します。

¨ Informatica Analystのカラムプロファイルの概要, 14 ページ

¨ カラムプロファイリングプロセス, 15 ページ

¨ プロファイルオプション, 15 ページ

¨ Analystツールでのカラムプロファイルの作成, 17 ページ

¨ プロファイルの実行, 18 ページ

¨ フラットファイルデータオブジェクトの同期, 19 ページ

¨ リレーショナルデータオブジェクトの同期, 19 ページ

Informatica Analystのカラムプロファイルの概要

プロファイルの作成時に、データをプロファイリングするデータオブジェクトのカラムを

選択します。サンプリングおよびドリルダウンのオプションを設定して、プロファイリン

グを高速化できます。プロファイルの実行後に、プロファイリングの統計を調べてデータ

を把握できます。

多数のカラムを含む幅の広いテーブルおよびフラットファイルをプロファイリングできま

す。カラム数が30を超えるテーブルや、カラム数が100を超えるフラットファイルをプロフ

ァイリングできます。プロファイルを作成または実行するときに、すべてのカラムを選択

するか、プロファイリング対象として含める各カラムを選択することができます。データ

プレビューには最初の30のカラムが表示されます。ドリルダウン対象としてすべてのカラ

ムを選択し、これらのカラムの値の頻度を表示することができます。出力フィールド数が

50を超えるルールを使用して、プロファイルの再実行時にルールカラムをプロファイリン

グ対象として含めることができます。

14

Page 26: De 910HF3 DataExplorer Guide Ja

カラムプロファイリングプロセスカラムプロファイリングプロセスの一環として、データオブジェクトのクイックプロファ

イルとカスタムプロファイルのどちらを作成するかを選択することができます。データオ

ブジェクトのすべてのカラムを含めてデフォルトのプロファイルオプションを使用するに

は、クイックプロファイルを使用します。データオブジェクトのカラムを選択してプロフ

ァイル結果、サンプリング、およびドリルダウンのオプションを設定するには、カスタム

プロファイルを使用します。

以下に、カラムプロファイリングプロセスの手順を示します。

1. プロファイリングするデータオブジェクトを選択します。

2. クイックプロファイルとカスタムプロファイルのどちらを作成するかを指定します。

3. プロファイルの保存先を選択します。

4. プロファイリングするカラムを選択します。

5. プロファイル結果のオプションを選択します。

6. サンプリングのオプションを選択します。

7. ドリルダウンのオプションを選択します。

8. フィルタを定義して、プロファイルの実行時に読み取る行を指定します。

9. プロファイルを実行します。

注: カラム名、および多言語データやUnicodeデータのプロファイリングについては、以下

のルールとガイドラインに注意してください。

¨ カラム名とプロファイル名が同じ場合、プロファイルにカラムを追加することはできま

せん。カラム名を変更しても、同じカラムをプロファイルに2回追加することはできま

せん。

¨ さまざまなソースから多言語データをプロファイリングしたり、ブラウザのロケール設

定に基づいてプロファイル結果を表示したりすることができます。Analystツールで

は、ブラウザのロケールに基づいて、日時、数値、およびDecimalデータ型が変更され

ます。

¨ 多言語データに基づくソート: 多言語データに基づいてソートすることができます。

Analystツールでは、ソート順がブラウザのロケールに基づいて表示されます。

¨ DB2データベースのUnicodeデータをプロファイリングするには、データベースで

DB2CODEPAGEデータベース環境変数を設定し、Data Integration Serviceを再起動しま

す。

プロファイルオプションプロファイルオプションには、プロファイル結果のオプション、データサンプリングのオ

プション、およびデータドリルダウンのオプションがあります。データオブジェクトのカ

ラムプロファイルを作成するときに、これらのオプションを設定することができます。

プロファイルオプションは、新しいプロファイルウィザードで設定します。カラム、サン

プリング、およびドリルダウンのデフォルトのオプションを使用してプロファイルを作成

カラムプロファイリングプロセス 15

Page 27: De 910HF3 DataExplorer Guide Ja

することもできます。Analystツールで複数のデータソースに対するプロファイルを作成す

るときは、カラムプロファイリングのデフォルトのオプションが使用されます。

プロファイル結果のオプション

以前に実行したプロファイルの結果を破棄するか表示するかを選択することができます。

以下の表に、プロファイルのプロファイル結果のオプションを示します。

オプション 説明

現在の実行で選択したカラムおよびル

ールの結果だけを表示します

以前プロファイリングしたカラムのプ

ロファイル結果を破棄し、最新のプロ

ファイル実行で選択したカラムとルー

ルに対する結果を表示する。以前プロ

ファイリングしたカラムのプロファイ

ル結果を表示する場合は、このオプシ

ョンを選択しないこと。

サンプリングのオプション

Analystツールでプロファイルの対象として選択される行の数は、サンプリングのオプショ

ンで決まります。サンプリングのオプションは、ウィザードに従って設定するか、プロフ

ァイルの実行時に設定することができます。

以下の表に、プロファイルのサンプリングのオプションを示します。

オプション 説明

すべての行 データオブジェクト内のすべての行が

選択されます。

最初の<number>行 プロファイルを実行する行の数。ソー

スの先頭からこの数の行が選択されま

す。

<number>行のランダムサンプリング ランダムサンプリングでプロファイル

を実行する行の数。ランダムサンプリ

ングでは、ステージングされたデータ

に対して強制的にドリルダウンが実行

されるため、ドリルダウンのパフォー

マンスに影響する場合があることに注

意してください。

ランダムサンプリング データオブジェクト内の行数に基づく

ランダムサンプリングのサイズ。ラン

ダムサンプリングでは、ステージング

されたデータに対して強制的にドリル

ダウンが実行されるため、ドリルダウ

ンのパフォーマンスに影響する場合が

あることに注意してください。

16 章 4: Informatica Analystのカラムプロファイル

Page 28: De 910HF3 DataExplorer Guide Ja

ドリルダウンのオプション

ドリルダウンのオプションは、ウィザードに従って設定するか、プロファイルの実行時に

設定することができます。

以下の表に、プロファイルのドリルダウンのオプションを示します。

オプション 説明

行のドリルダウンを有効にする プロファイル結果の行データにドリル

ダウンします。

カラムの選択 プロファイリング対象として選択して

いないカラムをドリルダウン対象とし

て指定します。

実データまたはステージングされたデ

ータのドリルダウン

実データをドリルダウンして、データ

ソースの現在のデータを読み取りま

す。

ステージングされたデータをドリルダ

ウンして、プロファイリングウェアハ

ウスでステージングされているプロフ

ァイルデータを読み取ります。

Analystツールでのカラムプロファイルの作成

データオブジェクトを選択し、カスタムプロファイルまたはデフォルトのプロファイルを

作成します。カスタムプロファイルを作成するときは、カラム、サンプリングする行、お

よびドリルダウンのオプションを設定できます。Analystツールにより、データオブジェク

トと同じプロジェクトおよびフォルダ内にプロファイルが作成されます。

1. ナビゲータで、カスタムプロファイルを作成するデータオブジェクトを含むプロジェ

クトを選択します。

2. [コンテンツ]パネルで、データオブジェクトを右クリックし、 [新規作成] >

[プロファイル]を選択します。

新しいプロファイルウィザードが表示されます。

3. ソースパネルでデータオブジェクトを選択します。

4. デフォルトのプロファイルとカスタムプロファイルのどちらを作成するかを選択しま

す。

¨ デフォルトのプロファイルを作成するには、[保存]または[保存して実行]をク

リックします。

¨ カスタムプロファイルを作成するには、[次へ]をクリックします。

5. プロファイルの名前を入力し、必要に応じて説明を入力します。

Analystツールでのカラムプロファイルの作成 17

Page 29: De 910HF3 DataExplorer Guide Ja

6. フォルダパネルで、プロファイルを作成するプロジェクトまたはフォルダを選択しま

す。

選択したプロジェクトと、プロファイルを作成できるフォルダが含まれている共有プ

ロジェクトが表示されます。 フォルダ内のプロファイルオブジェクトがプロファイル

パネルに表示されます。

7. [次へ]をクリックします。

8. [カラム]パネルで、プロファイリングするカラムを選択します。カラムには、プロ

ファイルに適用したルールが含まれます。 Analystツールには、各カラムの名前、デ

ータタイプ、精度、および位取りが一覧表示されます。

必要に応じて、[名前]を選択してすべてのカラムを選択します。

9. プロファイル結果のオプションパネルでデフォルトオプションを受け入れます。

初めてプロファイルを実行するときは、プロファイリング対象として選択したすべて

のカラムのプロファイル結果が表示されます。

10. サンプリングのオプションパネルでサンプリングのオプションを設定します。

11. ドリルダウンのオプションパネルでドリルダウンのオプションを設定します。

必要に応じて、[カラムの選択]をクリックして、ドリルダウンするカラムを選択し

ます。 [カラムのドリルダウン]ウィンドウで、ドリルダウン対象のカラムを選択し

て[OK]をクリックします。

12. [次へ]をクリックします。

13. オプションとして、プロファイルのフィルタを定義します。

14. [保存]をクリックしてプロファイルを作成するか、[保存して実行]をクリックし

てプロファイルを作成および実行します。

プロファイルの実行プロファイルを実行してデータソースの内容および構造を分析し、ドリルダウン対象のカ

ラムとルールを選択します。カラムとルールの実データまたはステージングされたデータ

をドリルダウンできます。プロファイルの実行後にすべてのソースカラムを再度プロファ

イリングしなくてもカラムまたはルールに対するプロファイルを実行できます。

1. ナビゲータで、実行するプロファイルを含むプロジェクトまたはフォルダを選択しま

す。

2. プロファイルをクリックして開きます。

タブにプロファイルが表示されます。

3. [アクション] > [プロファイルの実行]をクリックします。

[カラムのプロファイル]ウィンドウが表示されます。

4. カラムパネルで、プロファイリングするカラムを選択します。 カラムには、プロファ

イルに適用したルールが含まれます。

必要に応じて、[名前]を選択してすべてのカラムを選択します。 Analystツールに

は、各カラムの名前、データタイプ、精度、および位取りが一覧表示されます。

18 章 4: Informatica Analystのカラムプロファイル

Page 30: De 910HF3 DataExplorer Guide Ja

5. 必要に応じて、プロファイル結果のオプションパネルで、以前プロファイリングした

カラムとルールのプロファイル結果を破棄するオプションを選択します。

初めてプロファイルを実行するときは、プロファイリング対象として選択したすべて

のカラムのプロファイル結果が表示されます。

6. サンプリングのオプションパネルでサンプリングのオプションを設定します。

7. ドリルダウンのオプションパネルでドリルダウンのオプションを設定します。

8. 必要に応じて、[カラムの選択]をクリックして、ドリルダウンするカラムを選択し

ます。 [カラムのドリルダウン]ウィンドウで、ドリルダウン対象のカラムを選択し

ます。

9. [OK]をクリックします。

10. [実行]をクリックします。

プロファイル結果が表示されます。

フラットファイルデータオブジェクトの同期Informatica Analystで、外部フラットファイルデータソースに加えられた変更をそのデー

タオブジェクトに同期させることができます。データオブジェクトを同期させるには、

[フラットファイルの同期]ウィザードを使用します。

1. [コンテンツ]パネルで、フラットファイルデータオブジェクトを選択します。

2. [アクション] > [同期]をクリックします。

新しいタブに[フラットファイルの同期]ダイアログボックスが表示されます。

3. [参照とアップロード]フィールドのフラットファイルパスを確認します。

4. [次へ]をクリックします。

同期ステータスメッセージが表示されます。

5. 「同期が完了しました」というメッセージが表示されたら、[OK]をクリックしま

す。

このメッセージには、データオブジェクトに加えられたメタデータ変更の概要が示さ

れます。このメタデータ変更の詳細を確認するには、[プロパティ]ビューを使用し

ます。

リレーショナルデータオブジェクトの同期Informatica Analystで、外部リレーショナルデータソースに加えられた変更をそのデータ

オブジェクトに同期させることができます。外部データソース変更には、カラムの追加、

変更、削除や、ルールの変更などがあります。

1. [コンテンツ]パネルで、リレーショナルデータオブジェクトを選択します。

2. [アクション] > [同期]をクリックします。

フラットファイルデータオブジェクトの同期 19

Page 31: De 910HF3 DataExplorer Guide Ja

操作の確認を求めるメッセージが表示されます。

3. 同期プロセスを実行するには、[OK]をクリックします。このプロセスを取り消すに

は、[キャンセル]をクリックします。

[OK]をクリックすると、同期ステータスメッセージが表示されます。

4. 「同期が完了しました」というメッセージが表示された時点で、[OK]をクリックし

ます。

このメッセージには、データオブジェクトに加えられたメタデータ変更の概要が示さ

れます。このメタデータ変更の詳細を確認するには、[プロパティ]ビューを使用し

ます。

20 章 4: Informatica Analystのカラムプロファイル

Page 32: De 910HF3 DataExplorer Guide Ja

第 5 章

Informatica Analystのカラムプロファイル結果

この章では、以下の項目について説明します。

¨ Informatica Analystのカラムプロファイル結果の概要, 21 ページ

¨ プロファイルのまとめ, 22 ページ

¨ カラムの値, 23 ページ

¨ カラムパターン, 24 ページ

¨ カラム統計, 25 ページ

¨ カラムプロファイルのドリルダウン, 25 ページ

¨ Informatica Analystのプロファイルのエクスポートファイル, 27 ページ

Informatica Analystのカラムプロファイル結果の概要

データの構造を把握してその品質を分析するには、プロファイル結果を表示します。プロ

ファイル結果はプロファイルの実行後に表示できます。プロファイルのカラムとルールの

概要、およびカラムとルールの値、パターン、統計を表示できます。

プロファイルの実行後、[カラムプロファイリング]、[プロパティ]、および[データ

プレビュー]の各ビューにプロファイル結果を表示できます。プロファイル結果をCSVファ

イルにエクスポートすることで、すべてのデータをファイル内で確認して詳しく分析する

ことができます。

[カラムプロファイリング]ビューには、プロファイルの実行に対するカラムの概要情報

を表示できます。[値]、[パターン]、および[統計]の各ビューに各カラムの値、パ

ターン、統計を表示できます。

プロファイル結果のカラムとしてルールが表示されます。ルールのプロファイル結果はプ

ロファイリングしたカラムとして表示されます。表示されるプロファイル結果は、プロフ

ァイル設定およびサンプリングのオプションによって異なります。

21

Page 33: De 910HF3 DataExplorer Guide Ja

[カラムプロファイリング]ビューには次のプロファイリング結果が表示されます。

¨ 一意の値とNULL値の数、推測されるデータ型、最終実行日時などのプロファイルの実行

に関する概要情報。

¨ カラムの値、およびカラムの値が出現する頻度。頻度は数、割合、およびチャートで表

されます。

¨ プロファイリングしたカラムの値のパターン、およびパターンが出現する頻度。頻度は

数および割合で表されます。

¨ 平均、長さ、最上位と最下位の値などのカラム値に関する統計。

注: 値またはパターンを選択し、その値またはパターンと一致するプロファイリング済み

の行を詳細パネルに表示できます。

[プロパティ]ビューでは、[プロパティ]パネルにプロファイルのプロパティを表示で

きます。[カラム]パネルと[ルール]パネルにカラムとルールのプロパティを表示でき

ます。

[データプレビュー]ビューでは、プロファイルデータをプレビューできます。Analystツ

ールにはプロファイルのすべてのカラムが含まれますが、最初の100行のデータが表示され

ます。

プロファイルのまとめプロファイルの実行に関する概要には、一意の値とNULL値の数(数および割合で表され

る)、推測されるデータ型、最終実行日時が含まれます。各プロファイルの概要プロパテ

ィをクリックするとプロパティの値をソートできます。

以下の表に、プロファイルの概要プロパティを示します。

プロパティ 説明

名前 プロファイル内のカラムの名前。

一意の値 カラムの一意の値の数。

一意の値の割合 カラムの一意の値の割合。

Null カラムのNULL値の数。

NULLの割合 カラムのNULL値の割合。

データ型 カラムの値から導出されたデータ型。Analystツール

では、カラムの値のデータタイプから次のデータタ

イプを導出できる。

- String

- Varchar

- Decimal

- Integer

- NULLの場合は「-」

22 章 5: Informatica Analystのカラムプロファイル結果

Page 34: De 910HF3 DataExplorer Guide Ja

プロパティ 説明

注: Analystツールでは、精度が38より大きい数値カ

ラムの値からデータ型を導出することはできませ

ん。また、精度が255より大きい文字列カラムの値か

らデータ型を導出することはできません。1800年よ

り前の年の値を含む日付カラムに対してカラムプロ

ファイルを作成している場合は、推測されるデータ

型が固定長文字列として表示される可能性がありま

す。必要に応じて、InferDateTimeConfig.xmlで

year-minimumパラメータのデフォルト値を変更しま

す。

推測された値の割合 Analystツールによって推測されたデータ型に一致す

る値の割合。

記述されているデータ型 プロファイルされたオブジェクト内のカラムに対し

て宣言されたデータ型。

最大値 カラム内の最大値。

最小値 カラム内の最小値。

最終プロファイル日時 最後にプロファイルを実行した日時。

ドリルダウン カラムの実データをドリルダウンする場合に選択す

る。

カラムの値カラム値には、カラムの値、およびカラムの値が出現する頻度が含まれます。

以下の表に、カラム値のプロパティを示します。

プロパティ 説明

値 プロファイルのカラムのすべての値を示す一覧。

注: Analystツールでは、プロファイルのカラム値でCLOB、

BLOB、Raw、およびバイナリの各データ型が除外されます。

頻度 カラムの値が出現する回数(数、割合、およびチャートで表さ

れる)。

割合 カラムの値が出現する割合。

チャート 割合のチャート。

カラムの値 23

Page 35: De 910HF3 DataExplorer Guide Ja

注: [値]カラムおよび[頻度]カラムをソートするには、そのカラムを選択します。

[頻度]カラムの結果をソートすると、カラムのデータタイプに基づいて結果がソートさ

れます。

カラムパターンカラムパターンには、カラムの値のパターン、およびパターンが出現する頻度が含まれま

す。

プロファイリングウェアハウスには、一意の最高頻度値が16,000個格納されます。デフォ

ルトでは、プロファイル結果にNULL値が格納されます。プロファイル結果にNULL値が1つ以

上存在する場合、AnalystツールではNULL値をパターンとして表示することができます。

注: Analystツールでは、精度が38より大きい数値カラムのパターンを導出することはでき

ません。また、精度が255より大きい文字列カラムのパターンを導出することはできませ

ん。

以下の表に、カラムパターンのプロパティを示します。

プロパティ 説明

パターン プロファイルのカラムのパターン。

頻度 カラムのパターンが出現する回数(数で表される)。

割合 カラムのパターンが出現する割合。

チャート 割合のチャート。

以下の表に、パターン文字と、各パターン文字が何を表わすかを示します。

Character 説明

9 任意の数字を表します。Informatica Analystは、最高3文字を

「9」形式で別々に表示します。4文字以上の場合、括弧内に値

として示されます。例えば、「9(8)」という形式は8桁の数値を

表します。

X 任意の英字を表します。Informatica Analystは、最高3文字を

「X」形式で別々に表示します。4文字以上の場合、括弧内に値

として示されます。例えば、「X(6)」という形式は、値

「Boston」に相当する場合があります。

注: パターン文字Xは、大文字と小文字を区別しません。このた

め、ソースデータ内の大文字または小文字に相当する可能性が

あります。

p 「(」(左括弧)を表します。

24 章 5: Informatica Analystのカラムプロファイル結果

Page 36: De 910HF3 DataExplorer Guide Ja

Character 説明

q 「)」(右括弧)を表します。

b 空白(ブランクスペース)を表します。

カラム統計カラム統計には、平均、長さ、最上位と最下位の値などのカラム値に関する統計が含まれ

ます。表示される統計は、カラムの型によって異なります。

以下の表に、それぞれのカラムの型に対するカラム統計のタイプを示します。

統計 カラムの型 説明

平均 Integer カラムの値の平均。

標準偏差 Integer カラムのすべての値の標準偏差(カラム

値のばらつき)。

最大長 Integer、

String

カラムの最長値の長さ。

最小長 Integer、

String

カラムの最短値の長さ。

下 Integer、

String

カラムの最小値。

上 Integer、

String

カラムの最大値。

カラムプロファイルのドリルダウンカラムプロファイルのドリルダウンのオプションを使用すると、カラムの値に基づいてデ

ータソース内の特定の行をドリルダウンできます。ドリルダウンするデータソース内の現

在のデータを読み取ることも、プロファイルウェアハウスでステージングされたプロファ

イルデータを読み取ることもできます。ステージングされたプロファイルデータの特定の

行にドリルダウンする場合は、Analystツールによって、一致するカラムの値を抽出するド

リルダウンフィルタが作成されます。ドリルダウンフィルタは、ドリルダウンの実行後に

編集、再呼び出し、リセット、および保存が可能です。

ドリルダウンするカラムを選択するときは、プロファイリング対象として選択していない

カラムも選択できます。ドリルダウンするデータソース内の現在のデータを読み取ること

カラム統計 25

Page 37: De 910HF3 DataExplorer Guide Ja

も、プロファイルウェアハウスでステージングされたプロファイリングデータを読み取る

こともできます。カラム値のドリルダウンを実行した後に、選択した値またはパターンの

ドリルダウンデータをCSVファイルにエクスポートして、選択した場所に保存することがで

きます。Informatica Analystにはドリルダウンデータの最初の200個しか値が表示されま

せんが、CSVファイルにはすべての値がエクスポートされます。

行データのドリルダウン

プロファイルを実行した後に、カラムの値またはパターンに一致する特定の行にドリルダ

ウンすることができます。

1. プロファイルを実行します。

タブにプロファイルが表示されます。

2. [サマリ]ビューでカラム名を選択し、そのカラムのプロファイル結果を表示しま

す。

3. [値]タブでカラム値を選択するか、[パターン]タブでカラムパターンを選択しま

す。

4. [アクション] > [ドリルダウン]をクリックしてデータ行を表示します。

[ドリルダウン]パネルに、値またはパターンを含む行が表示されます。パネルの一

番上にカラムの値またはパターンが表示されます。

注: 実データまたはステージングされたデータをドリルダウンするように選択するこ

とができます。

ドリルダウンデータへのフィルタの適用

プロファイル結果のサブセットのデータの不整合を分析できるように、ドリルダウンデー

タを繰り返しフィルタすることができます。

1. プロファイル結果の行データにドリルダウンします。

2. [値]タブでカラム値を選択します。

3. 右クリックして [ドリルダウンフィルタ] > [編集]を選択し、[ドリルダウンフ

ィルタ]ダイアログボックスを開きます。

4. フィルタ条件を追加し、[実行]をクリックします。

5. 現在のドリルダウンフィルタを管理するために、フィルタの保存、再呼び出し、リセ

ットを行うことができます。

¨ フィルタを保存するには、 [ドリルダウンフィルタ] > [保存]を選択します。

¨ 前回保存したドリルダウンフィルタの結果に戻るには、 [ドリルダウンフィル

タ] > [再呼び出し]を選択します。

¨ ドリルダウンフィルタの結果をリセットするには、 [ドリルダウンフィルタ] >

[リセット]を選択します。

26 章 5: Informatica Analystのカラムプロファイル結果

Page 38: De 910HF3 DataExplorer Guide Ja

Informatica Analystのプロファイルのエクスポートファイル

プロファイルのカラムごとに、エクスポートするデータのタイプを㽸択することができま

す。値の頻度、パターンの頻度、または㽸択した値およびパターンのドリルダウンデータ

を㽸択できます。すべてのカラムのプロファイリング結果をエクスポートすることも可能

で、エクスポートファイルの保存先も㽸択できます。

プロファイルのエクスポート結果のスプレッドシート

Informatica Analystでプロファイル結果をエクスポートすると、情報はCSVファイルに保

存されます。エクスポートするデータのタイプによって、プロファイル結果がMicrosoft

Excelの1つのワークシートに表示される場合と複数のワークシートに表示される場合があ

ります。各カラムの値の頻度、パターン、またはドリルダウンデータは1つのワークシート

に表示されます。すべてのカラムのプロファイル結果をエクスポートした場合は、複数の

ワークシートに結果が表示されます。

次の表に、エクスポートファイルの各ワークシートに表示される情報を示します。

タブ 説明

カラムのプロファイル プロファイルの実行後に[カラムプロ

ファイリング]ビューからエクスポー

トされる概㽸情報。これには、カラム

名、ルール名、一意の値の数、NULL値

の数、推測されるデータ型、プロファ

イルの最終実行日時などが含まれま

す。

値 カラムとルールの値、および各カラム

の値が出現する頻度。

パターン プロファイルを実行したカラムとルー

ルの値のパターン、およびそのパター

ンが出現する頻度。

注: 推測されるカラムパターンをエク

スポートすると、異なる形式のカラム

パターンがCSVファイルにエクスポー

トされます。例えば、推測されるカラ

ムパターンX(5)をエクスポートする

と、XXXXXという形式のカラムパター

ンがCSVファイルに表示されます。

統計 それぞれのカラムとルールに関する統

計。これには、平均、長さ、上位の

値、下位の値、標準偏差などが含まれ

ます。

プロパティ [プロパティ]ビューの情報。これに

は、プロファイルの名前、タイプ、接

Informatica Analystのプロファイルのエクスポートファイル 27

Page 39: De 910HF3 DataExplorer Guide Ja

タブ 説明

続タイプ、サンプリングポリシー、行

数などが含まれます。

Informatica Analystからのプロファイル結果のエクスポート

プロファイルの結果をCSVファイルにエクスポートして、ファイルにデータを表示すること

ができます。

1. ナビゲータで、プロファイルを含むプロジェクトまたはフォルダを㽸択します。

2. プロファイルをクリックして開きます。

タブにプロファイルが開きます。

3. [カラムプロファイリング]ビューで、エクスポートするカラムを㽸択します。

4. [アクション] > [データのエクスポート]をクリックします。

[ファイルへのデータのエクスポート]ウィンドウが表示されます。

5. ファイル名を入力します。必㽸に応じて、デフォルトのファイル名を使用します。

6. エクスポートするデータのタイプを㽸択します。

¨ [すべて](サマリ、値、パターン、統計、プロパティ)

¨ [㽸択されたカラムの値の頻度]

¨ [㽸択されたカラムのパターンの頻度]

¨ [㽸択した値またはパターンのドリルダウンデータ]

7. ファイル形式を入力します。 デフォルトの形式は、[すべて]オプションの場合は

[Excel]、その他のオプションの場合は[CSV]です。

8. ファイルのコードページを㽸択します。

9. [OK]をクリックします。

28 章 5: Informatica Analystのカラムプロファイル結果

Page 40: De 910HF3 DataExplorer Guide Ja

第 6 章

Informatica Analystのルール

この章では、以下の項目について説明します。

¨ Informatica Analystのルールの概要, 29 ページ

¨ 定義済みルール, 30 ページ

¨ 式ルール, 31 ページ

Informatica Analystのルールの概要ルールは、プロファイルの実行時にソースデータに適用される条件を定義するビジネスロ

ジックです。プロファイルにルールを追加して、データをクレンジング、変更、または検

証できます。

ルールはさまざまな状況で使用します。例えば、1つ以上のデータカラムをクレンジングす

るルールを追加したり、ソースデータでは提供されない情報を提供するルックアップルー

ルを追加できます。また、データ品質プロジェクトやデータ統合プロジェクト用のクレン

ジングルールを検証するルールを追加することもできます。

ルールは、プロファイルの実行前でも実行後でも追加できます。プロファイルにルールを

追加するときは、ルールを作成するかルールを適用します。プロファイルに対して作成ま

たは適用できるのは、次のタイプのルールです。

¨ 式ルール: 式関数およびカラムを使用してルールロジックを定義します。式ルールは

Analystツールで作成します。アナリストは、式ルールを作成して、他のアナリストが

複数のプロファイルで使用できる再利用可能なルールに格上げすることができます。

¨ 定義済みルール: 開発者がDeveloperツールで作成した再利用可能なルールが含まれま

す。開発者がDeveloperツールでマプレットとして作成したルールは、再利用可能なル

ールとしてAnalystツールで使用できます。

プロファイルにルールを追加したら、ルールカラムに対してプロファイルを再実行するこ

とができます。ルールカラムのプロファイル結果が表示されます。ルールを変更してプロ

ファイルを再実行すると、プロファイル結果の変化を表示できます。ルールの出力を1つ以

上の仮想カラムにすることができます。仮想カラムはプロファイル結果に存在します。

Analystツールでは仮想カラムがプロファイリングされます。例えば、姓と名が含まれてい

る1つのカラムをFIRST_NAMEとLAST_NAMEの仮想カラムに分割する定義済みルールを使用す

29

Page 41: De 910HF3 DataExplorer Guide Ja

るとします。この場合、FIRST_NAMEカラムとLAST_NAMEカラムがAnalystツールによってプ

ロファイリングされます。

注: 他のオブジェクトタイプによって参照されているルールオブジェクトを削除しようと

すると、それらのオブジェクトタイプの一覧を示すメッセージが表示されます。ルールを

削除する前に、その削除の影響を判断するようにします。

定義済みルール定義済みルールは、Developerツールで作成されたルール、またはDeveloperツールと

Analystツールに付属しているルールです。定義済みルールをAnalystツールのプロファイ

ルに適用して、ソースデータを変更または検証します。

定義済みルールでは、トランスフォーメーションを使用してルールロジックを定義しま

す。定義済みルールは複数のプロファイルで使用できます。モデルリポジトリでは、定義

済みルールは入力グループ、出力グループ、およびルールロジックを定義するトランスフ

ォーメーションが含まれるマプレットです。

定義済みルールのプロセス

プロファイルに定義済みルールを適用するには、新しいルールウィザードを使用します。

定義済みルールは、次の手順に従って適用できます。

1. プロファイルを開きます。

2. 定義済みルールを選択します。

3. ルールのパラメータを確認します。

4. 入力カラムを選択します。

5. プロファイリングのオプションを設定します。

定義済みルールの適用

プロファイルに定義済みルールを適用するには、[新しいルール]ウィザードを使用しま

す。 定義済みルールを適用するときに、ルールを選択してそのルールの入力カラムと出力

カラムを設定します。 再利用可能なルールとして格上げされたルールを使用するか、開発

者が作成したルールを使用するには、定義済みルールを適用します。

1. ナビゲータで、ルールを追加するプロファイルを含むプロジェクトまたはフォルダを

選択します。

2. プロファイルをクリックして開きます。

タブにプロファイルが表示されます。

3. [アクション] > [ルールの追加]をクリックします。

[新しいルール]ウィンドウが表示されます。

4. オプション[ルールの適用]を選択します。

5. [次へ]をクリックします。

30 章 6: Informatica Analystのルール

Page 42: De 910HF3 DataExplorer Guide Ja

6. [ルール]パネルで、適用するルールを選択します。

[ルールのパラメータ]パネルの[入力]カラムと[出力]カラムに、名前、データ

型、説明、および精度の各カラムが表示されます。

7. [次へ]をクリックします。

8. [入力]セクションで、入力カラムを選択します。 入力カラムはプロファイルのカラ

ム名です。

9. 必要に応じて、[出力]セクションで出力カラムのラベルを設定します。

10. [次へ]をクリックします。

11. カラムパネルで、プロファイリングするカラムを選択します。 カラムには、プロファ

イルに適用したルールが含まれます。 必要に応じて、[名前]を選択してすべてのカ

ラムを含めます。

Analystツールには、各カラムの名前、データタイプ、精度、および位取りが一覧表示

されます。

12. サンプリングのオプションパネルでサンプリングのオプションを設定します。

13. ドリルダウンのオプションパネルでドリルダウンのオプションを設定します。

14. [保存]をクリックしてルールを適用するか、[保存して実行]をクリックしてルー

ルを適用してからプロファイルを実行します。

式ルール式ルールでは、式関数およびカラムを使用してルールロジックを定義します。式ルール

は、Analystツールで作成してプロファイルに追加します。

式ルールを使用して、プロファイルのカラムの値を変更または検証します。1つ以上の式ル

ールを作成して1つのプロファイルで使用できます。式関数は、ソースデータの変換に使用

されるSQLのような関数です。式ルールロジックを作成するときは、次のタイプの関数を使

用できます。

¨ Character

¨ 変換

¨ Data Cleansing

¨ 日付

¨ エンコーディング

¨ 財務

¨ 数値

¨ 科学

¨ 特殊

¨ テスト

式ルール 31

Page 43: De 910HF3 DataExplorer Guide Ja

式ルールのプロセス

式ルールを作成してプロファイルに追加するには、新しいルールウィザードを使用しま

す。

新しいルールウィザードには式エディタが用意されています。式エディタを使用して式関

数を追加し、カラムを関数への入力として設定して式を検証し、戻り型、精度、およびス

ケールを設定します。

式ルールの出力は、ルールの名前をカラム名として使用する仮想カラムです。Analystツー

ルでは仮想カラムがプロファイリングされます。例えば、式ルールを使用して郵便番号を

検証するとします。郵便番号が有効な場合は1が返され、無効な場合は0が返されます。こ

のルールの1と0の出力値がInformatica Analystによってプロファイリングされます。

式ルールは次の手順で作成できます。

1. プロファイルを開きます。

2. 式関数とカラムをパラメータとして使用してルールロジックを設定します。

3. プロファイリングのオプションを設定します。

式ルールの作成

式ルールを作成してプロファイルに追加するには、[新しいルール]ウィザードを使用し

ます。 式ルールを作成して、プロファイルのカラムの値を変更または検証します。

1. ナビゲータで、ルールを追加するプロファイルを含むプロジェクトまたはフォルダを

選択します。

2. コンテンツパネルで、プロファイルをクリックして開きます。

タブにプロファイルが表示されます。

3. [アクション] > [ルールの追加]をクリックします。

[新しいルール]ウィンドウが表示されます。

4. [ルールの作成]を選択します。

5. [次へ]をクリックします。

6. ルールの名前を入力し、必要に応じて説明を入力します。

7. 必要に応じて、ルールを再利用可能なルールとして格上げするように選択し、プロジ

ェクトとフォルダの場所を設定します。

ルールを再利用可能なルールに格上げすると、他のユーザーもこのルールを別のプロ

ファイルで定義済みルールとして使用できるようになります。

8. [関数]タブで、関数を選択して右矢印をクリックし、関数のパラメータを入力しま

す。

9. [カラム]タブで、入力カラムを選択して右矢印をクリックし、[式]エディタで式

を追加します。 式に論理演算子を追加することもできます。

10. [検証]をクリックします。式が有効な場合は次の手順に進むことができます。

11. 必要に応じて、[編集]をクリックして戻り型、精度、およびスケールを設定しま

す。

12. [次へ]をクリックします。

32 章 6: Informatica Analystのルール

Page 44: De 910HF3 DataExplorer Guide Ja

13. カラムパネルで、プロファイリングするカラムを選択します。 カラムには、プロファ

イルに適用したルールが含まれます。 必要に応じて、[名前]を選択してすべてのカ

ラムを選択します。

Analystツールには、各カラムの名前、データタイプ、精度、および位取りが一覧表示

されます。

14. サンプリングのオプションパネルでサンプリングのオプションを設定します。

15. ドリルダウンのオプションパネルでドリルダウンのオプションを設定します。

16. [保存]をクリックしてルールを作成するか、[保存して実行]をクリックしてルー

ルを作成してからプロファイルを実行します。

式ルール 33

Page 45: De 910HF3 DataExplorer Guide Ja

第 7 章

Informatica Analystのスコアカード

この章では、以下の項目について説明します。

¨ Informatica Analystのスコアカードの概要, 34 ページ

¨ Informatica Analystのスコアカードのプロセス, 35 ページ

¨ スコアカードへのカラムの追加, 35 ページ

¨ スコアカードの実行, 36 ページ

¨ スコアカードの表示, 37 ページ

¨ スコアカードの編集, 37 ページ

¨ しきい値の定義, 38 ページ

¨ スコアグループ, 38 ページ

¨ カラムのドリルダウン, 40 ページ

¨ 傾向グラフの表示, 41 ページ

Informatica Analystのスコアカードの概要スコアカードは、プロファイル内のカラムの有効値を視覚的に表したものです。スコアカ

ードを作成して、実データまたはステージングされたデータをドリルダウンすることがで

きます。

データ品質の進捗を測定するには、スコアカードを使用します。例えば、データ品質ルー

ルを適用する前に、スコアカードを作成してデータ品質を測定することができます。デー

タ品質ルールを適用した後に、別のスコアカードを作成して、データ品質に対するルール

の影響を比較することができます。

スコアカードには、カラムの値の頻度がスコアとして表示されます。スコアにはカラムの

有効値の割合が反映されます。プロファイルの実行後に、プロファイルからスコアカード

にカラムを追加できます。その後、しきい値を定義して、レコード内のカラムで許容でき

る不良データの範囲を指定できます。スコアカードを実行した後、スコアグループを作成

して、関連するスコアを1つのエンティティにグループ化することができます。有効なデー

34

Page 46: De 910HF3 DataExplorer Guide Ja

タレコードと無効なレコードを識別するには、各カラムをドリルダウンします。Analystツ

ールで傾向グラフを使用すると、一定の期間におけるスコアの変化を追跡できます。

Informatica Analystのスコアカードのプロセス

Analystツールでスコアカードを実行および編集できます。スコアカードの作成や表示は

Developerツールで行います。スコアカードは、データオブジェクトの現在のデータに対し

て実行するか、ステージングデータベースに格納されているデータに対して実行すること

ができます。

Analystツールの[コンテンツ]ビューでスコアカードを表示すると、スコアカードは別の

タブで開きます。スコアカードを実行したら、[スコアカード]ビューでスコアを表示で

きます。スコアカード内のスコアからデータオブジェクトを選択し、そのデータオブジェ

クトに移動できます。データオブジェクトは別のタブで開きます。

スコアカードに関する以下の作業を実行できます。

1. Developerツールでスコアカードを作成し、プロファイルからカラムを追加します。

2. 必要に応じて、Analystツールに接続し、Analystツールでスコアカードを開きます。

3. プロファイルの実行後に、プロファイルカラムをスコアカードに追加します。

4. スコアカードを実行してカラムのスコアを生成します。

5. スコアカードを表示して、レコード内の各カラムのスコアを確認します。

6. スコアのカラムをドリルダウンします。

7. スコアカードを編集します。

8. スコアカードの各スコアに対してしきい値を設定します。

9. グループを作成して、スコアカード内の関連するスコアを追加または移動します。

10. 必要に応じて、グループを編集または削除します。

11. 各スコアの傾向グラフを表示して、スコアの変化を時系列で監視します。

スコアカードへのカラムの追加プロファイルの実行後に、プロファイルカラムをスコアカードに追加できます。スコアカ

ードに追加ウィザードを使用して、プロファイルからスコアカードにカラムを追加したり

カラムに対して有効な値を設定したりします。[すべての行]以外のフィルタまたはサン

プリングのオプションが設定されているソースプロファイルからスコアカードにプロファ

イルカラムを追加した場合、プロファイル結果にスコアカードの結果は反映されないこと

があります。

1. ナビゲータで、プロファイルを含むプロジェクトまたはフォルダを選択します。

Informatica Analystのスコアカードのプロセス 35

Page 47: De 910HF3 DataExplorer Guide Ja

2. プロファイルをクリックして開きます。

タブにプロファイルが表示されます。

3. [アクション] > [プロファイルの実行]をクリックしてプロファイルを実行しま

す。

4. [アクション] > [スコアカードに追加]をクリックします。

[スコアカードに追加]ウィザードが表示されます。

注: スコアカードにカラムを追加するときは、以下のルールとガイドラインに従いま

す。

¨ カラム名とスコアカード名が同じ場合、スコアカードにカラムを追加することはで

きません。

¨ カラム名を変更しても、同じカラムをスコアカードに2回追加することはできませ

ん。

5. スコアカードに追加するカラムとルールを選択します。 必要に応じて、左側のカラム

ヘッダのチェックボックスをクリックしてすべてのカラムを選択します。 必要に応じ

て、[カラム名]を選択してカラム名をソートします。

6. 必要に応じて、スコア名を選択してスコア名を変更し、説明を追加します。

7. [次へ]をクリックします。

8. カラムを追加するスコアカードを選択するか、[新規]をクリックして[新しいスコ

アカード]ウィンドウでスコアカードの名前、説明、および場所を設定し、[OK]を

クリックします。

9. [次へ]をクリックします。

10. スコアパネルで各カラムを選択し、次のパネル内のすべての値のリストから有効な値

を設定します([スコアで使用: 値]パネル)。

必要に応じて、[有効]を選択して有効なすべての値を含めます。

11. スコアパネルで各カラムを選択し、スコア設定パネルで[このスコアのカスタムしき

い値の設定]を選択してスコアのしきい値を設定します。

[正常]、[許容可能]、および[許容不可]のスコアに対してしきい値を設定でき

ます。

12. [完了]をクリックします。

スコアカードの実行スコアカードを実行してカラムのスコアを生成します。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

タブにスコアカードが表示されます。

3. [アクション] > [スコアカードの実行]をクリックします。

36 章 7: Informatica Analystのスコアカード

Page 48: De 910HF3 DataExplorer Guide Ja

4. スコアパネルからスコアを選択し、カラムパネルからドリルダウンするカラムを選択

します。

5. [ドリルダウン]オプションで、実データをドリルダウンするかステージングされた

データをドリルダウンするかを選択します。

最適なパフォーマンスを実現するには、実データをドリルダウンします。

6. [実行]をクリックします。

スコアカードの表示スコアカードを表示して、レコード内の各カラムのスコアを確認します。 スコアを選択す

ると、各カラムのデータ行を表示できます。 有効なデータまたは無効なデータを表示でき

ます。 スコアを表示するには、スコアカードを実行する必要があります。 最終実行日時

などのスコアカードに関する概要情報を表示できます。 スコアごとに、名前、行の合計

数、および無効な行の合計数を表示できます。 スコアは割合および棒グラフとして表示で

きます。 スコアの生成元のデータオブジェクトの名前、データオブジェクトのソース名、

およびデータソースタイプを表示できます。

1. スコアを表示するためにスコアカードを実行します。

2. 表示するスコアが含まれているカラムを選択します。

3. [アクション] > [行を表示]をクリックして、カラムの有効なデータ行または無効

なデータ行を表示します。

デフォルトでは、Analystツールのドリルダウンパネルには有効なデータ行が表示され

ます。

スコアカードの編集スコアカードのカラムの有効な値を編集します。 スコアカードを編集する前に、そのスコ

アカードを実行する必要があります。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

タブにスコアカードが表示されます。

3. [アクション] > [編集]をクリックします。

[スコアカードの編集]ウィンドウが表示されます。

4. [スコア]タブのスコアパネルで各スコアを選択し、次のパネル内のすべての値のリ

ストから有効な値を設定します([スコアで使用: 値]パネル)。

5. スコア設定パネルで[このスコアのカスタムしきい値の設定]を選択してスコアのし

きい値を設定します。

6. [保存]をクリックして、変更内容をスコアカードに保存します。

スコアカードの表示 37

Page 49: De 910HF3 DataExplorer Guide Ja

しきい値の定義スコアカードの各スコアに対してしきい値を設定できます。 しきい値では、レコード内の

カラムで許容できる不良データの範囲を割合で指定します。 正常、許容可能、または許容

不可の範囲のデータに対してしきい値を設定できます。 スコアカードにカラムを追加する

とき、またはスコアカードを編集するときに、各カラムに対してしきい値を定義できま

す。

スコアカードのカラムに対してしきい値を定義する前に、次の前提条件のタスクを完了さ

せます。

¨ ナビゲータでプロファイルを含むプロジェクトまたはフォルダを選択し、[スコアカー

ドに追加]ウィンドウでプロファイルからスコアカードにカラムを追加します。

¨ 必要に応じて、ナビゲータでスコアカードを含むプロジェクトまたはフォルダを選択

し、[スコアカードの編集]ウィンドウでスコアカードをクリックして編集します。

1. [スコアカードに追加]ウィンドウまたは[スコアカードの編集]ウィンドウのスコ

アパネルで、各カラムを選択します。

2. [スコア設定]カラムで[このスコアのカスタムしきい値の設定]を選択します。

3. 許容不可の範囲の上限と正常の範囲の下限を表すしきい値を入力します。

4. [完了]または[保存]をクリックします。

スコアグループスコアカード内の関連するスコアを1つのまとまりとして分類するには、スコアグループを

作成します。デフォルトでは、すべてのスコアがデフォルトグループに分類されます。

グループを作成したら、デフォルトグループから別のグループにスコアを移動できます。

グループの名前と説明は変更することができます。デフォルトグループの名前も変更でき

ます。不要になったグループは削除できますが、デフォルトグループは削除できません。

グループの作成

グループを作成して、そのグループにスコアカード内の関連するスコアを追加します。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

タブにスコアカードが表示されます。

3. [アクション] > [編集]をクリックします。

[スコアカードの編集]ウィンドウが表示されます。

4. [スコアグループ]タブをクリックします。

デフォルトグループがスコアグループパネルに表示され、デフォルトグループのスコ

アがスコアパネルに表示されます。

38 章 7: Informatica Analystのスコアカード

Page 50: De 910HF3 DataExplorer Guide Ja

5. [新規]をクリックしてグループを作成します。

[新しいグループ]ウィンドウが表示されます。

6. 名前を入力し、必要に応じて説明を入力します。

7. [OK]をクリックします。

8. [保存]をクリックして、変更内容をスコアカードに保存します。

グループへのスコアの移動

グループを作成した後で、そのグループに関連するスコアを移動できます。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

タブにスコアカードが表示されます。

3. [アクション] > [編集]をクリックします。

[スコアカードの編集]ウィンドウが表示されます。

4. [スコアグループ]タブをクリックします。

デフォルトグループがスコアグループパネルに表示され、デフォルトグループのスコ

アがスコアパネルに表示されます。

5. スコアパネルからスコアを選択して、[移動]をクリックします。

[スコアの移動]ウィンドウが表示されます。

注: 複数のスコアを選択するには、Shiftキーを押しながら選択します。

6. スコアの移動先のグループを選択します。

7. [OK]をクリックします。

グループの編集

グループを編集して、グループの名前および説明を変更します。 デフォルトグループの名

前を変更できます。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

スコアカードがタブで開かれます。

3. [アクション] > [編集]をクリックします。

[スコアカードの編集]ウィンドウが表示されます。

4. [スコアグループ]タブをクリックします。

デフォルトグループがスコアグループパネルに表示され、デフォルトグループのスコ

アがスコアパネルに表示されます。

5. スコアグループパネルで[編集]をクリックします。

[編集]ウィンドウが表示されます。

6. 名前を入力し、必要に応じて説明を入力します。

7. [OK]をクリックします。

スコアグループ 39

Page 51: De 910HF3 DataExplorer Guide Ja

グループの削除

無効になったグループを削除できます。 グループを削除するときに、グループ内のスコア

をデフォルトグループに移動するように選択できます。 デフォルトグループは削除できま

せん。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

スコアカードがタブで開かれます。

3. [アクション] > [編集]をクリックします。

[スコアカードの編集]ウィンドウが表示されます。

4. [スコアグループ]タブをクリックします。

デフォルトグループがスコアグループパネルに表示され、デフォルトグループのスコ

アがスコアパネルに表示されます。

5. スコアグループパネルで[削除]をクリックします。

[グループの削除]ウィンドウが表示されます。

6. グループを削除する前に、グループ内のスコアを削除するオプション、またはスコア

をデフォルトグループに移動するオプションを選択します。

7. [OK]をクリックします。

カラムのドリルダウンスコアに対応するカラムをドリルダウンして、有効なデータ行または無効なデータ行を表

示したときに示されるカラムを選択します。ドリルダウン対象として選択したカラムはド

リルダウンパネルに表示されます。

1. スコアを表示するためにスコアカードを実行します。

2. 表示するスコアが含まれているカラムを選択します。

3. [アクション] > [行を表示]をクリックして、カラムの有効なデータ行または無

効なデータ行を表示します。

4. [アクション] > [カラムのドリルダウン]をクリックします。

[カラムのドリルダウン]ウィンドウが表示されます。

5. [ドリルダウン]パネルに含めるカラムを選択します。

必要に応じて、[名前]カラムを選択してすべてのカラムを含めます。

6. [OK]をクリックします。

選択したスコアに対応するカラムがドリルダウンパネルに表示されます。 デフォルト

では、Analystツールにはカラムの有効なデータ行が表示されます。 無効なデータ行

を表示する場合は、[無効]をクリックします。

40 章 7: Informatica Analystのスコアカード

Page 52: De 910HF3 DataExplorer Guide Ja

傾向グラフの表示各スコアの傾向グラフを表示して、スコアの変化を時系列で監視できます。

1. ナビゲータで、スコアカードを含むプロジェクトまたはフォルダを選択します。

2. スコアカードをクリックして開きます。

タブにスコアカードが表示されます。

3. [スコアカード]ビューで、スコアを選択します。

4. [アクション] > [傾向グラフの表示]をクリックします。

[傾向グラフの詳細]ウィンドウが表示されます。 スコアの値の変化を時系列で確認

できます。 Analystツールでは、日付ごとの履歴スコアカード実行データと最新の有

効なスコアの値を使用してスコアが計算されます。 また、グラフの最新のしきい値設

定を使用してスコアポイントの色が表示されます。

傾向グラフの表示 41

Page 53: De 910HF3 DataExplorer Guide Ja

パート III: InformaticaDeveloperを使用したデータ検出

この部には、以下の章があります。

¨ Informatica Developerのプロファイル, 43 ページ

¨ データオブジェクトプロファイル, 46 ページ

¨ Informatica Developerのカラムプロファイル結果, 55 ページ

¨ Informatica Developerのルール, 59 ページ

¨ Informatica Developerのスコアカード, 61 ページ

¨ マプレットとマッピングのプロファイリング, 63 ページ

¨ プロファイルモデル, 66 ページ

42

Page 54: De 910HF3 DataExplorer Guide Ja

第 8 章

Informatica Developerのプロファイル

この章では、以下の項目について説明します。

¨ Informatica Developerのプロファイルの概要, 43 ページ

¨ Informatica Developerのプロファイルのビュー, 44 ページ

Informatica Developerのプロファイルの概要

データセットのデータ品質に関する問題を検出したり、データセットのカラムの関係を把

握したりするには、Informatica Developerでプロファイルを作成して実行します。

次のタイプのデータ分析のプロファイルを作成できます。

¨ カラムプロファイリング

¨ プライマリキー検出

¨ 機能依存性検出

¨ 外部キー検出

¨ 結合分析

¨ 重複検出

Developerツールではウィザードを使用してプロファイルを作成します。プロファイルの作

成ウィザードには、プロファイルを作成するためのオプションとして、[プロファイ

ル]、[複数のプロファイル]、および[プロファイルモデル]の3つがあります。

プロファイル

単一のデータオブジェクトに対するプロファイルを作成します。単一のプロファイルで

は、カラムプロファイリングのフィルタ、ルール、およびドリルダウンのオプションを定

義します。また、詳細オプションを選択して、カラムプロファイル、プライマリキープロ

ファイル、および機能依存性プロファイルを作成することもできます。カラムプロファイ

リング、プライマリキー推測、および機能依存性推測の結果が表示されます。

43

Page 55: De 910HF3 DataExplorer Guide Ja

複数のプロファイル

複数のオブジェクトに対する一連のプロファイルを作成します。プロファイルはオブジェ

クトごとに作成され、同時に実行されます。 複数のプロファイルを一度に作成した場合、

複数のオブジェクトにまたがってデータを分析することはできません。

プロファイルモデル

複数のデータオブジェクトからデータモデルを作成し、複数のオブジェクトにまたがって

データを分析するプロファイルを作成します。プロファイルモデルを作成してから、一緒

にプロファイリングする物理データオブジェクトをそのモデルに追加します。データオブ

ジェクトプロファイル、外部キープロファイル、および結合プロファイルを作成できま

す。プロファイルモデルのデータオブジェクトごとに、全般プロパティ、プロファイリン

グするカラム、キー、およびリレーションを設定することができます。1つまたは複数のデ

ータソース内の重複データを検出できます。

以下の表に、各プロファイルタイプで実行できる操作を示します。

プロファイル

オプション

プロファイルの操作

プロファイル - 単一のデータセットに対してカラムプロファイルを実行する

- プライマリキーを検出する

- 機能依存性を検出する

複数のプロフ

ァイル

複数のオブジェクトに対してカラムプロファイルを同時に作成

および実行する

プロファイル

モデル

- 単一のデータセットに対してカラムプロファイルを実行する

- プライマリキーを検出する

- 外部キーを検出する

- 機能依存性を検出する

- 結合分析を実行する

- 2つのカラム間の重複を検出する

Informatica Developerのプロファイルのビュー

Informatica Developerのプロファイルに関する情報は、[概要]、[定義]、[コメン

ト]、および[結果]の各ビューを使用して表示したり追加したりできます。

Object Explorerからプロファイルを開くと、右ペインのエディタの以下のビューにプロフ

ァイル情報が表示されます。

概要

名前、説明、場所など、プロファイルの全般的な情報が表示されます。

44 章 8: Informatica Developerのプロファイル

Page 56: De 910HF3 DataExplorer Guide Ja

定義

プロファイル定義が表示され、設定することもできます。これには、プロファイルに

割り当てられるフィルタやルール、ドリルダウンのオプション、プロファイルの実行

時に有効になる関数などの情報が含まれます。

コメント

プロファイルに対するコメントが表示され、追加することもできます。

結果

プロファイルの実行結果が表示されます。

Informatica Developerのプロファイルのビュー 45

Page 57: De 910HF3 DataExplorer Guide Ja

第 9 章

データオブジェクトプロファイル

この章では、以下の項目について説明します。

¨ データオブジェクトプロファイルの概要, 46 ページ

¨ Informatica Developerのカラムプロファイル, 47 ページ

¨ プライマリキー検出, 48 ページ

¨ 機能依存性検出, 50 ページ

¨ 単一のデータオブジェクトプロファイルの作成, 52 ページ

¨ 複数のデータオブジェクトプロファイルの作成, 53 ページ

¨ フラットファイルデータオブジェクトの同期, 54 ページ

¨ リレーショナルデータオブジェクトの同期, 54 ページ

データオブジェクトプロファイルの概要データオブジェクトプロファイルでは、データソース内のカラムデータやメタデータに関

する情報を検出します。Developerツールでは、単一のデータオブジェクトおよび複数のデ

ータオブジェクトに対してプロファイルを実行できます。単一のデータオブジェクトプロ

ファイルでは1つのデータソースを分析し、複数のデータオブジェクトプロファイルでは複

数のデータソースを分析します。複数のデータオブジェクトプロファイルを作成すると、

それらに対してカラムプロファイリングを実行することができます。

以下の表に、単一のデータオブジェクトプロファイルに対して実行できるデータ検出作業

を示します。

Task 説明

カラムプロファイリング 頻度、割合、パターンなどのデータの

特性を検出します。フィルタを追加し

て、プロファイルが実行時に読み取る

行を特定できます。プロファイルで

46

Page 58: De 910HF3 DataExplorer Guide Ja

Task 説明

は、フィルタ条件を満たさない行は処

理されません。

プライマリキー検出 データソース内で行を一意に識別でき

る値を含むカラムを検出します。

機能依存性検出 データソース内のカラムのペア間の依

存性に関する情報が得られます。

以下の表に、[プロファイルモデル]オプションを使用してデータモデルを作成するとき

に、複数のデータオブジェクトに対して実行できるデータ検出作業を示します。

Task 説明

外部キー検出 別のデータソース内のプライマリキー

値と一致する値を含むカラムを検出し

ます。

結合分析 1つのデータソース内、または2つのデ

ータソース間における、2つのカラム

内のデータ間に見込まれる結合度を検

出します。

重複検出 1つまたは複数のデータソース内のカ

ラムのペア間で発生している重複デー

タの割合を検出します。

Informatica Developerのカラムプロファイル

データセットのカラムの特性(値の割合やパターンなど)を分析するには、カラムプロフ

ァイルを使用します。フィルタを追加して、プロファイルが実行時に読み取る行を特定で

きます。プロファイルでは、フィルタ条件を満たさない行は処理されません。

プロファイリングするカラムについて次のタイプの情報を検出できます。

¨ カラムの値が出現する回数。

¨ カラムの各値が出現する頻度(割合で表される)。

¨ カラムの値の文字パターン。

¨ カラムの値の最大長と最小長、および最初の値と最後の値。

カラムプロファイルは、マッピングまたはマプレット内のデータオブジェクトか、モデル

リポジトリ内のオブジェクトについて定義できます。リポジトリ内のオブジェクトは、単

一のデータオブジェクトプロファイル、複数のデータオブジェクトプロファイル、または

プロファイルモデルに含めることができます。

Informatica Developerのカラムプロファイル 47

Page 59: De 910HF3 DataExplorer Guide Ja

カラムプロファイルにルールを追加できます。ルールを使用して、プロファイリング対象

のソースデータのサブセットを選択します。また、カラムプロファイルのドリルダウンの

オプションを変更して、ドリルダウンの読み取り元をステージングされたデータにするか

実データにするかを決定することもできます。

フィルタリングオプション

フィルタを追加して、プロファイリング操作の実行時にカラムプロファイルで使用する行

を特定できます。 プロファイルでは、フィルタ条件を満たさない行は処理されません。

1. カラムプロファイルを作成するか、または開きます。

2. [フィルタ]ビューを選択します。

3. [追加]をクリックします。

4. フィルタタイプを選択して[次へ]をクリックします。

5. フィルタの名前を入力します。 必要に応じて、フィルタの説明を入力します。

6. [アクティブとして設定]を選択してフィルタをプロファイルに適用します。 [次

へ]をクリックします。

7. フィルタ条件を定義します。

8. [完了]をクリックします。

サンプリングのプロパティ

サンプリングのプロパティを設定して、プロファイリング操作中にプロファイルで読み取

る行数を決定します。

以下の表に、サンプリングのプロパティを示します。

プロパティ 説明

すべての行 ソースからすべての行を読み取る。 デフォルトでは

有効になっている。

先頭 最初の行から指定した行までを読み取る。

ランダムサンプル 指定した行数からランダムなサンプルを読み取る。

ランダムサンプル(自

動)

行のランダムなサンプルから読み取る。

プライマリキー検出プライマリキー検出では、指定したカラムからプライマリキー候補が生成されます。

プライマリキーは、データソース内で行を一意に識別するカラムまたはカラムの組み合わ

せです。プライマリキー検出では、特定の信頼度を満たすカラムおよびカラムの組み合わ

48 章 9: データオブジェクトプロファイル

Page 60: De 910HF3 DataExplorer Guide Ja

せを特定します。信頼度、およびプライマリキーの識別のために組み合わせるカラムの最

大数を編集できます。

プライマリキー検出では、プライマリキー候補における一意ではない行を特定すること

で、データ品質に関する潜在的な問題を強調表示することができます。これは特に、プラ

イマリキー検出で多数のカラムを組み合わせている場合に役立ちます。不適合レコードに

は重複情報が含まれている可能性が高いためです。

プライマリキー推測のプロパティ

単一のデータオブジェクトプロファイルを作成するときは、[プライマリキーのプロファ

イリング]ビューを使用して、プライマリキー推測のプロパティを設定できます。

以下の表に、[プライマリキーのプロファイリング]ビューのプライマリキー推測のプロ

パティを示します。

プロパティ 説明

デフォルトの推測オプシ

ョンをオーバーライド

プライマリキー推測のカスタム設定を実行できる。

最大キーカラム数 プライマリキーを構成できる最大カラム数。

最大行数 プロファイリングする行数。

適合条件 プライマリキーを判別するときにプロファイルで許

容できるキー違反の行の割合または数の最小値。

推測されるプライマリキーのプロパティ

単一のデータオブジェクトプロファイルを実行した後、[プライマリキーのプロファイリ

ング]ビューを使用して、データソース内の推測されるプライマリキーの詳細を確認でき

ます。

以下の表に、[プライマリキーのプロファイリング]ビューの推測されるプライマリキー

のプロパティを示します。

プロパティ 説明

カラム プロファイル内のカラムの名前。

適合する行の% カラム内の一意の値の割合。

重複する行の% カラムの重複する値の割合。

NULLの行の% カラムのNULL値の割合。

プライマリキー検出 49

Page 61: De 910HF3 DataExplorer Guide Ja

プロパティ 説明

検証済み カラムがプライマリキーカラムかどうかを判別す

る。

最終実行時刻 最後にプライマリキープロファイルを実行した日

時。

キー違反のプロパティ

単一のデータオブジェクトプロファイルを実行した後、[プライマリキーのプロファイリ

ング]ビューを使用して、データソース内のプライマリキー違反の詳細を確認できます。

以下の表に、[プライマリキーのプロファイリング]ビューのキー違反のプロパティを示

します。

プロパティ 説明

カラム プロファイルでプライマリキー候補の推測に使用さ

れるカラムの名前。

キー違反の数 プライマリキー候補におけるキー違反の数。

機能依存性検出機能依存性検出を行うと、データソース内のカラムのペア間の依存性に関する情報が得ら

れます。

一方のカラムの値が他方のカラムの値を確実に予測できる場合、そのカラムのペアは機能

的に依存関係にあります。例えば、データセットに雇用者IDカラムと生年月日カラムが含

まれている場合、特定の雇用者IDが含まれているすべての行で生年月日は同じになるはず

です。

機能依存性検出では、カラムの機能依存性に適合しないレコードを特定することで、デー

タ品質に関する潜在的な問題を強調表示することができます。例えば、データソース内の

行の99.8%が機能的に依存関係にある場合は、残りの行に正しくない情報が含まれている可

能性が高くなります。

50 章 9: データオブジェクトプロファイル

Page 62: De 910HF3 DataExplorer Guide Ja

機能依存性推測のプロパティ

[機能依存性プロファイリング]ビューには、カラム間の機能依存性に関する情報が表示

されます。

以下の表に、[機能依存性プロファイリング]ビューの機能依存性推測のプロパティを示

します。

プロパティ 説明

デフォルトの推測オプシ

ョンをオーバーライド

機能依存性推測のカスタム設定を実行できる。

決定側の最大カラム数 プロファイルで決定側を検出するために組み合わせ

ることができるカラムの数。

最大行数 プロファイリングする行数。

返された依存関係数 プロファイルに表示される依存関係数。 デフォルト

は[最小範囲]で、各カラムが依存側または決定側

に少なくとも1回出現する最小の依存性セットが表示

される。

返された最大依存関係数 プロファイルに表示される最大依存関係数。

適合条件 機能依存側を判別するときにプロファイルで許容で

きる依存性違反の割合または数の最小値。

推測される機能依存性のプロパティ

単一のデータオブジェクトプロファイルを実行した後、[機能依存性推測]ビューを使用

して、データソース内のカラム間の推測される機能依存性の詳細を確認できます。

以下の表に、[機能依存性推測]ビューの推測される機能依存性のプロパティを示しま

す。

プロパティ 説明

決定側カラム 機能依存性があるかどうかを分析するカラムの名

前。

依存カラム 決定側カラムに依存しているカラムの名前。

NULLの行の% カラムのNULL値の割合。

適合する行の% 機能依存性の一致の割合。

検証済み カラムが機能的に依存関係にあるかどうかを判別す

る。

最終実行時刻 最後に機能依存性プロファイルを実行した日時。

機能依存性検出 51

Page 63: De 910HF3 DataExplorer Guide Ja

機能依存性違反のプロパティ

カラム間の機能依存性に関する情報がビューに表示されます。単一のデータオブジェクト

プロファイルを実行した後、[機能依存性推測]ビューを使用して、データソース内の機

能依存性違反の詳細を確認できます。

以下の表に、[機能依存性推測]ビューの機能依存性違反のプロパティを示します。

プロパティ 説明

決定側カラム 機能依存性があるかどうかを分析するカラムの名

前。

別個の依存関係 一意の機能依存関係数。

単一のデータオブジェクトプロファイルの作成

データオブジェクトの1つ以上のカラムに対して単一のデータオブジェクトプロファイルを

作成し、プロファイルオブジェクトをモデルリポジトリに格納することができます。

1. [Object Explorer]ビューで、プロファイリングするデータオブジェクトを選択しま

す。

2. [ファイル]>[新規]>[プロファイル]をクリックしてプロファイルウィザードを

開きます。

3. [プロファイル]を選択して[次へ]をクリックします。

4. プロファイルの名前を入力し、プロジェクトの場所を確認します。 必要に応じて、新

しい場所を参照します。

5. 必要に応じて、プロファイルの説明を入力します。

6. 選択したデータオブジェクトの名前が[データオブジェクト]セクション内に表示さ

れることを確認します。

7. [次へ]をクリックします。

8. 実行するプロファイルの操作を設定します。 以下の操作を設定できます。

¨ カラムプロファイリング

¨ プライマリキー検出

¨ 機能依存性検出

注: プロファイルの操作を有効にするには、その操作に対して["プロファイルの実

行"アクションの一部として有効化]を選択します。 カラムプロファイリングはデフ

ォルトで有効になっています。

9. プロファイルのオプションを確認します。

52 章 9: データオブジェクトプロファイル

Page 64: De 910HF3 DataExplorer Guide Ja

カラムプロファイルではフィルタおよびサンプリングのオプションを編集でき、プラ

イマリキープロファイルと機能依存性プロファイルでは推測オプションを編集できま

す。

10. ドリルダウンのオプションを確認し、必要に応じて編集します。カラムプロファイル

ではドリルダウンのオプションを編集できます。 このオプションでは、ドリルダウン

操作の読み取り元をデータソースにするかステージングされたデータにするか、およ

び以前のプロファイルの実行による結果データを保存するかどうかを決定します。

11. [完了]をクリックします。

プロファイルを実行する準備ができました。

複数のデータオブジェクトプロファイルの作成

複数のデータオブジェクトのプロファイリング操作では、デフォルトのカラムプロファイ

リングオプションを使用して、1つ以上のデータオブジェクトのカラムプロファイルが生成

されます。

1. [Object Explorer]ビューで、プロファイリングするデータオブジェクトを選択しま

す。

2. [ファイル] > [新規] > [プロファイル]をクリックして[新しいプロファイ

ル]ウィザードを開きます。

3. [複数のプロファイル]オプションを選択して[次へ]をクリックします。

4. プロファイルを作成する場所を選択します。プロファイリングしたオブジェクトと同

じ場所に各プロファイルを作成するか、またはプロファイルの共通の場所を指定する

ことができます。

5. 選択したデータオブジェクトの名前が[データオブジェクト]セクション内に表示さ

れることを確認します。

必要に応じて、[追加]をクリックして別のデータオブジェクトを追加します。

6. 必要に応じて、プロファイリングする行数を指定し、ウィザードの完了時にプロファ

イルを実行するかどうかを選択します。

7. [完了]をクリックします。

8. 必要に応じて、プロファイル名に追加するプレフィックスおよびサフィックス文字列

を入力します。

9. [OK]をクリックします。

複数のデータオブジェクトプロファイルの作成 53

Page 65: De 910HF3 DataExplorer Guide Ja

フラットファイルデータオブジェクトの同期Informatica Developerで、外部フラットファイルデータソースに加えられた変更をそのデ

ータオブジェクトに同期させることができます。データオブジェクトを同期させるには、

[フラットファイルの同期]ウィザードを使用します。

1. [Object Explorer]ビューで、フラットファイルデータオブジェクトを選択しま

す。

2. 右クリックし、[同期]を選択します。

[フラットファイルデータオブジェクトの同期]ウィザードが表示されます。

3. [既存のフラットファイルの選択]フィールドのフラットファイルパスを確認しま

す。

4. [次へ]をクリックします。

5. 必要に応じ、コードページ、形式、区切り形式プロパティ、およびカラムプロパティ

を選択します。

6. [完了]をクリックし、[OK]をクリックします。

リレーショナルデータオブジェクトの同期Informatica Developerで、リレーショナルデータソースの外部データソース変更をそのデ

ータオブジェクトに同期させることができます。外部データソース変更には、カラムの追

加、変更、削除や、ルールの変更などがあります。

1. [Object Explorer]ビューで、リレーショナルデータオブジェクトを選択します。

2. 右クリックし、[同期]を選択します。

操作の確認を求めるメッセージが表示されます。

3. 同期プロセスを実行するには、[OK]をクリックします。このプロセスを取り消すに

は、[キャンセル]をクリックします。

[OK]をクリックすると、同期プロセスステータスメッセージが表示されます。

4. 「同期が完了しました」というメッセージが表示された時点で、[OK]をクリックし

ます。

このメッセージには、データオブジェクトに加えられたメタデータ変更の概要が示さ

れます。

54 章 9: データオブジェクトプロファイル

Page 66: De 910HF3 DataExplorer Guide Ja

第 1 0 章

Informatica Developerのカラムプロファイル結果

この章では、以下の項目について説明します。

¨ Informatica Developerのカラムプロファイル結果, 55 ページ

¨ カラム値のプロパティ, 56 ページ

¨ カラムパターンのプロパティ, 57 ページ

¨ カラム統計のプロパティ, 57 ページ

¨ Informatica Developerからのプロファイル結果のエクスポート, 58 ページ

Informatica Developerのカラムプロファイル結果

カラムプロファイル分析を行うと、データにおける不適合のパターンおよびインスタンス

が強調表示され、データ品質に関する情報が得られます。

55

Page 67: De 910HF3 DataExplorer Guide Ja

以下の表に、それぞれのタイプの分析のプロファイル結果を示します。

プロファイルタイプ プロファイル結果

カラムプロファイル - 一意の値とNULL値の割合と数に関する統計

- 推測されるデータ型

- データソースでデータに対して宣言されているデータ

タイプ

- 最大値と最小値

- 最後にプロファイルを実行した日時

- カラム内の一意の各データ要素の割合と数に関する統

- カラム内の一意の各文字パターンの割合と数に関する

統計

プライマリキープロ

ファイル

- 推測されるプライマリキー

- キー違反

機能依存性プロファ

イル

- 推測される機能依存性

- 機能依存性違反

カラム値のプロパティカラム値のプロパティは、プロファイリングしたカラムの値、および各値が各カラムに出

現する頻度を示します。 頻度は数、割合、および棒グラフで表されます。

カラム値のプロパティを表示するには、[表示]メニューから[値]を選択します。 カラ

ム値をダブルクリックし、その値を含む行にドリルダウンします。

以下の表に、カラム値のプロパティを示します。

プロパティ 説明

値 プロファイルのカラムのすべての値を示す一覧。

頻度 カラムの値が出現する回数。

割合 カラムの値が出現する回数(カラム内のすべての値

に対する割合で表される)。

チャート 割合の棒グラフ。

56 章 10: Informatica Developerのカラムプロファイル結果

Page 68: De 910HF3 DataExplorer Guide Ja

カラムパターンのプロパティカラムパターンのプロパティは、プロファイリングしたカラムにおけるデータのパターン

およびパターンが各カラムに出現する頻度を示します。 パターンは数、割合、および棒グ

ラフで表されます。

パターン情報を表示するには、[表示]メニューから[パターン]を選択します。 パター

ンをダブルクリックし、そのパターンを含む行にドリルダウンします。

以下の表に、カラム値のパターンのプロパティを示します。

プロパティ 説明

パターン 選択されたカラムのパターン。

頻度 カラムのパターンが出現する回数。

割合 カラムのパターンが出現する回数(カラム内のすべ

ての値に対する割合で表される)。

チャート 割合の棒グラフ。

カラム統計のプロパティカラム統計のプロパティは、値の最大長と最小長、および最初の値と最後の値を示しま

す。

統計情報を表示するには、[表示]メニューから[統計]を選択します。

以下の表に、カラム統計のプロパティを示します。

プロパティ 説明

最大長 カラムの最長値の長さ。

最小長 カラムの最短値の長さ。

下 カラム内の最後の5つの値。

上 カラム内の最初の5つの値。

注: Integerタイプのカラムの場合、プロファイルには平均と標準偏差の統計も表示されま

す。

カラムパターンのプロパティ 57

Page 69: De 910HF3 DataExplorer Guide Ja

Informatica Developerからのプロファイル結果のエクスポート

プロファイル結果からカラム値およびカラムパターンデータをエクスポートできます。

カラム値を、異なる値の数形式でエクスポートします。 パターン値を、ドメイン推測形式

でエクスポートします。

1. Object Explorerビューで、プロファイルを選択して開きます。

2. 必要に応じて、プロファイルを実行してプロファイル結果を更新します。

3. [結果]ビューを選択します。

4. エクスポートするデータが含まれているカラムを選択します。

5. [詳細]で、[値]または[パターン]を選択して[エクスポート]ボタンをクリッ

クします。

[ファイルへのデータのエクスポート]ダイアログボックスが開きます。

6. ファイル名を受け入れるか変更します。デフォルト名は、カラム値データの場合は

[Profile_name]_[column_name]_DVC、パターンデータの場合は

[Profile_name]_[column_name]_DIです。

7. エクスポートするデータのタイプを選択します。[選択したカラムの値]または[選

択したカラムのパターン]を選択できます。

8. [保存]で、[クライアントに保存]を選択し、[参照]をクリックして場所を選択

し、ファイルをコンピュータ上にローカルに保存します。デフォルトでは、

Informatica DeveloperはInformatica AdministratorのData Integration Service

プロパティに設定されている場所にファイルを書き込みます。

9. フィールド名を最初の行としてエクスポートしない場合は、[フィールド名を最初の

行としてエクスポート]チェックボックスをオフにします。

10. [OK]をクリックします。

58 章 10: Informatica Developerのカラムプロファイル結果

Page 70: De 910HF3 DataExplorer Guide Ja

第 1 1 章

Informatica Developerのルール

この章では、以下の項目について説明します。

¨ Informatica Developerのルールの概要, 59 ページ

¨ Informatica Developerでのルールの作成, 60 ページ

¨ Informatica Developerでのルールの適用, 60 ページ

Informatica Developerのルールの概要ルールは、プロファイルの実行時にソースデータに適用される条件を定義するビジネスロ

ジックです。Developerツールでは、マプレットから再利用可能なルールを作成することが

できます。作成したルールは、Analystツールのプロファイルでソースデータの変更や検証

を行うときに使用できます。

マプレットを作成してルールとして検証すると、Analystツールで再利用可能なルールとし

て使用できます。カラムプロファイルへのルールの適用は、DeveloperツールでもAnalyst

ツールでも実行できます。

ルールは、以下の要件を満たす必要があります。

¨ 入力トランスフォーメーションと出力トランスフォーメーションを含める必要がある。

ルールでデータソースを使用することはできません。

¨ 式トランスフォーメーション、ルックアップトランスフォーメーション、およびパッシ

ブなデータ品質トランスフォーメーションを含めることができる。他のタイプのトラン

スフォーメーションを含めることはできません。例えば、一致トランスフォーメーショ

ンはアクティブなトランスフォーメーションなので、ルールに含めることはできませ

ん。

¨ 入力グループ間のカーディナリティが指定されていない。

59

Page 71: De 910HF3 DataExplorer Guide Ja

Informatica Developerでのルールの作成Developerツールでルールを作成するには、マプレットをルールとして検証する必要があり

ます。

Developerツールでマプレットを作成します。

1. マプレットキャンバスを右クリックします。

2. [検証] > [ルール]を選択します。

Informatica Developerでのルールの適用保存したカラムプロファイルにルールを追加できます。結合分析用に設定したプロファイ

ルにルールを追加することはできません。

1. Object Explorerを参照して必要なプロファイルを見つけます。

2. プロファイルを右クリックし、[開く]を選択します。

プロファイルがエディタで開かれます。

3. [定義]タブをクリックし、[ルール]を選択します。

4. [追加]をクリックします。

[ルールの適用]ダイアログボックスが開きます。

5. [参照]をクリックして、適用するルールを見つけます。

リポジトリプロジェクトからルールを選択して、[OK]をクリックします。

6. [入力値]の下の[値]カラムをクリックし、ルールの入力ポートを選択します。

7. 必要に応じて、[出力行]の下の[値]カラムをクリックし、ルールの出力ポートの

名前を編集します。

ルールが[定義]タブに表示されます。

60 章 11: Informatica Developerのルール

Page 72: De 910HF3 DataExplorer Guide Ja

第 1 2 章

Informatica Developerのスコアカード

この章では、以下の項目について説明します。

¨ Informatica Developerのスコアカードの概要, 61 ページ

¨ スコアカードの作成, 61 ページ

Informatica Developerのスコアカードの概要

スコアカードは、プロファイルでの品質解析結果を視覚的に表したものです。スコアカー

ドの作成と削除はDeveloperツールで実行できます。Developerツールでスコアカードを作

成した後、Analystツールに接続してそのスコアカードを開くことができます。Analystツ

ールでスコアカードを実行および編集できます。スコアカードは、データオブジェクトの

現在のデータに対して実行するか、ステージングデータベースに格納されているデータに

対して実行することができます。

スコアカードの作成スコアカードを作成し、プロファイルからスコアカードにカラムを追加します。 スコアカ

ードにカラムを追加する前に、プロファイルを実行する必要があります。

1. Object Explorerで、スコアカードを作成するプロジェクトまたはフォルダを選択しま

す。

2. [ファイル] > [新規] > [スコアカード]をクリックします。

[新しいスコアカード]ダイアログボックスが表示されます。

3. [追加]をクリックします。

61

Page 73: De 910HF3 DataExplorer Guide Ja

[プロファイルの選択]ダイアログボックスが表示されます。 追加するカラムが含ま

れているプロファイルを選択します。

4. [OK]をクリックし、[次へ]をクリックします。

5. スコアカードに追加するカラムを選択します。

デフォルトでは、プロファイルで定義されているカラムとルールが選択されます。 プ

ロファイルに含まれていないカラムは追加できません。

6. [完了]をクリックします。

スコアカードが作成されます。

7. 必要に応じて、[Informatica Analystで開く]をクリックしてAnalystツールに接続

し、Analystツールでスコアカードを開きます。

62 章 12: Informatica Developerのスコアカード

Page 74: De 910HF3 DataExplorer Guide Ja

第 1 3 章

マプレットとマッピングのプロファイリング

この章では、以下の項目について説明します。

¨ マプレットとマッピングのプロファイリングの概要, 63 ページ

¨ マプレットまたはマッピングオブジェクトのプロファイリング, 64 ページ

¨ マッピングまたはマプレットオブジェクトのプロファイルの比較, 64 ページ

¨ プロファイルからのマッピングの生成, 65 ページ

マプレットとマッピングのプロファイリングの概要

マプレットまたはマッピングのオブジェクトに対するカラムプロファイルを定義できま

す。マッピングまたはマプレットの設計を確認するときにプロファイル結果を保存しない

場合は、マプレットまたはマッピングオブジェクトに対してプロファイルを実行します。

また、プロファイルからマッピングを生成することもできます。

63

Page 75: De 910HF3 DataExplorer Guide Ja

マプレットまたはマッピングオブジェクトのプロファイリング

マプレットまたはマッピングオブジェクトをプロファイリングする場合、プロファイリン

グ操作はすべてのデータカラムに対して実行され、データオブジェクトのステージングさ

れたデータに対するドリルダウン操作が可能になります。

プロファイルでは、選択したオブジェクトの出力ポートへのマッピングによってソースデ

ータがトレースされます。マッピングを実行した場合にこれらのポートに表示されるデー

タが分析されます。

1. マプレットまたはマッピングを開きます。

2. マプレットまたはマッピングが有効であることを確認します。

3. データオブジェクトまたはトランスフォーメーションを右クリックし、[今すぐプロ

ファイル]を選択します。

プロファイルの[結果]タブにプロファイル結果が表示されます。

マッピングまたはマプレットオブジェクトのプロファイルの比較

マプレットまたはマッピングの2つのオブジェクトを分析し、これらのオブジェクトのカラ

ムプロファイルの結果を比較するプロファイルを作成できます。

単一のマッピングまたはマプレットオブジェクトのプロファイルと同様に、プロファイル

比較はすべてのデータカラムに対して実行され、データオブジェクトにステージングされ

ているデータに対してドリルダウン操作を実行できるようにします。

1. マプレットまたはマッピングを開きます。

2. マプレットまたはマッピングが有効であることを確認します。

3. キャンバスでCtrlキーを押しながら2つのオブジェクトをクリックします。

4. いずれかのオブジェクトを右クリックし、[プロファイルの比較]を選択します。

5. 必要に応じて、一方のオブジェクトから他方のオブジェクトまでのカラムを照合する

ようにプロファイル比較を設定します。

6. 必要に応じて、一方のオブジェクトのカラムをクリックして他方のオブジェクトのカ

ラムにドラッグし、カラムを照合します。

7. 必要に応じて、プロファイルですべてのカラムを分析するか一致したカラムのみを分

析するかを選択します。

8. [OK]をクリックします。

64 章 13: マプレットとマッピングのプロファイリング

Page 76: De 910HF3 DataExplorer Guide Ja

プロファイルからのマッピングの生成プロファイルからマッピングオブジェクトを作成できます。作成したマッピングオブジェ

クトを使用し、有効なマッピングを作成します。作成するマッピングには、プロファイリ

ングしたオブジェクトに基づくデータソースが含まれます。また、プロファイルルールロ

ジックに基づくトランスフォーメーションを含めることもできます。マッピングの作成後

に、オブジェクトを追加してマッピングを完成させます。

1. Object Explorerビューで、マッピングを作成するプロファイルを見つけます。

2. プロファイル名を右クリックし、[マッピングの生成]を選択します。

[マッピングの生成]ダイアログボックスが表示されます。

3. マッピング名を入力します。 必要に応じて、マッピングの説明を入力します。

4. マッピングのフォルダの場所を確認します。

デフォルトでは、マッピングはプロファイルと同じプロジェクトのMappingsフォルダ

に作成されます。 マッピングの場所として別の場所を選択するには、[参照]をクリ

ックします。

5. Developerツールでマッピングを作成するために使用されるプロファイル定義を確認し

ます。 別のプロファイルを使用するには、[プロファイルの選択]をクリックしま

す。

6. [完了]をクリックします。

マッピングがObject Explorerに表示されます。

オブジェクトをマッピングに追加してマッピングを完成させます。

プロファイルからのマッピングの生成 65

Page 77: De 910HF3 DataExplorer Guide Ja

第 1 4 章

プロファイルモデル

この章では、以下の項目について説明します。

¨ プロファイルモデルの概要, 66 ページ

¨ プロファイルモデルの作成 , 67 ページ

¨ 外部キー検出, 67 ページ

¨ 結合分析, 70 ページ

¨ 重複検出, 72 ページ

プロファイルモデルの概要プロファイルモデルは、アプリケーションやスキーマのメタデータをキャプチャするオブ

ジェクトです。プロファイリングや検証に使用されるデータにアクセスするためのデータ

オブジェクトと、リレーション、キー、機能依存性などの構造オブジェクトが含まれま

す。

プロファイリングモデル用にモデリングキャンバスが用意されており、これを使用して、

複数のデータオブジェクトからデータモデルを作成し、複数のオブジェクトにまたがって

データを分析するプロファイルを作成することができます。プロファイルモデルから以下

のプロファイリング作業を実行できます。

¨ 単一のデータセットに対してカラムプロファイルを実行する。

¨ データセット内のプライマリキーを検出する。

¨ データセット内の機能依存性関係を検出する。

¨ データセットに対して結合分析を実行する。

¨ データセット内の外部キーを検出する。

¨ 1つまたは複数のデータソース内のカラムのペア間で発生している重複データを検出す

る。

66

Page 78: De 910HF3 DataExplorer Guide Ja

プロファイルモデルの作成プロファイルモデルを使用して、複数のデータソース全体でデータを読み取るプロファイ

ルを定義します。

1. [ファイル] > [新規] > [プロファイル]をクリックします。

プロファイルの作成ウィザードが開きます。

2. [プロファイルモデル]を選択し、[次へ]をクリックします。

3. プロファイルモデル名を入力します。

4. プロファイルモデルのプロジェクトフォルダを確認するか、[参照]をクリックして

フォルダを選択します。

[次へ]をクリックします。

5. [次へ]をクリックしてモデルにデータオブジェクトを追加します。

後でデータオブジェクトを追加する場合は、[完了]をクリックします。

[次へ]をクリックすると、データオブジェクトを追加するように求めるメッセージ

がウィザードに表示されます。

6. プロファイルに1つ以上のデータオブジェクトを追加します。

¨ [新規]をクリックし、[データオブジェクト]カラムの[参照]の矢印をクリッ

クします。

¨ [データオブジェクトの選択]ダイアログボックスを使用してモデルリポジトリを

参照し、データオブジェクトを選択します。

¨ [OK]をクリックしてダイアログボックスを閉じます。

¨ [新規]をクリックし、同じ方法で別のオブジェクトを追加します。

7. [完了]をクリックします。

モデリングキャンバスにデータオブジェクトが表示されます。

注: データオブジェクトはObject Explorerからプロファイルモデルにいつでもドラッグで

きます。

外部キー検出カラムのデータ値が別のデータオブジェクトのプライマリキーカラム値と一致する場合、

そのカラムは外部キーです。

Developerツールでは、複数のデータオブジェクトに対して外部キー検出を実行できます。

プロファイルモデルを作成してデータオブジェクトを選択し、プロファイルを定義しま

す。

外部キー検出を実行する前に、プロファイルモデルで親データオブジェクトと子データオ

ブジェクトを特定する必要があります。プロファイルでは、親オブジェクトの1つ以上のキ

ー(プライマリキーを含む)を使用して、子オブジェクトの外部キーを検出します。親オ

ブジェクトと子オブジェクトを定義し、親オブジェクトのキーを特定したら、プロファイ

ルを作成して実行します。

プロファイルモデルの作成 67

Page 79: De 910HF3 DataExplorer Guide Ja

オブジェクトの親子関係の定義

2つのデータオブジェクト間の外部キー関係を検出するには、親データオブジェクトを選択

し、そのオブジェクトのプライマリキーを指定する必要があります。

1. 分析するデータオブジェクトが含まれているプロファイルモデルを開きます。

2. 親オブジェクトを選択します。

3. 親オブジェクトのプライマリキーを選択します。

¨ [プロパティ]タブをクリックし、[キー]をクリックします。

¨ [追加]をクリックし、[新しいキー]ダイアログボックスでプライマリキーカラ

ムを選択します。

¨ [新しいキー]ダイアログボックスで[OK]をクリックします。 [選択したフィ

ールド]ペインにプライマリキーが表示されていること、および[プライマリキ

ー]オプションが選択されていることを確認します。

外部キープロファイルを作成して、子オブジェクトに外部キーがあるかどうかを分析しま

す。

データオブジェクト間の外部キー関係の検出

Developerツールでプロファイルモデルを使用して、2つのデータオブジェクト間のキー関

係を検出します。

プライマリキーを含むデータオブジェクトが親オブジェクトで、外部キーを含むデータオ

ブジェクトが子オブジェクトです。

1. 分析するデータオブジェクトが含まれているプロファイルモデルを開きます。

2. データオブジェクトの名前を右クリックし、[外部キープロファイル]を選択しま

す。

3. プロファイルの名前を入力し、プロジェクトの場所を確認します。 必要に応じて、新

しい場所を参照します。 必要に応じて、プロファイルの説明を入力します。

4. プロファイルで子オブジェクトの外部キーを検出するために使用される親オブジェク

トのキーを選択します。

5. プロファイルを保存して実行します。

外部キー分析結果

外部キープロファイルを実行したら、モデリングキャンバスの下にあるプロファイル名を

クリックして分析の結果を表示します。

結果ビューには、定義したプライマリキーと外部キーの推測条件を満たすカラムが一覧表

示されます。 推測の設定を編集するには、[オプション]ボタンをクリックします。 推

測されたキーがデータオブジェクトの有効なキーであることを確認するには、カラム名を

クリックして[検証]を選択します。

68 章 14: プロファイルモデル

Page 80: De 910HF3 DataExplorer Guide Ja

以下の表に、外部キー分析のプロパティを示します。

プロパティ 説明

親のプライマリキー プロファイルで子オブジェクトの外部

キーを検出するために使用された親デ

ータオブジェクトのプライマリキーカ

ラム。

子の外部キー プロファイルで、この行の親のプライ

マリキーに対する外部キーであると推

測されたカラム。

算入% プライマリキーと外部キーの間で一致

するデータ値の数(割合で表され

る)。

注: 外部キーの結果に示されている推

測されたカラムの[算入%]の値は、

検証後の値とは異なる可能性がある。

推測されたカラムの[算入%]は、親

オブジェクトの一意のプライマリキー

カラム値と一致する子オブジェクトの

一意の外部キーカラム値の数である。

推測されたカラムを検証すると、[算

入%]は、親オブジェクトのプライマ

リキーカラム値と一致する子オブジェ

クトの外部キーカラム値の数になる。

リレーションタイプ プロファイルの実行前にプライマリキ

ーカラムと外部キーカラムに対して定

義したリレーションのタイプ。

プロファイルの実行前にリレーション

を定義した場合は、算入の割合の数値

がプロファイルに対して設定されてい

る信頼度のしきい値を満たさない場合

でも、そのリレーションのデータが返

される。

検証済み ユーザーがプライマリキーと外部キー

のリレーションを検証したことを示

す。

最終実行時刻 最後にプロファイルを実行した日時。

リレーションタイプ(モデル内) プロファイルでカラム間のリレーショ

ンが検証されたことを示す。

外部キー検出 69

Page 81: De 910HF3 DataExplorer Guide Ja

結合分析結合分析は、2つのデータカラム間に見込まれる結合度を示します。結合プロファイルを使

用して、単一のデータソース内、または複数のデータソース全体のカラム結合を分析しま

す。

結合プロファイルの結果は、ベン図および数値と割合の値で表示されます。 結合プロファ

イルはプロファイルモデルから作成および実行します。

結合プロファイルの作成

プロファイルモデルのデータオブジェクト間の結合の可能性を分析できます。 結合プロフ

ァイルでは、分析はモデルリポジトリに格納されます。

1. プロファイルモデルを作成するか、または開きます。

2. プロファイルモデルに必要なデータオブジェクトが含まれていることを確認します。

結合プロファイルにデータオブジェクトを追加するには、そのオブジェクトをObject

Explorerからモデリングキャンバスにドラッグします。

3. プロファイリングするデータオブジェクトを選択します。

4. オブジェクトを右クリックし、[結合プロファイル]を選択します。

プロファイルウィザードが開きます。

5. プロファイルの名前を入力します。 必要に応じて、プロファイルの説明を入力しま

す。

6. データオブジェクトの名前がウィザードの[データオブジェクト]に表示されること

を確認します。

7. [終了時にプロファイルを実行]オプションを選択するか、選択を取り消します。

8. [次へ]をクリックします。

9. プロファイルに含めるデータカラムを選択し、[次へ]をクリックします。

必要に応じて、データオブジェクトをスクロールダウンして使用可能なすべてのカラ

ムを表示します。 プロファイルはデフォルトですべてのカラムに対して実行されま

す。

10. [追加]をクリックします。[結合条件]ダイアログボックスが開きます。

11. [新規]をクリックしてカラム選択フィールドをアクティブにします。

12. 検証するデータオブジェクトおよびカラムを選択します。

2つのカラム間の結合条件を定義します。 1つ以上のデータオブジェクトに対して複数

の結合条件を定義できます。

13. [OK]をクリックして結合条件を作成します。

必要に応じて、[追加]をクリックして追加の条件を定義します。

14. [左]と[右]の結合カラムに正しいデータオブジェクト名のプレフィックスが付い

ていることを確認します。

15. [完了]をクリックします。

70 章 14: プロファイルモデル

Page 82: De 910HF3 DataExplorer Guide Ja

結合分析結果

結合分析の[結果]タブには、親の孤立行、子の孤立行、および結合行の数と割合に関す

る情報が表示されます。 また、結合分析結果には、カラム間のリレーションを示すベン図

も含まれます。

以下の表に、[結果]タブに表示されるプロパティを示します。

プロパティ 説明

左テーブル 結合分析で使用された左テーブルおよ

びカラムの名前。

右テーブル 結合分析で使用された右テーブルおよ

びカラムの名前。

左のみの行 左テーブルの結合できない行の数。

右のみの行 右テーブルの結合できない行の数。

行の結合 結合に含まれる行の数。

カラム間のリレーションを示すベン図を表示するには、結合条件を選択します。 ベン図の

下の領域にも、カラム内の孤立値、NULL値、および結合値の数と割合が表示されます。

ベン図内のセクションをダブルクリックすると、そのセクションが表すレコードが表示さ

れます。 これらのレコードはデータビューアビューで開きます。

注: レコードの一覧をデータビューアビューからフラットファイルにエクスポートできま

す。

結合プロファイル結果のファイルへのエクスポート

結合条件に応じて返されたデータ行を区切りファイルにエクスポートできます。 左と右の

ソース間の重複する行、またはソース内の孤立行をエクスポートします。

1. [Object Explorer]ビューで、結合分析が含まれているプロファイルモデルを開きま

す。

2. 結合プロファイルを実行します。

3. [結合結果]ビューを選択します。

4. [データビューア]タブで、[ドリルダウン結果をファイルにエクスポート]アイコ

ンをクリックします。

[データのエクスポート]ダイアログボックスが表示されます。

5. ファイル名を入力し、[保存]をクリックします。

結合分析 71

Page 83: De 910HF3 DataExplorer Guide Ja

重複検出重複検出を行うと、1つまたは複数のデータソース内のカラムのペア間で発生している重複

データについての情報を得ることができます。重複データは、プロファイルモデルから検

出できます。プロファイル結果の検証と表示は、ベン図で行うことができます。

重複検出では、デフォルトの設定または指定した設定に基づいて重複データを特定しま

す。デフォルトの設定を上書きし、推測オプション(重複の割合に基づいて重複検出プロ

セスが返すトップペアの最大数など)を指定できます。また、重複検出に対する適格性を

決定する信頼度レベルを指定することもできます。

重複検出の結果

[重複検出]タブには、関係するカラムについての情報と、重複の割合が示されます。重

複検出結果には、カラムのペア間の重複データと前回重複検出が行われた日時を示したベ

ン図が含まれます。

カラムをクリックして[検証]を選択し、結果をベン図として表示できます。次の表は、

重複検出プロパティの説明です。

プロパティ 説明

左カラム 重複分析時に他のカラムと比較される

プライマリカラム。

右カラム プライマリカラムと比較されるカラ

ム。

重複の割合 2つのカラム間の重複の割合。

検証済み 重複結果の行を検証したことを示す。

最終実行時刻 前回重複検出が行われた日時。

重複データの検出

カラムのペア間の重複データは、プロファイルモデルで特定できます。重複分析はカラム

内の一意の値に基づいて行われ、NULL値は考慮されません。

1. プロファイルモデルを作成するか、または開きます。

2. 重複データを検出するデータオブジェクトを選択します。

データオブジェクトを1つ選択してカラムのペア間の重複データを検出することも、複

数のデータオブジェクトを選択することもできます。

3. オブジェクトを右クリックし、[重複検出]を選択します。

[新規重複検出]ダイアログボックスが表示されます。

4. 名前を入力してください。

5. 必要に応じ、その重複分析について説明するテキストを入力します。

72 章 14: プロファイルモデル

Page 84: De 910HF3 DataExplorer Guide Ja

6. データオブジェクトの名前がウィザードの[データオブジェクト]に表示されること

を確認します。

7. 必要に応じ、設定を完了した時点でプロファイルを実行するように、[終了時にプロ

ファイルを実行]を選択します。

8. [次へ]をクリックします。

9. 重複検出を行うカラムを選択します。

10. [次へ]をクリックします。

ダイアログボックスに、デフォルトの推測オプションが表示されます。

11. 必要に応じ、重複検出の推測オプションを指定し、デフォルト設定を上書きします。

12. [完了]をクリックします。

重複検出 73

Page 85: De 910HF3 DataExplorer Guide Ja

付録 A

用語解説

カラムプロファイル

データソース内のカラムの特性を決定するプロファイルのタイプ。例えば、値の頻度、割

合、パターン、データ型など。

D

Data Explorer

アプリケーション、スキーマ、エンタープライズなどに属するデータソースのコンテン

ツ、品質、構造などを検出する、Informaticaのデータ検出製品。

データオブジェクトプロファイル

データソースに対して行う分析の種類を定義するリポジトリオブジェクト。

依存カラム

機能依存性において、決定側カラムによって決定される値が含まれる列。

決定側カラム

機能依存性において、依存カラムの値を決定する一連のカラム。決定側にカラムが存在し

ない場合、依存側は一定です。

外部キー検出

1つのデータソース内で、親データソース内のプライマリキーカラムに一致するカラムを検

出するプロセス。

Page 86: De 910HF3 DataExplorer Guide Ja

機能依存性

決定側カラムが依存カラムを機能的に決定する、特定テーブルにおける一連のカラム間の

関係。

機能依存性検出

データソース内のカラム間の機能依存関係を検出するプロセス。

結合プロファイル

1つのデータソース内の1つ以上のカラムのセットと、同一または異なるデータソース内の

類似したカラムのセットの間の重複度を特定するプロファイルタイプ。

プライマリキー検出

データソース内の行を一意に識別するカラムまたはカラムの組み合わせを特定するプロセ

ス。

プロファイル

ソースデータ内のパターンを検出するルールが含まれるオブジェクト。データ構造を評価

し、必要なタイプの情報がデータカラムに含まれていることを確認するには、プロファイ

ルを実行します。

プロファイルモデル

アプリケーションまたはスキーマ用のメタデータを記録するリポジトリオブジェクト。プ

ロファイルモデルには、プロファイリングと検証のためのデータにアクセスするために

Data Explorerが使用するデータオブジェクトが含まれます。この他、リレーション、キ

ー、機能依存性などのような構造オブジェクトも含まれます。

ルール

プロファイルの実行時にソースデータに適用される条件を定義する再利用可能なビジネス

ロジック。ルールを使用して、プロファイル内のデータを詳細に検証したり、データ品質

の進捗を測定します。ルールは、Informatica AnalystまたはInformatica Developerで作

成できます。

用語集 75

Page 87: De 910HF3 DataExplorer Guide Ja

索引

DData Explorer

アーキテクチャ 4

概要 2

IInformatica Analyst

カラムプロファイル結果 21

カラムプロファイルの概要 14

ルール 29

Informatica Developer

プロファイルの概要 43

プロファイルのビュー 44

ルール 59

か外部キー検出

概要 67

外部キープロファイル

検出 68

カスタムプロファイルの作成

プロファイル 17

カラムプロファイル

Informatica Developer 47

オプション 12

概要 11

ドリルダウン 25

プロセス 15

カラムプロファイル結果

Informatica Developer 56

き機能依存性検出

概要 50

け傾向グラフ

表示 41

し式ルール

プロセス 32

式ルールの作成

ルール 32

重複検出

概要 72

結果 72

実行 72

すスコアカード

Informatica Analyst 34

Informatica Analystでのプロセス 35

Informatica Developer 61

概要 12

グループの削除 40

グループの作成 38

グループの編集 39

しきい値の定義 38

実行 36

スコアカードへのカラムの追加 35

スコアグループ 38

スコアの移動 39

ドリルダウン 40

表示 37

編集 37

て定義済みルール

プロセス 30

データオブジェクトプロファイル

概要 46

単一のプロファイルの作成 52

複数のプロファイルの作成 53

データ検出

プロセス 5

ふプライマリキー検出

概要 48

プロファイル

カスタムプロファイルの作成 17

コンポーネント 8

76

Page 88: De 910HF3 DataExplorer Guide Ja

実行 18

プロファイル結果

Informatica Analystからのエクスポート 28

Informatica Developerでのエクスポート 58

エクスポート 27

概要 22

カラム値 23

カラム統計 25

カラムパターン 24

スプレッドシート 27

ドリルダウン 26

プロファイルモデル

概要 66

まマプレットとマッピングのプロファイリング

概要 64

るルール

Informatica Developerでの作成 60

Informatica Developerでの適用 60

概要 12

式 31

式ルールの作成 32

定義済み 30

定義済みルールの適用 30

索引 77