Crisp dm.1.0

47
شناسیجع روش مدل مرCRISP-DM یه و تنظیم ته احمدی علی

Transcript of Crisp dm.1.0

مدل مرجع روش شناسی CRISP-DM

تهیه و تنظیمعلی احمدی

مقدمه

1

Crisp-dm توسط کنسرسیووی ایایس سیا تیارتنر 1996در سالتوسعا داده اده کا یخفی واگایا SPSSو NCRدایملرکرایسلر،

:زیر است

Cross Industry Standard Process for Data Mining

سرفصل هل

2

یقدیا و یعرف

یدل یرجع

crisp-

dm

خروج های

crisp-dm

راهنمای کاربر

crisp-

dm

مقدمه و معرفی

CRISP-DMروش اناس

اکست سلسلا یراتب

3

به صورت یک مدل فرآیندی سلسله مراتبیcrispروش شناسی تعریف شده است، این مدل شامل مجموعه ای از وظایف است که در

.سطح انتزاع تعریف شده اند4فرآیند داده کاوی به تعدادی فاز سازمان دهی می شود و: مراحل•

.هر فاز شامل چند وظیفه عمومی است. مانند پاکسازی داده: وظایف عمومی•.مانند پاکسازی داده در داده های عددی : وظایف خاص•نتایج حاصل شده از داده کاوی به صورت : نمونه های فرآیند•

.جزیی، بر خالف الیه اول

مقدمه و معرفی

CRISP-DMروش اناس

یدل یرجع و راهنمای کاربر

4

.میان مدل مرجع و راهنمای کاربر تمایز قایل استCRISPروش شناسی مدل مرجع یک نگاه کلی از مراحل و وظایف و خروجی ها ارایه می دهد ولی راهنمای کاربر وژه جزییات و نکات بیشتری در مورد هر فاز و وظایف درون هر فاز می دهد و روش مدیریت پر

.داده کاوی را مدیریت می کند

.در این مستند هر دو مورد را در سطح عمومی پوشش می دهیم

مقدمه و معرفی

نگاشت مدل های عمومی به مدل های خاص

زمینه داده کاوی

ابعادکاربردداده کاوینوع مسالهجنبه فنی ابزار و روش ها

Clementineیپیش بینی رویگردانبخش بندیمفقودمقادیر

مثالMineSetپولشوییکشفدسته بندی داده های پرت

کشف تقلبپیش بینیتصمیمدرخت

تحلیل وابستگی

5

چهار بعد زمینه های داده کاوی عبارتند از. ایجاد می کندcrispزمینه داده کاوی یک نگاشن بین سطوح عمومی وخاص در

یک زمینه داده کاوی مثل یک مساله دسته بندی در پیش بینی رویگردانی

مقدمه و معرفی

نگاات یدل های عموی با یدل های خاص

نگاشت با زمینه ها

6

اگر بخواهیم مدل فرآیند عمومی را برای یک پروژه اجرا کنیم: نگاشت برای حال•اگر بخواهیم از مدل فرآیندی عمومی در زمینه های مشابه در : نگاشت برای آینده•

آینده استفاده کنیم.با توجه به زمینه داده کاوی و نیازهای سازمان مورد مناسب را انتخاب می کنیم

مقدمه و معرفی

نگاات یدل های عموی با یدل های خاص

چگونگی نگاشت

7

:استراتژی نگاشت برای هر دو نوع نگاشت یکسان است و به صورت زیر استتحلیل زمینه مورد نظر•حذف جزییاتی که مناسب زمینه شما نیست•اضافه کردن جزییاتی که مناسب زمینه است•مشخص کردن محتوای عمومی مطابق با مشخصات زمینه مورد نظر •تغییر نام محتوای عمومی برای ارایه معانی شفاف تر•

CRISP-DMمدل مرجع

8

پروژه،فازهایشاملوکندمیارایهکاویدادههایپروژهعمرچرخهازکلینگاهفرآیندیمدلاینویستنممکنروابطهمهشناساییمرحلهایندر.استوظایفاینبینروابطوفازهربامرتبطوظایف

.استوابستهدادهرویکاربرهایخواستهوزمینهپیشاهداف،به

توالیکردنرعایت.استآمدهبعدیاسالیددرکهاستفاز6شاملکاویدادههایپروژهعمرچرخههرخروجیواستنیازموردهموارهمختلفمراحلبینبرگشتورفتونیستمهمخیلیروابطاین

ستگیوابهاپیکانهایجهت.شونداجرادوبارهبایدخاصوظیفهیافازکدامکهکندمیتعیینمرحله.دهدمینشانمرحلههربینراپرتکرارومهمهای

تعری

CRISP-DMمدل مرجع

دایره خارجی نشان دهندده ماهیدت تاتدی در واقدع . چرخه ای بودن داده کاوی است

زمانی که یک رهیافدت پیداده سدازی مدی آموختده . شود داده کاوی تمام نمدی شدود

ت های ناشی از فرآیند و پیاده سازی رهیافشتر می تواند پروژه جدیدی رو با تمرکز بی

روی سددواالت کسددب و کددار آددداز کنددد و تفاده فرآیندهای بعدی از تجربیات قبلی اس

در اسالید هدای بعدد تشدریح .خواهند کرد.مختصری از هر فاز را بیان می کنیم

9دیاارام یدل یرجع

CRISP-DMمدل مرجع

درک کسب و کار

ه درک اهداف و نیازمندی های پروژه از دید کسب و کار و تبدیل دانش بدست آمده به مساله داده کاوی و تدوین یک طرح مقدماتی برای رسیدن ب.اهداف

درک داده

شف بینش کده،این مرحله با جمع آوری داده اولیه آداز میشود و با فعالیت هایی ادامه می یابد که شما را با داده آشنا کند، شناسایی مساله کیفیت دا.اولیه نسبت به داده، ایجاد زیرمجموعه ای برای شکل دادن به فرضیات مرتبط با اطالعات پنهان

آماده سازی داده

. داین مرحله چندین بار تکرار می شود و هیچ گونه ترتیب تجویز شده ای ندار. همه فعالیت هایی که مجموعه داده نهایی را از داده ی خام می سازد.وظایف آن شامل انتخاب جداول، ویژگی ها و رکوردها همچنین تبدیل و پاکسازی داده برای ابزار مدل سازی

10

CRISP-DMمدل مرجع

مدل سازی

رخی از معموال چندین روش برای یک مساله داده کاوی وجود دارد، ب. انتخاب روش های مدل سازی مختلف و پیاده سازی آن ها و کالیبره کردن پارامترها به مقادیر بهینه: .روش ها نیازمند شکل داده ها به یک نوع خاص دارندبنابراین برگشت به مرحله آماده سازی داده مورد نیاز است

ارزیابیی خلق مدل به قبل از پیاده سازی نهایی مدل، ارزیابی جامع آن و بازنگری مراحل اجرا شده برا. تاکنون مدل هایی ساخته شده که از نگاه تحلیل داده کیفیت باالیی دارند

که به اندازه یکی از مسایل کلیدی مشخص کردن مسایلی مهمی در کسب و کار است. منظور اطمینان از دستیابی درست مدل به اهداف کسب و کار اهمیت بسازایی دارد!در پایان این فاز باید به این تصمیم رسید که آیا از نتایج داده کاوی استفاده شود یا خیر. کافی مورد توجه قرار نگرفته است

پیاده سازین استفاده حتی اگر هدف مدل افزایش دانش از داده است، دانش بدست آمده نیاز به سازماندهی و ارایه به نوعی است که مشتری بتواند از آ. خلق مدل پایان پروژه نیست

در . سطح سازمان باشدر دبسته به نیازمندی ها فاز پیاده سازی می تواند به سادگی تولید یک گزارش باشد یا پیچیدگی پیاده سازی یک فرآیند تکرارپذیر داده کاوی . کنده چه درک کند کری بسیاری از موارد این مشتری است که مراحل پیاده سازی را مدیریت می کند اگر هم تحلیلگر این اقدام را انجام دهد بسیار مهم است که مشت

.اقداماتی نیاز دارد برای استفاده از مدل های ساخته شده

11

CRISP-DMمدل مرجع

هر فاز از مدل مرجع دارای یک سری وظایف عمومی می باشد و هر کدام از این وظایف دارای خروجی هایی هستند که در ادامه بحث هر

ای فاز به طور مستقل مورد بررسی قرار میگیرد و وظایف و خروجی ه.هر فاز را مطرح می کنیم

12

درک کسب و کار–CRISP-DMمدل مرجع

وظایف عمومی

خروجی ها

13

درک کسب و کار–CRISP-DMمدل مرجع

کاروکسباهدافتعیین:عمومیوظیفه

.ردکبرقرارتعادلهااینبینبایدکهداردزیادیرقابتیاهدافوهامحدودیتمشتریادلب.استچیزیچهانجامخواهانمشتریراستیبهاستایناولهدفهایسوالهبدرستپاسخبرایهزینهصرفمرحلهاینازدفلتنتیجه.باشدمیبگذارندتاثیرپروژهخروجیرویتوانندمیکهمهمعواملکشفگرتحلیلهدف.استدلط

.پروژهآدازدردرسازمانکاروکسبوضعیتازشدهشناساییاطالعاتضبطوثیت:زمینهپس•رایب.میدهدقرارتوجهموردمشتریکهداردوجوددیگریمرتبطکاروکسبسواالتمعموال.کاروکسبنگاهازمشتریاصلیاهدافتوصیف:پروژهاهداف•

حالتایندرارنددرارقیبسمتبهرفتنبهتمایلکهاستمشتریانیبینیپیشطریقازفعلیمشتریاننگهداریکاروکسباصلیهدفکنیدفرضمثال(…,POS,ATM)چیست؟مشتریتصمیمبرمیگذارداثرکهاستفادهمورداصلکانالازاستعبارتمرتبطکاروکسبسوال

کهمعینسطحکیبهمشتریرویگردانیکاهشمثالبرایکاروکسبنگاهازپروژهنتایجبودنمفیدوموفقیتبرایمعیارتعریف:کاروکسبموفقیتمعیار•.هددانجامراقضاوتاینکسیچهشودتعیینبایدموردایندراستقضاوتیمعیاریکروابطمورددرمفیدبینشیکارایهیااستعینیمعیاریک

اوظوفتعری

هاخروج

14

درک کسب و کار–CRISP-DMمدل مرجع

وضعیتارزیابی:عمومیوظیفه

تعیینردشودگرفتهنظردربایدکهعواملیدیگرومنابعوفرضیاتها،محدودیتمورددربیشتریجزییاتموردایندر.شودمطرحبیشتریجزییاتبااینجابودوضعیتازسریعدرکهدفبخشدر.پروژهطرحودادهتحلیلهدف

تیبانیپشداده،متخصصکار،وکسبمتخصص)پرسنلشاملپروژهدردسترسدرمنابعکردنلیست:منابعموجودی•ترهایبس)رایانشمنابع،(دادهبهلحظهدردسترسیداده،هایانبارهعملیاتی،هایداده)داده؛(کاویدادهمتخصصفنی،

(کاویدادهابزارهای)افزازنرمو(افزاریسخت

اوظوفتعری

هاخروج

15

درک کسب و کار–CRISP-DMمدل مرجع

ارزیابی وضعیت: وظیفه عمومی

بایدموردنایدرشوندپروژهشکستباعثیاکنندایجادتاخیرپروژهدراستممکنکهاتفاقاتییاخطراتکردنلیست:هانیازمندیوخطرات•.دهیمانجامرااقداماتیچهاتفاقاتوخطراتبرابردرکهصورتاینبهشودفراهمریسکمدیریتطرحیک

استجزدوشاملکهپروژهبامرتبطواژگانازلغاتیفرهنگگردآوری:شناسیواژه•کاروکسبواژگانبامرتبطلغاتفرهنگکاروکسبمسالهازهاییمثالباهمراهکاویدادهبامرتبطلغاتفرهنگ

.تاسموفقیتصورتدرآنبلقوهمنافعباپروژههایهزینهبینمقایسههمانکهپروژهبرایمنافع-هزینهتحلیلانجام:منافعوهاهزینه•امنیتوجنتایبودندرکقابلوکیفیتتکیل،بندیزمانشاملپروژههاینیازمندیهمهکردنلیست:هامحدودیتوفرضیاتهای،نیازمندی•

این.پروژهتوسطشدهساختهفرضیاتکردنلیست.دادهازاستفادهاجازهازاطمینانشاملقسمتاینخروجیازبخشی.قانونیمسایلعالوهبهکهباشندیتاییددیرقابلفرضیاتاستممکنهمچنینوشوندتاییدکاویدادهطیدرمیتوانندکهباشنددادهمورددراستممکنفرضیات

هایمحدودیتکردنلیست.داردبیشتریاهمیتبگذارداثرنتایجاعتبارسنجیرویکهصورتیدردوممورد.هستندپروژهکاروکسببامرتبطلمدساختبرایکهدادهمجموعهاندازهمانندفنیهایمحدودیتیاباشدمنابعبهدسترسیمحدودیتتوانندمیهامحدودیتاین.پروژه.استعملی

خروجی ها

16

درک کسب و کار–CRISP-DMمدل مرجع

کاویدادهاهدافتعیین:عمومیوظیفه

یمبیانفنیصورتبهراپروژهاهدافکاویدادههدفوکندمیبیانتجاریاصطالحاتبارااهدافیکاروکسبهدف.کند

.کنندمیکاروکسباهدافبهدستیابیبهقادرراماکهپروژهنظرموردهایخروجیتشریح:کاویدادهاهداف•پیشدقتازمعینیسطحمثالبرایفنیاصطالحاتباموفقهایخروجیبرایتشریح:کاویدادهموفقیتمعیارهای•

.کنیدتوصیفSUBJECTIVEاصطالحاتبارااینهاباشدالزمممکنکاروکسبموفقیتمعیارهایمانندبینی

هوظیفتعریف

هاخروجی

17

درک کسب و کار–CRISP-DMمدل مرجع

هتولید طرح پروژ: وظیفه عمومی

اقی مانده این طرح باید قدم هایی را مشخص کند که باید در ب. تشریح طرح مطلوب برای دسترسی به اهداف داده کاوی و به واسطه آن اهداف کسب و کار

.پروژه انجام شوند مانند انتخاب ابزار و روش ها

طرح پروژه

در صورت امکان . لیست کردن قدم هایی برای اجرا درپروژه همراه با زمان اجرای آن ها، منابع مورد نیاز آن ها، ورودی ها، خروجی ها و وابستگی ها

.تعیین تکرارها در فرآیند داده کاوی مانند تکرار فاز مدل سازی و ارزیابی

.به عنوان بخشی از طرح پروژه، تحلیل وابستگی های میان زمان بندی و خطرات اهمیت بسزایی دارد

.میم گرفتدر این نقطه باید در مورد استراتژی ارزیابی مورد استفاده در فاز ارزیابی تص. طرح پروژه شامل طرح پروژه برای بر هر مرحله است:تذکر

هتعریف وظیف

خروجی ها

18

درک کسب و کار–CRISP-DMمدل مرجع

هتولید طرح پروژ: وظیفه عمومی

روزرسانیبهنهمچنیباشدمیهایافتهدستوپیشرفتبازنگریبهنیازهرفازپایاندروباشدمیپویاسندیکپروژهطرح.استپروژهطرحازبخشیهابروزرسانیبرایبازنگرینقاط.پروژهطرح

ارزیابیدکنمیپشتیبانیرامختلفیهایروشکهایدکردهانتخابراابزاریکنیدفرض:هاروشوابزاراولیهارزیابی•اثرهپروژکلرویاستممکنهاروشوابزاراینانتخابزیراداردبسزاییاهمیتفرآیندابتدایدرهاروشوابزاراین

.بگذارد

خروجی ها

19

درک داده-CRISP-DMمدل مرجع

وظایف عمومی

هاخروجی

20

درک داده-CRISP-DMمدل مرجع

دادهاولیهآوریجمع:عمومیوظیفه

.باشددادهسازیآمادههاییقدمکنندهشروعاستممکنتالشاینپروژه،منابعدرشدهلیستهایدادهآوریجمعسازیآمادهمرحلهدرچهمرحلهایندرچهاستدیگریمسالهیکهادادهتجمیعباشند،منبعچنددرهادادهاگر:تذکر.داده

ها،آنمحلباهمراهآمدهبدستهایدادهمجموعهکردنلیست:مقدماتیدادهآوریجمعگزارش•هایحلراهوشدیممواجهآنباکهمشکلیهروهاآنآوردنبدستبرایشدهاستفادههایروش.مشکلبرایشدهارایه

هوظیفتعریف

هاخروجی

21

درک داده-CRISP-DMمدل مرجع

اکتشاف داده: وظیفه عمومی

اده و های سری پاسخ به سواالت داده کاوی از طریق پرس و جو، مصورسازی و روش های گزارش گیری همچنین شامل روابط میان ویژگی های کلیدی، نتایج جمع آود یا این موارد ممکن است مستقیما اهداف داده کاوی را هدف قرار دهد یا اینکه کمک به تشریح داده و گزارش های کیفیت داده انجام دهن. تحلیل های ساده آماری

.مقدمه ای باشند برای مراحل آماده سازی داده

مچنین ه. تشریح نتایج شامل یافته ها و فرضیات اولیه و اثرات آن ها روی پروژه: گزارش اکتشاف داده•.در صورت امکان ترسیم گراف ها و نمودارهایی که مشخصات داده را نشان می دهند

اتعری وظوف

خروج ها

22

درک داده-CRISP-DMمدل مرجع

دادهکیفیتتایید:عمومیوظیفه

خطایاندهستصحیحهادادهآیا؟(دهندمیپوششرانیازهاهمهآیا)هستندکاملهادادهآیا:میگیرددرنظررازیرمواردشاملهاییپرسشکهدادهکیفیتبررسیولمتداهاکداموانددادهرخکجادرواندیافتهنمایشچگونهبلهاگرداریم؟دادهدرمفقودهمقادیرآیاهستند؟متداولخطاهاییچهخطاوجودصورتدردارند

هستند؟

تمشکالکارهایراه.کنیدلیستراهاآنهایحلراهمشکالتوجودصورتدر:دادهکیفیتگزارش•.دارندکاروکسبودادهدانشبهزیادیوابستگیعمومادادهکیفیت

اوظوفتعری

هاخروج

23

آماده سازی داده-CRISP-DMمدل مرجع

وظایف عمومی

خروجی ها

24

آماده سازی داده–CRISP-DMمدل مرجع

مجموعه داه تولید شده در فاز آماده سازی داده، که برای مدل سازی یا : مجموعه داده•.تحلیل های اصلی مورد استفاده قرار خواهد گرفت

توصیف و تشریح مجموعه داده بدست آمده: توصیف مجموعه داده•

25خروج ها

آماده سازی داده–CRISP-DMمدل مرجع

انتخاب داده: وظیفه عمومی

ودیت های معیارهای انتخاب عبارت هستند از میزان ارتباط با اهداف داده کاوی، کیفیت داده و محد. تصمیم گیری روی داده ای که باید استفاده شود.توجه کنید انتخاب داده ویژگی ها و همچنین انتخاب رکوردهای جداول هست. فنی مانند محدودیت روی حجم داده یا نوع داده

ل لیست کردن داده هایی که باید شامل شوند و خارج شدوند و دالید : منطق شمول و خروج•این تصمیم

اتعری وظوف

خروج ها

26

آماده سازی داده–CRISP-DMمدل مرجع

پاکسازی داده: وظیفه عمومی

ا وارد این اقدام ممکن است از طریق انتخداب زیرمجموعده ای پداک از داده باشدد ید . افزایش سطح کیفیت داده توسط روش های تحلیل انتخاب شده.کردن مقادیر پیش فرض مناسب یا روش های دیگری مانند تخمین مقادیر مفقود توسط مدل سازی

اده کده در تشریح تصمیامات واقدامات صورت گرفته برای حل مشکالت کیفیت د: گزارش پاکسازی داده•اکسدازی تبدیالت داده برای اهداف پ. طی وظیفه تایید کیفیت داده در در فاز درک داده گزارش شده اند

.و اثرات ممکن آن روی نتایج تحلیلی باید در نظر گرفته شوند

اتعری وظوف

خروج ها

27

آماده سازی داده–CRISP-DMمدل مرجع

دادهساخت:عمومیوظیفه

براییرمقادتبدیلیاجدیدهایرکوردشدهمشتقهایویژگیتولیدمانندتولیدیدادهسازیآمادهعملیاتوظیفهاین.موجودهایویژگی

یژگیوبیشتریتعدادیایکرویازکههستندجدیدیهایویژگیشدهمشتقهایویژگی:شدهمشتقهایویژگی•.شودمیساختهعرضوطولرویازکهمساحتمانند.اندشدهساختهموجود

ردخریدیهیچکههاییمشتریبرایرکوردساخت:مانند.جدیدهایرکوردساختتشریح:شدهساختههایرکورد•.باشدداشتهوجودخامدادهدررکوردهاییچنیناینکهنداردوجوددلیلیهیچ.اندندادهانجامگذشتهسالیک

اوظوفتعری

هاخروج

28

آماده سازی داده–CRISP-DMمدل مرجع

دادهتجمیع:عمومیوظیفه

وردرکخلقبرایشوندمیترکیبرکوردیاجدولچندازاطالعاتهاآنوسیلهبهکهدارندوجودهایروشقسمتایندر.جدیدمقادیریاها

ازمتفاوتیاطالعاتکهاستجداولازبیشترتعدادییادوکردنJOINهمانجداولکردنیکی:شدهیکیهایداده•استعبارتکه(aggregation)دهدمیپوششراآوریجمعهمچنینشدهیکیهایداده.دارندیکسانهایآبجکت

دولجیارکوردچندازاطالعاتسازیخالصهتوسطشوندمیمحاسبهجدیدیمقادیرهااننتیجهدرکهعملیاتیازرایبکهجدیدجدولیکبهداردوجودرکوردیکخریدهربرایآندرکهمشتریخریدجدولیکتبدیلمثالبرای

.داردوجودرکوردیکمشتریهر

اوظوفتعری

هاخروج

29

آماده سازی داده–CRISP-DMمدل مرجع

هشکل دادن به داد: وظیفه عمومی

نند ام تبدیالت فرمتی داده همان اصالحات نحوی است که روی داده انجام می شود به نوعی که تغییری در معنی ایجاد نک.ممکن است مورد نیاز ابزارهای مدل سازی باشند

گیرندمیفردهبمنحصرشناسهعنوانبهرااولویژگیمثالعنوانبهدارند،هاویژگیترتیببهنیازابزارهاازبرخی:یافتهفرمتتغییرهایداده•رکوردبایدبیعصهایشبکهدرمثالباشدداشتهاهمیترکوردهاترتیباستممکنحتییا.شودبینیپیشبایدکهاستویژگیآخرویژگیو

عالوهبه.ندندارکاربردخالتبهنیازیومیکنندمدیریترامورداینخودکارصورتبهابزارازبرخیاگرچهباشندداشتهتصادفیترتیبهایشدهجدادیتاستیکدرمتنیازفیلدهایکاماحذفمثالبرایباشندسازیمدلابزارهاینیازمورداستممکننحویکامالتغییراتازبرخی.کاراکتر32حداکثرتعدادبهمقادیریپیرایشیاکاما،توسط

اتعری وظوف

خروج ها

30

مدل سازی–CRISP-DMمدل مرجع

وظایف عمومی

خروجی ها

31

مدل سازی–CRISP-DMمدل مرجع

سازیمدلهایروشانتخاب:عمومیوظیفه

انتخابراابزارهاییکاروکسبدرکفازدراستممکناگرچه.شوداستفادهبایدکهاستسازیمدلهایتکنیکانتخابسازیمدلدرقدماولیناگرانتشاربنابراینپسعصبیشبکهیا5.0تصمیمدرختمثالبرایشودمیانتخابخاصصورتبهسازیمدلروشوظیفهایندرباشید،کرده.دهیدانجامتکنیکهربرایراوظیفهاینبردخواهیدکاربهتکنیکچند

.شوداستفادهاستقرارکهسازیمدلهایتکنیکسازیمستند:سازیمدلتکنیک•برایدارنددادهمورددرمشخصیمفروضاتسازیمدلهایروشازبسیاری:سازیمدلمفروضات•

بایدالسکبرچسبنیست،مجازمفقودهمقادیرباشند،داشتهیکسانیتوزیعبایدهاویژگیهمهمثال.کنیدثبترامفروضاتهمه.باشدنمادین

اوظوفتعری

هاخروج

32

مدل سازی–CRISP-DMمدل مرجع

آزمونطرحساخت:عمومیوظیفه

دستهمثلناظرباکاویدادهدرمثالبرای.کنیمطراحیمدلاعتباروکیفیتآزمونبرایایرویهومکانیزمکهداریمنیازمدلساختازپیشمیسیمتقآموزشوآزمونبخشدوبهرادادهمجموعهبنابراینشودمیاستفادهکاویدادههایمدلکیفیتارزیابیبرایخطانرخازمعموالبندی.زنیممیتخمینآزموندادهازاستفادهباراکیفیتسپسسازیممیآموزشدادهرویرامدلوکنیم

طرحاصلیهایبخشازیکی.مدلارزیابیوآزمونآموزش،براینظرموردطرحتشریح:آزمونطرح•.استtrain,test,validateبهدادهمجموعهتقسیمنحوهتعیین

اوظوفتعری

هاخروج

33

مدل سازی–CRISP-DMمدل مرجع

مدلساخت:عمومیوظیفه

چندیایکخلقبرایشدهسازیآمادهدادهمجموعهرویسازیمدلابزارهایالگوریتمسازیپیاده.مدل

یرمقادوپارامترهااین.شوندتنظیمتوانندمیپارامترهااززیادیتعدادادلبسازیمدلهرابزاردر:پارامترهاتظیم•.کنیدلیستراپارامترهاتنظیممنطقطورهمینوهاآنانتخابی

.هامدلازگزارشینهوشوندمیارایهشدهساختههایمدلبخشایندر:هامدل•.هامدلتفسیروشدهمنتجهایمدلتشریح:هامدلتوصیف•

اوظوفتعری

هاخروج

34

مدل سازی–CRISP-DMمدل مرجع

(ASSESSS MODEL)ممیزی مدل: وظیفه عمومی

ودمهندس داده کاوی مدل ها را مطابق با دانش خود در زمینه دامنه مورد نظر و معیارهای موفقیت داده کاوی و طرح آزمون مطلوب تفسیر می کند ر زمینده روی موفقیت کاربرد های مدل قضاوت می کند همچنین با تحلیل گران کسب و کار و خبرگان حوزه به منظدور بررسدی نتدایج داده کداوی د

الزم اسددت توجدده شددود کدده ایددن وظددایف فقددط مدددل را در نظددر مددی گیددرد در صددورتی کدده در فدداز . کسددب و کددار ارتبدداط برقددرار مددی کنددد .همه نتایجی که در پروژه بدست آمده مورد توجه قرار می گیرد( ECALUATION PHASE)ارزیابی

تا جایی که ممکدن اسدت اهدداف کسدب . او مدل ها را مطابق با معیارهای ارزیابی ممیزی می کند. مهندس داده کاوی مدل ها را رتبه بندی می کندبار اجدرا در بعضی از پروژه های داده کاوی، مهندس داده کاوی یک تکنیک را بیش از یک. وکار و معیارهای موفقیت کسب و کار را در نظر می گیرد

.او همچنین نتایج را مطابق با معیارهای ارزیابی مقایسه می کند. میکند یا نتایج مختلف را با تکنیک های مختلف ایحاد می کند

اتعری وظوف

35

مدل سازی–CRISP-DMمدل مرجع

(ASSESSS MODEL)ممیزی مدل: وظیفه عمومی

و(accuracy=دقتمثال)شدهساختههایمدلکیفیتکردنلیستووظیفهایننتایجسازیخالصه:مدلممیزی•.کنیدبندیرتبههمبهنسبتراهاکیفیت

درعدیباجرایبرایراهاآنوکنیدبازنگریراهاپارامترتنظیماتمدل،ممیزیبرحسب:پارامترتنظیماتبازنگری•همه.دبرسیمدلبهترینبهکهکنیدتکرارجاییتارامدلممیزیومدلساخت.کنیدتنظیممدلساختوطیفه.کنیدمستندراهابازنگریوممیزی

خروج ها

36

ارزیابی–CRISP-DMمدل مرجع

وظایف عمومی

خروجی ها

37

ارزیابی–CRISP-DMمدل مرجع

EVALUATE)نتایجارزیابی:عمومیوظیفه RESULTS)

اهدافکردنبرآوردهمیزانقدمایندر.داشتیمسروکارمدلgeneralityوaccuracyهمچونعواملیباقبلمرحلهدربهمنجرکهکاروکسبدالیلجستجویمدلناکارآمدیصورتدروکنیممیارزیابیرامدلتوسطکاروکسب

.بودجهوزمانمحدودیتعدمصورتدراستآزمایشیاپلیکیشنرویمدلآزمایشبعدمورد.شدهمدلناکارآمدیباضروریباطارتکههایییافتهسایرشاملکندمیبررسیراکاویدادهتوسطآمدهبدستنتایجدیگرارزیابیبراینعالوه

.سازدآشکارآیندهبرایرااشاراتواطالعاتاستممکناماندارنداصلیکاروکسباهداف

اوظوفتعری

38

ارزیابی–CRISP-DMمدل مرجع

(EVALUATE RESULTS)ارزیابی نتایج: وظیفه عمومی

لحاظهبارزیابینتایجسازیخالصه:کاروکسبمعیارموفقیتبهتوجهباکاویدادهنتایجارزیابی•.یهاولکاروکسباهدافکردنبرآوردهمورددرنهایینظراظهارشاملکار،وکسبموفقیتمعیارهای

ولیدتهایمدلکار،وکسبموفقیتمعیارهایبهتوجهباهامدلبررسیازپس:شدهتاییدهایمدل•.شوندمیشدهتاییدهایمدلکندمیبرآوردهراموفقیتمعیارهایکهشده

خروج ها

39

ارزیابی–CRISP-DMمدل مرجع

فرآیند بازنگری

ده اکنون مناسب است که ارزیابی جامع تری روی مسیر دا. در این نقطه مدل های ساخته شده در ظاهر نیازهای کسب و کار را برآورده می کنندبرای مثال آیا همچنین این بازنگری تضمین کیفیت را پوشش می دهد. کاوی انجام شود به منظور تعیین عوامل یا وظایفی که چشم پوشی شده اند

تند؟هسمدل را به درستی ساخته ایم؟ آیا از ویژگی هایی استفاده کرده ایم که مجاز به استفاده از آن ها هستیم و در تحلیل های آینده در دسترس

فراموش خالصه سازی بازنگری فرآیند و مشخص کردن فعالیت هایی که: بازنگری فرآیند•.شده اند و آن هایی که باید تکرار شوند

اتعری وظوف

خروج ها

40

ارزیابی–CRISP-DMمدل مرجع

بعدیهایقدمتعیین

بهوکندتمامراژهپرواینآیاگیردمیتصمیمتیمهمچنین.دهدادامهچگونهگیردمیتصمیمپروژهتیمبازنگری،فرآیندوممیزینتایجبهباتوجهماندهاقیبتحلیلشاملوظیفهاین.کنندشروعراکاویدادهجدیدپروژهآیادهد،انجامرابیشتریتکرارهایآیاکند،حرکتسازیپیادهسمت.بگذاردتاثیرتصمیماترویاستممکنکههستبودجهومنابع

محتملاقداماتازلیستی•آنهادالیلوآیندهبرایمحتملاقداماتازلیستی•تصمیم•تصمیماینمنطقباهمراهبدهیمادامهچگونهاینکهتصمیمتشریح•

اوظوفتعری

هاخروج

41

پیاده سازی-CRISP-DMمدل مرجع

وظایف عمومی

خروجی ها

42

پیاده سازی-CRISP-DMمدل مرجع

سازیپیادهریزیطرح

خلقبرایریتعامروندیکاگر.کندمیتعییناستراتژیسازیپیادهبرایوکندمیدریافتراارزیابینتایجوظیفهاین.شودمیمستندبعدیهایسازیپیادهبرایرونداینشودشناساییمرتبطهایمدل

.هاآناجراینحوهوالزمهایقدمشاملسازی،پیادهاستراتژیسازیخالصه:سازیپیادهطرح•

اوظوفتعری

هاخروج

43

پیاده سازی-CRISP-DMمدل مرجع

نگهداریوپایشریزیطرح

دورهازناباجتبهکمکنگهداریاستراتژیدقیقتهیه.استمهمیمسالهنگهداریوپایشباشدروزانهکاروکسبازبخشیکاویدادهنتایجاگردقیقپایشیندفرآیکبهنیازپروژهکاویدادهنتایجسازیپیادهمنظوربه.کندمیکاویدادهنتایجازصحیحدیراستفادهدیرضروریطوالنیهای.دارد

نآاجراینحوهوالزمهایقدمشاملنگهداریوپایشاستراتژیازایخالصه:نگهداریوپایشطرح•.ها

اوظوفتعری

هاخروج

44

پیاده سازی-CRISP-DMمدل مرجع

نهاییگزارشتولید

صرفادتوانمیگزارشاینسازیپیادهطرحبهوابسته.کندمیتدوینرانهاییگزارشیکپروژهتیمپروژه،پایاندروجامعارایهیکیا(باشدنشدهمستندمستمرفعالیتیکعنوانبهاینازاگرپیش)باشدتجربیاتشوپروژهازایخالصه.باشدکاویدادهنتایجازنهایی

ازماندهیسنتایجوهادادنیتحویلشاملکهکاویدادهفرآیندازمکتوبنهاییگزارش:نهاییگزارش•.استشدهخالصهوشده

.شودمیپرداختهمشتریبهنتایجارایهبهآندرکهایجلسه:نهاییارایه•

اوظوفتعری

هاخروج

45

پیاده سازی-CRISP-DMمدل مرجع

بازنگری پروژه

از به بررسی اینکه چه چیزهایی را به اشتباه و چه چیزهایی را به درستی انجام دادیم و چه چیزهایی نی.بهبود دارند

دلطایرویکردهمثالبرایپروژهطولدرآمدهبدستمهمنتایجمستندسازی:تجربیاتمستندسازی•آلایدهپروژهیکدر.مشابههایوضعیتدرکاویدادهتکنیکترینمناسبانتخاببرایاشاراتییا

میشپوشنیزراشدهمکتوبفازهردرپروژهاعضایتوسطکههاییگزارشتجربیاتمستندسازی.دهد

اتعری وظوف

خروج ها

46