|
اخبار -
خبرهای بیمه ای
|
|
تاثیرات داده کاوی در بانک و بیمه |
|
|
سه شنبه ، 28 دی 1389 ، 21:28 |
|
*الهام کریمی
معرفی داده کاوی یاdata mining داده کاوی یا کشف دانش در پایگاه داده ها (KDD ) علم نسبتا تازه ای است که با توجه پیشرفت کشور در زمینه IT و نگاه های ویژه به دولت الکترونیک و نفوذ استفاده از سیستم های رایانه ای در صنعت و ایجاد بانک های اطلاعاتی بزرگ ،توسط ادارات دولتی و بخش خصوصی نیازبه استفاده از آن به طور عمیقی احساس می شود. داده کاوی یعنی کشف دانش و اطلاعات معتبر پنهان در پایگاه های داده . یا به بیان بهتر تجزیه و تحلیل ماشینی داده ها برای پیدا کردن الگوهای مفید و تازه و قابل استناد در پایگاه های بزرگ داده کاوی نامیده می شود. داده کاوی در پایگاه داده کوچک نیز بسیار پرکاربرد است.و از نتایج و الگوهای تولید شده به وسیله آن تصمیم گیری استراتژیک تجاری شرکت های کوچک نیز می توان بهره های فراوان برد. کاربرد داده کاوی در یک جمله را این گونه می توان بیان کرد:داده کاوی اطلاعاتی می دهد ، که شما برای گرفتن تصمیم هوشمندانه ای درباره مشکلات سخت شغلتان به آن نیاز دارید.
مثالی کلاسیک از کاربرد داده کاوی
اغلب تجارت ها به تصمیم گیری استراتژیک و یا اتخاذ خط مشی های جدید برای خدمت رسانی بهتر مشتریان نیاز دارند. به عنوان مثال فروشگاه ها آرایش مغازه خود را برای ایجاد میل بیشتر به خرید مجددا طراحی می کنند. این مثال به داده هایی در مورد رفتار مصرفی گذشته مشتریان برای تعیین الگویی به وسیله داده کاوی ، نیاز دارند. برای روشن تر شدن مساله می توان مثال را این گونه بیان کرد که در یک فروشگاه زنجیره ای پس از داده کاوی مشخص می شود که درصدی از مشتریان خرید تلویزیون ، میز تلویزیون و گلدان کریستالی را هم در همان روز و بعد از خرید تلویزیون می خرند. مدیر فروشگاه می تواند بلافاصله دستوراتی صادر کند که بر اساس مدل های تلویزیون موجود میزهایی و براساس مدل میزها گلدان های کریستالی برای فروش سفارش داده شود و غرفه های جنبی غرفه تلویزیون را به میز و گلدان کریستالی اختصاص دهد . مطمئنا" حتی پس از مدت کوتاهی سود حاصل از این بخش از فروشگاه به طور قابل ملاحظه ای ترقی خواهد کرد . در واقع ابزار داده کاوی ،داده را می گیرد و یک تصویر از واقعیت به شکل مدل می سازد این مدل روابط موجود در داده ها را شرح می دهد. برای بهبودی بهره وری از یک فروشگاه داده کاوی از داده های انبار داده، مدل هایی را ارائه می دهد که بیانگر این هستند که چه محصولاتی یا خدماتی ،به چه مشتریانی،در چه زمانی واز طریق چه کانالی عرضه شود. بیشتر شرکت ها بانک های داده ای عظیمی،شامل داده های بازاریابی،منایع انسانی و مالی را دارا هستند . بنابراین سرمایه گذاری در زمینه انبار داده ، یکی از اجزای حیاتی در استراتژی ارتباط با مشتری است. رابطه مشتری با زمان تغییر می کند و چنانچه تجارت و مشتری درباره یکدیگر بیشتر بدانند این رابطه تکامل ورشد می یابد. چرخه زندگی مشتری چارچوب خوبی برای به کارگیری داده کاوی در مدیریت ارتباط با مشتری فراهم می کند . در بخش ورودی داده کاوی،چرخه زندگی مشتری می گوید چه اطلاعاتی در دسترس است و در بخش خروجی آن چرخه زندگی مشتری می گوید چه چیزی احتمالا" جالب توجه است. و چه تصمیماتی باید گرفته شود. داده کاوی می تواند سود آوری مشتری های بالقوه را که می توانند به مشتریان بالفعل تبدیل شوند،پیش بینی کند و اینکه مشتری تا چه زمانی وفادار خواهد ماند وچگونه احتمالا" مارا ترک خواهد کرد. بعضی از مشتریان مرتبا" مراجعاتشان رابه شرکت ها برای کسب مزیت هایی که طی رقابت میان آنها به وجود می آید، تغییر می دهند . در این صورت شرکت ها می توانند هدفشان را روی مشتریانی متمرکز کنند که سود آوری بیشتری دارند . بنابراین می توان از طریق داده کاوی ارزش مشتریان را تعیین ، رفتار آینده آنها راپیش بینی و تصمیمات آگاهانه ای را در این رابطه اتخاذ کرد. ادامه دارد....
از کاربردهای داده کاوی می توان به نمونه های زیر اشاره کرد:
1-بانکداری
از جالب ترین کاربردهای داده کاوی می توان به کشف پولشویی اشاره کرد.
تشخیص مشتریان ثابت و همیشگی
تعیین مشتریان استفاده کننده از یک سرویس خاص
2-بیمه
پیشگویی میزان استقبال از بیمه نامه های جدید
تشخیص کلاهبرداری و مشخص کردن رفتارهای نامناسب
تشخیص نیاز مشتریان و خواسته های آنها
تشخیص تخلفات پزشکی
واضح است که زمینه استفاده از داده کاوی بی نهایت گسترده است و دو مثال فوق به خاطر درک راحت تر انتخاب شده اند. داده کاوی شباهت زیادی به تحلیل های آماری دارد. ولی داده کاوی از جهات زیادی با آمار متفاوت است و مزیت های زیادی نسبت به آمار دارد.جالب ترین تفاوت داده کاوی با تحلیل های آماری این است که در آمار ما فرضیه ای مطرح می کنیم و با استفاده از تحلیل های آماری به اثبات یا رد فرضیه می پردازیم اما داده کاوی به فرضیه احتیاجی ندارد. در واقع ابزار داده کاوی فرض می کند که شما خود هم نمی دانید به دنبال چه می گردید و این نکته ای است که باعث می شود کارآمدی داده کاوی در مواقع بروز مشکل نمایان شود.برای مثال ما در آمار فرض می کنیم که دو گروه فاصله ای با هم ارتباط دارند سپس با استفاده از ضریب همبستگی پیرسون مشخص می کنیم که ارتباط وجود دارد یا خیر. ولی داده کاوی بدون توجه به این که ما چنین فرضی داشته باشیم یا نه با کاوش میان داده ها اگر ارتباطی مخفی معنی داری وجود داشته باشد آن را به اطلاع ما می رساند . تفاوت بعدی آمار و داده کاوی در این است که آمار فقط می تواند از داده های عددی استفاده کند ولی داده کاوی از داده ها ی غیرعددی هم استفاده می کند. تفاوت های دیگری هم میان آمار و داده کاوی وجود دارد که بحث در مورد آنها در حوصله این مقاله نمی گنجد.اما برای اولین بار در سال 1950 از رایانه برای تحلیل و ذخیره پایگاه داده ها استفاده شد. ولی حجم اطلاعات و میزان رشد آنها به قدری زیاد بوده است که هم اکنون کسی از میزان اطلاعات ذخیره شده در پایگاه داده های سراسر دنیا به صورت دقیق اطلاعی ندارد ولی مطمئنا حجم اطلاعات و مخصوصا سرعت رشد آنها به قدری زیاد شده که آمار شناسان وو تحلیل گران در بررسی و تحلیل پایگاه های داده در زمینه های مختلف نا توانند . بعضی از پایگاه داده ها به قدری بزرگ و پیچیده شده اند که تحلیل روابط و استخراج اطلاعات مفید پنهان شده در آنها واقعا از ظرفیت ذهنی بشری فراتر رفته است . از زمانی که رشد پایگاه های داده و حجم اطلاعات سرعت گرفت میزان داده ها افزایش یافت . نیاز به تحلیل ماشینی داده ها و استخراج سریع و دقیق دانش نهفته در آنها احساس شد شاید بتوان لوول (1983) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان " شبه سازی فعالیت داده کاوی" ارائه نمود.
عمل داده کاوی از یک پایگاه داده به چند مرحله مشخص تقسیم می شود که ما در این مقاله به معرفی و توضیحی مخنصر در مورد هریک از این مراحل اکتفا می کنیم:
1-مرحله اول :تشکیل انبار داده
با توجه به عنوان، این مرحله برای تشکیل محیطی پیوسته و یکپارچه جهت انجام مراحل بعدی و داده کاوی در آن انجام می گیرد. در حالت کلی انبار داده مجمئعه پیوسته و طبقه بندی شده است که دائما در حال نغییر بوده و دینامیک است که برای کاوش آماده می شود.
2-مرحله دوم:انتخاب داده ها
در این مرجله برای کم کردن هزینه های عملیات کاری، داده هایی از پایگاه داده انتخاب می شود که مورد مطالعه هستند و هدف داده کاوی دادن نتایجی در مورد آنهاست .
3-مرحله سوم:تبدیل داده ها
مشخص است برای انجام عملیات داده کاوی لزوما باید تبدیلات خاصی روی داده ها انجام گیرد. ممکن است این تبدیلات خیلی راحت و مختصر مثل تبدیل byteبه integer باشد یا خیلی پیچیده و زمان بر با هزینه های بالا مثل تعریف صفات جدید و یا تبدیل و استخراج داده ها از مقادیر رشته ای و ... باشند.
4-مرحله چهارم:کاوش در داده ها
در این مرحله است که داده کاوی انجام می شود. در این مرحله با استفاده از تکنیک های داده کاوی داده ها مورد کاوش قرار گرفته ، دانش نهفته در آنها استخراج شده و الگو سازی صورت می گیرد.
5-مرحله پنجم:تفسیر نتیجه
دراین مرحله نتایج الگوهای ارائه شده توسط ابزار داده کاو مورد بررسی قرار گرفته و نتایج مفید معین می شود .طرز کار ابزار داده کاو اینگونه است که ابزار به دنبال اثبات این است که وجود چیزی به معنای وجود چیز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگیرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخلی و مخاطبش ارائه دهد . همچنین در داده کاوی از الگوهای ژنتیک و شبکه های عصبی هم استفاده می شود. شبکه های عصبی به علت کارآمدی در حل مسایل پیچیده و بزرگ مورد استفاده اند و کاربرد الگوریتم های ژنتیک در داده کاوی برای جستجو و ساختن یک مدل بهینه در میان مدل های به دست آمده ، به این گونه که مدل های اولیه روی کروموزوم هایی قرار می گیرند و با رقابت بر سر انتقال صفات به نسل بعد ، بهترین مدل و لایق ترین آنها به کاربر ارائه می شوند.
داده کاوی امروز گسترش زیادی یافته است به طوری که اکثر نرم افزارهای پایگاه داده مثل SQL Server و Oracle نیز شامل ابزارهای داده کاوی شده اند ولی هنوز نرم افزار تخصصی داده کاوی همچون Darwin,Mind Knowledge,Data Mind,Intelligent Miner Set,Studio از مهمترین ابزارهای داده کاوی اند.
|
|