ISO Software SBU
PegahSystem Co.

امتیاز کاربران

ستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعال
 
icon-ps-news

انتخاب داده ها

انبار داده ها شامل انواع مختلف و گوناگوني از داده ها است که همه آنها در داده کاوي مورد نياز نيستند . براي فرايند داده کاوي بايد داده ها ي مورد نياز انتخاب شوند . به عنوان مثال در يک پايگاه داده هاي مربوط به سيستم فروشگاهي ، اطلاعاتي در مورد خريد مشتريان ، خصوصيات آماري آنها ، تامين کنندگان ، خريد ، حسابداري و ... وجود دارند . براي تعيين نحوه چيدن قفسه ها تنها به داده ها يي در مورد خريد مشتريان و خصوصيات آماري آنها نياز است . حتي در مواردي نياز به کاوش در تمام محتويات پايگاه نيست بلکه ممکن است به منظور کاهش هزينه عمليات ، نمونه هايي از عناصر انتخاب و کاوش شوند .

 تبديل داده ها

هنگامي که داده هاي مورد نياز انتخاب شدند و داده ها ي مورد کاوش مشخص گرديدند ، معمولا به تبديلات خاصي روي داده ها نياز است . نوع تبديل به عمليات و تکنيک داده کاوي مورد استفاده بستگي دارد : تبديلاتي ساده همچون تبديل نوع داده اي به نوع ديگر تا تبديلات پيچيده تر همچون تعريف صفات جديد با انجام عملياتهاي رياضي و منطقي روي صفات موجود .

 کاوش در داده ها

داده هاي تبديل شده با استفاده از تکنيکها و عملياتهاي داده کاوي مورد کاوش قرار مي گيرند تا الگوهاي مورد نظر کشف شوند .

 تفسير نتيجه

اطلاعات استخراج شده با توجه به هدف کاربر تجزيه و تحليل و بهترين نتايج معين مي گردند . هدف از اين مرحله تنها ارائه نتيجه (بصورت منطقي و يا نموداري) نيست ، بلکه پالايش اطلاعات ارايه شده به کاربر نيز از اهداف مهم اين مرحله است .

 عملياتهاي داده کاوي

در داده کاوي ، چهار عمل اصلي انجام مي شود که عبارتند از

مدلسازي پيشگويي کننده

تقطيع پايگاه داده ها

تحليل پيوند

تشخيص انحراف

از عملياتهاي اصلي مذکور ، يک يا بيش از يکي از آنها در پياده سازي کاربرد هاي گوناگون داده کاوي استفاده مي شوند . به عنوان مثال براي کاربرد هاي خرده فروشي معمولا از عمليات تقطيع و تحليل پيوند استفاده مي شود در حالي که براي تشخيص کلاهبرداري ، مي توان از هر يک از چهار عمليات مذکور استفاده نمود . علاوه برا ين مي توان از دنباله اي از عملياتها براي يک منظور خاص استفاده کرد . مثلا براي شناسايي مشتريان ، ابتدا پايگاه تقطيع مي شود و سپس مدلسازي پيشگويي کننده در قطعات ايجاد شده اعمال مي گردد .

تکنيکها ، روشها و الگوريتمهاي داده کاوي ، راههاي پياده سازي عملياتهاي داده کاوي هستند . اگر چه هر عمليات نقاط ضعف و قوت خود را دارد ، ابزارهاي گوناگون داده کاوي عملياتها را بر اساس معيارهاي خاصي ، انتخاب مي کنند . اين معيارها عبارتند از:

تناسب با نوع داده هاي ورودي

شفافيت خروجي داده کاوي

مقاومت در مقابل اشتباه در مقادير داده ها

ميزان صحت خروجي

توانايي کار کردن با حجم بالاي داده ها

 مدلسازي پيشگويي کننده

مدلسازي پيشگويي کننده ، شبيه تجربه يادگيري انسان در به کار بردن مشاهدات براي ايجاد يک مدل از خصوصيات مهم پديده ها است . در اين روش از تعميم دنياي واقعي و قابليت تطبيق داده هاي جديد با يک قالب کلي ، استفاده مي شود .

در اين مدل ، مي توان با تحليل يک پايگاه داده هاي موجود ، خصوصيات مجموعه هاي داده را تعيين کرد . اين مدل با استفاده از روش يادگيري نظارت شده، شامل دو فاز آموزش و آزمايش ايجاد شده است . در فاز آموزش با استفاده از نمونه هاي عظيمي از داده هاي سابقه اي ، مدلي ساخته مي شود که به آن مجموعه آموزشي مي گويند . در فاز آزمايش اين مدل روي داده هايي که در مجموعه آموزشي قرار ندارند ، اعمال مي شود تا صحت و خصو صيات آن تاييد گردد .

از کاربردهاي عمده اين مدل مي توان به مديريت مشتريان ، تصويب اعتبار ، بازاريابي مستقيم در خرده فروشي و ... اشاره کرد .

 تقطيع پايگاه داده ها

هدف از تقطيع پايگاه داده ها ، تقسيم آن به تعداد نامعيني از قطعات يا خوشه هايي از رکوردهاي مشابه است ، يعني رکوردهايي که خصوصياتي مشابه دارند و مي توان آنها را همگن فرض کرد . پيوستگي داخلي اين قطعات بسيار زياد است در حالي که همبستگي خارجي ميان آنها کم مي باشد .

در اين مدل بر خلاف مدل قبل ، از يادگيري نظارت نشده براي تعيين زيرشاخه هاي ممکن از جمعيت داده اي استفاده مي شود . دقت تقطيع پايگاه داده ها از روشهاي ديگر کمتر است ، بنابراين در مقابل خصوصيات نامربوط و افزونگي ، حساسيت کمتري از خود نشان مي دهد .

از کاربردهاي اين روش مي توان به شناسايي مشتريان ، بازاريابي مستقيم و ... اشاره کرد .

 تحليل پيوند

در اين روش پيوند هايي مرسوم به بستگي ميان رکوردها و يا مجموعه اي از رکوردها بازشناسي مي شوند . سه رده ويژه از تحليل پيوند وجود دارند که عبارتند از :

کشف بستگي

کشف الگوهاي متوالي

کشف دنباله هاي زماني مشابه

 تشخيص انحراف

 داده کاوي فرآيندي است که طي آن با استفاده از انواع مختلف ابزار تحليل داده به دنبال کشف الگوها و ارتباطات ميان داده هاي موجود که ممکن است منجر به استخراج اطلاعات جديدي از پايگاه داده گردند مي باشد.  

اولين وساده ترين گام تحليل داده در داده کاوي توضيح و شرح مشخص داده (از جمله معني داده وانحراف استاندارد کلمه)مي باشد که اين کار مي تواند به وسيله نمودارها و گراف ها وهمچنين کلماتي که با اين کلمه ارتباط معنايي نزديکي دارند انجام گردد در نتيجه جمع آوري، جستجو و انتخاب داده درست در اين بخش بسيار مهم و حياتي مي باشد.

اما اين کار به تنهايي کار خاصي انجام نمي دهد شما بايد يک مدل پيش بيني کننده بر اساس الگوهايي که از نتايج دانش به دست آورده شده بسازيد سپس آزمايش کنيد که آيا آن مدل با نمونه اصلي سازگار است. يک مدل خوب نبايد با جهان واقع تفاوت چنداني داشته باشد

آخرين گام نيز تشخيص صحت وسقم عملکرد مدل بصورت تجربي مي باشد. براي مثال از يک بانک مربوط به مشتريان وپاسخ هايي که به يک پيشنهاد خاص داده اند يک مدل مي سازيد که بر اساس آن مشخص مي شود که کدام حدس وانتظار بيشترين نزديکي را با يک پيشنهاد مانند پيشنهاد قبلي دارد و اينکه آيا شما مي توانيد بر اين حدس اعتماد کنيد يا نه؟

 

درخواست بازدیدکننده

نام(*)

شماره تماس(*)

ایمیل(*)

نام شرکت

درخواست شما(*)