X
تبلیغات
رایتل
پنج‌شنبه 11 اردیبهشت 1393 @ 09:52 ق.ظ

داده کاوی چیست

داده کاوی چیست

داده کاوی چیست ؟

  

 

جامعه مبتنی بر اطلاعات را می توان به عنوان جامعه ای تعریف نمود که بخش غالب اجتماع به جای کارهای فیزیکی در گیرکارهای فکری هستند. در چنین جامعه ای بیشترین توجه به فعالیتهای اطلاعاتی از قبیل : فراهم آوری، پردازش، تولید، ثبت، انتقال، اشاعه و مدیریت اطلاعات مبذول می گردد وبیشترین هزینه ها صرف فرایندهای اطلاعاتی می شود (cawkell,1987).

با گسترش سیستمهای پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، به ابزاری نیازاست تا بتوان این داده ها راپردازش کرد و اطلاعات حاصل از آن را در اختیار کاربران قرار داد.معمولا”کاربران پس از طرح  فرضیه ای بر  اساس گزارشات مشاهده شده به اثبات یا رد آن می پردازند ، در حالی که امروزه به روشهایی نیازداریم که به اصطلاح به کشف دانش(Knowledge Discovery) بپردازند یعنی روشهائی که با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند.

یکی از روشهای بسیار مهمی که با آن می توان الگوهای مفیدی را در میان داده ها تشخیص داد،داده کاوی است ،این روش که با حداقل دخالت کاربران همراه است اطلاعاتی را در اختیار آنها وتحلیل گران قرار میدهد تا براساس آنها تصمیمات مهم و حیاتی در سازمانشان اتخاذ نمایند .

باید توجه داشت که اصطلاح داده کاوی زمانی به کار برده می شود که با حجم بزرگی از داده ها ، در حد مگا یا ترابایت ، مواجه باشیم . در تمامی منابع داده کاوی بر این مطلب تاکید شده است . هر چه حجم داده ها بیشتر و روابط میان آنها پیچیده تر باشد دسترسی به اطلاعات نهفته در میان داده ها مشکلتر می شود و نقش داده کاوی به عنوان یکی از روشهای کشف دانش ،آشکارتر می گردد.

داده کاوی از چندین رشته علمی بطور همزمان بهره میبرد نظیر : تکنولوژی پایگاه داده،هوش مصنوعی ،شبکه های عصبی،آمار،سیستم های مبتنی بر دانش،بازیابی اطلاعات وغیره .]۱[که برای پرهیزاز اطاله کلام می توان آن به لحاظ تاریخی به اختصار به مراحل زیر تقسیم کرد:

مرحله اولیه: گردآوری وایجاد پایگاه اطلاعاتی(تا دهه ۱۹۶۰)

مرحله دوم :  نظامهای مدیریتی مبنی بر پایگاه اطلاعاتی(دهه۱۹۷۰ واوایل دهه ۱۹۸۰)

مرحله سوم : نظامهای پایگاه اطلاعاتی پیشرفته (اواسط دهه ۱۹۸۰ تازمان حاضر)

مرحله چهارم : انبارش اطلاعات وداده کاوی (اواخر دهه ۱۹۸۰ تا به امروز)

  مرحله پنجم : نظام پایگاه اطلاعاتی مبنی برشبکه (دهه ۱۹۹۰ تا کنون)

مرحله ششم : نسل نوین نظامهای اطلاعاتی یکپارچه شده(از ۲۰۰۰ به بعد)

بدین ترتیب فعالیتی که از دهه ۱۹۶۰ شروع شده بود در دهه ۱۹۹۰ گامهای بلندی برداشت وانتظار میرود در این قرن به رشد و بالندگی خود ادامه دهد.

تعریفی از داده کاوی

بطور کلی، داده کاوی (که گاهی اوقات اکتشاف اطلاعات یا دانش نامیده میشود)عبارت از فرآیندی است  که از چشم اندازهای مختلف به تحلیل داده ها می پردازد  و جمعبندی آنها را در قالب اطلاعات مفیدی ارائه میکند . این اطلاعات را میتوان برای افزایش در آمد ، کاهش هزینه ها یا هردوبه کاربرد. نرم افزار داده کاوی یکی از ابزارهای تحلیل اطلاعات است .این نرم افزار به کاربران امکان می دهد اطلاعات را از ابعاد وزوایای بسیار متفاوت تحلیل و طبقه بندی کنند وروابطی را که در آن ها شناسائی نموده اند به اجمال بیان نمایند.

به لحاظ فنی، داده کاوی عبارت از فرآیندی است که در میان حوزه های گوناگون بانکهای اطلاعاتی ارتباطی بزرگ، همبستگی ها یا الگوهایی را پیدا می کند. البته این ویژگی به معنای یکسان دانستن داده کاوی وآنالیزآماری نیست که درجدول زیر این تفاوتها آورده شده است :

داده کاوی

آنالیز آماری

به فرضیه احتیاجی ندارد.

الگوریتمهای داده کاوی در ابزارها بطور اتوماتیک روابط را ایجاد میکنند.

ابزارهای داده کاوی از انواع مختلف داده و نه فقط عددی میتوانند استفاده کنند.

داده کاوی به داده های صحیح و درست طبقه بندی شده بستگی دارد.

نتایج داده کاوی آسان نیست و همچنان به متخصصان آمار برای تحلیل آنها و بیان آنها به مدیران نیاز است.

آمارشناسان همیشه با یک فرضیه شروع به کار میکنند.

آمارشناسان باید رابطه هایی را ایجاد کنند که به فرضیه آنها مربوط شود.

آنها از داده های عددی استفاده میکنند.

آنها میتوانند داده های نابجا و نادرست را در طول آنالیز تشخیص دهند.

آنها میتوانند نتایج کار خود را تفسیر کنند و برای مدیران بیان کنند.

پنج ویژگی مهم داده کاوی عبارت است از :

·        استخراج ،دگرگونی وبارنمودن داده های تراکنشی برروی سیستم انبار داده ها .

·        ذخیره ومدیریت داده ها در سیستم بانک اطلاعات چند بعدی.

·        فراهم آوردن امکان دسترسی تحلیل گران تجاری ومتخصصان تحلیل اطلاعات به داده ها .

·        تحلیل داده ها با استفاده از نرم افزارکاربردی .

·        معرفی نمودن ، در یک قالب بندی سودمند ، همانند گراف یا جدول

داده کاوی به چه کار می آید؟

 امروزه در درجه اول شرکتها ازداده کاوی استفاده می کنند.(با توجه بسیار زیاد به مصرف کننده ،  خرده فروشی،مالی ، ارتباط،وسازمانهای بازاریابی). داده کاوی این شرکتهارا قادر می سازد  که   رابطه    عوامل "درونی" (مانند قیمت ، موقع یابی فرآورده ،‌یا مهارت های کارمندان) ، را با عوامل  "خارجی"  (مانند شاخص های اقتصادی ، رقابت وآمارگیری جمعیتی مشتری ) مشخص کنند؛ داده کاوی شرکت ها را قادر می سازد اثر گذاری بر مشتری ، رضایتمندی مشتری و منافع شرکت را تعیین کنند.بالاخره ، شرکتها را قادر می سازد که فشرده اطلاعات را برای دیدن داده های معاملاتی دقیق"حفاری" نمایند.

برخی از کاربردهای داده کاوی در محیطهای واقعی عبارتند از :

  1. خرده فروشی : از کاربردهای کلاسیک داده کاوی است که می توان به موارد زیر اشاره کرد :
    • تعیین الگوهای خرید مشتریان
    • تجزیه و تحلیل سبد خرید بازار
    • پیشگویی میزان خرید مشتریان از طریق فروش الکترونیکی
  2. بانکداری :
    • پیش بینی الگوهای کلاهبرداری از طریق کارتهای اعتباری
    • تشخیص مشتریان ثابت
    • تعیین میزان استفاده از کارتهای اعتباری بر اساس گروههای اجتماعی
  3. بیمه :
    • تجزیه و تحلیل دعاوی
    • پیشگویی میزان خرید بیمه نامه های جدید توسط مشتریان
  4. پزشکی :
    • تعیین نوع رفتار با بیماران و پیشگویی میزان موفقیت اعمال جراحی
    • تعیین میزان موفقیت روشهای درمانی در برخورد با بیماریهای صعب العلاج]۲[

نتیجه اینکه :

بسیاری از سازمانها بر معادنی از طلا تکیه زده اند .این گنجینه گرانبها در شرکتهای بیمه همان داده های جمع آوری شده از بیمه گذاران،‌بیمه شدگان ، زیاندیدگان ، مقصران حادثه وانواع بیمه های فروخته شده است که می باید با بهره گیری از تکنولوژیهای جدید وابزارهای خودکاری که بصورت هوشمند آنهارا تجزیه وتحلیل می کنند ،گردآوری وپردازش شده وبه دانش تبدیل وبه کار گرفته شوند.

داده کاوی چیست

داده کاوی چیست

داده کاوی چیست

نظرات (0)
نام :
ایمیل :
وب/وبلاگ :
ایمیل شما بعد از ثبت نمایش داده نخواهد شد