کتاب راهنمای گام به گام داده کاوی با استاندارد کریسپ ترجمه شد
به گزارش خبرنگار خبرگزاری آنا، در مقدمه مترجمان این کتاب میخوانیم: در طول دهههای گذشته حجم زیادی از دادهها در پایگاه دادهها انباشته و ذخیره شده اند. امروزه داده ها قلب تپنده فرآیند تجاری بیشتر شرکت ها تلقی می شوند، آنها فارغ از خرد و کلان بودن نوع صنعت در تمامی صنایع نظیر خرده فروش ها، ارتباطات، تولید، تسهیلات،حمل و نقل، بیمه، کارت های اعتباری و بانکداری از طریق تعاملات در سیستمهای عملیاتی شکل میگیرند. در واقع سازمانها در اطلاعات غرق شدهاند در حالی که تشنه دانش هستند.
مترجمان این کتاب در تعریف داده کاوی اینگونه بیان کردند: داده کاوی فرآیند کشف دانش پنهان درون دادهها است که با توصیف، تشریح، پیشبینی و کنترل پدیدههای گوناگون پیرامونی، دارای کاربرد بسیار وسیعی در حوزههای مختلف است به گونهای که مرز و محدودیتی برای کاربرد آن در نظر گرفته نشده است. امروزه، استفاده از روشهای سنتی جمع آوری و تحلیل داده به دلیل اتلاف زمان و ایجاد هزینههای بسیار زیاد، مناسب نبوده و از این رو استفاده از روشهای جدید آنالیز داده مانند داده کاوی بسیار حیاتی به نظر میرسد.
مترجمان در ادامه این مقدمه به معضلات داده کاوی در ایران پرداخته و مینویسند: معضل اصلی داده کاوی در ایران این است که بسیاری از کارشناسان این حوزه، بدون مطالعه و شناخت کافی از ماهیت داده ها و قبل از انتخاب و پیاده سازی بستر و متدولوژی مناسب برای انجام یک پروزه داده کاوی، به سراغ ابزارهای داده کاوی می روند. به نظر می رسد دلیل اصلی این امر عدم رعایت استاندارد کریسپ درباره نحوه اجرا و پیاده سازی صحیح پروژه های داده کاوی است. این استاندارد در تمام دنیا بعنوان ابزار مشترک در پیاده سازی و اجرای پروژه های داده کاوی مورد استفاده کارشناسان مربوطه قرار میگیرد.
کتاب راهنمای گام به گام داده کاوی با استاندارد کریسپ از سوی سه شرکت دایمر کرایسلر [1]، SPSS و NCR در سال 1996 مورد توافق قرار گرفت. پیش نویس استاندارد کریسپ، اولین بار در سال 1999 نگارش شد. سپس کنسرسیوم CRISP در سال 2000 نسخه نهایی را منتشر کرد. با توجه به استقبال کارشناسان داده کاوی از نرمافزارSPSS Celementine و اهمیت استاندارد مورد توجه در پروژهای داده کاوی، برآن شدیم با ترجمه آخرین نسخه از استاندارد فوق، گامی مثبت در راه پیشرفت و موفقیت بنگاههای اقتصادی و خدماتی از طریق اجرای پروژههای داده کاوی برداریم.
در مقدمه این کتاب مدل مرجع CRISP-DM مورد بررسی قرار گرفته است: مدل فرایند فعلی برای داده کاوی یک مرور کلی از چرخه حیات یک پروژه داده کاوی را فراهم می کند. این شامل مراحل یک پروژه، وظایف و روابط مربوطه بین این وظایف است. در این سطح از توصیف، ممکن است شناسایی تمام روابط ممکن نباشد. اساساً، روابطی که میتواند بین وظایف داده کاوی وجود داشته باشد وابسته به اهداف، پس زمینه و علاقه کاربر و مهمتر از همه وابسته به دادههاست.
نویسنده کتاب چرخه حیات یک پروژه داده کاوی مدل مرجع CRISP-DM شامل شش مرحله شناخت کسب و کارشناخت دادهها آماده سازی داده مدل سازیارزیابی[2] استقرار برشمرده است.
انتهای پیام/