نقشه راه یادگیری داده کاوی

علم داده رشته در حال ظهوری است که به جمع‌آوری، آماده‌سازی، تحلیل، بصری‌سازی، مدیریت و نگهداشت اطلاعات در حجم بالا می‌پردازد. دریسکول در سال ۲۰۱۴ علم داده را این طور تعریف می‌کند: علم داده مهندسی عمران داده‌هاست.

کلمه بیگ دیتا و داده کاوی یک اصطلاح کلی و سطح بالا هست مثل عبارت هوش مصنوعی که کلی زیر شاخه داره ….
پس در قدم اول باید تصمیم بگیریم که در کدام یک از زیر شاخه های بیگ دیتا میخواهید فعالیت کنید …

معمولا بیگ دیتا در سه حوزه ی
– ذخیره و بازیابی داده های حجیم
– تحلیل اطلاعات و داده کاوی
– بازنمایی و بصری سازی اطلاعات

به نظر من روش درست اینه که متخصصین به این سه حوزه تسلط داشته باشند و یادگیری را از ذخیره و بازیابی شروع کنند….

برای ورود به حوزه Big Data Engineer لازم هست با معماری ها، پلتفرم‌ها و ابزارهای مطرح حوزه Big Data آشنا بشوید. پایگاه داده های NOSQL و اکوسیستم آپاچی هدوپ و موتور پردازشی اسپارک، جز معروف ترین پلتفرم ها در پروژه های حال حاضر بیگ دیتا در داخل و خارج کشور هستند.

🔅برای یادگیری دو حوزه کتاب های مطرح انتشارات O’reilly و شرکت در دوره های آنلاین وب سایت های مانند Coursera و Edx پیشنهاد می شود. (البته اکثر دوستان به علت ضعف زبان و عدم درک درست از مبانی داده های حجیم نمیتوانند بهره‌برداری مناسبی از دوره های آنلاین داشته باشند)

🔅به صورت کلی در مبحث بیگ دیتا با توجه به پیچیدگی ها و وجود ابزارها و پلتفرم های متعدد توصیه میکنم بعد از پیدا کردن یک دید مناسب نسبت به این حوزه به صورت پروژه محور یادگیری را انجام بدهید. و حتما از بستر های ذخیره و بازیابی مانند NOSQL ها شروع کنید چون تا در رابطه با ذخیره صحیح بیگ دیتا دیدی نداشته باشید باقی موارد خوب درک نخواهد شد.

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *