علم داده ها چیست و چه نیازهایی از ما را مرتفع میکند؟

راهنمای ساده پیرامون علم داده ها (Data Science)

همانطور که جهان وارد دوران داده های بزرگ ( BIG DATA)   شده است ، نیاز به ذخیره سازی آن نیز رشد کرده است. این چالش اصلی و بزرگی است که نگرانی زیادی را  برای صنایع سرمایه گذاری در صنعت IT  تا سال  ۲۰۱۰ کرده بود. تا آن زمان تمرکز اصلی در چارچوب ساخت و راه حلی برای ذخیره داده ها بود. اما در حال حاضر با توسعه  Hadoop و چارچوب های دیگر این مشکل با موفقیت حل شده و تمرکز  از ذخیره سازی ،  به پردازش این داده ها (داده های حجیم) منتقل شده است. علم داده ها رمز و راز اصلی این دانش است. همه ایده هایی که شما در فیلم های sci-fi  هالیوود میببینید در واقع می تواند به واقعیت های علم داده تبدیل شود. علم داده ها آینده هوش مصنوعی است. بنابراین ، بسیار مهم است که بدانیم علم داده چیست و چگونه می تواند به کسب و کار ما رونق بخشد.

در این مقاله مطالب زیر را خواهید یافت.

1- نیاز به علم داده ها

2- علم داده چیست؟

3- تفاوت بین هوش تجاری(BI) و تجزیه و تحلیل داده در کجا است؟

4- بررسی چرخه عمر علم داده با کمک از مثال های واقعی 

بیایید ببینیم ما چرا به علم داده نیاز داریم 

به طور سنتی ، داده هایی که ما از آنها استفاده می کنیم بیشتر ساختایافته و در اندازه های کوچک هستند ،  این دادها را ما می توانیم  با ستفاده از ابزارهای  ساده  هوش تجاری (BI)  تجزیه و تحلیل کنیم. بر خلاف داده ها در سیستم های سنتی که بیشتر ساختایافته بودند ، امروزه بسیاری از داده ها بدون ساختار  یا نیمه ساخت یافته اند. بیایید نگاهی به روند داده ها در تصویر زیر  بیاندازیم  که نشان می دهد تا سال 2020  بیش از ۸۰ ٪ از داده ها بدون ساختار خواهند شد.

بیش از 80 درصد داده های دیگر ساخت یافته نیستند و نیاز به توصیف  دارند.

این نمودار رشد حجم داده ها را در طول زمان ساختار پایگاه داده ها نمایش می دهد. 

این داده ها از منابع مختلفی در کسب و کارها تولید شده اند  که شامل اسناد و داده های مالی ، فایل های متنی ، اشکال چند رسانه ای ، داده های تولید شده از طریق سنسورها ، و ابزارهای مختلف . ابزار ساده BI قادر به پردازش این حجم عظیم و انواع داده های تولید شده  نیست. این است که  ما نیاز به ابزارهای پیچیده تر و ابزار تحلیلی پیشرفته و الگوریتم هایی برای پردازش ، تجزیه و تحلیل و طراحی  علم داده برای کسب بینش معنی داری از داده های خود هستیم.

البته  این تنها دلیلی  نیست که   علم داده را  محبوب کرد ه است. اجازه دهید  به عمق نیاز ما به علم داده  برویم و ببینیم  چگونه علم داده در حوزه های مختلف استفاده می شود.

  •  فکر کنید چطور میشد، می توانستید نیازهای دقیق مشتریانتان را از داده های موجودشان  همچون سوابق مشتری، سابقه خرید ، سن و درآمدشان بدست آورید. بدون شک شما تا به حال ممکن است تمام این اطلاعات را کم و بیش  جمع آوری کرده باشید. اما در حال حاضر با مقدار گسترده و تنوع داده ها ، شما می توانید با دقت بالایی مدل های زیادی را  به طور موثر  و کارآمد   ایجاد کنید تا برای توصیه و ارائه محصولات جدید به مشتری از آنها  استفاده کنید .  آیا فکر نمیکنید این موضوع شگفت انگیز می تواند به کسب و کار سازمان شما رونق بخشد ؟

  • اجازه دهید تا سناریوی دیگری برای نقش علم داده ها در کمک به تصمیم سازی  بررسی کنیم، چطور می شد اگر اتومبیل شما به صورت هوشمند به سمت منزلتان هدایت میشد؟ می دانیم که امروزه ماشین های خودران در حال توسعه و بهره برداری هستند. این اتومبیل ها داده های موجود از سنسورهای تعبیه شده را دریافت میکنند. از جمله اطلاعات منعکس شده از رادارها، دوربینها و لیزرهایی که در اطراف و در اتومبیل کار گذاشته شده است. این اطلاعات نقشه مسیر را ایجاد میکند. بر اساس این داده اتومبیل تصمیم میگیرد که چه موقع سرعت بگیرد، یا سرعت خود را کاهش دهد، چه موقع سبقت بگیرد و کی دوربزند. همه اینها بر اساس یک الگوریتم پیشرفته انجام میشود که اصطلاحا به آن اگوریتم یادگیری ماشین  ( machine learning algorithms ) می گوییم.

  • بیایید ببنیم که چطور علم داده ها در تجزیه و تحلیل  و پیش بینی استفاده میشود.  اجازه دهید از پیش بینی آب و هوا مثالی بزنیم. داده های زیاد آب و هوایی از کشتی ها و هواپیماهای در حال حرکت و همچنین ماهواره ها و رادرهای تعبیه شده در اقسا نقاط دنیا جمع آوری می شود.این داده  تجزیه و تحلیل شده و توسط آنها مدلهای آب و هوایی ساخته می شود. این مدلها نه تنها آب و هوای آینده را پیش بینی می کنند، بلکه حدس های زیادی را پیرامون بلایای طبیعی پیش رو در اختیار ما میگذارند که می تواند در به حداقل رساندن مصیبتهای پیش رو به ما کمک کند. 

حال بیایید به انفوگرافی زیر که حوزه های مختلف علم داده را نمایش میدهد نگاهی بیاندازیم 

Odoo CMS - a big picture

حال شما متوجه شدید که چرا به علم داده نیاز داریم. حال ببینیم علم داده چیست ؟