افزایش روزافزون استفاده از اینترنت، شبکههای اجتماعی و وسایل هوشمند در دهه اخیر انفجار دادهها را به همراه داشته است. این مهم یک فرصت تاریخی بی سابقه برای متخصصان علم دادهها ایجاد کرده تا بتوانند با جزئیات بیشتری به مطالعه ویژگیها، رفتار، پویایی، و تعاملات انسانی و اجتماعی افراد بپردازند.
با اینحال، استفاده از این دادهها در علوم اجتماعی و مسائل حاکمیتی نیازمند انتقال تجربیات پیشین، آموختن مهارتهای فنی و دانشی لازم، و آشنایی با چالشهای کاربرد علوم داده و هوش مصنوعی است.
با توجه به نوظهور بودن این رشته و عدم وجود دانش کامل و دانشکدههای تخصصی آن در ایران، لزوم حرکت به سمت تربیت نیروی متخصص و پاسخگویی به نیازهای صنعتی و حاکمیتی کشور به شدت احساس میشود. همین مسئله دستمایه نگارش این مقاله شده تا ببینم متخصص علم داده کیست و چگونه به یک کارشناس علم دادهی خبره تبدیل شویم.
علم داده (Data Science) چیست؟
علم داده یکی از قدرتمندترین فناوریهای حال حاضر است. بهطوری که گزارش تجاری هاروارد آن را بهترین شغل قرن 21 توصیف کرد. امروزه، علم داده و زمینههای آن یکی از پر سودترین مشاغل دنیای فناوری و به ویژه هوش مصنوعی هستند.
متخصص علم داده حجم زیادی از اطلاعات را تحلیل و باز نویسی میکند تا بتواند مشکلات را شناسایی و برطرف کند. شرکتها دلایل قابل توجه زیادی برای استخدام این افراد دارند که از آن جمله باید به درک بهتر مشکلات سازمانی، شناسایی کاستیهای موجود در فعالیتهای تجاری، بهبود تجربه مشتریان و تجزیه و تحلیل فرصتهای بالقوه برای رشد و پیشرفت اشاره کرد. متخصصان علم داده، روزانه از از ابزارهای مصورسازی برای رسم، فرمولبندی و نمایش نتایج و روندها استفاده می کنند.
متخصص علم داده (Data Scientist) کیست؟
متخصص علم داده فردی است که دادههای پیچیده را تجزیه، تحلیل و تفسیر میکند. این افراد با استفاده از مهارتهای آماری پیشرفته و الگوریتمهای یادگیری ماشین به پیشبینی و پاسخ به پرسشهای مهم کسب و کار میپردازند و بیشتر با بزرگ دادهها (Big Data) در ارتباط هستند و از طریق پاکسازی و مصورسازی دادهها و تحلیل به نتایج بهتر دست مییابند.
لازم به توضیح است که تمرکز متخصصان علم داده بیشتر روی دادههای موجود با هدف دستیابی به چشمانداز فعلی یک سازمان است. تنها در این صورت است که متخصص علم داده قادر به ارائه پیشبینیهای قابل اطمینان از آینده است. در مجموع باید بگوییم متخصص علم دادهها فردی است که اطلاعات را استخراج و تحلیل میکند تا بتواند اهداف کلی شرکت را شناسایی و تقویت کند.
وظیفه این متخصصان این است که اطلاعات را از حالت خام خارج کرده و به شکل قابل قبولی درآورند. بهطور معمول، متخصصان علم دادهها به تنهایی کار نمیکنند و همراه با تحلیلگران داده، مهندسان داده، متخصصان هوش تجاری و مهندسان معماری نرمافزار روی مشکلات و مسائل شرکت متمرکز میشوند.
نکتهای که باید در این زمینه به آن دقت کنید این است که متخصص علم داده و تحلیلگر داده دو شغل متفاوت از هم هستند. تحلیلگر داده، فردی است که اطلاعات را پالایش میکند تا الگوهای تجاری قابل شناسایی باشند و برای این منظور از ابزارهای مصورسازی استفاده میکنند.
متخصص علم داده، همانگونه که اشاره شد مفسران اطلاعات هستند که در مدلسازی ریاضیات و برنامهنویسی مهارت دارند. بیشتر متخصصان علم داده در اوایل روزهای کاری تحلیلگر داده بودهاند و سپس وارد این عرصه شدهاند.
بنابراین اگر بگوییم یکی از اولین قدمها برای تبدیل شدن به متخصص علم داده، گذراندن تخصص تحلیلگر داده است اغراق نکردهایم. متخصصان علم دادهها میتوانند وظایف یک فرد تحلیلگر داده را نیز انجام دهند، هرچند به ندرت اینکار را انجام میدهند.
متخصص علم داده چه کاری انجام میدهد؟
یک متخصص علم داده از روشها و الگوریتمهای پیشرفته آماری و دادهکاوی مثل خوشهبندی، شبکههای عصبی، درختان تصمیمگیری و موارد مشابه برای دستیابی به بینش تجاری استفاده میکند و به همین دلیل باید در زمینه یادگیری ماشین، آمار و کار با دادهها تخصص خوبی داشته باشد. بهطور معمول، این فرد مسئولیت مدیریت تیم تحلیل داده و ساخت استراتژی تجاری پس از دریافت ورودی از مهندسان و تحلیلگران داده را دارد. یک متخصص علم داده باید مهارتهای مربوط به حوزه تحلیلگری و مهندسی داده را داشته باشد.
یک متخصص علم داده چه وظایفی دارد؟
از مهمترین وظایف یک کارشناس علم دادهها باید به موارد زیر اشاره کرد:
- مدیریت، کنکاش و تمیزکاری دادههای فاقد ساختار برای استفاده عملی.
- تجزیه، تحلیل و تفسیر کلان دادهها.
- بهبود مدلها و الگوریتمهای کنونی مورد استفاده در بزرگ دادهها.
- مدیریت تیم تحلیل دادهها و کمک به آنها در رسیدن به اهداف مربوطه.
- ارائه نتایج موثر بر کسب و کار.
در مجموع وظایف این کارشناسان را باید به شرح زیر طبقهبندی کرد:
- دریافت اطلاعات: یک متخصص علم داده باید همیشه به دنبال کشف و یکپارچه ساختن دستههای داده جدید با اطلاعات سازمان باشد.
- آمادهسازی دادهها: پس از دریافت دادهها و اطلاعات، باید آماده استفاده شوند.
- یکپارچهسازی و ذخیره دادهها: متخصصین علم داده بهطور مستمر با دستههای داده روبرو هستند که باید به آنها نظم دهند.
- تحلیل دادهها: متخصصان علم داده باید دادهها را بررسی و تفسیر کنند تا به نتایج قابل پیشبینی برسند.
- مدلسازی الگوریتمی: یکی دیگر از وظایف این افراد، ساخت الگوریتمهایی است که با کمک آنها بتوان از دادهها برای اخذ تصمیمات مهم استفاده کرد.
- گزارش به ذینفعان: گاهی اوقات، متخصص علم داده باید یافتههای خود را برای ذینفعان و سهامداران عمده شرکت شرح دهد.
یک کارشناس علم داده به چه مهارتهایی نیاز دارد؟
بهطور معمول، متخصصان علم داده باید بر زبانهای برنامهنویسی پر کاربرد مثل جاوا، پایتون، آر، SQLو نرمافزار SAS مسلط باشند. علاوه بر این، باید توانایی کار کردن با چارچوبهای بزرگ دادهها مثل هدوپ (Hadoop)، اسپارک (Spark) و پیگ (Pig) را داشته باشند. تسلط بر فناوریهایی مانند یادگیری عمیق، یادگیری ماشین به پیشبرد هرچ بهتر وظایف کمک میکند. متخصصان علم داده مهارتهای فنی در زمینه برنامهنویسی و آمار دارند و از آن جایی که برای تبدیل شدن به یک متخصص علم داده باید در زمینه ریاضیات اطلاعات داشته باشید، باید اول از همه باید به سراغ آمار و احتمالات بروید. از مهارتهای مهم یک متخصص علم باید به تسلط بر مفاهیم ریاضی، یادگیری SQL، آشنایی با مباحث یادگیری ماشین و کسب تجربه به عنوان تحلیلگر داده اشاره کرد. بهطور معمول، افرادی که قصد تبدیل شدن به یک متخصص علم دادهها را دارند بر مبنای یک برنامه پنج مرحلهای زیر گام بر میدارند:
تقویت مهارتهای پایه ریاضی: ضروری است که دانش خود در ارتباط با مباحث ریاضی را تقویت کنید. برای اینکه یک متخصص علم داده شوید، باید بهطور پیشرفته ریاضیات را درک کرده و درک جامعی از زبانهای برنامهنویسی قدرتمند، مثل پایتون، آر، جاوا و مطلب داشته باشید.
یادگیری مباحث SQL: زبان پرسوجوی ساخت یافته (SQL) یک زبان خاص دامنه است که برای استخراج اطلاعات از پایگاههای داده استفاده میشود. خوشبختانه SQL پیچیدگی زبانهای برنامهنویسی را ندارد و هر متخصص علم دادهها که رزوانه با حجم زیادی از دادهها در ارتباط است، حتما باید بر آن تسلط داشته باشد.
یادگیری ماشین: به عنوان زیر مجموعهای از هوش مصنوعی، کارشناسان علم داده از یادگیری ماشین برای پیشبرد اهداف خود استفاده میکنند. بنابراین بهتر است در ارتباط با الگوریتمهای یادگیری ماشین بدون ناظر و با ناظر اطلاعات کافی کسب کنید.
کسب تجربه به عنوان تحلیلگر داده: یکی دیگر از اصول ضروری برای تبدیل شدن به یک متخصص علم دادهها، یادگیری اصول شناسایی روندهای موجود در اطلاعات و دادهها است. باید توانایی تحلیل اطلاعات در زمینه کسبوکار را داشته باشید.
مصورسازی داده: داشتن اطلاعات زیاد درباره ابزارهای مصورسازی داده مثل Tableau و Chartist از مبانی مهم برای موفقیت در حوزه علم داده است.
این امکان وجود دارد که بدون مدرک دانشگاهی یک متخصص علم داده شد؟
اگر در هیچ رشتهای از رشتههای مرتبط با هوش مصنوعی؛ فناوریاطلاعات یا علوم کامپیوتر مدرک کارشناسی یا کارشناسی ارشد ندارید، بازهم این شانس را دارید که یک کارشناس علم دادهها شوید. مطالعهای که سال 2018 انجام گرفت نشان داد که متخصصان علم داده سوابق تحصیلی متفاوت نسبت به هم دارند. بنابراین مدرک دانشگاهی در این زمینه ضروری نیست و تنها شما را با مباحث زیربنایی دنیای فناوری اطلاعات آشنا میکند.
بازار کار متخصصان علم داده چگونه است؟
همانگونه که اشاره کردیم یکی از پرتقاضاترین مشاغل دنیای فناوری است که تعداد موقعیتهای شغلی آن در سال 2021 در مقایسه با سال 2020 از 364.000 شغل به 2.720.000 شغل افزایش یافته است. به وضوح مشخص است که این شغل به شدت مورد توجه شرکتها قرار دارد.
علم دادهها چه مزایایی برای شرکتها دارد؟
مهمترین و اصلیترین مزیت علم داده، توانمندسازی و تسهیل در تصمیمگیری است. سازمانهایی که از علم داده استفاده میکنند، میتوانند از شواهد قابل سنجش و مبتنی بر داده برای تصمیمگیری استفاده کنند. تصمیمهای دادهمحور در بشتر موارد سودهی بیشتر و بهبود بهرهوری عملیاتی، کارایی کسبوکار و جریانهای کاری را به همراه دارند.
سازمانهایی که به شکل مستقیم با مشتریان در ارتباط هستند این شانس را دارند تا از علم داده برای جلب اعتماد مشتریان بگیرند. این دانش میتواند به سازمانها در استخدام نیروهایشان نیز کمک کند. علم داده با پردازش داخلی کاربردها و آزمونهای احراز صلاحیت دادهمحور، میتواند به واحد منابع انسانی سازمانها در انجام انتخابهای صحیحتر و سریعتر در طول فرآیند استخدام کمک کند.
با اینحال، نکته مهمی که باید به آن دقت کنید این است که مزایای علم داده به اهداف شرکت و صنعت ارتباط دارد. بهطور مثال، دپارتمانهای فروش و بازاریابی میتوانند دادههای مشتریان را برای بهبود نرخ جذب مشتری و ساخت کمپینهای فرد به فرد کاوش کنند.
موسسات بانکی، دادههای خود را جهت ارتقا وظیفه شناسایی کلاهبرداری کاوش میکنند. سرویسهای استریم ویدیویی میتوانند دادهها را برای شناسایی آنچه کاربران به آن علاقمند هستند و استفاده از آنها برای دانستن اینکه تولید چه فیلمها یا برنامههای تلویزیونی بهتر است کاوش میکنند.
بهطور مثال میتوان از الگوریتمهای مبتنی بر پایگاه داده برای ساخت توصیههای شخصیسازی شده متناسب با عقاید کاربران استفاده کرد یا از علم داده برای کشف بهترین مسیرها، زمانها و نوع حملونقل کالا استفاده کرد. با وجود کاربردهای متعدد علم داده، این زمینه در کسبوکار هنوز نوظهور است، زیرا شناسایی و تحلیل حجم انبوهی از دادههای ساختار نیافته میتواند برای شرکتها بسیار پیچیده، گران قیمت و زمانبر باشد.