پلتفرم های یادگیری ماشین و علم داده (هوش مصنوعی) در جهان

فناوری هوش مصنوعی که به واسطه روباتیک و دستگاه­ های خودکار، پردازش زبان طبیعی، عامل­ های مجازی، یادگیری ماشین و بسیاری دیگر از فناوری ­ها عملیاتی می ­شود، به عنوان دانشی قلمداد می ­شود که قوعد بازی کسب ­وکار را از طریق بهبود تولید، پایین آوردن قیمت­ ها، ایجاد شغل و فرصت­ های رشد تغییر خواهد داد. از آنجا که پس از سال 2030 دامنه آثار هوش مصنوعی هم در حوزه اقتصاد و هم در اجتماع افزایش چشم­گیری خواهد یافت، صنایع مختلف بایستی راهبردها و سرمایه­ گذاری ­های هدفمندی برای ایجاد سکوی پرتاب به سوی آینده فراهم آورده باشند. طبق آمار و ارقام راائه شده توسط Statista تا سال 2019، که در شکل زیر قابل مشاهده است، سرمایه­ گذاری­ های هنگفتی در بخش ­ها و حوزه ­های مختلف این فناوری صورت گرفته است.

 

 

موسسه تحقیقاتی گارتنر در گزارش اخیر خود با عنوان چارک­ های جادویی در پلتفرم‌های یادگیری ماشین و علم داده به بررسی این پلتفرم­ ها پرداخته است. گزارشی که نتایج آن بسیار متفاوت از گزارش سال قبل می باشد. در شکل زیر چارک جادویی گارتنر در سال 2020 که نمایش ­دهنده برترین پلتفرم ­های یادگیری ماشین در آن سال و تغییر جایگاه هر یک آنها نسبت به سال قبل می ­باشد، آمده است.

 

 

در شکل فوق، هر یک از 4 جایگاه(چارک) داری مفهوم و معنی و معیارهای خاص خود می باشد که تعریف هر یک در ادامه آمده است.

پیشتازها(Leaders): پرچمدارانی هستند که هم نیازهای امروز مشتری را برآورده می کنند و هم برای آینده، خود را آماده کرده اند. در این بررسی پلتفرم‌های Alteryx ،Dataiku، Databricks ،MathWorks ،SAS و TIBCO پیشتاز بازار می باشند.

مدعیان(Challengers): این گروه که نیاز امروز مشتری را به خوبی درک کرده و رضایت آنها را به دست آورده­ اند، ممکن است جهت آتی حرکت بازار را به درستی تشخیص ندهند و از قافله پیشرفت، عقب بمانند. «مدعیان شرکت هایی هستند که در حال حاضر توانایی اجرایی بالایی دارند و یا بر بخش عمده بازار مسلط هستند ولی نشانه ای که مشخص سازد سمت و سوی بازار را درک کرده اند، ندارند.» پلتفرم IBM در اینجا به عنوان یک مدعی شناخته شده است.

آینده ­نگرها(Visonaries): این گروه، برخلاف گروه دوم، جهت حرکت بازار و نیاز آتی مشتری را درک کرده ­اند اما در حال حاضر، ممکن است استفاده از آنها کمی با ریسک همراه باشد. «آینده ­نگرها شرکت هایی هستند که درک کرده ­اند که بازار در حال تغییر است و چشم اندازی برای تغییر نقش خود در بازار دارند ولی در اجرا توانایی لازم را ندارند.» بر اساس بررسی گارتنر، پلتفرم ­های  DataRobot، Domino، Google، H2O، KNIME، Microsoft و RapidMiner در چارک آینده ­نگر ها قرار گرفته ­اند.

بازیگران گوشه ای (Niche Players): این گروه، به عنوان ضعیف ­ترین گروه، نه بازار بزرگی را در دست دارند و نه جهت­ گیری آینده بازار را ممکن است به درستی درک کنند اما پتانسیل رشد و پیشرفت را دارند. «بازیگران گوشه ای، یا به تعبیری فرصت­ طلب، شرکت­ هایی هستند که با موفقیت روی بخش کوچکی از بازار تمرکز کرده­ اند و اجرای بهتری در آن بخش نسبت به بقیه دارند. این دسته از شرکت ­ها در هر دو زمینه تکمیل چشم ­انداز و توانایی اجرا امتیاز کمتری نسبت به دیگران کسب کرده ­اند و عموما شرکت ­های تازه ­وارد به بازار هستند» پلتفرم ­های Anaconda و (Altair (former DataWatch/Angoss نیز در این چارک قرار دارند.

در ادامه 4 مورد از پلتفرم های فوق به اختصار معرفی شده است.

پلتفرم Databicks

Databricks که مبتنی بر Apache Spark است، یک پلتفرم یکپارچه برای تحلیل داده پیشنهاد می­ کند که قابلیت گسترش به حوزه علم داده، مهندسی ML و داده را دارد. این شرکت بر اساس عملکرد بالا و رو به رشد خود، و نیز اکوسیستم همکاری متشکل از بیش از 500 شرکت در چارک پیشتازان قرار دارد.

از نقاط قوت این شرکت می توان به موارد ذل اشاره نمود:

  • بودن در قلب اکوسیستم اسپارک
  • کار با Datasest های بزرگ
  • نوآوری (پردازش داده­ های بلادرنگ، اینترنت اشیا، و …)

 پلتفرم H2O

می ­توان گفت H2O یک سیستم ­عامل متن باز برای یادگیری ماشین محسوب می ­شود که توسط کمپانی ­های بزرگی که در فهرست ۵۰۰ کمپانی برتر دنیا هستند، مورد استفاده قرار می ­گیرد. برنامه اصلی این شرکت این است که تحقیقات حوزه هوش مصنوعی در دسترس عموم باشد نه اینکه به عنوان اهرم فشار شرکت­ های بزرگ و سرمایه ­دار باقی بماند. چندین محصول و راهکار توسط پلتفرم H2O ارائه می­ شوند که عبارتند از:

H2O: بستر پایه برای کاوش و استفاده از یادگیری ماشین
Sparkling Water: ادغام H2O با Apache Spark برای کار با مجموعه داده ­های عظیم
H2O4GPU: نسخه شتاب­دهنده GPU از پلتفرم H2O

H2O همچنین راهکارهای مناسبی برای شرکت­ ها ایجاد کرده است که عبارتند از:

Driverless AI: فناوری هوش مصنوعی Driveless بیشتر با فناوری یادگیری ماشین AutoML گوگل شباهت دارد. به طوری که مبتنی بر آن بیشتر مراحل هوش مصنوعی یا یادگیری ماشین به صورت خودکار انجام می ­شود. در نتیجه ابزارهای توسعه یادگیری ماشین با استفاده از آنها، ساده ­تر و سریع ­تر می شوند.
پشتیبانی پولی: طرح مسائل و مشکلات در GitHub و متعاقبا دریافت پاسخ، فرایند بسیار زمان­بری است. از این رو H2O برای شرکت ­های بزرگ پشتیبانی پرداختی و مشاوره­ ای ارائه می­ دهد.

به طور کلی H2O، یادگیری ماشین به صورت خودکار را با عنوان H2O Driverless AI ارائه می ­دهد و همچنین از محصول منبع باز H2O-3 پشتیبانی می ­کند. این شرکت همچنین خدمات پشتیبانی خود را در سطح جهان ارائه می کند. از نقاط قوت این شرکت می ­توان به موارد ذیل اشاره نمود.

– رهبری در فناوری
– گستردگی کاربرد در میان داشنمندان داده و حتی دیگر بازیگران اکوسیستم
– رضایت کاربران

شکل زیر معماری کلان این پلتفرم را نشان می­ دهد.

 

پلتفرم Datarobot

DataRobot یک راهکار متمرکز بر یادگیری ماشین برای شرکت­ ها است. این پلتفرم به صورت کاملا گرافیکی ارائه می­ شود و به گونه ­ای طراحی شده است که به سرعت بتواند روند موجود در داده­ ها را یافته و استفاده تجاری خاصی از آن­ها کند.

رابط این پلتفرم، بصری و شفاف است و به افراد غیر متخصص امکان می دهد کنترل را به دست بگیرند و به بینش ­های معناداری از داده دست یابند. DataRobot دارای ویژگی های متنوع و متعددی نیست، در عوض بر روند­های سنتی داده­ ها تمرکز می­ کند و قابلیت ­های کاربردی را در موارد زیر ارائه می­ دهد:

  • یادگیری ماشین خودکار
  • رگرسیون و طبقه بندی
  • سری زمانی

 

همانطور که از شکل زیر بر می آید، Datarobot به ارائه یک پلتفرم DSML به منظور اتوماسیون در کل فرآیند تجزیه و تحلیل ارائه پرداخته است. به طوری که کسب وکار ها و دانشمندان داده «شهروند» امکان تجزیه و تحلیل داده­ های مورد نیاز را داشته باشند. DataRobot همچنین پشتیبانی پیش و پس از فروش را ارائه می­ دهد. این شرکت اخیراً Cursor، یک بستر همکاری داده، ParallelM، یک بستر MLOps و Paxata، یک پلتفرم آماده ­سازی داده­ ها را خریده است. DataRobot رشد قابل توجهی در درآمد، تعداد کاربران و برندینگ از خود نشان داده است.

پلتفرم Google

درست مانند خدمات آمازون، گوگل نیز مجموعه ­ای از سرویس ­های ابری دارد که حول هوش مصنوعی شکل گرفته ­اند. در شکل زیر آنچه در دسترس توسعه ­دهندگان است، قابل مشاهده است.

 

 

به طور خلاصه دو روش برای استفاده از خدمات هوش مصنوعی گوگل وجود دارد. روش اول استفاده از مدلی است که قبلاً توسط گوگل آموزش دیده است و کاربر فقط شروع به استفاده از آن در محصولات خود می­ کند. روش دوم، خدمات به اصطلاح AutoML است که چندین مرحله واسطه ­ای یادگیری ماشین را به صورت خودکار انجام می ­دهد. به عنوان مثال، به توسعه ­دهندگان با تخصص کمتر در زمینه یادگیری ماشین کمک می­ کند تا مدل­ ها را به راحتی بسازند و آموزش دهند.

شرکت گوگل به طور فعالانه در حال ارائه پیشنهادات خود در زمینه AI/ML است و در حال حاضر Google Cloud AI را به عنوان بستر اصلی DSML خود در اختیار دارد. این پلتفرم شاملCloud AutoML ، BigQuery ML و TensorFlow است. گوگل همچنین دارای سخت افزار TPU و زیرساخت­ های گسترده ابر می ­باشد. گوگل در میان پیشتازان رتبه­ بندی نشده است زیرا Cloud AI Platform محصولی مستقل نیست.

 

پلتفرم IBM

محصول اصلی IBM که در این گزارش در نظر گرفته شده است Watson Studio همراه با بسیاری از محصولات پشتیبانی ­کننده از جمله یادگیری ماشین Watson ،SPSS (مدل­ساز و تحلیلگر آماری)، بهینه سازی تصمیم IBM برای Watson Studio و IBM Streams است.

 

گارتنر در توصیف این شرکت می گوید: «بهبود بسته ­بندی محصولات و تصحیح استراتژی ورود در بازار، نشان از تلاش های ستودنی IBM برای اصلاح پیشنهادات و همگام شدن با رقابت شدید فزاینده فروشندگان بزرگ و کوچک دارد.» از مهم­ترین ویژگی ­های این پلتفرم می ­توان به موارد ذیل اشاره کرد:

– درک صحیح از نیازهای بازار
– رویکرد نوآورانه (متمرکز بر روندهای کلیدی)
– قابلیت­ های آماده ­سازی و مدیریت مدل