پلتفرم ابری هوش مصنوعی DataSolouk متمرکز بر تحلیل داده و کلان داده است و یک AI Platform یا به عبارت دیگر یک  Data Science & Machine Learning Platform (DSML) محسوب می شود.
دیتاسلوک عملیات زمان بر و دشوار توسعه، ساخت و استقرار الگوریتم های یادگیری را تسریع و خودکار نموده و کاربران را از عملیات پیچیده مدیریت زیرساخت، MLOps و DevOps مرتبط با کلاسترهای پردازش و ذخیره سازی رها می سازد.

محیط های کاربری مختلفی برای توسعه، مدیریت مدل ها، نظارت بر کلاسترهای پردازشی و محیط ساخت خودکار مدل ها توسط دیتاسلوک ارائه می شود.

محیط توسعه با کتابخانه های یادگیری ماشین از پیش نصب شده، توسعه الگوریتم ها را تسهیل کرده و نیز ابزاری برای سهولت استقرار مدل ها روی پلتفرم به منظور انجام پیش بینی آنلاین ارائه می نماید. مدل های آماده را می توان در مارکت پلیس ثبت کرده و به صورت API به متقاضیان ارائه نمود.

دیتاسلوک محیط توسعه، آموزش و مدیریت مدل های یادگیری را برای محققان داده و مهندسین یادگیری ماشین فراهم کرده، مدیریت زیرساخت ها را برای مهندسین داده تسهیل کرده، و مدل های آماده و ابزار ساخت خودکار مدل را برای محققان داده و تحلیل گران کسب و کار ارائه می کند.

امکان تحلیل کلان داده باارائه قابلیت توسعه الگوریتم، و استقرار و مانیتور مدل های یادگیری ماشین در این پلتفرم فراهم می شود.
مدل های ساخته شده در مخزنی از مدل ها نگهداری می شوند. میتوان این مدل ها را در مارکت پلیس ثبت کرده و به صورت API به متقاضیان ارائه نمود.
متقاضیان  پس از ثبت درخواست، امکان استفاده از مدل ها را به صورت REST API خواهند داشت.

معرفی دیتاسلوک

دیتاسلوک پلتفرم ابری هوش مصنوعی و تحلیل داده/کلان­ داده است که عملیات زمان­بر و دشوار توسعه، مدیریت و استقرار الگوریتم ­های یادگیری را تسریع و خودکار نموده و کاربران را از عملیات پیچیده مدیریت زیرساخت، MLOps و DevOps مرتبط با کلاسترهای پردازش و ذخیره ­سازی رها می سازد. این پلتفرم که در دسته AI Platformها و یا پلتفرم های «علوم داده و یادگیری ماشین (DSML Platform[1]قرار می گیرد مخاطبان با نقش های مختلفی را پشتیبانی می کند که مهمترین آنها دانشمندان/محققان داده (Data Scientists)، مهندسان یادگیری ماشین[2]، مهندسان داده[3] و تحلیل گران کسب و کار[4] می باشند. دیتاسلوک، محیط توسعه، آموزش و اجرا برای محققان داده و مهندسین یادگیری ماشین فراهم کرده، مدیریت زیرساخت های داده را برای مهندسین داده تسهیل کرده، و مدل های آماده و ابزار مصورسازی برای تحلیل گران کسب و کار ارائه می کند.

همانطور که در پایپ لاین پایینی شکل فوق دیده می شود، داده از منابع داده ­ای مختلف وارد پلتفرم شده و ذخیره می شود (مرحله Ingest&Store). سپس مراحل تحلیل روی آن انجام شده (مرحله Analyze) و نتیجه تحلیل ها به صورت مصور (مرحله Visualize) و از طریق یکپارچه سازی با ابزارهای BI به تحلیل­گران کسب و کار تحویل می شود.

در مراحل تحلیل (پایپ لاین بالای شکل)، محیط توسعه (IDE) برای ساخت و آموزش کد یادگیری ماشین در اختیار محققان داده و مهندسین یادگیری ماشین قرار می گیرد (مرحله Develop ML Model). کد آموزش داده شده روی مقیاس بالای داده و با قابلیت پاسخ گویی به درخواست ها در مقیاس بالا، استقرار یافته (مرحله Deploy Model) و مانیتور(مرحله Monitor Model) میشود. نهایتا مدل های ساخته شده می توانند روی marketplace به کسب و کارهایی که نیاز به یک مدل یادگیری ماشین خاص دارند ارائه شوند (مرحله Provide Model). بنابراین ارائه دهندگان مدل یادگیری ماشین (ML Provider) می توانند با ساخت مدل روی پلتفرم، مدل ها را روی marketplace به درخواست کنندگان ارائه دهند، و از طرف دیگر کسب و کارهایی که به یادگیری ماشین نیاز دارند می توانند روی مارکت مدل مورد نیاز خود را درخواست دهند (ML Demander).

ویژگی­ های اصلی پلتفرم هوش مصنوعی دیتاسلوک عبارتند از:

  • ارائه محیط توسعه از پیش ساخته شده برای توسعه الگوریتم یادگیری ماشین
  • قابلیت آموزش، اجرا، و استقرار الگوریتم روی کلاسترهای پردازشی
  • استقرار مدل به صورت سرویس ابری با قابلیت مقیاس پذیری خودکار
  • AutoML و ساخت خودکار ماشین مجازی از طریق محیط گرافیکی
  • بهینه سازی موازی هایپرپارامترها (Hyper-parameter Tuning)
  • مدیریت نسخه های الگوریتم در حال توسعه و مدل های ساخته شده
  • ارائه محیط توسعه همکارانه برای فعالیت مشارکتی تیم های Data Scientist
  • امکان ساخت پایپ لاین های یادگیری ماشین
  • اعتبارسنجی مدل
  • نظارت بر مدل از طریق ثبت پارامترها و متریک ­های الگوریتم یادگیر
  • ارائه مخزن مدل ­ها و Market Place ی برای آنها
  • امکان استقرار مدل بصورت API و ارائه سرویس استنتاج برخط (Online Scoring)

افق و چشم انداز دیتاسلوک ارائه یک «پلتفرم نوآوری باز» است که امکان تولید، استقرار و ارئه مدل های یادگیری ماشین را فراهم کرده و بازارساز و فعال ساز هوش مصنوعی در صنایع مختلف می­ باشد.

ارزش های پیشنهادی به کاربران دیتاسلوک

سرویس ­های تحلیل کلان داده ارائه شده تا کنون در بازار ایران که از الگوریتم ­های هوش نیز استفاده می­ کنند، On-premises بوده و به صورت یک راهکار برای یک مساله خاص در یک صنعت خاص ارائه شده اند (مانند راهکارهای خاص بانک یا مخابرات). در حالی­ که دیتاسلوک یک سرویس پلتفرم ابری است و نه یک راهکار خاص محدود شده به یک صنعت خاص. لذا می­ تواند تسهیل گر ساخت و استقرار هوش در انواع صنایع و به صورت سرویس ابری باشد. همین امر موجب می­ شود که دیتاسلوک بازارساز هوش مصنوعی بوده و تسهیل گر کاربست یادگیری ماشین در انواع صنایع باشد.

از طرف دیگر، سایر پلتفرم ­های هوش مصنوعی موجود در ایران در حال حاضر به ارائه الگوریتم ­های یادگیری ماشین داخلی شرکت به صورت API بسنده کرده اند. درحالی­ که دیتاسلوک تنها به مدل­ های داخلی خود متکی نیست، بلکه امکان سرویس دهی را برای انواع شرکت­ های بزرگ و نوپا فراهم کرده و نه تنها امکان ارائه سرویس یادگیری ماشین به صورت API را فراهم می­ کند، بلکه امکان ساخت مدل روی کلان داده، مدیریت مدل، تنظیم و نظارت بر مدل، و استقرار مدل را فراهم می ­نماید. نهایتا مدل ساخته شده را می­ توان روی یک Marketplace به متقاضیان ارائه نمود.

با توجه به توضیحات فوق می­توان گفت سرویسی که Marketplace برای انواع راهکارهای هوش مصنوعی ارائه نماید و همزمان امکان ساخت، مدیریت، نظارت و استقرار خودکار به صورت سرویس و روی کلان داده را به صورت ابری فراهم نماید تا به حال در ایران ارائه نشده است و تیم نوپای سلوک پرچم­دار این فناوری محسوب می شود. لذا پلتفرم دیتاسلوک می تواند تسهیل گر ایجاد مدل های یادگیری ماشین در انواع شرکت های حوزه هوش مصنوعی، اعم از شرکت­ های نوپا یا شرکت ­های بزرگ ارائه دهنده راهکارهای هوش، و همچنین بکاری گیری مدل ها روی حجم بالای داده باشد.

مولفه های اصلی دیتاسلوک

پلتفرم ابری هوش مصنوعی دیتاسلوک از شش مولفه اصلی تشکیل شده است که عبارتند از:

  1. زیرساخت و کلاسترهای ابری
  2. اکوسیستم کلان داده
  3. محیط توسعه و AutoML،
  4. مدیریت چرخه حیات ماشین یادگیر،
  5. استقرار و استنتاج برخط و دسته ای،
  6. و مارکت مدل های یادگیری ماشین.

داده در دیتاسلوک روی زیرساخت های ذخیره سازی و کلاسترهای پردازشی کلان داده ثبت و مدیریت می شود و در لایه زیرین از زیرساخت پردازشی ابری استفاده می کند.

در بخش توسعه، محیط های از پیش ساخته شده با کتابخانه ­های یادگیری ماشین از پیش نصب شده برای محققان داده ارائه می شود. محیط توسعه به گونه ای طراحی شده که فعالیت های همکارانه در تیم های علوم داده تسهیل گردد. محققان داده می توانند داده­ های خود را در فایل سیستم های توزیع شده وارد کرده، الگوریتم های خود را به صورت متمرکز و یا توزیع شده روی کلاستر اجرا کنند.

علاوه بر این امکاناتی برای مدیریت مدل­ های یادگیری ماشین فراهم شده و مهندسین یادگیری ماشین و مهندسین داده می توانند به راحتی روی نسخ مختلف مدل های ساخته شده کنترل داشته، و مدل ها را مانیتور کنند. در بخش مانیتور، کاربران میتوانند پارامترها و متریک های مدل را ثبت و مانیتور کرده، مدل ها را در رابط گرافیکی مقایسه کرده و مدل و پارامترهای مناسب الگوریتم را انتخاب کنند. همچنین تمامی نسخ مدل های ساخته شده در یک نقطه مرکزی ذخیره می شود و بنابراین امکان استفاده از نسخه های قبلی مدل ها همواره فراهم است. نسخه نهایی مدل ها می توانند در مخزن مدل ها ثبت شده و وضعیت آنها از لحاظ استقرار، آرشیو و … ثبت گردد.

مدل های ساخته شده یادگیری ماشین می توانند به صورت REST API روی زیرساخت ابری استقرار یافته و استنتاج برخط (Online Scoring) ارائه کنند.

یکی دیگر از امکانات دیتاسلوک در سطح توسعه الگوریتم های یادگیر، ارائه محیطی ساده و گرافیکی برای انتخاب و اجرای الگویتم های یادگیری ماشین است که به این قابلیت AutoML نیز گفته می شود. کاربران می توانند به راحتی و توسط رابط گرافیکی، داده را در سیستم وارد کرده، آن را تمیز کرده، الگوریتم های یادگیری مختلفی را از منوی موجود انتخاب کرده، الگوریتم ها را به صورت موازی و توزیع شده در سطح کلاستر روی داده اجرا کرده، نتیجه را مقایسه کرده و مدل مناسب را انتخاب کنند. سپس هایپرپارامترهای مدل را به صورت موازی تنظیم کرده و مدل را به مبتنی بر یک الگوی مشخص ثبت کرده و در صورت نیاز مستقر کنند.

دیتاسلوک مخزنی از الگوریتم­ های یادگیری و Marketplace ی برای تحویل مدل های یادگیری ماشین ارائه می دهد. لذا برای توسعه دهندگان علاوه بر امکان ساخت و استقرار، محیطی فراهم می ­شود که می ­توانند الگوریتم­ های خود را به متقاضیان به صورت API های آماده تحویل نمایند.

 

 

[1] Data Science Machine Learning Platform

[2] ML Engineer

[3] Data Engineer

[4] Business Analyst