مرداد ۲۴, ۱۳۹۹

پردازش اطلاعات به سبک Sirius؛ جیسون مارس آینده را ترسیم می کند

جیسون مارس (Jason Mars)، استاد رشته علوم کامپیوتر در دانشگاه میشیگانه. اون Siri خودشو با کمک استادان دیگه دانشگاه ها و محققان ساخت و بعد اونو وقف عام کرد. دستیار صوتی اون از نظر کارکرد بسیار مثل Siri اپل عمل می کنه اما حالا اون با به اشتراک گذاشتن و متن باز کردن دستیار صوتی اش، پذیرای ایده های جدید شده.

پروژه اون که با نام Sirius شناخته می شه، راه رو صاف می سازه تا همه کدنویسان بتونن با دشواریای فناوری تشخیص گفتار رو به رو شن و حتی اونو واسه اپلیکیشنای خودشون شخصی سازی کنن. جیسون مارس عقیده داره که تشخیص گفتار در آخر به این سو میره.

البته پروژه نامبرده هدف دیگری هم داره. مارس تشخیص داده که سایتا و سرورهای کامپیوتری امروزی پاسخگوی انقلاب صوتی پیش رو نیستن و می خواد با پروژه اش هدف آینده این صنعت رو ترسیم کنه: «ما می خوایم پی ببریم که مراکز اطلاعات آینده چیجوری باید ساخته شن.»

در ادامه مطلب با سایت ما همراه باشین.

جیسون مارس

جیسون مارس

ما می خوایم پی ببریم که مراکز اطلاعات آینده چیجوری باید ساخته شن.

دستیارهای دیجیتالی مثل Siri، Google Now و Cortana تنها روی موبایل شما اجرا نمی شن، بلکه هزاران دستگاه رو در مراکز کامپیوتری بزرگ به خدمت می گیرن و با این وجود، با افزایش اندازه سرویس دهی به کاربران، دیگه نمیشه به این همه کامپیوتر هم اکتفا کرد.

مراکز کامپیوتر حجم زیادی رو اشغال و انرژی بسیاری رو مصرف می کنن. همین حالا واسه تأمین انرژی این مراکز از انرژی هسته ای استفاده می شه که بسیار گرون س؛ وای به حال وقتی که این مراکز گسترش پیدا کنن و چند برابر شن. به جای کمیت باید به دنبال کیفیت باشیم، راه حل در پیدا کردن روش و سخت افزارهای کاراتره.

با این پروژه متن باز، مارس و همکارانش از جمله یونکی ژانگ (Yunqi Zhang)، دانشجوی مقطع دکترای میشیگان، می تونن نشون بدن که ابزاری مانند Siri چیجوری رفتاری در مراکز داده نشون میده و بالاتر از اون، می تونن بهترین سخت افزار رو واسه اجرای اینجور سرویسای صوتی شناسایی کنن.

تحقیر گوگل

در آزمایشایی که روی Sirius انجام شد، مارس نشون داد که اگه این سرویس روی سخت افزارهای عادی اجرا شه، حدود ۱۶۸ برابر انرژی، فضا و کامپیوترای بیشتری نسبت به سخت افزارهای لازم واسه جست و جوی متنی مانند گوگل نیاز داره. گوگل با اون همه عظمتش در برابر پردازش اطلاعات نسل جدید سرویسای تشخیص گفتار، زانو میزنه.

به هر حال اگه با روال فعلی پیش بریم، از اون جا که سرویسای تشخیص گفتار روز به روز گسترش پیدا میکنه و به زودی در همه دستگاه های پوشیدنی هم مورد استفاده قرار می گیره، جفت و جور کردن منابع این سرویس ممکن نیس. جدای از منابع سخت افزاری، انرژی زیاد لازم اون هزینه های بسیار زیادی داره.

سوال بزرگ اینجاس که چه سخت افزاری باید جانشین شه؟ جواب این سوال نه فقط اپل و گوگل و مایکروسافت و دیگه فعالان این بخش رو، بلکه شرکتای فروشنده سخت افزارهای مراکز داده مانند اینتل و AMD رو هم دچار تغییر می کنه. مارک پیپرمستر (Mark Papermaster)، کارمند ارشد بخش فناوری AMD میگه: «ما همه درگیر ماجرا هستیم، این فناوری واسه ما آینده مون اهمیت زیادی داره.»

واسه همینه که مارس در حال پیشبرد پروژه Siriusه. اپل و گوگل و مایکروسافت در جریان کار قرار دارن و خودشون می دانند چیجوری گلیمشان رو از آب بیرون بکشن. اما دیگه مردم دنیا نمی دونن و لازمه که در این باره آگاهی پیدا کنن.

دنیای موازی

بیشتر سرویسای تحت وب، از موتور جست و جوی گوگل گرفته تا شبکه اجتماعی فیس بوک، روی چیپای معمولی Intet و AMD (و بیشتر اینتل) فعالیت می کنن. مشکل اینجاس که این پردازندها واسه سرویسای تشخیص گفتاری مانند Siri ناجور هستن، چون که باید میلیونا میلیون داده رو به طور موازی پردازش کنن.

به خاطر همین، شرکتایی مثل گوگل، مایکروسافت و غول جست و جوی چین، Baidu، به روشای جدیدی مثل به کار گیری GPU (مخفف Graphics Processing Unit) یا چیپای قابل برنامه ریزی (FPGA – Field Programmable Array) واسه مصرف انرژی کمتر روی آورده ان. گوگل الان از GPUا واسه تأمین انرژی لازم «شبکه عصبی» مغز مانندش، یعنی Google Now بهره میگیره. مایکروسافت هم از FPGAا واسه دست کم بخشی از موتور جست و جوی بینگ استفاده می کنه.

بینگ صدا رو پردازش نمی کنه اما مانند GPUا، FPGAا هم بهره وری کل سیستم رو زیاد می کنن چون که انرژی و فضای کمتری رو به خود اختصاص میدن.

پردازش موازی

 

با به کار گیری GPU و FPGA میشه چیپای بیشتر رو به هر ماشین اختصاص داد. هر چند هر کدوم از اونا به تنهایی به اندازه یه CPU قوی نیستن اما میشه محاسبات سنگین رو به صورت محاسبات سبک تر بین اونا تقسیم کرد. ماجرا واسه کاربرده هایی مانند تشخیص گفتار باحال تر هم می شه چون که اینجور چیپایی خوب از پس پردازش موازی بر میان.

پیپرمستر میگه: «تعدادی از این داده ها به حضور شما واسه غربال شدن سریع از بین حجم بزرگی از اطلاعات نیاز دارن. این اطلاعات، به طور طبیعی می تونن [با به کار گیری GPU یا FPGA] با در نظر گرفتن ذات تکراری کار شما، شتابدهی شن.»

GPUا حالا نه فقط واسه پردازش تشخیص گفتار، بلکه واسه دیگه پردازشای براساس شبکه های عصبی هم به کار می رن که شامل وسیله مختلفی از تشخیص چهره در گوگل پلاس و فیس بوک گرفته تا فناوریای تبلیغاتی موتور جست و جوی بایدو می شه. در آخر این فناوری «یادگیری عمیق» به وسیله کامپیوترها می تونه به کمک صنعت اتومبیلای خودران و دیگه صنایع وابسته به روباتیک بیاد.

جف دان (Jeff Dean)، که بر روند یادگیری عمیق ماشینا در گوگل نظارت داره میگه که شرکتشون حالا از GPUا در کنار CPUا واسه اجرای حدود ۵۰ سرویس تحت وب گوگل استفاده می کنه.

از طرف دیگه مایکروسافت FPGAا رو به عنوان گزینه ای دیگه مطرح کرده. جیسون مارس مارس که تحقیقات زیادی در مورد معماری مراکز داده در دانشگاه میشیگان و کالیفورنیا داشته، با پروژه Sirius به دنبال شناسایی بهترین گزینه واسه آینده سرویسای اینترنتیه.

اون طرف اپل و گوگل

جواب هنوز مشخص نیس اما مارس با Sirius دست کم نشون داده که GPUا و FPGAا گزینه های بسیاری بهتری نسبت به اون چیزی که Intel ارائه می کنه، هستن. مارس میگه: «شک نداشته باشینً تجهیز مراکز داده آینده به GPU و FPGA بحث برانگیز میشه. دست کم تماشاگر رشد نمایی (پیرو نمایی – تصاعد توانی) هستین.»

مقایسه معماری CPU و GPU

چون می تونین اونا رو هر طور که می خواین برنامه ریزی کنین و اون طور که مارس میگه، FPGAا حتی از GPUا هم کاراتر هستن (بنا به آزمایشای دانشگاه میشیگان، نسبت بازده FPGAا ۱۶ برابر و GPUا ۱۰ برابره). اما به کار گیری اونا نیازمند برنامه ریزیای جدیه به طوری شرکتایی مانند گوگل، اپل و مایکروسافت باید مهندسانی رو واسه برنامه ریزی این چیپا استخدام کنن.

Siri و کورتانا و Google Now ـــ و حتی اپلیکیشنای پیشرفته تر که با تحلیل اطلاعات و پردازش همزان ویدیو سر و کار دارن و به شما پیشنهادهای شخصی سازی شده میدن ـــ جاییه که فناوری ما، صنعت اون به سمتش حرکت می کنه

این چیپا ویژگی مثبتی مثل قابل برنامه ریزی بودن دارن اما متناسب با اون، به کار گیری این چیپا نیازمند طراحی نرم افزار به صورت اختصاصی واسه اوناس. همین توانایی امید دهنده موندگاری و قابل اعتمادتر بودن این چیپا حساب می شه چون که می تونن واسه هر شرایطی شخصی سازی شن. هم اینکه در نظر داشته باشین که فناوریای تشخیص گفتار در آخر از انحصار گوگل و مایکروسافت و اپل خارج می شه و تجارتی جدیدی واسه چیپای اختصاصی و مهندسان چیپا شکل می گیره.

مارس میگه: «Siri و کورتانا و Google Now ـــ و حتی اپلیکیشنای پیشرفته تر که با تحلیل اطلاعات و پردازش همزان ویدیو سر و کار دارن و به شما پیشنهادهای شخصی سازی شده میدن ـــ جاییه که فناوری ما، صنعت اون به سمتش حرکت می کنه»

به هر حال این ماجرا دنیای پردازندهای کامپیوتری رو از این رو به اون رو می کنه. اینتل در حال پیشرفت FPGA هاسه و nVidia، سازنده بزرگ GPU به دنبال گشودن درهای جدیدی بر این بخش س. و AMD که چند سال پیش سازنده بزرگ GPU یعنی ATI رو چند سال پیش خرید هم در حال کاوشه. پیپرمستر از AMD میگه که شرکتشون به همراه دیگه شرکتای این صنعت در حال ساختن ابزاری هستن که نوشتن نرم افزار واسه GPUا رو آسون تر می سازه.

اگه این مسأله رو نظر داشته باشین که غولای اینترنتی جهان مثل مایکروسافت و فیس بوک به سمت به کار گیری چیپای کم مصرف ARM می رن، متوجه میشین که بازار چیپا واسه تغییرات بزرگی در سالای آینده در حال آماده شدنه.

جیسون مارس و پروژه اش Sirius، می خوان نشون بدن اون آینده ای که در انتظارش هستیم چیجوری میشه. و البته خود Sirius هم می تونه بخشی از این تغییر بزرگ رو تشکیل بده. اگه هر کسی بخواد Siri خودشو داشته باشه، به چیپ اختصاصی خودش نیاز داره.

در آخر پیشنهاد می کنیم توضیحات رو از زبون خود جیسون مارس هم بشنوین: