هوش مصنوعی در صنعت زیبایی- بخش دوم: درون این سیستم ها چه می گذرد؟

سنجش میزان جذابیت و زیبایی افراد مفهوم جدیدی نیست، اما نحوه عملکرد این سیستم‌ها پیشرفت نسبتاً جدیدی به حساب می‌آید: Face++ در سال ۲۰۱۷ سیستم سنجش زیبایی خود را عرضه کرد.

زمانی که از یکی از سخنگویان شرکت Megvii راجع به نحوه عملکرد این الگوریتم‌ها پرسیدند، پاسخ داد:« این الگوریتم‌ها حدود سه سال پیش و در نتیجه تقاضای بازار توسعه داده شدند و در اپلیکیشن‌های سرگرم‌کننده به کار گرفته شدند». در وب‌سایت این شرکت گفته شده سیستم آن‌ها بر روی چهره‌ چینی‌ها و افراد جنوب شرق آسیا آموزش دیده است  و بالافاصله پس از رونمایی مورد توجه 300000 برنامه‌نویس قرار گرفته، اما اطلاعات بیشتری راجع به این سیستم ارائه نشده است.

سخنگوی Megvii می‌گوید Face++ یک پلتفرم متن‌باز است و به همین دلیل نمی‌توانند بر استفاده برنامه‌نویسان از این سیستم نظارت و کنترل داشته باشند، اما در وب‌سایت آن‌ها از «فروش محصولات آرایشی» و «دوست‌یابی» به عنوان دو کاربرد اصلی آن‌ یاد شده است.

از جمله مهم‌ترین مشتریان این سیستم‌ها می‌توان به Alibaba ،Lenovo و  سیستم نظارت ویدئویی دولت چین اشاره کرد که در جای جای کشور دوربین‌های مداربسته نصب کرده است. Megvii به تازگی در صف عرضه اولیه قرار گرفته و ارزش کنونی‌اش ۴ میلیارد دلار برآورد شده است. طبق گزارشی که در نیویورک تایمز به چاپ رسیده Megvii یکی از سه شرکتی است که به دولت چین در شناسایی شهروندانی که به اقلیت قومی اویغور تعلق دارند، کمک کرده است.

نحوه عملکرد شبکه‌های عصبی کانولوشن

  • شبکه های عصبی کانولوشن برای تجزیه و تحلیل و طبقه‌بندی اشیا به تصاویر و ویدئوها نگاه می‌کنند. در این حالت ممکن است یکی از لایه‌های شبکه حاشیه‌ دست ، لایه‌ دیگر انگشتان و به همین ترتیب لایه‌های دیگر دست‌ها، بازوان و افراد را شناسایی کند.
  • لایه‌های دیگر به مفاهیم انتزاعی می‌پردازند: برای مثال اگر این تصویر یک درخت است، شبکه چه اطلاعاتی در مورد درخت‌ها یاد گرفته است؟ اگر یک خیابان است، معمولاً چه چیزهایی در خیابان‌ها یافت می‌شود که شبکه باید آن‌ها را ببیند و شناسایی کند؟ به عنوان مثال، یک شبکه عصبی کانولوشن ممکن است تصویر فردی که خط فک دارد را به عنوان فردی جذاب تشخیص دهد، چرا که در فرایند آموزش یاد گرفته خط فک یکی از اصلی‌ترین معیارهای زیبایی در میان انسان‌ها است.

در این ضمن، Qoves  آماده ارائه توضیحات بیشتر در مورد نحوه عملکرد سیستم تحلیل چهره خود بود. Qoves که در استرالیا واقع شده، فعالیت خود را از سال ۲۰۱۹ و به عنوان یک استودیو روتوش عکس آغاز کرد، اما در سال ۲۰۲۰ تغییر رویه داد و در زمینه تحلیل چهره به کمک هوش مصنوعی و جراحی پلاستیک به فعالیت خود ادامه داد. سیستم هوش مصنوعی Qoves از یکی از رایج‌ترین تکنیک‌های یادگیری عمیق یعنی شبکه‌ عصبی کانولوشن (CNN) استفاده می‌کند. به طور معمول، CNNها برای سنجش میزان زیبایی افراد بر روی دیتاستی متشکل از صدها و هزاران تصویر از افرادی که به صورت دستی و توسط انسان‌‌ها به عنوان فردی جذاب شناخته شده‌اند آموزش می‌بینند. سیستم با نگاه کردن به تصاویر و امتیازات معیارهای زیبایی انسان‌ها را استنباط می‌کند و زمانی که تصویر جدیدی به او نشان دادند می‌تواند میزان جذابیت فرد را پیش‌بینی کند.

طی سال‌های اخیر چندین شرکت بزرگ دیگر هم در زمینه ابزارها و سیستم‌های زیبایی مجهز به AI سرمایه‌گذاری کرده‌اند. از جمله این شرکت‌ها که شبیه به Qoves هستند می‌توان به Ulta Beauty ،با ارزشی معادل ۱۸ میلیارد دلار، اشاره کرد. Ulta Beauty یک شرکت آمریکایی فعال در زمینه خرده‌فروشی لوازم آرایشی است و یک ابزار تجزیه و تحلیل پوست توسعه داده است. Nvidia و مایکروسافت هم در سال ۲۰۱۶ اسپانسر یک «جشنواره روبات زیبایی» بودند، در این جشنواره از شرکت‌کنندگان خواسته شد بهترین سیستم هوش مصنوعی برای ارزیابی میزان جذابیت را توسعه دهند.

طبق گفته‌های ایوان نیسلسون، یکی از سهام‌داران شرکت LDV Capital، فناوری بینایی هنوز در مراحل آغازین به سر می‌برد و «فرصت‌های قابل توجهی برای سرمایه‌گذاری» فراهم آورده است. طبق برآورد LDV سال آینده ، به غیر از دوربین‌هایی که در بخش تولیدی و لجستیک استفاده می‌شوند، حدود ۴۵ میلیارد دوربین در سراسر جهان نصب خواهد شد. علاوه بر این به عقیده LDV در آینده‌ای نه چندان دور  داده‌های بصری (تصاویر، ویدئوها و …) اصلی‌ترین داده‌های ورودی به سیستم‌های AI را تشکیل خواهند داد. نیسلسون می‌گوید تحلیل چهره «بازار گسترده‌ای» است که با گذشت زمان «پشته فن‌آوری را بازآفرینی می‌کند و دقتی مشابه، نزدیک به و یا حتی بهتر از چشم انسان خواهد داشت.»

شفیع حسن، بنیان‌گذار شرکت Qoves می‌گوید این احتمال وجود دارد که میزان استفاده از سیستم‌های سنجش زیبایی بیش از این افزایش یابد. به عقیده وی اپلیکیشن‌ها و پلتفرم‌های شبکه‌های اجتماعی اغلب از سیستم‌هایی استفاده می‌کنند که چهره افراد را اسکن می‌کنند، بر اساس میزان جذابیت چهره‌شان به آن‌ها نمره می‌دهند و به افرادی که امتیاز بیشتری کسب کرده‌اند، توجه بیشتری نشان می‌دهند. او می‌گوید: «کاری که ما انجام می‌دهیم شبیه کاری است که اسنپ‌چت، اینستاگرام یا تیک‌تاک انجام می‌دهد، اما کار ما شفافیت بیشتری دارد».

بنیان‌گذار شرکت Qoves در ادامه می‌گوید: « شبکه عصبی و سیستمی که آن‌ها به کار گرفته‌اند تفاوتی با شبکه عصبی و سیستم ما ندارد، اما به عنوان مثال آن‌ها به شما نمی‌گویند بینی‌تان چین و چروک دارد، یا مرز سرخاک لب شما نازک است یا مواردی از این قبیل. به همین دلیل آن‌ها شما را به عنوان فردی که کمتر جذاب است، تشخیص می‌دهند.»

منبع: هوشیو

@Aseman_Mag

ما را دنبال کنید