متن شایعترین مکانیزم ارتباطی کاربران فیسبوک است. فیسبوک برای آنکه به مردم کمک کند، در زمان کار با فیسبوک و محصولات مرتبط با آن تجربه کاربری خوبی داشته باشند، به راهکاری نیاز دارد که توانایی تحلیل و درک محتوای متون را داشته باشد. این راهکار به فیسبوک کمک میکند تا پیامهایی که محتوای آنها متشکل از اسپم است را شناسایی کرده و در ادامه اقدام به فیلتر کردن آنها کند. برای نیل به این هدف DeepText خلق شد. چهارشنبه هفته گذشته DeepText چشمانداز قابل توجهی را به همگان نشان داد. دورنمایی که به ما میگوید؛ فیسبوک چگونه با استفاده از هوش مصنوعی قادر است پلتفرمی را ایجاد کند که در یک چشم به هم زدن میلیاردها خط را تفسیر کند. متونی که بهطور مداوم و به زبانهای مختلف روی این شبکه اجتماعی رد و بدل میشوند.
DeepText یک موتور ادراکی متنی یادگیرمحور بوده که قادر است با دقتی نزدیک به دقت انسانی محتوای هزاران پست را در یک ثانیه تحلیل کند. اهرمهایی که DeepText از آنها استفاده میکند بر پایه معماری شبکههای عمیق عصبی مختلفی همچون شبکههای سلولی (convolutional) و بازگشتی (recurrent) قرار دارند. DeepText بر مبنای یادگیری خود این توانایی را دارد تا در سطح کلمه یا حتا یک کاراکتر متون را درک کند. برای این منظور فیسبوک از Flow FBLearner و Torch برای آموزش مدلها استفاده میکند. مدلهایی که آموزش دیدهاند به عنوان یک زیرساخت توزیع شده تنها از طریق یک کلیک ساده قادر به تحلیل محتوای متون کاربران خواهند بود. فیسبوک میگوید: « برنامه هوش مصنوعی جدید، قادر است با ظرافت و هوشمندی خاصی متون را درک کند. به عبارت دیگر، DeepText موتور ادراکپذیر جدید متون ما به اندازهای خوب است که تنها در یک ثانیه قادر است چند هزار پیام را که به زبانهای مختلفی (20 زبان) در فیسبوک مبادله میشوند تفسیر کند.»
فیسبوک هدف از طراحی DeepText را افزایش دقت درک محتوا و همچنین توانایی درک محتوایی که درون پیامها قرار دارد اعلام کرده است. بهطوری که در نهایت کاربران تجربه خوشایندی را از حضور در فیسبوک یا کار با محصولات این شرکت تجربه کنند. البته لازم به توضیح است که در گذشته نیز فیسبوک از فناوریهای مشابهی در این ارتباط استفاده کرده بود. بهطور مثال در Messenger فیسبوک بخشی وجود دارد که به نام استخراج مفهوم (intent extraction) از آن یاد میشود. این ویژگی سعی میکرد تفاوت میان پیامهای یکسانی که ارسال میشود را کشف کند، اما در عمل آنگونه که باید کارایی خوبی از خود نشان نداد. DeepText همچنین این توانایی را دارد تا برای کاربران فعالی که از ابزارهای فیسبوک برای بهروزرسانی محتوا استفاده میکنند، مفید واقع شود. پژوهشگران فیسبوک در این ارتباط گفتهاند: «بهطور مثال، شخصی ممکن است در پست خود بنویسید، من تمایل دارم دوچرخه قدیمی خود را به قیمت 200 دلار به فروش برسانم. آیا شخص علاقهمندی وجود دارد؟ DeepText به خوبی درک میکند که محتوای این پست در ارتباط با فروش وسیلهای بوده و در ادامه اقدام به استخراج اطلاعات معناداری در ارتباط با وسیله در معرض فروش و قیمت آن کرده و به فروشنده اعلانی در ارتباط با ابزارهای موجودی که این تراکنش را برای او در فیسبوک سادهتر میکنند نشان میدهد.»
شاید از خود سوال کنید، یادگیری عمیق فیسبوک چگونه عمل میکند؟ اگر بخواهیم این فرآیند را به بیانی ساده تشریح کنیم، این گونه است که درک متن شامل چند مرحله است. در ابتدا طبقهبندی عمومی برای تعیین اینکه یک پست در ارتباط با چیست انجام میشود. بهطور مثال بسکتبال، در مرحله بعد فرآیند تشخیص موجودیت انجام میشود. شبیه به اینکه نام بازیکنان چیست، نتایج بازی چگونه است؟ و... به این شکل اطلاعات معناداری به دست میآید. اما برای آنکه این فرآیند به درک انسانی نزدیکتر شود، کامپیوتر باید در ارتباط با موضوعاتی همچون زبان عامیانه و ابهامزدایی کلمات حساس آموزش ببنید. بهطور مثال، اگر شخصی میگوید "من بلکبری را دوست دارم؛" معنای جمله او یک میوه است یا یک دستگاه؟ درک متن در فیسبوک مسلتزم بخش بخش کردن جملات و چالشهای زبانی است. جاییکه فناوریهای پردازش زبان طبیعی آنچنان که باید کارا نیستند. اما زمانی که از یادگیری عمیق استفاده میشود، پیامهایی که به زبانهای مختلف در فیسبوک نوشته میشوند، بهتر درک میشوند. برای افزایش این دقت درک، از مکانیزم برچسبگذاری دادهها استفاده شده که در مقایسه با فناوریهای سنتی پردازش زبان طبیعی (NLP) بهتر عمل میکنند. DeepText بر مبنای ایدههای مرتبط با یادگیری عمیق که اولین بار توسط رونان کولوبرت و یان لکان از آزمایشگاه هوش مصنوعی فیسبوک معرفی شده بودند، طراحی شده است.
در رویکردهای پردازش زبان طبیعی سنتی، لغات در فرمتی که یک الگوریتم کامپیوتری توانایی یادگیری آنها را داشته باشد، تبدیل میشدند. لغت brother ممکن بوده به یک شناسه عدد صحیح از قبیل 4598 اختصاص داده شود، در حالیکه لغت bro ممکن است به مقدار صحیح دیگری شبیه به 986665 تخصیص داده شود. این شیوه کارکرد مستلزم این مهم است که املای دقیق دادهها به مدل آموزش داده شود تا مفهوم کاملا درک شود. اما در یادگیری عمیق، ما به جای آنکه از کلمات جایگذاری شده استفاده کنیم از یک مفهوم ریاضی که رابطه معنایی دو لغت را حفظ میکنند استفاده میکنیم. در نتیجه؛ زمانی که محاسبه به درستی انجام میشود، ما مشاهده خواهیم کرد که لغات قرار گرفته در brother و Bro هر دو در فضای نزدیک به هم قرار دارند. این نوع از نمایش به ما اجازه میدهد تا معنای عمیقتر لغات را ضبط کنیم. این ترکیب به DeepText این قابلیت را داده است که بداند happy birthday در زبان انگلیسی و feliz cumpleaños در زبان اسپانیایی هر دو در فضای نزدیک به هم قرار دارند. با نقشهبرداری لغات و جملات در یک فضای مشترک، DeepText قادر به ساخت مدلهایی است که زبان آگنوستیک هستند.
پروژه جدید همچنین این قابلیت را در اختیار شما قرار میدهد تا به سادگی نظراتی که به صورت عمومی دریافت میکنید را فیلتر کرده تا کمتر اسپمها را مشاهده کنید. در حالی که تعدادی از این تغییرات جزیی به نظر میرسند، اما پروژههایی شبیه به DeepText بهطور فزایندهای این شرکت را به سمت آیندهای که هوش مصنوعی در آن حرف اول را میزند، هدایت خواهند کرد. بهطوری که به فیسبوک کمک میکنند، درک کند شما درباره چه چیزی صحبت میکنید، چه خبرهایی متناسب با تخصص و نیاز شما است و در نهایت به شما اجازه میدهند به مکالمه خود در چت ادامه دهید، در حالی که اسپمها از شما دور خواهند بود. اینکار باعث میشود کاربران بیشتر و بیشتری مجذوب محصولات فیسبوک شوند.
هر چند این پروژه هنوز در مراحل ابتدایی قرار دارد، اما فیسبوک میگوید: «ما تلاش میکنیم DeepText بهتر شود. ما همچنین سعی خواهیم کرد راههای جدید را برای استفاده از این پروژه درون فیسبوک کشف کند. بهطوری که DeepText توانایی درک محتوای تصاویر و ویدیوها را داشته باشد.»