همه با قابلیت های ترجمه ای هوش مصنوعی گوگل آشنا هستیم. اما این سیستم حالا یک قابلیت جدید دارد، گوگل می تواند متن ها را از زبان هایی ترجمه کند که حتی برای اولین بار با آن ها برخورد داشته است.
این پلتفرم برای انجام چنین کاری از یک «زبان اینترلینگوا» (interlingua) اختصاصی بهره می برد که می تواند عبارت ها را بدون این که زبان مقصد یا مبداً ملاک باشد، به صورتی هوشمند معادل سازی کند.
پلتفرم یادگیری عمیق گوگل از همین معادل سازی ها برای ترجمه یک عبارت با دقتی قابل قبول استفاده می کند. حتی بدون این که لزومی داشته باشد خود از درک این جلملات برآید.
سرویس ترجمه گوگل حالا یک پلتفرم جامع یادگیری عمیق است که گوگل آن را «سیستم عصبی ترجمه ماشینی گوگل» (Google Neural Machine Translation) یا به اختصار «GNMT» می نامد. این پلتفرم ترجمه زبان های مختلف را نه بر اساس قواعد دستور زبانی که به روش یادگیری مثالی می آموزد. در این روش، هر قدر که مراجعات و درخواست ترجمه عبارات به این سامانه بیشتر شود، دقت آن بالاتر خواهد رفت.
مشکل اینجاست که گوگل ترنسلیت در حال حاضر بیش از ۱۰۳ زبان مختلف را تحت پوشش دارد، این یعنی بیش از ۵ هزار جفت زبان مختلف برای ترجمه به یکدیگر وجود خواهند داشت. بنابراین برای دستیابی به دقتی قابل قبول به میلیون ها مثال تمرینی نیاز است، که این فشار بسیاری را به سرورهای پردازشی خواهد آورد.
خود محققین گوگل هم هنوز به طور دقیق، ساز و کار این پلتفرم ترجمه را برای ترجمه دو زبان کاملاً جدید به یکدیگر نمی دانند، چرا که ساختار یادگیری عمیق هوش مصنوعی بسیار پیچیده و درک روش های دستیابی به پاسخ در آنها به شدت دشوار است.
با این حال، محققین توانستند به یک الگوی سه بعدی سه زبانه دست بیابند که الگوهای متنی را در زبان های مختلف نشانه گذاری می کند (تصویر بالا). آنها دریافتند که GNMT می تواند الگوی یکتای جملات با معانی مشابه را از هر سه زبان استخراج نماید. همین همسان یابی میان الگوهاست که هوش مصنوعی گوگل را قادر می سازد زبان میانجی (اینترلینگوا) اختصاصی خود را توسعه داده و عبارات جدید را به یکدیگر ترجمه نماید.
در یک آزمایش، این محققین ۱۲ جفت زبان مختلف را در ابعاد یک جفت یکتا ترکیب کردند. طوری که سیستم همه آن ۱۲ جفت را به عنوان یک جفت زبانی (شامل زبان مبداً و مقصد) تشخیص دهد. در کمال تعجب مشاهده شد، نتیجه ترجمه چنین عبارتی تنها کاهش نسبی دقت بود.
به عبارت دیگر، هوش مصنوعی گوگل این ترکیبات مختلف را به عنوان زبان های مستقل شناسایی نمی کند، بلکه تنها الگوهایی را می بیند که باید مشابه آنها پیدا شود. پس در واقع گوگل ترنسلیت به این که زبان مقصد و مبداً چه باشد کاری ندارد، بلکه تنها به دنبال الگوهای مشابه می گردد. هرقدر دقت الگوها به واسطه تمرین های مثالی افزایش یافته باشد، دقت ترجمه در آن جفت زبانی نیز بالاتر می رود.
باید در نظر داشت که تمام این پیشرفت ها در مدت بسیار کوتاهی حاصل شده، بنابراین چندان بعید نیست که تا چند سال دیگر، نیاز به هرگونه مترجم انسانی به طور کامل از میان برود.
برگرفته از: دیجیاتو
این پلتفرم برای انجام چنین کاری از یک «زبان اینترلینگوا» (interlingua) اختصاصی بهره می برد که می تواند عبارت ها را بدون این که زبان مقصد یا مبداً ملاک باشد، به صورتی هوشمند معادل سازی کند.
پلتفرم یادگیری عمیق گوگل از همین معادل سازی ها برای ترجمه یک عبارت با دقتی قابل قبول استفاده می کند. حتی بدون این که لزومی داشته باشد خود از درک این جلملات برآید.
سرویس ترجمه گوگل حالا یک پلتفرم جامع یادگیری عمیق است که گوگل آن را «سیستم عصبی ترجمه ماشینی گوگل» (Google Neural Machine Translation) یا به اختصار «GNMT» می نامد. این پلتفرم ترجمه زبان های مختلف را نه بر اساس قواعد دستور زبانی که به روش یادگیری مثالی می آموزد. در این روش، هر قدر که مراجعات و درخواست ترجمه عبارات به این سامانه بیشتر شود، دقت آن بالاتر خواهد رفت.
مشکل اینجاست که گوگل ترنسلیت در حال حاضر بیش از ۱۰۳ زبان مختلف را تحت پوشش دارد، این یعنی بیش از ۵ هزار جفت زبان مختلف برای ترجمه به یکدیگر وجود خواهند داشت. بنابراین برای دستیابی به دقتی قابل قبول به میلیون ها مثال تمرینی نیاز است، که این فشار بسیاری را به سرورهای پردازشی خواهد آورد.
خود محققین گوگل هم هنوز به طور دقیق، ساز و کار این پلتفرم ترجمه را برای ترجمه دو زبان کاملاً جدید به یکدیگر نمی دانند، چرا که ساختار یادگیری عمیق هوش مصنوعی بسیار پیچیده و درک روش های دستیابی به پاسخ در آنها به شدت دشوار است.
با این حال، محققین توانستند به یک الگوی سه بعدی سه زبانه دست بیابند که الگوهای متنی را در زبان های مختلف نشانه گذاری می کند (تصویر بالا). آنها دریافتند که GNMT می تواند الگوی یکتای جملات با معانی مشابه را از هر سه زبان استخراج نماید. همین همسان یابی میان الگوهاست که هوش مصنوعی گوگل را قادر می سازد زبان میانجی (اینترلینگوا) اختصاصی خود را توسعه داده و عبارات جدید را به یکدیگر ترجمه نماید.
در یک آزمایش، این محققین ۱۲ جفت زبان مختلف را در ابعاد یک جفت یکتا ترکیب کردند. طوری که سیستم همه آن ۱۲ جفت را به عنوان یک جفت زبانی (شامل زبان مبداً و مقصد) تشخیص دهد. در کمال تعجب مشاهده شد، نتیجه ترجمه چنین عبارتی تنها کاهش نسبی دقت بود.
به عبارت دیگر، هوش مصنوعی گوگل این ترکیبات مختلف را به عنوان زبان های مستقل شناسایی نمی کند، بلکه تنها الگوهایی را می بیند که باید مشابه آنها پیدا شود. پس در واقع گوگل ترنسلیت به این که زبان مقصد و مبداً چه باشد کاری ندارد، بلکه تنها به دنبال الگوهای مشابه می گردد. هرقدر دقت الگوها به واسطه تمرین های مثالی افزایش یافته باشد، دقت ترجمه در آن جفت زبانی نیز بالاتر می رود.
باید در نظر داشت که تمام این پیشرفت ها در مدت بسیار کوتاهی حاصل شده، بنابراین چندان بعید نیست که تا چند سال دیگر، نیاز به هرگونه مترجم انسانی به طور کامل از میان برود.
برگرفته از: دیجیاتو