ابتكر الباحثون الذين يعملون في مشاريع مستقلة ذكاء اصطناعيًا ثنائي اللغة يمكنه تعلم لغة جديدة دون البحث في قاموس موجود ، وحتى بدون تدخل بشري. تقدم ملحوظ.
تخيل إعطاء شخص ما العديد من الكتب باللغتين الصينية والعربية ، وكلها مختلفة ، وتطلب منهم الترجمة من الصينية إلى العربية. يبدو مستحيلاً ، أليس كذلك؟ حسنًا ، يمكن للكمبيوتر القيام بذلك. " هذا ما أعلن عن ميكيل أرتيتكس ، مهندس كمبيوتر في جامعة بلاد الباسك (UPV) من سان سيباستيان في إسبانيا.
وهو مؤلف واحد من مقالتين علميتين تم نشرهما على arXiv ويصفان طريقة غير خاضعة للإشراف للتعلم الآلي قادرة على أداء الترجمات دون اللجوء إلى قاموس. يعمل النظام أيضًا بدون وجود نص متوازي أو متطابق بلغة أخرى.
الترجمة الآلية
المقالة الثانية ( الترجمة الآلية غير الخاضعة للإشراف باستخدام لغة واحدة فقط ) ، مستقلة تمامًا ولكنها تستخدم نفس التقنية ، هي عمل Guillaume Lample ، مهندس كمبيوتر فرنسي يعمل في قسم الذكاء الاصطناعي في Facebook . في كلتا الحالتين ، أظهر الباحثون أن الشبكة العصبية يمكن أن تتعلم ترجمة لغة دون البحث في قاموس.
في السنوات الأخيرة ، حققت الترجمة الآلية تقدمًا هائلاً بفضل الشبكات العصبية التي عززت أداء التعلم الآلي. ومع ذلك ، يتطلب هذا النوع من الذكاء الاصطناعي كميات كبيرة من المحتوى الذي ترجمه البشر سابقًا.
الترجمة هي نتيجة التعلم الخاضع للإشراف حيث تقوم الآلة بالتخمين ثم تتلقى الاستجابة الصحيحة من الإنسان ، مما يسمح لهم بعد ذلك بتعديل معالجتهم وفقًا لذلك.
هذه الطريقة فعالة للغات المستخدمة على نطاق واسع ، مثل الإنجليزية أو الفرنسية ، والتي يوجد بها العديد من المستندات المتوازية.
لكنها تعمل بشكل أقل جودة مع اللغات النادرة التي لا تقدم مثل هذه المجموعة.
يستخدم الذكاء الاصطناعي الجغرافيا لتعلم الكلمات
في حالة الطريقتين الجديدتين المعنيتين ، طور الخبراء التعلم الآلي غير الخاضع للإشراف. لهذا ، اعتمدوا على الارتباطات المتطابقة الموجودة بين الكلمات بغض النظر عن اللغة. على سبيل المثال ، غالبًا ما يتم استخدام جدول الكلمات مع كلمة كرسي .
من هناك ، ستعمل الآلة على تعيين هذه الروابط لكل لغة ، تمامًا مثل أطلس الطريق حيث تحل الكلمات محل أسماء المدن. يقوم الذكاء الاصطناعي بعد ذلك بالتوفيق بين هذه البطاقات وتحديد اتصالات متشابهة ولكن بأسماء مختلفة. هذه هي الطريقة التي نحصل بها على قاموس ثنائي اللغة بدون بيانات مسبقة.
جحيم من الإنجاز الفني!
كلا نظامي AI قادران على ترجمة ليس فقط الكلمات الفردية ، ولكن أيضًا الجمل الكاملة. للقيام بذلك ، يتم استخدام طريقتين للتدريب.
الأول ، الذي يسمى الترجمة العكسية أو "الترجمة العكسية" ، يتضمن ترجمة جملة تقريبًا من لغة إلى أخرى ثم ترجمتها مرة أخرى إلى لغتها الأصلية. إذا لم تكن الترجمة المرتجعة هي نفس الترجمة الأصلية ، فستقوم الشبكة العصبية بتعديل عملها وفقًا لذلك.
تقنية التدريب الثانية التي تسمى تقليل الضوضاء ، والتي يمكن ترجمتها على أنها "تقليل الضوضاء" ، تشبه الترجمة العكسية من حيث المبدأ. وهو يتألف من إضافة أو إزالة كلمات من جملة ثم ترجمتها. من خلال الجمع بين هاتين التقنيتين حصل الباحثون على أفضل النتائج. يوجد في قلب كلا النظامين ، نظام Mikel Artetxe و Guillaume Lample ، خطوة تخلق تمثيلًا أكثر تجريدًا للجملة قبل ترجمتها إلى لغة أخرى.
هذه القدرة على التجريد هي عنصر أساسي في منظور إنشاء الذكاء الاصطناعي العام. عند السؤال ، شعر الباحثان أنهما يمكنهما التقدم من خلال دمج المتغيرات من تقنيات كل منهما.
يعد التعلم الآلي غير الخاضع للإشراف عنصرًا أساسيًا في الذكاء الاصطناعي غدًا
تمت مقارنة النظامين في اختبارات الترجمة الإنجليزية-الفرنسية المستمدة من قاعدة مشتركة من 30 مليون جملة. حصل كل منهم على درجة 15 في اتجاه واحد (الإنجليزية - الفرنسية) والآخر (الفرنسية - الإنجليزية).
في نفس التمرين ، حصلت خدمة الترجمة من Google على 40 درجة ، لكن الخدمة تستخدم التعلم الخاضع للإشراف. يتصدر المترجمون البشر الطريق برصيد 50. في حين أن الطريقة غير الخاضعة للإشراف لا تزال بعيدة عن مستويات الأداء هذه ، إلا أنها أثبتت بالفعل أنها أفضل من الترجمة الحرفية.
بالإضافة إلى ذلك ، يحدد المؤلفون أن الذكاء الاصطناعي الخاص بهم يمكن أن يتقدم إذا قدمنا جزءًا من التعلم الخاضع للإشراف بترجمة بضعة آلاف من الجمل بالتوازي. لا يزال النظام في مهده ، لكنه سيتحسن بالتأكيد. وحقيقة أن الآلة قادرة على تعلم الترجمة دون تدخل بشري هي بالفعل خطوة كبيرة إلى الأمام.

تعليقات
إرسال تعليق