ثلاث وحدات استخدام جديدة متعددة اللغات تأتي إلى TensorFlow

تقنية / ثلاث وحدات استخدام جديدة متعددة اللغات تأتي إلى TensorFlow 2 دقيقة للقراءة

جوجل البحث الصوتي



تعد Google واحدة من رواد أبحاث الذكاء الاصطناعي وقد استمرت العديد من مشاريعهم في لفت الأنظار. الفا زيرو من جوجل العقل العميق حقق الفريق إنجازًا كبيرًا في أبحاث الذكاء الاصطناعي ، نظرًا لقدرة البرنامج على تعلم الألعاب المعقدة بنفسه (بدون تدريب وتدخل بشري). قامت Google أيضًا بعمل ممتاز في برامج معالجة اللغة الطبيعية (البرمجة اللغوية العصبية) ، وهي أحد أسباب كفاءة 'مساعد Google' في فهم الكلام البشري ومعالجته.

أعلنت Google مؤخرًا عن إطلاق ثلاثة إصدارات جديدة استخدام وحدات متعددة اللغات وتقديم المزيد من النماذج متعددة اللغات لاسترجاع نص مشابه لغويًا.



توفر الوحدتان الأوليان نماذج متعددة اللغات لاسترداد نص مشابه لغويًا ، أحدهما محسّن لأداء الاسترجاع والآخر للسرعة واستخدام أقل للذاكرة. النموذج الثالث متخصص ل استرجاع السؤال والجواب بستة عشر لغة (USE-QA) ويمثل تطبيقًا جديدًا تمامًا للاستخدام. يتم تدريب جميع الوحدات الثلاث متعددة اللغات باستخدام ملف إطار عمل ثنائي التشفير متعدد المهام ، على غرار نموذج USE الأصلي للغة الإنجليزية ، أثناء استخدام التقنيات التي طورناها لتحسين التشفير المزدوج مع نهج softmax الهامش الإضافي . وهي مصممة ليس فقط للحفاظ على أداء تعليم النقل الجيد ، ولكن لأداء مهام الاسترجاع الدلالية بشكل جيد.



لقد قطعت معالجة اللغة في الأنظمة شوطًا طويلاً ، بدءًا من تحليل شجرة التركيب الأساسي إلى نماذج ارتباط المتجهات الكبيرة. يعد فهم السياق في النص أحد أكبر المشكلات في مجال معالجة اللغات الطبيعية ، ويعمل Universal Sentence Encoder على حل هذه المشكلة عن طريق تحويل النص في متجهات عالية الأبعاد ، مما يجعل ترتيب النص والدلالة أسهل.



مصدر هيكل تعليم UTE - مدونة Google

وفقًا لـ Google ، ' تم بناء جميع الوحدات الثلاث الجديدة على معمارية الاسترجاع الدلالية ، والتي تقسم عادةً ترميز الأسئلة والإجابات إلى شبكات عصبية منفصلة ، مما يجعل من الممكن البحث بين مليارات الإجابات المحتملة في غضون أجزاء من الثانية. بمعنى آخر ، يساعد هذا في فهرسة البيانات بشكل أفضل.

' يتم تدريب جميع الوحدات الثلاث متعددة اللغات باستخدام ملف إطار عمل ثنائي التشفير متعدد المهام ، على غرار نموذج USE الأصلي للغة الإنجليزية ، أثناء استخدام التقنيات التي طورناها لتحسين التشفير المزدوج مع نهج softmax الهامش الإضافي . وهي مصممة ليس فقط للحفاظ على أداء تعليم النقل الجيد ، ولكن لأداء مهام الاسترجاع الدلالية بشكل جيد . ' غالبًا ما تُستخدم وظيفة Softmax لتوفير القوة الحسابية عن طريق الأس المتجهات ثم قسمة كل عنصر على مجموع الأسي.



العمارة الاسترجاع الدلالي

'جميع الوحدات الثلاث الجديدة مبنية على معماريات استرجاع دلالية ، والتي تقسم عادةً ترميز الأسئلة والإجابات إلى شبكات عصبية منفصلة ، مما يجعل من الممكن البحث بين مليارات الإجابات المحتملة في غضون أجزاء من الثانية. مفتاح استخدام التشفير المزدوج للاسترجاع الدلالي الفعال هو التشفير المسبق لجميع الإجابات المرشحة لاستعلامات الإدخال المتوقعة وتخزينها في قاعدة بيانات متجهية تم تحسينها لحل مشكلة أقرب مشكلة جار ، مما يتيح إمكانية البحث عن عدد كبير من المرشحين بسرعة وجيد الدقة والاستدعاء '.

يمكنك تنزيل هذه الوحدات من TensorFlow Hub. لمزيد من القراءة الرجوع إلى GoogleAI الكامل مشاركة مدونة .

العلامات جوجل