Microsoft Word و Outlook و PowerPoint للحصول على أداة تسمية توضيحية للصور تعمل بالذكاء الاصطناعي يتم تدريبها على مجموعات البيانات الكبيرة بعد خدمات Azure

تقنية / Microsoft Word و Outlook و PowerPoint للحصول على أداة تسمية توضيحية للصور تعمل بالذكاء الاصطناعي يتم تدريبها على مجموعات البيانات الكبيرة بعد خدمات Azure 2 دقيقة للقراءة

مايكروسوفت أزور. CirtixGuru



مايكروسوفت لديها تم تأكيد أنها طورت نظامًا قويًا وذكيًا لتسميات الصور. يمكن للنظام الذي يعمل بالذكاء الاصطناعي أن يولد بسرعة وبشكل ذاتي الكاتيونات ذات الصلة من الصور. قد لا يكون النظام بطلاقة أو إبداعية مثل البشر الذين يقومون بإنشاء تسميات توضيحية للصور ، ولكن ورد أنه تم تدريبه على مجموعات بيانات ضخمة لتحسين الملاءمة والدقة. تؤكد Microsoft أن النظام أقوى بمرتين من النظام السائد المستخدم في خدمات الشركة.

لدى Microsoft نظام تسمية توضيحية تلقائي جديد للصور. سيتم إطلاق النظام أولاً في خدمات Azure المعرفية. ومع ذلك ، أشارت Microsoft إلى أن الأمر نفسه سينتقل إلى Microsoft Word و Outlook و PowerPoint.



كيف يعمل نظام AI-Drive Captioning الجديد للصور؟

يجب تدريب أي نظام يحركه الذكاء الاصطناعي أولاً على مجموعات البيانات ذات الصلة. تتعلم هذه الخوارزميات من نقاط البيانات ومن ثم تكتسب القدرة على محاكاة الأنماط السلوكية المتوقعة. وبحسب ما ورد تم تدريب نظام التسمية التوضيحية للصور الجديد من Microsoft أيضًا بمجموعة بيانات ضخمة من الصور التي تم إقرانها بعلامات الكلمات. تم تعيين علامات الكلمات هذه إلى كائن مميز في صورة ما.



بعد التدريب الأولي ، صقل الباحثون النموذج المدرَّب مسبقًا للتعليق على مجموعة بيانات الصور الموصوفة بالفعل. سمحت عملية التدريب والضبط الدقيق لنموذج الذكاء الاصطناعي بتعلم كيفية تكوين جملة مفهومة. يستفيد نموذج الذكاء الاصطناعي الجديد لاحقًا من المفردات المرئية لإنشاء تسميات توضيحية للصور التي تحتوي على كائنات جديدة أو مميزة بدقة. يبدو أن التركيز على الكائن المحدد أو الفريد في الصورة.



كما هو الحال مع جميع نماذج الذكاء الاصطناعي ، حتى نظام التسمية التوضيحية للصور من Microsoft ليس دقيقًا أو مثاليًا بنسبة 100٪. ومع ذلك ، تؤكد Microsoft أن نموذج AI الجديد أفضل بمرتين من نموذج التسمية التوضيحية للصور المستخدم حاليًا في منتجات وخدمات الشركة. الاختبار الداخلي يشير يمكن للنموذج الجديد إنشاء تسميات توضيحية أكثر وضوحًا ودقة من التعليقات المكتوبة يدويًا بواسطة البشر ، كما يزعم Xuedong Huang ، الزميل التقني في Microsoft والمسؤول التقني الأول في Azure AI Cognitive Services في ريدموند ، واشنطن ،

'نحن نأخذ طفرة الذكاء الاصطناعي هذه إلى Azure كمنصة لخدمة مجموعة أوسع من العملاء. إنه ليس مجرد اختراق في البحث ؛ الوقت المستغرق لتحويل هذا الاختراق إلى إنتاج على Azure يعد أيضًا تقدمًا كبيرًا '.



ما أشار إليه هوانغ هو أن Microsoft قادرة بشكل كبير على تسريع تطوير وصقل ونشر نماذج الذكاء الاصطناعي التي يمكنها التنافس مع المحتوى الذي ينشئه الإنسان. ومع ذلك ، من المهم ملاحظة أن هذه النماذج تتبع عادةً مجموعة محددة من الإرشادات وتعتمد بشكل كبير على مجموعات البيانات.

تعمل Microsoft بجد خلال السنوات القليلة الماضية لبث قوة الذكاء الاصطناعي عبر العديد من منتجاتها وخدماتها. يتمتع الذكاء الاصطناعي بالقدرة على زيادة الإنتاجية مع تحرير البشر للقيام بمهام أكثر إبداعًا. ومن المثير للاهتمام ، أن Microsoft تهدف إلى مساعدة جميع المستخدمين على الوصول إلى المحتوى الحيوي في أي صورة للأشخاص ضعاف البصر من خلال نظام التعليق التلقائي الجديد للصور.

العلامات أزور مايكروسوفت