نكهة جديدة في الترجمة بتحكم صوتي: ميزة AI Mode من غوغل تتوسع عالميًا وتطوّر إمكانيات التفاعل

لمحة نيوز

غوغل تُطلق مرحلة جديدة في التفاعل الصوتي مع الترجمة… و"AI Mode" يتوسع عالميًا

مقدمة

أعلنت غوغل عن نقلة كبيرة في كيفية استخدام الذكاء الاصطناعي داخل البحث وخدماتها، من خلال التوسّع العالمي لميزة AI Mode (وضع الذكاء الاصطناعي) التي لم تعد تقتصر على تلخيص النتائج أو الإجابة النصية، بل باتت قادرة على تنفيذ خطوات متكاملة ومحادثات طبيعية بالصوت. هذا التطور يتقاطع مع قدرات Gemini Live، وهي الخدمة التي تتيح حوارات صوتية فورية متعددة اللغات، ما يمنح المستخدمين «ترجمة طبيعية» أقرب ما تكون إلى حديث بشري حي.

تفاصيل التوسع الجديد

1) من البحث التقليدي إلى المساعد الفعّال

في السابق، كان المستخدم يكتب استفسارًا في محرك البحث ويتلقى روابط. أما اليوم، فـ AI Mode قادر على التصرف كوكيل رقمي: تنفيذ مهام، ترتيب خطوات، وتخصيص النتائج حسب احتياجات الشخص. غوغل أكدت أن هذا النمط الجديد لم يعد حكرًا على أسواق محدودة، بل يجري إطلاقه عالميًا تدريجيًا.

2) الترجمة
الصوتية تتطور

مع التوسع، تبرز Gemini Live كأحد أبرز أوجه التغيير. الخدمة تتيح للمستخدم التحدث مباشرة مع النظام والحصول على ترجمة فورية منطوقة، سواء في السفر أو الاجتماعات أو الدروس. وتؤكد غوغل أن هذه الخدمة باتت تدعم أكثر من 45 لغة وفي 150 دولة.

3) محاكاة نبرة الصوت في الترجمة

من الابتكارات اللافتة، قدرة النظام على إعادة إنتاج نبرة المتحدث الأصلية عند ترجمة المكالمات. هذا التطور، الذي ظهر في هواتف بكسل الأخيرة، يضيف بعدًا إنسانيًا لم يكن موجودًا من قبل، ويجعل التواصل عبر اللغات أكثر صدقًا ودفئًا.

دمج الترجمة داخل المنظومة الذكية

أصبحت الترجمة جزءًا مدمجًا في كل خطوة:

في البحث: عند طلب شرح أو ترجمة نصوص، النظام يُنفّذها تلقائيًا.

في المكالمات: الترجمة الفورية بالصوت والنص تجري داخل المحادثة.

في التعليم والعمل: يمكن الاستعانة بالميزة لتقديم دروس ثنائية اللغة أو لتسهيل الاجتماعات الدولية.

هذا الدمج يعكس استراتيجية غوغل في جعل الترجمة

خاصية خلفية تعمل بسلاسة، بحيث لا يشعر المستخدم أنه انتقل من خدمة إلى أخرى.

الاستخدامات المحتملة

التعليم

حصص مباشرة بلغة أجنبية مع ترجمة فورية إلى العربية.

تمارين محادثة واقعية عبر "الوضع المتقدم" الذي يركز على الدقة والسياق.

الإعلام

تحرير مقابلات مع ضيوف يتحدثون لغات مختلفة، مع إمكانية نشرها بلغات متعددة بسرعة.

إنتاج محتوى صوتي/مرئي مترجم مع الحفاظ على أسلوب المتحدث.

السفر والأعمال

ترجمة تلقائية لمكالمات خدمة العملاء أو مكاتب السفر.

إتمام حجوزات وتنظيم مهام عبر AI Mode بلغات مختلفة دون الحاجة إلى طرف وسيط.

التحديات والخصوصية

رغم الجاذبية الواضحة لهذه التقنيات، إلا أن هناك اعتبارات حساسة:

الخصوصية: الشخصنة والقدرة على «التصرف بدلًا من المستخدم» تتطلب إذنًا وصلاحيات دقيقة، وغوغل أوضحت أن التفعيل اختياري ضمن إعدادات Labs.

القوانين المحلية: تسجيل المكالمات أو ترجمتها قد يفرض إعلام الأطراف كافة.

الدقة الثقافية: الترجمة ما تزال

عرضة للأخطاء عند التعامل مع تعبيرات محلية أو نكات، ما يجعل المراجعة البشرية ضرورية في المواقف الرسمية.

قيود التوفر

الميزات المتقدمة عادة ما تصل أولًا باللغة الإنجليزية، ثم تتوسع تدريجيًا للغات أخرى.

بعض الوظائف الصوتية المتطورة متاحة حاليًا حصريًا على هواتف بكسل المزودة بمعالجات خاصة، قبل أن تصل لاحقًا إلى باقي الأجهزة.

خطوات عملية لتجربة الخدمة

تفعيل Gemini Live على الهاتف والتأكد من دعم اللغة والبلد.

اختبار AI Mode عبر البحث وطلب مهام معقدة تشمل ترجمة.

تجربة سيناريو عملي مثل مكالمة تجريبية مع صديق بلغة أجنبية أو محادثة تعليمية قصيرة.

خاتمة

يمثل التوسع العالمي لوضع الذكاء الاصطناعي من غوغل، إلى جانب التطويرات الصوتية والقدرات الجديدة للترجمة، قفزة في طبيعة التفاعل مع التقنية. لم يعد الأمر مجرد ترجمة نصوص أو أوامر صوتية محدودة، بل أصبح حوارًا متكاملًا متعدد اللغات، يُشبه في طبيعته التحدث مع شخص آخر. ومع دخول الصوت الطبيعي الذي يحاكي

نبرة المتحدث، باتت الترجمة أداة لا تُشعرك بالاغتراب، بل وسيلة تقرّب البشر من بعضهم، مهما اختلفت لغاتهم.

تم نسخ الرابط