غوغل تتيح Gemini Live لترجمة مكالمات واتساب آنيّاً

لمحة نيوز

في إطار توسعها المستمر في مجال الذكاء الاصطناعي، أعلنت شركة غوغل عن إطلاق ميزة جديدة تحمل اسم Gemini Live، تهدف إلى توفير تجربة ترجمة فورية للمكالمات الصوتية داخل تطبيق واتساب. وتعد هذه المبادرة تقدمًا تقنيًا لافتًا نحو إزالة الحواجز اللغوية بين المستخدمين من مختلف الجنسيات، وفتح آفاق جديدة للتواصل في الزمن الحقيقي دون الحاجة إلى مترجم بشري أو تقنيات تقليدية.

ما هي Gemini Live؟

Gemini Live هي تقنية متقدمة ضمن مجموعة خدمات مساعد غوغل الذكي، وتهدف إلى تقديم ترجمة صوتية فورية للمحادثات المباشرة. بدأت غوغل بتطوير هذه الميزة لاستخدامها في تطبيق Google Meet، بحيث تتيح للمشاركين التحدث بلغاتهم المختلفة، ويقوم النظام بترجمة الصوت فورًا إلى لغة المستمع مع الحفاظ على نبرة الصوت وتعبيراته، ما يضفي طابعًا إنسانيًا وواقعيًا على الترجمة.

وقد تم توسيع نطاق استخدام Gemini Live لتشمل الآن تطبيق واتساب، أحد أكثر تطبيقات المراسلة الصوتية استخدامًا في العالم، لتمنح المستخدمين القدرة على خوض محادثات هاتفية بلغات متعددة دون أي عوائق تواصل.

كيف تعمل الميزة داخل واتساب؟

تعتمد Gemini Live على تقنيات الذكاء الاصطناعي المتقدمة، حيث تقوم بتحليل كلام المتحدث لحظيًا، ثم تترجمه وتعيد إنتاجه بصوت صناعي مطابق لنبرة المتحدث

الأصلية، بلغة الطرف الآخر. ويجري كل ذلك في الوقت الحقيقي، دون تأخير أو مقاطعة، لتبدو المحادثة طبيعية كما لو كان الطرفان يتحدثان نفس اللغة.

ولتفعيل هذه الميزة، يحتاج المستخدم إلى هاتف يعمل بنظام Android، مع تثبيت أحدث إصدار من تطبيق Gemini. كما ينبغي تفعيل خيار "نشاط التطبيقات" في إعدادات غوغل، والذي يسمح للتقنية بالوصول إلى تطبيق واتساب وإجراء الترجمة داخله.

خطوات الاستخدام:

تحميل تطبيق Gemini من متجر Google Play.

تفعيل خاصية App Activity من إعدادات الخصوصية في حساب غوغل.

فتح واتساب وإجراء مكالمة صوتية مع أحد جهات الاتصال.

تنشيط Gemini Live عبر الأوامر الصوتية، مثل: "اتصل بعلي على واتساب باستخدام Gemini Live لترجمة المحادثة".

بمجرد بدء المكالمة، تتولى Gemini Live مهمة الترجمة الصوتية، حيث يسمع كل طرف الرسالة بلغته الأم، وكأن الطرف الآخر يتحدثها بطلاقة.

تطبيقات عملية متعددة

توفر Gemini Live حلًا عمليًا لعدد من الاستخدامات اليومية المهمة، مثل:

التواصل أثناء السفر أو التبادل الثقافي: حيث يمكن للمسافرين إجراء محادثات مع السكان المحليين دون الحاجة لتعلم اللغة.

الاجتماعات التجارية الدولية: إذ تتيح لأطراف من دول مختلفة التفاوض والتعاون دون مترجم.

الدعم الأكاديمي والتعليمي: تسهل عملية التعلم

عن بعد للطلاب غير الناطقين بلغة المعلم.

وتتميز هذه الميزة بتقديم تجربة تواصل طبيعية، لا تعتمد فقط على النصوص أو الترجمة المكتوبة، بل تقدم صوتًا يحمل تعبيرات المتحدث الحقيقي، مما يجعل التفاعل أكثر صدقًا وسلاسة.

توسع داخل منظومة غوغل

لا تقتصر Gemini Live على تطبيق واتساب فحسب، بل تمتد لتشمل تطبيقات أخرى في منظومة غوغل، مثل Gmail، Google Calendar، وGoogle Meet. ويأتي هذا التوسع ضمن استراتيجية غوغل لتحويل مساعدها الذكي إلى منظومة شاملة مبنية على الذكاء الاصطناعي، بعد الانتقال من Google Assistant إلى تقنيات Gemini الجديدة.

كما تدعم الميزة في الوقت الراهن عدة لغات، أبرزها الإنجليزية والإسبانية، على أن تُضاف لغات أخرى قريبًا، مثل الألمانية، الإيطالية، والبرتغالية، مع خطة لتوسيع التغطية لتشمل عشرات اللغات واللهجات لاحقًا.

التحديات التي تواجه Gemini Live

رغم الإمكانات الكبيرة التي تقدمها Gemini Live، إلا أنها تواجه عددًا من التحديات، من بينها:

الخصوصية والأمان: لا تخضع المحادثات التي تمر عبر Gemini للتشفير الكامل، ما قد يثير قلق بعض المستخدمين بشأن سرية بياناتهم.

دقة الترجمة: لا تزال الدقة تعتمد على تركيبة اللغة المستخدمة، وقد تكون أقل فعالية في اللغات ذات القواعد المعقدة أو اللهجات المحلية.

الحاجة

إلى الاتصال القوي بالإنترنت: تتطلب الخدمة اتصالًا مستقرًا وعالي السرعة، ما قد يحد من استخدامها في بعض المناطق.

إتاحة الميزة تدريجيًا: ستبدأ غوغل بطرح الميزة لمشتركي الخطط المدفوعة مثل AI Pro وAI Ultra، ثم توفرها لاحقًا لبقية المستخدمين.

نظرة مستقبلية

تسعى غوغل لتوسيع هذه الميزة مستقبلًا لتشمل المكالمات الهاتفية التقليدية وشبكات VoIP الأخرى، بالإضافة إلى دعم المؤتمرات الجماعية داخل واتساب. كما تعمل الشركة على تطوير نسخ خفيفة من الميزة لتعمل عبر الأجهزة القابلة للارتداء مثل النظارات الذكية والساعات، مما يفتح الباب أمام تجربة تواصل فورية ومباشرة دون الحاجة لهاتف في اليد.

إضافةً إلى ذلك، تهدف غوغل إلى إدماج تقنيات فهم السياق الثقافي واللهجات المحلية، لضمان ترجمة أكثر دقة وواقعية في المحادثات.

ختامًا

تُعد Gemini Live واحدة من أبرز محاولات غوغل لدمج الذكاء الاصطناعي في تفاصيل الحياة اليومية، ولا سيما في جانب التواصل البشري. فمن خلال تمكين المستخدمين من إجراء مكالمات بلغاتهم المختلفة دون حواجز، تعيد غوغل تعريف مفهوم "الحديث العالمي"، حيث يصبح اختلاف اللغة مجرد تفصيل بسيط لا يعيق التواصل أو الفهم.

وبينما لا تزال هناك بعض التحديات التقنية والتنظيمية، إلا أن الاتجاه العام يشير إلى أن Gemini Live قد

تكون بوابة لعصر جديد من المحادثات العابرة للغات، بأسلوب فوري، واقعي، وذكي.

تم نسخ الرابط