صراحة نيوز – أطلقت شركة غوغل تقنية جديدة تتيح الترجمة الصوتية الفورية للمحادثات بأكثر من 70 لغة في الوقت الحقيقي. وتَعِد هذه التقنية بتحويل طريقة التواصل بين الأشخاص حول العالم من خلال تقليل الحواجز اللغوية وجعل الحوار أكثر سلاسة وطبيعية بفضل الذكاء الاصطناعي المتقدم.
في خطوة تهدف إلى إزالة الحواجز اللغوية وتعزيز التواصل العالمي، كشفت شركة غوغل عن تقنية جديدة تحمل اسم Gemini 3.5 Live Translate، وهي نموذج ذكاء اصطناعي متطور يتيح ترجمة المحادثات الصوتية بشكل شبه فوري بين أكثر من 70 لغة.
نبرة المتحدث
تعتمد التقنية الجديدة على معالجة الصوت أثناء تدفقه بدلاً من انتظار انتهاء الجمل بالكامل قبل الترجمة، ما يجعل المحادثات أكثر سلاسة وطبيعية. وتؤكد غوغل أن النظام قادر على الحفاظ على نبرة الصوت وسرعة الحديث وحتى بعض الخصائص التعبيرية للمتحدث، وهو ما يمنح المستخدمين تجربة أقرب إلى التواصل المباشر. كما يتميز النموذج بقدرته على التعرف التلقائي على اللغات المختلفة دون الحاجة إلى إعدادات يدوية مسبقة، إضافة إلى مقاومة الضوضاء المحيطة، مما يجعله مناسباً للاستخدام في البيئات المزدحمة أو أثناء التنقل.
دمج واسع
أكدت غوغل أن Gemini 3.5 Live Translate سيُطرح تدريجياً عبر عدد من منتجاتها وخدماتها، وسيصبح متاحاً للمطورين من خلال واجهة Gemini Live API ومنصة Google AI Studio، ما يتيح بناء تطبيقات تعتمد على الترجمة الصوتية الفورية.
وفي قطاع الأعمال، تستعد خدمة الاجتماعات المرئية Google Meet للاستفادة من التقنية الجديدة، حيث سترتفع اللغات المدعومة من خمس لغات فقط إلى أكثر من 70 لغة، مع إمكانية إجراء ما يزيد على 2000 تركيبة لغوية مختلفة داخل الاجتماع الواحد.
تحسينات على الترجمة
لن يقتصر التحديث على الشركات والمؤسسات، إذ سيصل أيضاً إلى تطبيق Google Translate على نظامي أندرويد وiOS .
وسيتمكن المستخدمون من إجراء محادثات مترجمة مباشرة عبر سماعات الرأس، مع الاستماع إلى الترجمة الصوتية بشكل فوري أثناء الحديث.
كما بدأت غوغل في اختبار وضع جديد على أجهزة أندرويد يُعرف باسم Listening Mode، يسمح للمستخدم بسماع الترجمة مباشرة عبر سماعة الهاتف الداخلية دون الحاجة إلى سماعات خارجية.
خطوة جديدة
يأتي إطلاق Gemini 3.5 Live Translate في ظل المنافسة المتزايدة بين شركات التكنولوجيا الكبرى لتطوير أدوات تعتمد على الذكاء الاصطناعي التوليدي. وترى غوغل أن التقنية الجديدة يمكن أن تُستخدم في الاجتماعات الدولية، وخدمات العملاء، والتعليم، والبث المباشر، وحتى في المحادثات اليومية أثناء السفر.
وبفضل دعمها لأكثر من 70 لغة وقدرتها على تقديم ترجمة صوتية طبيعية منخفضة التأخير، تمثل Gemini 3.5 Live Translate إحدى أبرز محاولات غوغل لتحويل الترجمة الآلية إلى تجربة تواصل فورية وأكثر إنسانية.

