ترجمة Gemini 3.5 المباشرة: الذكاء الاصطناعي الصوتي في الوقت الفعلي من Google

ليزا إرنست · 14.06.2026 · أخبار الذكاء الاصطناعي · 8 دقائق قراءة

Google has pushed live speech translation deeper into its Gemini roadmap. Gemini 3.5 Live Translate connects Google Translate, Google Meet and the Gemini Live API into one real-time speech translation story.

ما الذي تغير مع ترجمة Gemini 3.5 المباشرة؟

تم تصميم ترجمة Gemini 3.5 المباشرة لترجمة الكلام إلى كلام بزمن استجابة منخفض. بدلاً من ترجمة النص فقط أو انتظار انتهاء جملة كاملة، يقوم النموذج بمعالجة تدفقات الصوت باستمرار ويعيد الكلام المترجم بتأخير قصير فقط.

المصدر: مصدر الصورة: لقطة شاشة لمنتج Google

تعد Google Translate هي الواجهة الاستهلاكية الأكثر وضوحًا للترجمة المباشرة التي تعمل بالذكاء الاصطناعي Gemini. تربط الواجهة النصوص والترجمة الصوتية المباشرة وميزات التدريب في تجربة تطبيق واحدة.

التحديث مهم لأنه يقرب الترجمة المباشرة من المحادثة الطبيعية. تقول Google إن النظام يمكنه اكتشاف أكثر من 70 لغة والحفاظ على عناصر مثل النبرة، والوتيرة، ودرجة الصوت، والتنغيم.

أين الميزة متاحة؟

يتم تقسيم الطرح عبر ثلاثة مجالات للمنتجات. يرى المستخدمون العاديون الميزة في Google Translate. يمكن لعملاء المؤسسات تجربة ترجمة الكلام في Google Meet. يمكن للمطورين تجربة النموذج من خلال Google AI Studio و Gemini Live API.

مجال المنتج	ما تضيفه Google	لماذا هو مهم
ترجمة Google	ترجمة الكلام المباشرة مع حالات استخدام الهاتف المحمول وسماعات الرأس	تحول الهاتف إلى مترجم عملي في الوقت الفعلي
لقاء Google	ترجمة الكلام عبر أكثر من 70 لغة	يحسن اجتماعات العمل متعددة اللغات والتعاون عن بعد
واجهة برمجة تطبيقات Gemini المباشرة	تدفق ترجمة الكلام إلى الكلام للمطورين	يسمح للتطبيقات بإضافة ترجمة دون بناء مكدس الصوت بالكامل من البداية

لقاء Google هو الإشارة التجارية

يعد Google Meet المكان الذي يصبح فيه التحديث مهمًا بشكل خاص للشركات. يمكن للكلام المترجم المباشر أن يجعل الاجتماعات الدولية أكثر مباشرة من مجرد التسميات التوضيحية.

عرض ترجمة Gemini المباشرة للصوت في Google Meet أثناء مكالمة فيديو

المصدر: مصدر الصورة: لقطة شاشة لمنتج Google

في Google Meet، يمكن للكلام المترجم أن يصبح طبقة صوتية بين المشاركين بدلاً من مجرد ميزة ترجمة نصية.

بالنسبة للمبيعات والدعم والتوظيف والتعليم وعمل المشاريع الدولية، يمكن أن يقلل ذلك من الاحتكاك. لا يلغي الحاجة إلى مترجمين محترفين في الحالات الحساسة، ولكنه يمكن أن يسهل التواصل متعدد اللغات اليومي.

المصدر: مصدر الصورة: لقطة شاشة لمنتج Google

لماذا ترى AIMarketCap تحولًا أكبر في السوق

تؤطر AIMarketCap التحديث على أنه أكثر من مجرد ميزة منتج Google. النقطة الأوسع هي أن الصوت المتعدد اللغات المتزامن قد يصبح قدرة منصة أساسية.

هذه هي إشارة السوق الحقيقية. تنتقل الترجمة المباشرة من ميزة خاصة إلى بنية تحتية. يمكن للتطبيقات للسفر ودعم العملاء والتعليم والعمل عن بعد وأدوات المبدعين البدء في التعامل مع الكلام متعدد اللغات على أنه شيء يمكنهم البناء عليه.

عرض المطور: الترجمة، وليس وكيلًا كاملاً

بالنسبة للمطورين، فإن التمييز المهم هو أن الترجمة المباشرة ليست مثل الوكيل المباشر الكامل. يمكن للوكيل المباشر التفكير، واستدعاء الأدوات، والتصرف كمساعد. الترجمة المباشرة أكثر تركيزًا: فهي تأخذ الصوت المباشر وتعيد الصوت المترجم.

نتيجة بحث Google مع تحسينات الترجمة بأسلوب Gemini

المصدر: مصدر الصورة: لقطة شاشة لمنتج Google

تعمل Google أيضًا على تحسين جودة الترجمة عبر البحث والترجمة، خاصة للعبارات والتعبيرات والاصطلاحات التي لا تُترجم جيدًا حرفيًا.

الإدخال: تدفقات صوتية مباشرة.
الإخراج: صوت الكلام المترجم.
بيانات اختيارية: نصوص الإدخال والإخراج.
الاستخدام الرئيسي: تفسير في الوقت الفعلي داخل التطبيقات والمكالمات وجلسات الدعم.

لماذا الأسعار والوصول إلى واجهة برمجة التطبيقات مهمان

تعتبر زاوية واجهة برمجة التطبيقات مهمة لأنها تسمح للمطورين بدمج الترجمة المباشرة في منتجاتهم الخاصة. يمكن لتطبيق سفر ترجمة مكالمات السائق والراكب. يمكن لأداة دعم ترجمة الرسائل الصوتية. يمكن لمنصة تعليمية توفير جلسات تدريس متعددة اللغات.

القيود لا تزال حقيقية

حتى مع التقدم المثير للإعجاب، فإن ترجمة الكلام المباشرة ليست سحرًا. يمكن لكنات الصوت، وضوضاء الخلفية، والمقاطعات، والمحادثات المتعددة المتحدثين السريعة أن تسبب مشاكل.

شاشة ممارسة اللغة الألمانية في Google Translate

المصدر: مصدر الصورة: لقطة شاشة لمنتج Google

يظهر دفع Gemini أيضًا في ميزات ممارسة Google Translate، حيث يصبح تعلم اللغة أكثر تفاعلية وقائمًا على السيناريو.

لهذا السبب تتطلب الأماكن عالية المخاطر الحذر. يمكن أن تعتمد المحادثات الطبية أو القانونية أو المتعلقة بالهجرة أو المالية على الفروق الدقيقة. الترجمة الخاطئة في تلك السياقات ليست مجرد إزعاج؛ يمكن أن تخلق عواقب وخيمة.

SynthID والكلام الذي تم إنشاؤه بواسطة الذكاء الاصطناعي

تقول Google إن الصوت الذي تم إنشاؤه بواسطة نماذجها تم وضع علامة مائية عليه باستخدام SynthID. وهذا مهم لأن الكلام المترجم الواقعي يقع بالقرب من قلق الجمهور بشأن الأصوات الاصطناعية واستنساخ الأصوات.

الحكم

تعد ترجمة Gemini 3.5 المباشرة واحدة من تلك التحديثات التي تبدو بسيطة في البداية ولكن لها معنى منصة أكبر بكثير. بالنسبة للمستخدمين، فهي تعني ترجمة مباشرة أفضل في Translate و Meet. بالنسبة للمطورين، فهي تعني كتلة بناء جديدة لتدفق الكلام إلى الكلام.

الاستنتاج الأكبر واضح: الصوت المتعدد اللغات في الوقت الفعلي يصبح بنية تحتية. تحاول Google جعل الترجمة تبدو أقل وكأنها أداة منفصلة وأكثر وكأنها طبقة اتصال افتراضية. لمزيد من تحليلات منتجات الذكاء الاصطناعي والأفكار العملية للمطورين، قم بزيارة Zerlo.

الأسئلة الشائعة

ما هي ترجمة Gemini 3.5 المباشرة؟

إنه نموذج ترجمة الكلام إلى الكلام في الوقت الفعلي من Google للمحادثات المباشرة والاجتماعات وتطبيقات المطورين.

كم عدد اللغات التي يدعمها؟

تقول Google إن ترجمة Gemini 3.5 المباشرة تدعم أكثر من 70 لغة.

هل هي متاحة في Google Translate؟

نعم. تجلب Google ميزات الترجمة المباشرة التي تعمل بالذكاء الاصطناعي Gemini إلى Google Translate على الأجهزة المحمولة.

هل يمكن للمطورين استخدامها؟

نعم. يمكن للمطورين الوصول إلى النموذج من خلال Google AI Studio و Gemini Live API.

هل تحل محل المترجمين المحترفين؟

لا. يمكن أن تساعد في المواقف اليومية والتجارية، ولكن المحادثات الحساسة أو عالية المخاطر لا تزال تتطلب إشرافًا بشريًا دقيقًا.

ترجمة Gemini 3.5 المباشرة: الذكاء الاصطناعي الصوتي في الوقت الفعلي من Google

ما الذي تغير مع ترجمة Gemini 3.5 المباشرة؟

أين الميزة متاحة؟

لقاء Google هو الإشارة التجارية

لماذا ترى AIMarketCap تحولًا أكبر في السوق

عرض المطور: الترجمة، وليس وكيلًا كاملاً

لماذا الأسعار والوصول إلى واجهة برمجة التطبيقات مهمان

القيود لا تزال حقيقية

SynthID والكلام الذي تم إنشاؤه بواسطة الذكاء الاصطناعي

الحكم

الأسئلة الشائعة

حول Zerlo

روابط

وسائل التواصل الاجتماعي