فناوری

زیرنویس ‌هم‌زمان ‌در ‌Gemini Live ‌‌فعال ‌شد

گوگل با انتشار آپدیت جدید Gemini Live نمایش هم‌زمان گفتار کاربر و پاسخ مدل را فعال کرده و کیفیت زیرنویس‌ها و تعامل مکالمه را به‌صورت چشمگیر بهبود داده است.

به گزارش جهانی مگ در بخش اخبار هوش مصنوعی، گوگل به‌طور رسمی یک به‌روزرسانی تازه برای Gemini Live منتشر کرده که علاوه بر ارتقای مدل هوش مصنوعی در هفته‌ی گذشته، کیفیت تعامل کاربر و نمایش زیرنویس‌ها را نیز بهبود می‌دهد. این تغییر جدید تجربه‌ای روان‌تر و دقیق‌تر برای کاربران فراهم می‌کند که حالا می‌توانند هم گفت‌و‌گوی خود و هم پاسخ‌های Gemini را به‌صورت هم‌زمان ببینند.

زمانی که قابلیت زیرنویس در ژوئن معرفی شد، تنها پاسخ‌های Gemini به متن تبدیل می‌شد و صحبت‌های کاربر در رابط گفت‌و‌گو نمایش داده نمی‌شد. اکنون با لمس دکمه‌ی بالای سمت راست در Gemini Live، متن هر دو طرف مکالمه روی صفحه ثبت می‌شود.

هنوز این زیرنویس‌ها محدود به سه خط هستند و موقعیت جعبه‌ی نمایش قابل تغییر نیست، اما اضافه شدن گفتار کاربر باعث می‌شود بتوان در همان لحظه بررسی کرد که Google جمله‌ی او را درست تشخیص داده یا خیر، پیش از آن‌که پاسخ طولانی مدل تولید شود. در نسخه‌ی قبل برای دیدن متن کامل گفت‌و‌گو باید از محیط چت خارج می‌شدی، اما این محدودیت امروز برای تمام کاربران اندروید لغو شده است.

گوگل هم‌زمان قابلیت دیگری با عنوان Search Live AI Mode را راحت‌تر کرده است. اکنون علاوه بر مسیر معمول یعنی باز کردن اپلیکیشن Google و انتخاب میانبر پایین نوار جست‌وجو، می‌توان گزینه‌ی «Live» را مستقیماً در ویجت صفحه‌ی اصلی جست‌وجو تنظیم کرد. این قابلیت ادامه‌ی همان تغییرات اخیر در رابط شناور (floating controls) است که امکان کنترل سریع‌تری در حالت هوش مصنوعی ایجاد می‌کند.

در کنار این اصلاحات، به نقل از 9to5google، گوگل آزمایشی تازه را نیز در فید Discover شروع کرده است؛ نماد شاخص جدیدی با عنوان Nano Banana icon در بالای فید ظاهر می‌شود و جایگزین میانبر قبلی Google Lens خواهد بود. با لمس این ایموجی، کاربر به‌طور مستقیم به تصاویر و اسکرین‌شات‌های ذخیره‌شده در دستگاهش منتقل می‌شود.

مجموع این تغییرات بخشی از برنامه‌ی گوگل برای افزایش سهولت استفاده از Gemini Live و یکپارچگی بیشتر بین جست‌وجوی زنده، گفت‌و‌گوی هوشمند و محیط Discover است؛ حرکتی که نشان می‌دهد گوگل در مسیر تبدیل Live Mode به هسته‌ی اصلی تجربه‌ی جست‌وجوی مبتنی بر هوش مصنوعی در اندروید قدم گذاشته است.

Source link

تیم تحریریه جهانی مگ

تیم تحریریه jahanimag.ir مجموعه‌ای از نویسندگان، پژوهشگران و تولیدکنندگان محتواست که با دقت، تخصص و نگاه حرفه‌ای تلاش می‌کند معتبرترین اطلاعات، تازه‌ترین اخبار و بهترین تحلیل‌ها را در اختیار خوانندگان قرار دهد. ما با تکیه بر استانداردهای روز تولید محتوا، همواره در تلاشیم تا تجربه‌ای لذت‌بخش، قابل اعتماد و الهام‌بخش برای مخاطبان خود خلق کنیم.

نوشته های مشابه

دکمه بازگشت به بالا