مدل صوتی جدید OpenAI تجربه‌ای طبیعی‌تر و بدون نمایشگر ارائه می‌کند

خواندن این مطلب 2 دقیقه زمان میبرد

مدل صوتی جدید OpenAI با تمرکز بر مکالمه طبیعی و پاسخ‌گویی هم‌زمان، تجربه‌ای شبیه به ارتباط با هم‌صحبت واقعی و بدون واسطه ارائه می‌کند.

به گزارش سرویس هوش مصنوعی جهانی مگ، OpenAI با تمرکز جدی بر هوش مصنوعی صوتی، گام تازه‌ای در مسیر آینده تعامل انسان و فناوری برداشته است. در این مسیر، نقش صفحه‌نمایش‌ها کم‌رنگ و صدا به رابط اصلی تبدیل خواهد شد. این رویکرد تازه نشان می‌دهد که سیلیکون‌ولی وارد مرحله‌ای جدید از رقابت شده است؛ مرحله‌ای که هدف آن کاهش وابستگی به نمایشگرها و جایگزینی آن‌ها با تجربه‌ای طبیعی‌تر و مکالمه‌محور است.

بنابر گزارش تازه وبسایت اینفورمیشن، OpenAI در دو ماه گذشته چندین تیم مهندسی و محصول و تحقیقاتی خود را ادغام کرده است تا مدل‌های صوتی خود را به‌طور اساسی بازطراحی کند. هدف این اقدام آماده‌سازی دستگاه شخصی صوت‌محور عنوان شده است که انتظار می‌رود در یک سال آینده معرفی شود. به گفته منابع آگاه، این پروژه فقط به بهبود صدای ChatGPT محدود نیست و بخشی از استراتژی کلان برای ورود به نسل جدید دستگاه‌های هوشمند به شمار می‌رود.

این تغییر مسیر هم‌سو با روندی گسترده‌تر در صنعت فناوری است. در سال‌های اخیر، بلندگوهای هوشمند دستیارهای صوتی را به بخشی عادی از زندگی روزمره تبدیل کرده‌اند و اکنون در بیش از یک‌سوم خانه‌های ایالات متحده حضور دارند. متا به‌تازگی قابلیتی جدید برای عینک‌های هوشمند ری‌بن خود عرضه کرده است که با استفاده از آرایه‌ای متشکل از پنج میکروفون، شنیدن مکالمه‌ها را در محیط‌های شلوغ آسان‌تر می‌کند. قابلیت مذکور عملاً صورت انسان را به ابزار شنیداری جهت‌دار تبدیل می‌سازد.

در همین حال، گوگل آزمایش ویژگی مرورهای صوتی را آغاز کرده است که نتایج جست‌وجو را به خلاصه‌هایی محاوره‌ای و شنیداری تبدیل می‌کند. هم‌زمان، تسلا نیز با ادغام چت‌بات گراک در خودروهای خود، به‌دنبال ساخت دستیار صوتی مکالمه‌محور است که بتواند از مسیریابی گرفته تا تنظیمات تهویه مطبوع را از‌طریق گفت‌وگوی طبیعی مدیریت کند. مجموعه این تحولات نشان می‌دهد که صدا به‌تدریج در‌حال تبدیل‌شدن به هسته اصلی تعامل با فناوری است.

لوگوی OpenAI روی یک موج صوتی رنگی با پس‌زمینه بنفش و عبارت "NEWS".

در کنار غول‌های فناوری، استارتاپ‌های متعددی نیز با همین باور وارد میدان شده‌اند؛ هرچند همه آن‌ها موفق نبوده‌اند. دستگاه بدون نمایشگر Humane AI Pin با وجود سرمایه‌گذاری چندصد‌میلیون‌دلاری، به نمونه‌ای هشداردهنده تبدیل شد. گردنبند Friend AI که ثبت زندگی و همراهی دائمی را وعده می‌دهد، نگرانی‌های گسترده‌ای درباره حریم خصوصی و پیامدهای روانی ایجاد کرده است.

درحال‌حاضر نیز دست‌کم دو شرکت ازجمله Sandbar و استارتاپی با مدیریت اریک میگی‌کوفسکی بنیان‌گذار Pebble در‌حال ساخت حلقه‌های هوشمند مبتنی‌بر هوش مصنوعی هستند که قرار است در سال ۲۰۲۶ معرفی شوند. با وجود تفاوت در شکل و کاربرد این محصولات، فرض اصلی یکسان است: صدا رابط کاربری آینده خواهد بود. در این چشم‌انداز، هر فضا از خانه و خودرو گرفته تا بدن انسان به سطحی برای تعامل و کنترل تبدیل می‌شود.

تک‌کرانچ می‌نویسد که انتشار مدل صوتی جدید OpenAI برای اوایل سال ۲۰۲۶ برنامه‌ریزی شده است. این مدل صدایی طبیعی‌تر خواهد داشت و وقفه‌ها را مانند هم‌صحبت واقعی مکالمه مدیریت می‌کند و حتی می‌تواند هم‌زمان با صحبت کاربر پاسخ دهد. همچنین، گفته می‌شود این شرکت در‌حال بررسی توسعه خانواده‌ای از دستگاه‌ها از‌جمله عینک‌ها یا بلندگوهای هوشمند بدون نمایشگر است که بیش از آنکه شبیه ابزار باشند، نقش همراه را ایفا کنند.

این رویکرد با دیدگاه جانی آیو، طراح ارشد سابق اپل، هم‌راستا است. آیو پس‌از خرید شرکت io به تلاش‌های سخت‌افزاری OpenAI پیوسته است و کاهش اعتیاد به دستگاه‌ها را اولویتی مهم می‌داند و طراحی صوت‌محور را فرصتی برای جبران اشتباه‌های گذشته در دنیای ابزارهای دیجیتال توصیف می‌کند.

Source link