مدل هوش مصنوعی GPT-5.2 منتشر شد

خواندن این مطلب 5 دقیقه زمان میبرد

شرکت OpenAI روز پنجشنبه در شرایطی از مدل جدید GPT-5.2 رونمایی کرد که رقابت این شرکت با گوگل در حوزهٔ مدل‌های پیشرفتهٔ هوش مصنوعی وارد مرحله‌ای حساس شده است.

به گزارش سرویس هوش مصنوعی جهانی مگک، معرفی این مدل در ادامهٔ تلاش‌های OpenAI برای حفظ برتری فنی و تجاری در بازار انجام می‌شود؛ بازاری که طی ماه‌های اخیر شاهد پیشروی قابل‌توجه گوگل بامدل Gemini 3 و همچنین نگرانی‌هایی درباره کاهش ترافیک ChatGPT بوده است.

در این رونمایی، مدیران OpenAI مدل جدید را ابزاری برای توسعه‌دهندگان، سازمان‌ها و کاربران حرفه‌ای معرفی کردند؛ ابزاری که قرار است استدلال بهتر، دقت بالاتر و قابلیت اتکا در کاربردهای واقعی را ارائه دهد.

OpenAI مدل GPT-5.2 را در سه نسخه عرضه می‌کند: Instant، نسخهٔ سریع و سبک برای انجام وظایف روزمره نظیر جست‌وجوی اطلاعات، نگارش و ترجمه؛ Thinking، نسخهٔ عمیق‌تر با توانایی استدلال چندگامی مناسب برای تحلیل اسناد طولانی، برنامه‌ریزی، ریاضیات و کدنویسی؛ و Pro، نسخهٔ سازمانی که برای ارائهٔ بیشترین سطح دقت و قابلیت اتکا طراحی شده است. مدیران شرکت می‌گویند این تقسیم‌بندی به کاربران اجازه می‌دهد با توجه به نیاز محاسباتی و نوع کاربرد، مدل مناسب را انتخاب کنند.

فیجی سیمو، مدیر ارشد محصول OpenAI، در نشست خبری اعلام کرد که OpenAI مدل ۵.۲ را با هدف «گشودن ارزش اقتصادی بیشتر برای مردم» طراحی کرده است. او گفت این مدل در تولید صفحات گسترده، ساخت ارائه‌های کاری، تولید کد، تحلیل تصویر، درک متن طولانی و انجام پروژه‌های چندمرحله‌ای عملکرد بهتری نشان می‌دهد. به گفتهٔ او، GPT-5.2 بهبودهای قابل‌توجهی در سرعت، پایداری و دقت دارد و می‌تواند برای کسب‌وکارها نقش زیرساختی ایفا کند.

عرضهٔ نسخهٔ تازه در حالی صورت می‌گیرد که گوگل طی ماه‌های اخیر، به‌ویژه با معرفی Gemini 3 و حالت Deep Think، جایگاه قدرتمندی در جدول‌های بنچمارک به دست آورده است. در اکثر معیارهای مطرح، به‌جز حوزهٔ کدنویسی که همچنان در اختیار مدل Claude Opus-4.5 شرکت Anthropic است، گوگل در رتبه‌های بالای مقایسه‌ها قرار دارد. تحلیلگران می‌گویند سرعت پیشرفت گوگل در حوزهٔ مدل‌های عامل‌محور، چندرسانه‌ای و پردازش چندمرحله‌ای باعث نگرانی جدی OpenAI شده است.

گزارش وب‌سایت The Information از انتشار یک یادداشت داخلی «کد قرمز» توسط سم آلتمن، مدیرعامل OpenAI، خبر می‌داد؛ یادداشتی که طی آن آلتمن نسبت به کاهش ترافیک ChatGPT و تهدید تصاحب سهم بازار توسط گوگل هشدار داده بود. او در این یادداشت خواستار توقف پروژه‌هایی مانند معرفی تبلیغات و تمرکز مجدد بر ارائهٔ تجربهٔ کاربری بهتر برای ChatGPT شد. رونمایی از GPT-5.2، به‌نظر می‌رسد پاسخی مستقیم به همین وضعیت باشد.

با وجود این، برخی کارکنان reportedly خواستار تعویق عرضه شده بودند تا فرصت بیشتری برای تقویت مدل فراهم شود. اما OpenAI مسیر سرعت‌بخش خود را ادامه داد. تحلیلگران معتقدند تغییر جهت اخیر OpenAI ـ از محصول‌محوری مصرف‌کننده به ارائهٔ قابلیت‌های عمیق‌تر سازمانی ـ نشان می‌دهد شرکت در تلاش است جایگاه خود را به عنوان «لایهٔ زیرساختی» هوش مصنوعی حفظ کند.

OpenAI با معرفی GPT-5.2 جایگاه خود را در رقابت فشردهٔ هوش مصنوعی تقویت می‌کند

OpenAI در هفتهٔ جاری داده‌هایی منتشر کرد که رشد چشمگیر استفادهٔ سازمانی از ابزارهای آن را نشان می‌دهد. این داده‌ها بیانگر آن است که شرکت بیش از پیش در مسیر تبدیل‌شدن به استاندارد پیش‌فرض برای توسعهٔ برنامه‌های هوش مصنوعی حرکت می‌کند. این در حالی است که گوگل هم‌زمان با معرفی سرورهای مدیریت‌شدهٔ MCP، اتصال Agentها به سرویس‌هایی مانند Google Maps و BigQuery را ساده‌تر کرده و اکوسیستم خود را تقویت کرده است.

OpenAI اعلام کرده است که GPT-5.2 در حوزه‌های کدنویسی، ریاضیات، علوم، بینایی ماشین، استدلال در بافت‌های طولانی و استفاده از ابزارها رکوردهای تازه‌ای ثبت کرده است. شرکت می‌گوید این توانایی‌ها امکان ایجاد «گردش‌کارهای عامل‌محور قابل‌اعتمادتر» و ایجاد «کد سطح تولید» را فراهم می‌کند و می‌تواند به طراحی سیستم‌های پیچیده برای پردازش داده‌های واقعی کمک کند.

مدل جدید در چندین بنچمارک مهم، از جمله SWE-Bench Pro برای مهندسی نرم‌افزار واقعی، GPQA Diamond برای دانش علمی در سطح دکترا، و مجموعه‌های ARC-AGI برای استدلال انتزاعی، عملکرد بالاتری نسبت به Gemini 3 و Claude Opus-4.5 داشته است. ادین کلارک، رهبر تحقیقات OpenAI، توضیح داد که توانایی بالا در ریاضیات صرفاً حل معادلات نیست، بلکه نشانهٔ توان مدل در دنبال‌کردن منطق چندمرحله‌ای، حفظ ثبات عددی، و جلوگیری از خطاهای کوچک انباشتی است؛ ویژگی‌هایی که برای برنامه‌ریزی مالی، پیش‌بینی و تحلیل داده اهمیت حیاتی دارند.

جدول مقایسه عملکرد GPT-5.2 Thinking و GPT-5.1 Thinking

Benchmark / Task Category	توضیح	GPT-5.2 Thinking	GPT-5.1 Thinking (یا GPT-5)
GDPval	وظایف دانش‌محور (Knowledge Work)	70.9%	38.8% (GPT-5)
SWE-Bench Pro (Public)	مهندسی نرم‌افزار	55.6%	50.8%
SWE-Bench Verified	مهندسی نرم‌افزار	80.0%	76.3%
GPQA Diamond (No Tools)	پرسش‌های علمی سطح دکترا	92.4%	88.1%
CharXiv Reasoning (with Python)	تحلیل و استدلال روی شکل‌های علمی	88.7%	80.3%
AIME 2025 (No Tools)	ریاضیات رقابتی	100.0%	94.0%
FrontierMath (Tier 1–3)	ریاضیات پیشرفته	40.3%	31.0%
FrontierMath (Tier 4)	ریاضیات پیشرفته سطح بالا	14.6%	12.5%
ARC-AGI-1 (Verified)	استدلال انتزاعی	86.2%	72.8%
ARC-AGI-2 (Verified)	استدلال انتزاعی	52.9%	17.6%

در حوزهٔ کدنویسی نیز مکس شفارتزر، مدیر محصول OpenAI، اعلام کرد که GPT-5.2 «پیشرفت‌های قابل‌توجهی» در تولید و رفع‌اشکال کد ایجاد کرده است. او گفت این مدل می‌تواند فرایندهای پیچیدهٔ کدنویسی را مرحله‌به‌مرحله توضیح دهد و استارت‌آپ‌هایی مانند Windsurf و CharlieCode، عملکردی در سطح «عامل‌های کدنویسی پیشرفته» گزارش کرده‌اند. علاوه بر این، شرکت ادعا می‌کند نسخهٔ Thinking مدل GPT-5.2 در مقایسه با نسل قبل ۳۸ درصد خطای کمتر دارد.

تحلیل‌ها نشان می‌دهد مدل جدید OpenAI بیش از آنکه بازطراحی ریشه‌ای باشد، یک یکپارچه‌سازی و تقویت دو ارتقای پیشین است. GPT-5 که در ماه اوت عرضه شد، سیستم جدیدی برای جابه‌جایی بین حالت سریع و حالت عمیق Thinking فراهم کرد. نسخهٔ GPT-5.1 این سیستم را مکالمه‌ای‌تر و مناسب‌تر برای وظایف عامل‌محور کرد. اکنون GPT-5.2 این روند را تکمیل و مدل را به گزینه‌ای پایدارتر برای استفادهٔ سازمانی تبدیل کرده است.

اما هم‌زمان با این تقویت فنی، پرسش‌های جدی درباره هزینه‌های محاسباتی OpenAI شکل گرفته است. شرکت طی سال‌های آینده تعهداتی تا سقف ۱.۴ تریلیون دلار برای توسعهٔ زیرساخت محاسباتی خود ایجاد کرده است؛ تعهداتی که اکنون، با پیشروی رقبایی مانند گوگل، فشار بیشتری بر OpenAI وارد می‌کند. گزارش TechCrunch نشان می‌دهد بخش عمدهٔ هزینهٔ اجرای مدل‌های OpenAI اکنون به‌صورت نقدی پرداخت می‌شود، زیرا هزینه‌ها از سقف اعتبارات ابری شرکای این شرکت فراتر رفته‌اند.

کارشناسان هشدار می‌دهند که تمرکز شدید بر مدل‌های استدلالی ـ که محاسبات سنگین‌تری مصرف می‌کنند ـ ممکن است OpenAI را وارد چرخه‌ای کند که هم توسعه و هم اجرای مدل‌ها هزینه‌های بسیار بالاتری ایجاد کند.

در کنار این مسائل، نبود یک مولد تصویر جدید در این رونمایی نیز پرسش‌برانگیز است. سم آلتمن در یادداشت «کد قرمز» بر اهمیت پیشبرد حوزهٔ تولید تصویر تأکید کرده بود، خصوصاً پس از محبوبیت گستردهٔ Nano Banana گوگل. گوگل ماه گذشته نسخهٔ پیشرفته‌تر Gemini 3 Pro Image را عرضه کرد که قدرت رندر متن بهتر و کیفیت بصری نزدیک‌تر به واقعیت دارد و در ابزارهایی نظیر Mixboard برای تولید خودکار ارائه‌ها ادغام شده است. گزارش‌ها حاکی از آن است که OpenAI قصد دارد ژانویهٔ آینده مدل تصویری جدیدی عرضه کند، هرچند شرکت این موضوع را تأیید نکرده است.

به نقل از تک‌کرانچ، OpenAI همچنین اعلام کرد که مجموعه‌ای از تدابیر ایمنی جدید دربارهٔ کاربردهای مرتبط با سلامت روان و همچنین احراز سن کاربران نوجوان ارائه خواهد کرد؛ هرچند این موضوع در مراسم معرفی GPT-5.2 در مرکز توجه قرار نداشت.

با معرفی GPT-5.2، OpenAI اکنون تلاش می‌کند جایگاه خود را در رقابت فشردهٔ صنعت حفظ کند. این مدل قرار است همزمان نیازهای توسعه‌دهندگان، سازمان‌ها و کاربران حرفه‌ای را پاسخ دهد و در برابر شتاب فنی گوگل و سایر رقبا، رویکردی دفاعی و تهاجمی توأمان ارائه کند. اما میزان موفقیت آن در بازار بستگی خواهد داشت به چگونگی مدیریت هزینه‌های محاسباتی، سرعت توسعهٔ قابلیت‌های تصویری، و توان شرکت در ارائهٔ تجربهٔ کاربری بهبود‌یافته در ChatGPT؛ مسائلی که اکنون در مرکز فشارهای داخلی و رقابت خارجی قرار دارند.

Source link