Gemini 2.5 Pro اکنون عمیقاً فکر می کند. 2.5 فلش در همه ابعاد
Gemini 2.5 Pro اکنون عمیقاً فکر می کند. 2.5 فلش در همه ابعاد

Gemini 2.5 Pro اکنون عمیقاً فکر می کند. 2.5 فلش در همه ابعاد

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


گوگل در حال نزدیک شدن به هدف خود از “دستیار جهانی هوش مصنوعی” است که می تواند زمینه ، برنامه ریزی و اقدام را درک کند.

امروز در Google I/O ، غول فناوری پیشرفت هایی را در فلش Gemini 2.5 خود اعلام کرد – اکنون تقریباً در هر بعد بهتر است ، از جمله معیارهای استدلال ، کد و زمینه طولانی – و 2.5 PRO ، از جمله یک حالت استدلال پیشرفته آزمایش ، “فکر عمیق” ، که به Pro اجازه می دهد تا قبل از پاسخگویی فرضیه های متعدد را در نظر بگیرد.

دمیس هاسابیس ، مدیرعامل Google DeepMind ، در یک مطبوعات پیش از برفیش گفت: “این هدف نهایی ما برای برنامه Gemini است: هوش مصنوعی که شخصی ، فعال و قدرتمند است.”

“Deep Think” در معیارهای برتر نمره می دهد

Google Gemini 2.5 Pro را اعلام کرد-آنچه که هوشمندانه ترین مدل خود را با یک پنجره زمینه یک میلیون تکنیک در نظر می گیرد-در ماه مارس ، و در اوایل ماه جاری نسخه کدگذاری “I/O” خود را منتشر کرد (با Hassabis آن را “بهترین مدل برنامه نویسی که تاکنون ساخته ایم!”).

حسابیس گفت: “ما واقعاً تحت تأثیر آنچه مردم ایجاد کرده اند ، از تبدیل طرح ها به برنامه های تعاملی تا شبیه سازی کل شهرها ، تحت تأثیر قرار گرفته ایم.”

وی خاطرنشان كرد: براساس تجربه Google با Alphago ، هنگامی كه به آنها زمان بیشتری برای تفكر داده می شود ، پاسخ های مدل هوش مصنوعی بهبود می یابند. این امر باعث شد دانشمندان DeepMind Deep Think را توسعه دهند ، که از آخرین تحقیقات برجسته Google در تفکر و استدلال ، از جمله تکنیک های موازی استفاده می کند.

Deep Think نمرات چشمگیر را در سخت ترین معیارهای ریاضی و برنامه نویسی ، از جمله المپیاد ریاضی 2025 ایالات متحده (USAMO) نشان داده است. همچنین منجر به LiveCodebench ، معیار دشواری برای برنامه نویسی در سطح رقابت می شود و در MMMU 84.0 ٪ نمره می دهد ، که درک و استدلال چندمدی را آزمایش می کند.

حسابیس خاطرنشان كرد: “ما برای انجام ارزیابی های ایمنی مرزی بیشتر وقت اضافی می گیریم و از متخصصان ایمنی اطلاعات بیشتری کسب می كنیم.” (معنی: در حال حاضر ، قبل از اینکه قابلیت به طور گسترده ای در دسترس باشد ، از طریق API برای بازخورد در دسترس آزمایش کنندگان قابل اعتماد است.)

به طور کلی ، 2.5 PRO رهبری برنامه نویسی محبوب WebDev Arena را با نمره ELO-که سطح مهارت نسبی بازیکنان را در بازی های دو نفره مانند شطرنج-از 1420 (میانی تا مهارت) اندازه گیری می کند ، هدایت می کند. همچنین در تمام دسته های رهبر Lmarena ، که هوش مصنوعی را بر اساس اولویت انسانی ارزیابی می کند ، منتهی می شود.

از زمان راه اندازی آن “ما واقعاً تحت تأثیر آنچه کاربران ایجاد کرده اند ، از تبدیل طرح ها به برنامه های تعاملی تا شبیه سازی کل شهرها ، تحت تأثیر قرار گرفته ایم.”

به روزرسانی های مهم در Gemini 2.5 Pro ، Flash

همچنین امروز ، گوگل یک فلاش پیشرفته 2.5 را اعلام کرد ، که مدل اسب بخار خود را برای سرعت ، کارآیی و کم هزینه طراحی کرده است. 2.5 فلش در معیارهای استدلال ، چند مدلی ، کد و زمینه طولانی در هیئت مدیره بهبود یافته است – حسابیس خاطرنشان کرد که این تنها “دوم” برای 2.5 طرفدار در تابلوی Lmarena است. این مدل همچنین با استفاده از 20 تا 30 ٪ نشانه های کمتر کارآمدتر است.

Google بر اساس بازخورد توسعه دهنده ، تنظیمات نهایی را به 2.5 فلش انجام می دهد. اکنون برای پیش نمایش در استودیوی Google AI ، Vertex AI و برنامه Gemini در دسترس است. در اوایل ماه ژوئن به طور کلی برای تولید در دسترس خواهد بود.

Google قابلیت های دیگری را برای هر دو Gemini 2.5 Pro و 2.5 Flash ، از جمله خروجی صوتی بومی برای ایجاد تجربیات مکالمه طبیعی تر ، متن به گفتار برای پشتیبانی از چندین بلندگو ، خلاصه فکر و بودجه تفکر به ارمغان می آورد.

با توجه به ورودی صوتی بومی (در پیش نمایش) ، کاربران می توانند لحن ، لهجه و سبک صحبت کردن جمینی را هدایت کنند (فکر کنید: کارگردانی مدل به عنوان ملودراماتیک یا مودلین هنگام گفتن یک داستان). مانند Project Mariner ، این مدل همچنین مجهز به استفاده از ابزار است و به آن امکان می دهد از طرف کاربران جستجو کند.

از دیگر ویژگی های آزمایشی اولیه ، شامل گفتگوی عاطفی است که به مدل امکان تشخیص احساسات در صدای کاربر و پاسخ مناسب را می دهد. صوتی فعال که به آن اجازه می دهد مکالمات پس زمینه را تنظیم کند. و فکر کردن در API زنده برای پشتیبانی از کارهای پیچیده تر.

ویژگی های چند بلندگو جدید در هر دو Pro و Flash بیش از 24 زبان پشتیبانی می کنند و مدل ها می توانند به سرعت از یک گویش به دیگری تغییر دهند. Koray Kavukcuoglu ، CTO از Google DeepMind و Tulsee Doshi ، مدیر ارشد مدیریت محصول در Google DeepMind ، امروز در یک پست وبلاگ بنویسید: “متن به گفتار بیانگر است و می تواند ظرافت های ظریف مانند زمزمه ها را ضبط کند.”

علاوه بر این ، 2.5 Pro و Flash اکنون شامل خلاصه های فکری در API Gemini و Vertex AI هستند. Kavukcuoglu و Doshi توضیح می دهند: “افکار خام مدل را به دست می آورند و آنها را به یک قالب واضح با هدر ، جزئیات کلیدی و اطلاعات مربوط به اقدامات مدل سازماندهی می کنند.” هدف این است که یک فرمت ساختار یافته تر و ساده تر برای فرایند تفکر مدل فراهم شود و به کاربران تعامل با جمینی بدهد که درک و اشکال زدایی ساده تر است.

مانند Flash 2.5 ، Pro هم اکنون به “بودجه های تفکر” مجهز است ، که به توسعه دهندگان این امکان را می دهد تا تعداد نشانه هایی را که یک مدل برای فکر کردن قبل از پاسخ دادن استفاده می کند ، کنترل کند ، یا در صورت تمایل ، قابلیت های تفکر خود را به طور کلی خاموش کنید. این قابلیت به طور کلی در هفته های آینده در دسترس خواهد بود.

سرانجام ، Google پشتیبانی SDK بومی را برای تعاریف پروتکل زمینه Model (MCP) در API Gemini اضافه کرده است تا مدل ها بتوانند به راحتی با ابزارهای منبع باز ادغام شوند.

همانطور که حسابیس بیان کرد: “ما در یک لحظه قابل توجه در تاریخ زندگی می کنیم که هوش مصنوعی آینده ای جدید و شگفت انگیز را امکان پذیر می کند. این پیشرفت بی امان بوده است.”