Gemini 2.5 Pro اکنون عمیقاً فکر می کند. 2.5 فلش در همه ابعاد

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید

گوگل در حال نزدیک شدن به هدف خود از “دستیار جهانی هوش مصنوعی” است که می تواند زمینه ، برنامه ریزی و اقدام را درک کند.

امروز در Google I/O ، غول فناوری پیشرفت هایی را در فلش Gemini 2.5 خود اعلام کرد – اکنون تقریباً در هر بعد بهتر است ، از جمله معیارهای استدلال ، کد و زمینه طولانی – و 2.5 PRO ، از جمله یک حالت استدلال پیشرفته آزمایش ، “فکر عمیق” ، که به Pro اجازه می دهد تا قبل از پاسخگویی فرضیه های متعدد را در نظر بگیرد.

دمیس هاسابیس ، مدیرعامل Google DeepMind ، در یک مطبوعات پیش از برفیش گفت: “این هدف نهایی ما برای برنامه Gemini است: هوش مصنوعی که شخصی ، فعال و قدرتمند است.”

“Deep Think” در معیارهای برتر نمره می دهد

Google Gemini 2.5 Pro را اعلام کرد-آنچه که هوشمندانه ترین مدل خود را با یک پنجره زمینه یک میلیون تکنیک در نظر می گیرد-در ماه مارس ، و در اوایل ماه جاری نسخه کدگذاری “I/O” خود را منتشر کرد (با Hassabis آن را “بهترین مدل برنامه نویسی که تاکنون ساخته ایم!”).

حسابیس گفت: “ما واقعاً تحت تأثیر آنچه مردم ایجاد کرده اند ، از تبدیل طرح ها به برنامه های تعاملی تا شبیه سازی کل شهرها ، تحت تأثیر قرار گرفته ایم.”

وی خاطرنشان كرد: براساس تجربه Google با Alphago ، هنگامی كه به آنها زمان بیشتری برای تفكر داده می شود ، پاسخ های مدل هوش مصنوعی بهبود می یابند. این امر باعث شد دانشمندان DeepMind Deep Think را توسعه دهند ، که از آخرین تحقیقات برجسته Google در تفکر و استدلال ، از جمله تکنیک های موازی استفاده می کند.

Deep Think نمرات چشمگیر را در سخت ترین معیارهای ریاضی و برنامه نویسی ، از جمله المپیاد ریاضی 2025 ایالات متحده (USAMO) نشان داده است. همچنین منجر به LiveCodebench ، معیار دشواری برای برنامه نویسی در سطح رقابت می شود و در MMMU 84.0 ٪ نمره می دهد ، که درک و استدلال چندمدی را آزمایش می کند.

حسابیس خاطرنشان كرد: “ما برای انجام ارزیابی های ایمنی مرزی بیشتر وقت اضافی می گیریم و از متخصصان ایمنی اطلاعات بیشتری کسب می كنیم.” (معنی: در حال حاضر ، قبل از اینکه قابلیت به طور گسترده ای در دسترس باشد ، از طریق API برای بازخورد در دسترس آزمایش کنندگان قابل اعتماد است.)

به طور کلی ، 2.5 PRO رهبری برنامه نویسی محبوب WebDev Arena را با نمره ELO-که سطح مهارت نسبی بازیکنان را در بازی های دو نفره مانند شطرنج-از 1420 (میانی تا مهارت) اندازه گیری می کند ، هدایت می کند. همچنین در تمام دسته های رهبر Lmarena ، که هوش مصنوعی را بر اساس اولویت انسانی ارزیابی می کند ، منتهی می شود.

از زمان راه اندازی آن “ما واقعاً تحت تأثیر آنچه کاربران ایجاد کرده اند ، از تبدیل طرح ها به برنامه های تعاملی تا شبیه سازی کل شهرها ، تحت تأثیر قرار گرفته ایم.”

به روزرسانی های مهم در Gemini 2.5 Pro ، Flash

همچنین امروز ، گوگل یک فلاش پیشرفته 2.5 را اعلام کرد ، که مدل اسب بخار خود را برای سرعت ، کارآیی و کم هزینه طراحی کرده است. 2.5 فلش در معیارهای استدلال ، چند مدلی ، کد و زمینه طولانی در هیئت مدیره بهبود یافته است – حسابیس خاطرنشان کرد که این تنها “دوم” برای 2.5 طرفدار در تابلوی Lmarena است. این مدل همچنین با استفاده از 20 تا 30 ٪ نشانه های کمتر کارآمدتر است.

Google بر اساس بازخورد توسعه دهنده ، تنظیمات نهایی را به 2.5 فلش انجام می دهد. اکنون برای پیش نمایش در استودیوی Google AI ، Vertex AI و برنامه Gemini در دسترس است. در اوایل ماه ژوئن به طور کلی برای تولید در دسترس خواهد بود.

Google قابلیت های دیگری را برای هر دو Gemini 2.5 Pro و 2.5 Flash ، از جمله خروجی صوتی بومی برای ایجاد تجربیات مکالمه طبیعی تر ، متن به گفتار برای پشتیبانی از چندین بلندگو ، خلاصه فکر و بودجه تفکر به ارمغان می آورد.

با توجه به ورودی صوتی بومی (در پیش نمایش) ، کاربران می توانند لحن ، لهجه و سبک صحبت کردن جمینی را هدایت کنند (فکر کنید: کارگردانی مدل به عنوان ملودراماتیک یا مودلین هنگام گفتن یک داستان). مانند Project Mariner ، این مدل همچنین مجهز به استفاده از ابزار است و به آن امکان می دهد از طرف کاربران جستجو کند.

از دیگر ویژگی های آزمایشی اولیه ، شامل گفتگوی عاطفی است که به مدل امکان تشخیص احساسات در صدای کاربر و پاسخ مناسب را می دهد. صوتی فعال که به آن اجازه می دهد مکالمات پس زمینه را تنظیم کند. و فکر کردن در API زنده برای پشتیبانی از کارهای پیچیده تر.

ویژگی های چند بلندگو جدید در هر دو Pro و Flash بیش از 24 زبان پشتیبانی می کنند و مدل ها می توانند به سرعت از یک گویش به دیگری تغییر دهند. Koray Kavukcuoglu ، CTO از Google DeepMind و Tulsee Doshi ، مدیر ارشد مدیریت محصول در Google DeepMind ، امروز در یک پست وبلاگ بنویسید: “متن به گفتار بیانگر است و می تواند ظرافت های ظریف مانند زمزمه ها را ضبط کند.”

علاوه بر این ، 2.5 Pro و Flash اکنون شامل خلاصه های فکری در API Gemini و Vertex AI هستند. Kavukcuoglu و Doshi توضیح می دهند: “افکار خام مدل را به دست می آورند و آنها را به یک قالب واضح با هدر ، جزئیات کلیدی و اطلاعات مربوط به اقدامات مدل سازماندهی می کنند.” هدف این است که یک فرمت ساختار یافته تر و ساده تر برای فرایند تفکر مدل فراهم شود و به کاربران تعامل با جمینی بدهد که درک و اشکال زدایی ساده تر است.

مانند Flash 2.5 ، Pro هم اکنون به “بودجه های تفکر” مجهز است ، که به توسعه دهندگان این امکان را می دهد تا تعداد نشانه هایی را که یک مدل برای فکر کردن قبل از پاسخ دادن استفاده می کند ، کنترل کند ، یا در صورت تمایل ، قابلیت های تفکر خود را به طور کلی خاموش کنید. این قابلیت به طور کلی در هفته های آینده در دسترس خواهد بود.

سرانجام ، Google پشتیبانی SDK بومی را برای تعاریف پروتکل زمینه Model (MCP) در API Gemini اضافه کرده است تا مدل ها بتوانند به راحتی با ابزارهای منبع باز ادغام شوند.

همانطور که حسابیس بیان کرد: “ما در یک لحظه قابل توجه در تاریخ زندگی می کنیم که هوش مصنوعی آینده ای جدید و شگفت انگیز را امکان پذیر می کند. این پیشرفت بی امان بوده است.”

بینش روزانه در مورد موارد استفاده تجاری با VB Daily

اگر می خواهید رئیس خود را تحت تأثیر قرار دهید ، VB Daily شما را پوشش داده است. ما از آنچه شرکت ها با هوش مصنوعی تولید می کنند ، از تغییرات نظارتی گرفته تا استقرار عملی ، به شما دست و پنجه نرم می کنیم ، بنابراین می توانید بینش های حداکثر ROI را به اشتراک بگذارید.

خط مشی رازداری ما را بخوانید

با تشکر از مشترک شدن خبرنامه های بیشتر VB را در اینجا ببینید.

خطایی رخ داد

Gemini 2.5 Pro اکنون عمیقاً فکر می کند. 2.5 فلش در همه ابعاد

“Deep Think” در معیارهای برتر نمره می دهد

به روزرسانی های مهم در Gemini 2.5 Pro ، Flash

جو روگان از آزمایش شستشوی مغزی مارک زاکربرگ که ذهن 700K را به خود جلب کرد ، شوکه شد

Sutton Hoo Mystery پس از 1400 سال حل می شود: سطل بیزانس کشف شده در سایت تاریخی “حاوی بقایای مهم از افراد مهم”

Android Studio تست های AI و تشخیص دقیق تصادف را اضافه می کند

برندگان جوایز Summit Summit 2025 Visionary و Up-Comer

کد Visual Studio (VS) اکنون یک ویرایشگر AI منبع باز ساخته خواهد شد

رمز و راز به عنوان پرتوی روشن از رگه های نور از طریق آسمان بر سر ایالات متحده

شماره Google Maps می تواند کاربران Android را به سمت نسخه وب موبایل نقشه های اپل سوق دهد

بالاخره Google برنامه Mobile Notebooklm را در I/O راه اندازی کرد: دستی ، برداشت اول

Xiaomi 15S Pro و Xiaomi Pad 7 Ultra اولین کسی خواهد بود که مجهز به پردازنده Xring O1 است

باید صبح یا شب دوش بگیرید؟ سرانجام دانشمندان بحث را حل و فصل کردند – بنابراین ، آیا شما با توصیه های آنها موافق هستید؟

فروشگاه Google Play باهوش تر می شود ، و این خبر خوبی برای کاربران Android است

وقتی برنده می شوید آواز بخوانید: چگونه کارائوکه در اتومبیل ها پیروزی شرکت های چینی | چین

Infinix GT 30 Pro Launch رسماً در هند طعنه زد

جزیره مخفی لقب “مالدیو ترکیه” با قیمت های بسیار ارزان تر و آبهای شفاف

Vivo S30 Pro Mini Display و Dimension قبل از راه اندازی رسمی آن خسته شده است

Spotify یک تغییر ظریف ایجاد کرده است که کاربران را خشمگین کرده است – به عنوان یکی از منافذی که برنامه ها را طراحی می کنند هیچ توجهی به حافظه عضلانی ندارند “

موتورولا در میان شایعات عجیب و غریب ، راه اندازی RAZR (2025) را در Verizon تأیید کرد

Alcatel V3 Ultra 5G ، V3 Pro 5G و V3 Classic Classic 5G جزئیات کلیدی از طریق Flipkart اذیت می شوند. راه اندازی در تاریخ 27 مه در هند

کاربران رسانه های اجتماعی با استفاده از زن با استفاده از “تلفن شفاف” با فیلم زن ناراحت می شوند – و توضیحات حتی وحشی تر است

در حال آمدن است! هیچ چیز سرانجام پنجره پرتاب تلفن (3) را تأیید نمی کند