با پادشاه جدید کدگذاری AI ملاقات کنید: Google’s Gemini 2.5 Pro I/O Dethrones Claude 3.7 Sonnet

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


یک پادشاه جدید در مورد تاج و تخت مدل های کد نویسی AI وجود دارد: امروز ، واحد تحقیقاتی DeepMind AI Google از نسخه Gemini 2.5 Pro “I/O” رونمایی کرد ، نسخه جدیدی از مدل زبان بزرگ Gemini 2.5 Pro Multimodal (LLM) در ماه مارس منتشر شد که DeepMind Depo DeMis Hassabis گفت: “بهترین کدگذاری ما تا کنون ساخته شده است!”

در واقع ، معیارهای اولیه منتشر شده توسط این شرکت نشان می دهد که Google پیشرو است – برای اولین بار از زمان آغاز مسابقه AI تولیدی با جدیت با شروع اواخر سال 2022 ChatGPT – بالاتر از سایر مدل ها حداقل در یک معیار کدگذاری مهم.

نسخه جدید با عنوان “Gemini-5.5-Proview-05-06” ، نسخه قبلی 03-25 را جایگزین می کند و هم اکنون برای توسعه دهندگان Indie در Google AI Studio و شرکت های موجود در پلت فرم Cloud Vertex AI و همچنین برای کاربران شخصی در برنامه Gemini در دسترس است. پست وبلاگ Google گفت که این همچنین باعث می شود بوم برنامه Mobile Gemini و سایر ویژگی ها.

نسخه جدید Powers دارای توسعه در برنامه هایی مانند Gemini 95 است ، جایی که این مدل به طور خودکار با سبک های بصری در بین قطعات مطابقت دارد. همچنین این گردش کار مانند تبدیل فیلم های YouTube را به برنامه های یادگیری کامل و ساخت اجزای بسیار زیبا-مانند پخش کننده های ویدئویی پاسخگو یا Dictation Dictation uis-با کمی و بدون ویرایش CSS امکان پذیر می کند.

این یک مدل اختصاصی است ، به این معنی که شرکت ها برای استفاده از آن و دسترسی به آن فقط از طریق خدمات وب Google باید به Google بپردازند. با این حال ، قیمت یا محدودیت نرخ را تغییر نمی دهد. کاربران فعلی Gemini 2.5 Pro به طور خودکار به مدل به روز شده که 1.25 دلار/10 دلار در هر میلیون توکن در داخل/خارج (برای طول زمینه 200،000 توکن) در مقایسه با Claude 3.7 Sonnet 3/15 دلار هزینه می شود ، هدایت می شوند.

این شرکت این حرکت را قاب می کند-پیش از کنفرانس توسعه دهنده سالانه I/O (ورودی/خروجی) در اواخر این ماه در Mountain View و آنلاین ، 20-21 مه-به عنوان پاسخی به بازخورد قوی جامعه پیرامون کاربرد عملی Gemini در تولید کد در دنیای واقعی و طراحی رابط.

Logan Kilpatrick ، ​​مدیر ارشد محصول Gemini API و Google AI Studio ، در یک پست وبلاگ توسعه دهنده تأیید کرد که این بروزرسانی همچنین به بازخورد اصلی توسعه دهنده در مورد فراخوانی عملکرد ، با پیشرفت در کاهش خطا و قابلیت اطمینان می پردازد.

امتیازات برتر از رأی دهندگان انسانی در تولید برنامه های وب

در WebDev Arena Leaderboard ، یک متریک شخص ثالث که بر اساس توانایی آنها در تولید برنامه های وب جذاب و کاربردی ، مدل های اولویت انسانی را رتبه بندی می کند ، پیش نمایش Gemini 2.5 Pro (05-06) اکنون در جایگاه شماره یک آنتروپیک را پشت سر گذاشته است.

نسخه جدید 1499.95 را در تابلوی رهبری به دست آورد و آن را به خوبی از Sonnet 3.7’s 1377.10 قرار داد. مدل قبلی Gemini 2.5 Pro (03-25) مقام سوم را با نمره 1278.96 به دست آورد ، به این معنی که نسخه I/O نشان دهنده پرش 221 امتیاز است.

همانطور که توسط کاربر AI Power “Lisan Al Gaib” در X ذکر شد ، حتی GPT-4O Openai (“O3”) قادر به جابجایی Sonnet 3.7 نبود و اهمیت پیشرفت جمینی را برجسته کرد.

افزایش عملکرد Gemini نشان دهنده قابلیت اطمینان ، زیبایی شناسی و قابلیت استفاده در خروجی های آن است.

در حال حاضر برنده بررسی های RAVE

چندین توسعه دهنده و رهبران پلتفرم ، قابلیت اطمینان و کاربرد بهبود مدل را در سناریوهای تولید برجسته کرده اند.

سیلاس آلبرتی شناخت خاطرنشان کرد: Gemini 2.5 Pro اولین الگویی بود که با موفقیت یک اصلاح مجدد پیچیده از یک سیستم مسیریابی پس زمینه را انجام داد ، و نشان می دهد نوع تصمیم گیری که از یک توسعه دهنده ارشد انتظار دارد.

مایکل Truell ، مدیرعامل مکان نما AI Coding Tool ، گفت که آزمایش داخلی کاهش قابل توجهی در خرابی تماس ابزار ، یک مسئله قبلاً ذکر شده را نشان می دهد. او انتظار دارد که کاربران آخرین نسخه را در محیط های دستی به طور قابل توجهی مؤثر بدانند. مکان نما در حال حاضر Gemini 2.5 Pro را در عامل کد خود یکپارچه کرده است ، و نشان می دهد که چگونه توسعه دهندگان از مدل به عنوان یک مؤلفه اصلی در گردش کار توسعه دهنده باهوش تر استفاده می کنند.

میشل کاتاستا ، رئیس جمهور Refit ، Gemini 2.5 Pro را به عنوان بهترین مدل مرزی برای تعادل توانایی با تأخیر توصیف کرد. اظهارات وی حاکی از آن است که Replit در نظر گرفتن ادغام مدل در ابزارهای خاص خود ، به ویژه برای کارهایی است که پاسخگو بودن و قابلیت اطمینان بالا بسیار مهم است.

به همین ترتیب ، مربی AI و بنیانگذار خصوصی AI AI Chatbot Paul Couvert در X خاطرنشان كرد كه “كد و قابلیت تولید UI آن چشمگیر است.”

و همانطور که Pietro Schirano ، مدیرعامل AI ART Tool Everart ، در X ، اشاره کرد ، نسخه جدید Gemini 2.5 Pro I/O توانست یک شبیه سازی تعاملی از یادداشت های “1 گوریل در مقابل 100 مرد” ایجاد کند که اخیراً در رسانه های اجتماعی در حال گردش است.

تعاملی دیگر را نشان می دهد ماتری-بازی پازل استایل با جلوه های صوتی کاری که در کمتر از یک دقیقه ایجاد شده است ، کاربر X “Rameshr” (rezmeram) نوشت که “صنعت بازی گاه به گاه مرده است !!”

این تأییدها به ادعاهای DeepMind در مورد پیشرفت های عملی اضافه می کنند و ممکن است پذیرش گسترده تری را در سکوهای توسعه دهنده ترغیب کند.

برنامه ها و برنامه های کامل از یک متن سریع

یکی از ویژگی های برجسته بروزرسانی ، توانایی آن در ساخت برنامه های وب کامل و تعاملی یا شبیه سازی از یک فوری واحد است.

این با دید DeepMind در ساده سازی فرآیند نمونه سازی و توسعه هماهنگ است.

تظاهرات در برنامه Gemini به نمایش می گذارد که چگونه کاربران می توانند الگوهای بصری یا پیشبرد های موضوعی را به کد قابل استفاده تبدیل کنند ، و مانع ورود برای توسعه دهندگان و تیم های طراحی گرا با ایده های جدید می شوند.

اگرچه معماری و تغییرات زیر هود از Gemini 2.5 Pro به طور کلی به تفصیل عمومی نشده است ، اما تأکید بر فعال کردن تجربه های توسعه سریعتر و بصری تر است.

Gemini 2.5 Pro با تکیه به نقاط قوت خود در تولید کد و ورودی های چند مدلی ، کمتر به عنوان یک تحقیق و تحقیق بیشتر به عنوان ابزاری عملی برای چالش های برنامه نویسی در دنیای واقعی قرار می گیرد. نسخه اولیه نشان دهنده قصد واضح از Google DeepMind برای برآورده کردن تقاضای توسعه دهنده و حفظ حرکت قبل از اعلامیه های مهم کنفرانس خود است.