Openai امروز صبح خانواده جدیدی از مدل های هوش مصنوعی را راه اندازی کرد که در ضمن کاهش هزینه ها ، توانایی های برنامه نویسی را به میزان قابل توجهی بهبود می بخشد و مستقیماً به رشد رقابت در بازار AI Enterprise پاسخ می دهد.
شرکت هوش مصنوعی مستقر در سانفرانسیسکو سه مدل-GPT-4.1 ، GPT-4.1 MINI و GPT-4.1 NANO را معرفی کرد-همه بلافاصله از طریق API خود در دسترس هستند. ترکیب جدید در کارهای مهندسی نرم افزار بهتر عمل می کند ، دستورالعمل های دقیق تری را دنبال می کند و می تواند تا یک میلیون نشانه متن را معادل حدود 750،000 کلمه پردازش کند.
کوین ویل ، مدیر ارشد محصول OpenAI ، در اعلامیه روز دوشنبه گفت: “GPT-4.1 عملکرد استثنایی را با هزینه کمتری ارائه می دهد.” “این مدل ها تقریباً در هر بعد از GPT-4O بهتر هستند.”
شاید مهمترین آنها برای مشتریان سازمانی قیمت گذاری باشد: GPT-4.1 26 ٪ کمتر از سلف خود خواهد بود ، در حالی که نسخه نانو سبک وزن ارزان ترین پیشنهاد Openai با فقط 12 سنت در میلیون نشانه می شود.
چگونه پیشرفت های GPT-4.1 بزرگترین نقاط درد توسعه دهندگان شرکت را هدف قرار می دهد
در مصاحبه ای صادقانه با VentureBeat ، میشل پوكراس ، رهبر تحقیقات پس از آموزش در OpenAI ، تأكید كرد كه برنامه های كسب و كار عملی روند توسعه را آغاز كرده است.
Pokrass به VentureBeat گفت: “GPT-4.1 با یک هدف آموزش داده شد: برای توسعه دهندگان مفید است.” “ما دریافتیم که GPT-4.1 در پیروی از انواع دستورالعمل هایی که شرکت ها در عمل از آن استفاده می کنند ، بسیار بهتر است ، و این باعث می شود استقرار برنامه های آماده تولید بسیار ساده تر شود.”
این تمرکز بر روی ابزار در دنیای واقعی در نتایج معیار منعکس شده است. در SWE-BENCH تأیید شده ، که اندازه گیری قابلیت های مهندسی نرم افزار ، GPT-4.1 54.6 ٪ به دست آورد-بهبود قابل توجهی 21.4 درصد نسبت به GPT-4O.
برای مشاغل توسعه دهنده عوامل هوش مصنوعی که به طور مستقل روی کارهای پیچیده کار می کنند ، پیشرفت در دستورالعمل های زیر به ویژه ارزشمند است. در معیار MultiChallenge Scale ، GPT-4.1 38.3 ٪ به ثمر رساند و از GPT-4O با 10.5 درصد امتیاز بالاتر است.
چرا استراتژی مدل سه لایه Openai رقبا مانند Google و Anthropic را به چالش می کشد
معرفی سه مدل مجزا در نقاط مختلف قیمت ، به بازار متنوع AI می پردازد. پرچمدار GPT-4.1 برنامه های پیچیده سازمانی را هدف قرار می دهد ، در حالی که نسخه های Mini و Nano مواردی را مورد استفاده قرار می دهند که سرعت و راندمان هزینه اولویت ها هستند.
Pokrass به VentureBeat گفت: “همه کارها به بیشترین اطلاعات یا توانایی های برتر احتیاج ندارند.” “نانو برای استفاده از مواردی از قبیل خودکار ، طبقه بندی ، استخراج داده ها یا هر چیز دیگری که سرعت در آن نگرانی اصلی باشد ، یک مدل اسب بخار خواهد بود.”
به طور همزمان ، Openai اعلام کرد که قصد دارد پیش نمایش GPT-4.5 را کاهش دهد-بزرگترین و گرانترین مدل آن که فقط دو ماه پیش منتشر شد-از API خود تا 14 ژوئیه. این شرکت GPT-4.1 را به عنوان جایگزینی مقرون به صرفه تر قرار داد که “عملکرد بهبود یافته یا مشابه را در بسیاری از قابلیت های کلیدی با هزینه بسیار پایین تر و تأخیر ارائه می دهد”.
این حرکت به OpenAI اجازه می دهد تا در حالی که به توسعه دهندگان جایگزین کارآمدتری برای گرانترین پیشنهاد خود می دهد ، که 75 دلار در هر میلیون نشانه ورودی و 150 دلار در هر میلیون توکن خروجی قیمت گذاری شده است ، منابع محاسباتی را پس بگیرد.
نتایج دنیای واقعی: چگونه تامسون رویترز ، کارلایل و ویندوزورف در حال افزایش GPT-4.1 هستند
چندین مشتری سازمانی که قبل از راه اندازی مدل ها را آزمایش کرده اند ، پیشرفت های قابل توجهی در حوزه های خاص خود داشتند.
تامسون رویترز هنگام استفاده از GPT-4.1 با دستیار قانونی خود ، Cocounsel ، 17 ٪ در دقت بررسی چند مستند بهبود یافته است. این پیشرفت به ویژه برای گردش کار پیچیده حقوقی شامل اسناد طولانی با روابط ظریف بین بندها بسیار ارزشمند است.
شرکت مالی Carlyle گزارش داد که 50 ٪ عملکرد بهتری در استخراج داده های مالی دانه ای از اسناد متراکم-یک توانایی مهم برای تجزیه و تحلیل سرمایه گذاری و تصمیم گیری.
Varun Mohan ، مدیر عامل شرکت ارائه دهنده ابزار کدگذاری Windsurf (سابق Codeium) ، در طول اعلامیه معیارهای عملکرد مفصلی را به اشتراک گذاشت.
موهان گفت: “ما دریافتیم که GPT-4.1 تعداد دفعاتی را که نیاز به خواندن پرونده های غیر ضروری 40 ٪ در مقایسه با سایر مدل های پیشرو دارد ، کاهش می دهد و همچنین پرونده های غیر ضروری 70 ٪ کمتر را اصلاح می کند.” “این مدل همچنین به طرز حیرت انگیزی کمتری دارد … GPT-4.1 50 ٪ کمتر از سایر مدلهای پیشرو است.”
زمینه میلیون-تکن: آنچه مشاغل می توانند با ظرفیت پردازش 8 برابر بیشتر انجام دهند
هر سه مدل دارای یک پنجره متن از یک میلیون توکن هستند-هشت برابر بزرگتر از حد 128،000 GPT-4O. این ظرفیت گسترش یافته به مدل ها اجازه می دهد تا چندین اسناد طولانی یا کل کد های کد را به طور همزمان پردازش کنند.
در یک تظاهرات ، OpenAI GPT-4.1 را تجزیه و تحلیل یک پرونده ورود به سیستم سرور 450،000 تکن ناسا از سال 1995 نشان داد و یک ورودی غیر عادی را که در اعماق داده ها پنهان شده بود ، شناسایی کرد. این توانایی به ویژه برای کارهای مربوط به مجموعه داده های بزرگ مانند مخازن کد یا مجموعه اسناد شرکت ها بسیار ارزشمند است.
با این حال ، Openai تخریب عملکرد را با ورودی های بسیار بزرگ تصدیق می کند. در تست داخلی OpenAI-MRCR ، دقت از حدود 84 ٪ با 8000 نشانه به 50 ٪ با یک میلیون توکن کاهش یافته است.
چگونه چشم انداز AI Enterprise در حال تغییر است به عنوان Google ، Anthropic و OpenAI برای توسعه دهندگان رقابت می کنند
این نسخه در حالی صورت می گیرد که رقابت در Enterprise AI Space گرم می شود. Google به تازگی Gemini 2.5 Pro را با یک پنجره متن قابل مقایسه با یک میلیون تنوک راه اندازی کرده است ، در حالی که غزل Claude 3.7 Anthropic با مشاغل به دنبال گزینه های گزینه های Openai ، کشش را به خود جلب کرده است.
استارتاپ هوش مصنوعی چینی Deepseek همچنین اخیراً مدلهای خود را به روز کرده و فشار بیشتری بر Openai برای حفظ موقعیت رهبری خود وارد کرده است.
پوكراس گفت: “این بسیار جالب بوده است كه می توان دید كه چگونه پیشرفت در زمینه درک زمینه طولانی به عملکرد بهتر در عمودی های خاص مانند تجزیه و تحلیل حقوقی و استخراج داده های مالی تبدیل شده است.” “ما فهمیدیم که مدل های خود را فراتر از معیارهای دانشگاهی آزمایش می کنیم و اطمینان حاصل می کنیم که آنها با شرکت ها و توسعه دهندگان عملکرد خوبی دارند.”
OpenAI با انتشار این مدل ها به طور خاص از طریق API خود به جای چتپ ، تعهد خود را به توسعه دهندگان و مشتریان شرکت نشان می دهد. این شرکت قصد دارد به تدریج ویژگی های GPT-4.1 را به مرور زمان در chatgpt گنجانده باشد ، اما تمرکز اصلی بر ارائه ابزارهای قوی برای مشاغل در حال ساخت برنامه های تخصصی است.
برای تشویق تحقیقات بیشتر در پردازش طولانی مدت ، OpenAI دو مجموعه داده ارزیابی را منتشر می کند: OpenAI-MRCR برای آزمایش توانایی های هسته ای چند دور و گرافیک برای ارزیابی استدلال پیچیده در اسناد طولانی.
برای تصمیم گیرندگان شرکت ، خانواده GPT-4.1 رویکردی عملی و مقرون به صرفه تر برای اجرای AI ارائه می دهند. از آنجا که سازمانها ادغام هوش مصنوعی را در عملیات خود ادامه می دهند ، این پیشرفت ها در قابلیت اطمینان ، ویژگی و کارآیی می تواند باعث تسریع در تصویب صنایع شود که هنوز هزینه های اجرای را در برابر مزایای بالقوه وزن می کند.
در حالی که رقبا مدلهای بزرگتر و پرهزینه ای را تعقیب می کنند ، محوری استراتژیک Openai با GPT-4.1 نشان می دهد که آینده هوش مصنوعی ممکن است متعلق به بزرگترین مدل ها باشد ، بلکه به کارآمدترین مدل ها. دستیابی به موفقیت واقعی ممکن است در معیارها نباشد ، اما در آوردن هوش مصنوعی درجه یک شرکت در دسترس بیشتر مشاغل بیشتر از گذشته است.
ارسال پاسخ