مدل های هوش مصنوعی مهندسی نرم افزار وارد شده اند: SWE-1 Windsurf برای تصمیم گیرندگان فنی چه معنی دارد
مدل های هوش مصنوعی مهندسی نرم افزار وارد شده اند: SWE-1 Windsurf برای تصمیم گیرندگان فنی چه معنی دارد

مدل های هوش مصنوعی مهندسی نرم افزار وارد شده اند: SWE-1 Windsurf برای تصمیم گیرندگان فنی چه معنی دارد

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


تا به امروز ، سیستم عامل های برنامه نویسی VIBE تا حد زیادی به مدلهای بزرگ زبان (LLM) تکیه کرده اند تا به نوشتن کد کمک کنند.

با این حال ، نوشتن کد تنها یکی از بسیاری از وظایف مختلف است که توسعه دهندگان برای ساختن یک پلت فرم تولید کامل با درجه سازمانی باید انجام دهند. سایر کارها در گردش کار کامل مهندسی نرم افزار نیاز به استفاده از ابزارهای مختلف برای کمک به بررسی ، تعهد و حفظ کد در طول زمان دارد. این یک چالش Windsurf (که قبلاً Codeium) با مجموعه ای از مدل های جدید AI Frontier که آن را SWE-1 (مهندس نرم افزار 1) می نامد ، به عنوان بخشی از بروزرسانی موج 9 شرکت می نامد.

این خبر در حالی منتشر می شود که ویندزورف در میان به دست آوردن توسط رهبر AI Openai با قیمت 3 میلیارد دلار است. این معامله هنوز به طور رسمی بسته نشده است ، و Windsurf در حال حاضر به طور علنی درباره این معامله اظهار نظر نمی کند.

SWE-1 خانواده ای از مدل های AI کلاس مرزی است که به طور خاص برای تسریع در کل فرآیند مهندسی نرم افزار طراحی شده است. بر خلاف مدل های هوش مصنوعی با هدف کلی که برای کارهای کدگذاری اقتباس شده اند ، خانواده SWE-1 برای پرداختن به طیف کامل فعالیت های مهندسی نرم افزار ساخته شده است.

مدل های جدید با هدف پشتیبانی از توسعه دهندگان از طریق چندین سطوح ، حالات کار ناقص و کارهای طولانی مدت که توصیف توسعه نرم افزار در دنیای واقعی است. SWE-1 بلافاصله برای کاربران Windsurf در دسترس است ، ورود شرکت به توسعه مدل مرزی با عملکرد رقابتی در مدل های بنیادی مستقر ، اما با تمرکز بر گردش کار مهندسی نرم افزار است.

Anshul Ramachandran ، رئیس محصول و استراتژی Windsurf ، به VentureBeat گفت: “هدف اصلی ما در اینجا تسریع تمام مهندسی نرم افزار 99 ٪ است.”

توسعه دهندگان سازمانی بیش از مدل های دارای برنامه نویسی نیاز دارند

نوآوری اصلی در پشت SWE-1 تشخیص Windsurf است که کدگذاری تنها بخشی از آنچه مهندسان نرم افزار را در واقع انجام می دهند ، نشان می دهد.

این رویکرد به یک محدودیت اساسی در LLM های کدگذاری AI فعلی می پردازد. امروزه بسیاری از مدلهای مختلف را می توان برای نوشتن کد برنامه ، از جمله GPT-4.1 OpenAI ، Anthropic Claude 3.7 و Google’s Gemini 2.5 Pro I/O Edition استفاده کرد.

Windsurf دارای یک رابط ماژولار است که می تواند استفاده از چندین مدل مختلف را فعال کند. Ramachandran توضیح داد که کاربران Windsurf به این شرکت بازخورد داده اند که مدل های برنامه نویسی موجود تمایل دارند با راهنمایی کاربر خوب عمل کنند ، اما با گذشت زمان تمایل به از دست دادن چیزها دارند.

این محدودیت ناشی از تفاوت اساسی در ساختار کار است. در حالی که تولید کد اغلب یک کار تک شات است ، مهندسی نرم افزار واقعی شامل پیمایش چندین ابزار ، کار با کد ناقص و حفظ زمینه در پروژه های طولانی مدت است.

خانواده SWE-1: برای کارهای مختلف مهندسی ساخته شده است

Windsurf به جای ایجاد یک راه حل یک اندازه متناسب ، سه مدل تخصصی را توسعه داده است:

  1. SWE-1: مدل با اندازه کامل که برای استدلال پیشرفته و استفاده از ابزار طراحی شده است ، در دسترس همه کاربران پرداخت شده است.
  2. SWE-1-LITE: یک مدل کوچکتر اما قدرتمند جایگزین پایگاه آبشار موجود Windsurf ، در دسترس همه کاربران (رایگان و پرداخت شده).
  3. SWE-1-MINI: یک مدل سبک وزن پیش بینی کد منفعل در برگه Windsurf ، نامحدود برای همه کاربران.

مدل های SWE از طریق یک فرآیند آموزش داخلی گسترده ساخته شده است که به طور خاص روی کارهای مهندسی نرم افزار متمرکز شده است. Ramachandran گفت که این شرکت از یک مدل داده جدید با مراحل پی در پی برای آموزش استفاده کرده است.

معیارهای عملکرد: چگونه SWE-1 مقایسه می شود

در حالی که SWE-1 برای جایگزینی مدل های بنیاد از آزمایشگاه های اصلی قرار ندارد ، ویندزورف ادعا می کند که به عملکرد کلاس مرزی به طور خاص برای کارهای مهندسی نرم افزار دست پیدا می کند. این شرکت گزارش می دهد که از مدل های بنیادی متوسط ​​و مدلهای دارای وزن باز بسیار بهتر است.

با این حال ، Windsurf مراقب است که این نتایج اولیه را تحت الشعاع قرار ندهد.

Ramachandran اذعان کرد: “حتی معیار ما نشان می دهد که از نظر عینی بهتر از همه مدل های دیگر نیست.”

در عوض ، هدف این است که SWE-1 را به عنوان اولین قدم به سمت مدل های ساخته شده هدف قرار دهیم که در نهایت برای کارهای خاص مهندسی-و به طور بالقوه با هزینه کمتری-از آنهایی با هدف کلی پیشی می گیرد.

لبه فنی: آگاهی از جریان و جدول زمانی مشترک

آنچه باعث می شود رویکرد ویندزورف از نظر فنی متمایز باشد ، اجرای آن از مفهوم آگاهی از جریان است.

ایده اصلی این است که جریان مراحل به عنوان بخشی از توسعه شرکت باید اتفاق بیفتد. به جای نوشتن کد برای یک مرحله خاص ، آگاهی از جریان در مورد آگاهی از زمینه گسترده تر است.

آگاهی از جریان متمرکز بر ایجاد یک جدول زمانی مشترک از اقدامات بین انسان و هوش مصنوعی در توسعه نرم افزار است. ایده اصلی این است که به تدریج وظایف خود را از انسان به هوش مصنوعی منتقل کنیم و درک کنیم که هوش مصنوعی می تواند به طور مؤثر کمک کند.

این رویکرد یک حلقه بهبود مستمر برای مدل ها ایجاد می کند.

Ramachandran گفت: “ما همچنان به بهبود مدل ها ادامه می دهیم ، بیشتر مراحل موجود در آن جدول زمانی مشترک از انسان به هوش مصنوعی می چرخد.” “هوش مصنوعی قادر خواهد بود کارهای بیشتری انجام دهد که انسان قبلاً باید انجام دهد زیرا هوش مصنوعی درست نبود.”

این برای تصمیم گیرندگان فنی چه معنی دارد

برای شرکت های سازمانی یا نگهداری نرم افزار ، SWE-1 نشان دهنده تکامل مهم در توسعه با کمک AI است. این رویکرد به جای درمان دستیاران کد نویسی هوش مصنوعی به عنوان ابزارهای کاملاً ناقص ، نوید می دهد که کل چرخه عمر توسعه را تسریع کند.

تأثیر بالقوه فراتر از نوشتن کد سریعتر است. تشخیص اینکه توسعه برنامه بیشتر درگیر است ، به بالغ شدن الگوی برنامه نویسی VIBE کمک می کند تا برای توسعه نرم افزار پایدار سازمانی کاربرد بیشتری داشته باشد.

در حالی که هنوز روزهای اولیه برای SWE-1 است ، این حرکت مهم است. اگر و هنگامی که OpenAI کسب Windsurf را تکمیل می کند ، مدل های جدید می توانند از اهمیت بیشتری برخوردار شوند زیرا با منابع بزرگتر تحقیق و توسعه مدل که در دسترس خواهد بود ، می توانند از اهمیت بیشتری برخوردار شوند.

رهبران فنی باید در نظر بگیرند که چه مقدار از گردش کار توسعه آنها می تواند از کمک هوش مصنوعی فراتر از تولید کد صرف بهره مند شود. تیم هایی که زمان قابل توجهی را برای بررسی کد ، اشکال زدایی و مدیریت بدهی فنی می گذرانند ، ممکن است مزایای قابل توجهی از ابزارهایی مانند SWE-1 را نسبت به آنهایی که در درجه اول در تولید کد جدید متمرکز شده اند ، ببینند.