MISTRAL AI مدل Devstral ، قدرتمند جدید منبع منبع باز SWE را که روی لپ تاپ ها اجرا می شود ، راه اندازی می کند
MISTRAL AI مدل Devstral ، قدرتمند جدید منبع منبع باز SWE را که روی لپ تاپ ها اجرا می شود ، راه اندازی می کند

MISTRAL AI مدل Devstral ، قدرتمند جدید منبع منبع باز SWE را که روی لپ تاپ ها اجرا می شود ، راه اندازی می کند

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


سازنده مدل AI AI فرانسوی که میسترال از زمان اولین مدل بنیاد منبع باز منبع باز خود در پاییز 2023 به طور مداوم بیش از وزن خود مشت زده است-اما اخیراً به دلیل آخرین نسخه خود از یک مدل بزرگ زبان اختصاصی (LLM) به نام Medium 3 ، انتقاداتی را در بین توسعه دهندگان به دست آورد که برخی از آنها به عنوان BETRAYS ROOTS OPENT OPENT و تعهد خود مشاهده می کردند.

(به یاد بیاورید که مدل های منبع باز می توانند توسط هر کسی آزادانه گرفته و تطبیق شوند ، در حالی که باید مدل های اختصاصی پرداخت شود و گزینه های سفارشی سازی آنها توسط سازنده مدل محدود تر و کنترل می شود.)

اما امروز ، Mistral دوباره به جامعه منبع آزاد AI و توسعه نرم افزار با قدرت AI به طور خاص ، به روشی بزرگ بازگردانده شده است. این شرکت با Source Startup All Hands AI ، سازندگان Open Devin برای انتشار Devstral ، یک مدل جدید زبان منبع باز با پارامترهای 24 میلیون-بسیار کوچکتر از بسیاری از رقبا که مدل های آنها در چند لایه قرار دارند ، همکاری کرده است ، و بنابراین ، نیاز به قدرت محاسباتی بسیار کمتری دارد که می تواند بر روی یک لپ تاپ-هدفمند برای توسعه عامل AI اجرا شود.

بر خلاف LLM های سنتی که برای تکمیل کد های کوتاه یا تولید عملکرد جدا شده طراحی شده است ، Devstral بهینه شده است تا به عنوان یک عامل مهندسی نرم افزار کامل عمل کند-قادر به درک زمینه در بین پرونده ها ، پیمایش پایگاه های بزرگ و حل مسائل در دنیای واقعی است.

این مدل اکنون آزادانه تحت مجوز مجاز Apache 2.0 در دسترس است و به توسعه دهندگان و سازمان ها امکان می دهد بدون محدودیت آن را مستقر ، اصلاح و تجاری کنند.

باپتیست Rozière ، دانشمند تحقیقاتی در Mistral AI گفت: “ما می خواستیم چیزی را برای توسعه دهنده و جامعه مشتاق آزاد کنیم. “این تحت Apache 2.0 منتشر شده است ، بنابراین مردم می توانند اساساً هر آنچه را که می خواهند با آن انجام دهند.”

در حال ساخت بر روی رمزگذاری

Devstral به دنبال موفقیت قبلی خود در سری Codestral ، مرحله بعدی در سبد رشد Mistral از مدل های متمرکز بر کد را نشان می دهد.

اولین بار در ماه مه 2024 راه اندازی شد ، Codestral از طریق اولیه Mistral در LLMS Coding Tecialed بود. این یک مدل 22 میلیارد پارامتر بود که برای اداره بیش از 80 زبان برنامه نویسی آموزش دیده بود و به دلیل عملکرد آن در کارهای تولید و کارهای تکمیل شده ، مورد توجه قرار گرفت.

محبوبیت و نقاط قوت فنی این مدل منجر به تکرارهای سریع ، از جمله راه اندازی Codestral-Mamba-یک نسخه پیشرفته ساخته شده در معماری Mamba-و اخیراً ، Codestral 25.01 ، که در بین توسعه دهندگان افزونه های IDE و کاربران سازمانی که به دنبال مدل های با فرکانس بالا و کم عرضه هستند ، پیدا کرده است.

حرکت پیرامون Codestral به ایجاد Mistral به عنوان یک بازیگر اصلی در اکوسیستم کدگذاری مدل کمک کرد و پایه و اساس توسعه Devstral را ایجاد کرد-از اتمام اتمام سریع تا اجرای کار کامل.

از مدل های بزرگتر در معیارهای بالای SWE بهتر عمل می کند

Devstral نمره 46.8 ٪ در معیار تأیید شده SWE-Bench ، یک مجموعه داده از 500 شماره GitHub در دنیای واقعی به صورت دستی برای صحت تأیید می شود.

این امر آن را پیش از تمام مدل های منبع باز که قبلاً منتشر شده بود و پیش از چندین مدل بسته از جمله GPT-4.1-Mini ، که بیش از 20 درصد از آن پیشی می گیرد ، قرار می دهد.

Rozière گفت: “در حال حاضر ، این بهترین مدل باز برای SWE-BENCH تأیید شده و برای عوامل کد است.” “و همچنین یک مدل بسیار کوچک – تنها 24 میلیارد پارامتر – که می توانید به صورت محلی ، حتی در یک مک بوک اجرا کنید.”

سوفیا یانگ ، دکتری ، رئیس روابط توسعه دهنده در شبکه اجتماعی ، نوشت: “Devstral را با مدل های بسته و باز ارزیابی شده در هر داربست ارزیابی کنید.

این مدل با استفاده از تکنیک های یادگیری تقویت کننده و تراز ایمنی از Mistral Small 3.1 استفاده می شود.

روزیر گفت: “ما از یک مدل پایه بسیار خوب با کنترل درخت کوچک میسترال شروع کردیم ، که قبلاً عملکرد خوبی دارد.” “سپس ما آن را با استفاده از تکنیک های ایمنی و یادگیری تقویت برای بهبود عملکرد آن در SWE-BENCE تخصص دادیم.”

ساخته شده برای دوره عامل

Devstral فقط یک مدل تولید کد نیست-بلکه برای ادغام در چارچوب های عامل مانند OpenHands ، Swe-Agent و OpenDevin بهینه شده است.

این داربست ها به Devstral اجازه می دهند تا با موارد آزمایش ارتباط برقرار کند ، به پرونده های منبع منتقل شود و کارهای چند مرحله ای را در پروژه ها انجام دهد.

Rozière گفت: “ما آن را با OpenDevin ، که داربست برای عوامل کد است ، منتشر می کنیم.” “ما مدل را می سازیم ، و آنها داربست را می سازند – مجموعه ای از مطالب و ابزارهایی که مدل می تواند از آن استفاده کند ، مانند یک پس زمینه برای مدل توسعه دهنده.”

برای اطمینان از استحکام ، این مدل در مخازن متنوع و گردش کار داخلی مورد آزمایش قرار گرفت.

روزیر توضیح داد: “ما بسیار مراقب بودیم که بیش از حد به SWE-BENCH نپردازیم.” “ما فقط در مورد داده های مخازن که از مجموعه SWE-BENCH کلون نشده اند آموزش داده ایم و مدل را در چارچوب های مختلف تأیید کرده ایم.”

وی افزود: Mistral Dogooded Devstral داخلی را برای اطمینان از تعمیم در کارهای جدید و غیب.

استقرار کارآمد با مجوز باز مجاز – حتی برای پروژه های تجاری و تجاری

معماری 24B جمع و جور Devstral باعث می شود که توسعه دهندگان محلی اجرا کنند ، چه در یک GPU RTX 4090 یا MAC با 32 گیگابایت رم. این امر باعث می شود که برای موارد استفاده حساس به حریم خصوصی و استقرار لبه جذاب باشد.

روزیر گفت: “این مدل به سمت علاقه مندان و افرادی که به اجرای برنامه های محلی و خصوصی اهمیت می دهند ، هدف قرار گرفته است – چیزی که حتی می توانند در هواپیما بدون اینترنت استفاده کنند.”

فراتر از عملکرد و قابلیت حمل ، مجوز Apache 2.0 آن گزاره ای قانع کننده برای برنامه های تجاری ارائه می دهد. این مجوز اجازه استفاده ، سازگاری و توزیع نامحدود-حتی برای محصولات اختصاصی-را ایجاد می کند که Devstral گزینه ای پایین برای پذیرش شرکت ها را ایجاد می کند.

مشخصات دقیق و دستورالعمل های استفاده در کارت مدل Devstral-Small-25505 در بغل کردن چهره در دسترس است.

این مدل دارای یک پنجره زمینه 128،000 توکن است و از Tekken Tokenizer با 131،000 واژگان استفاده می کند.

این پشتیبانی از استقرار از طریق کلیه سیستم عامل های مهم منبع باز از جمله بغل کردن چهره ، اولاما ، کاگگل ، استودیوی LM و Unloth پشتیبانی می کند و با کتابخانه هایی مانند VLLM ، ترانسفورماتور و استنتاج میسروال خوب کار می کند.

از طریق API یا محلی موجود است

Devstral از طریق MISTRAL’s LE Platforme API (رابط برنامه نویسی برنامه) تحت نام مدل Devstral-Small-25505 قابل دسترسی است ، با قیمت گذاری 0.10 دلار در هر میلیون نشانه ورودی و 0.30 دلار در هر میلیون توکن خروجی.

برای کسانی که به صورت محلی مستقر می شوند ، پشتیبانی از چارچوب هایی مانند OpenHands ادغام با کد های کد و گردش کار عامل را از جعبه خارج می کند.

Rozière به اشتراک گذاشت که چگونه او Devstral را در جریان توسعه خود گنجانیده است: “من خودم از آن استفاده می کنم. شما می توانید از آن بخواهید که کارهای کوچک را انجام دهد ، مانند به روزرسانی نسخه یک بسته یا اصلاح یک اسکریپت توکن سازی. این مکان مناسب را در کد شما پیدا می کند و تغییرات را ایجاد می کند. استفاده از آن بسیار خوب است.”

بیشتر برای آمدن

در حالی که Devstral در حال حاضر به عنوان پیش نمایش تحقیق منتشر می شود ، Mistral و All Hands AI در حال حاضر روی یک مدل پیگیری بزرگتر با قابلیت های توسعه یافته کار می کنند. Rozière خاطرنشان كرد: “همیشه بین مدلهای كوچكتر و بزرگتر فاصله ای وجود خواهد داشت.”

Devstral با داشتن معیارهای عملکرد ، مجوز مجاز و طراحی عامل ، خود را نه تنها به عنوان یک ابزار تولید کد ، بلکه به عنوان یک الگوی اساسی برای ساخت سیستم های مهندسی نرم افزار خودمختار قرار می دهد.