Google از مدل منبع باز Gemma 3 با پنجره زمینه 128K پرده برداری می کند

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید

حتی به عنوان مدل های بزرگ زبان و استدلال ، سازمان ها به طور فزاینده ای به مدل های کوچکتر می روند تا فرآیندهای هوش مصنوعی را با انرژی و نگرانی کمتری انجام دهند.

در حالی که برخی از سازمان ها مدل های بزرگتر را به نسخه های کوچکتر تقطیر می کنند ، ارائه دهندگان مدل مانند Google همچنان مدل های زبان کوچک (SLM) را به عنوان جایگزینی برای مدل های بزرگ زبان (LLMS) منتشر می کنند ، که ممکن است بدون قربانی کردن عملکرد یا دقت ، هزینه بیشتری برای اجرای آن داشته باشد.

با توجه به این نکته ، Google آخرین نسخه از مدل کوچک خود ، Gemma را منتشر کرده است که دارای ویندوز زمینه گسترش یافته ، پارامترهای بزرگتر و قابلیت های استدلال چند حالته بیشتر است.

Gemma 3 که دارای همان قدرت پردازش با مدل های بزرگتر Gemini 2.0 است ، بهترین استفاده از دستگاه های کوچکتر مانند تلفن و لپ تاپ است. مدل جدید دارای چهار اندازه است: پارامترهای 1B ، 4B ، 12B و 27B.

در مقابل ، با یک پنجره زمینه بزرگتر از نشانه های 128K – در مقابل ، Gemma 2 دارای یک پنجره زمینه از 80K بود – Gemma 3 می تواند اطلاعات بیشتر و درخواست های پیچیده را درک کند. Google Gemma 3 را به روز کرد تا در 140 زبان کار کند ، تصاویر ، متن و فیلم های کوتاه را تجزیه و تحلیل کند و عملکرد پشتیبانی را برای خودکار سازی وظایف و گردش کار عامل انجام دهد.

Gemma عملکرد قوی می دهد

برای کاهش هزینه های محاسبات حتی بیشتر ، Google نسخه های کمکی Gemma را معرفی کرده است. به مدلهای کمکی به عنوان مدل های فشرده فکر کنید. این اتفاق از طریق فرآیند “کاهش دقت مقادیر عددی در وزن یک مدل” بدون قربانی کردن دقت انجام می شود.

گوگل گفت Gemma 3 “عملکرد پیشرفته ای را برای اندازه خود ارائه می دهد” و از LLM های پیشرو مانند Llama-405b ، Deepseek-V3 و O3-Mini بهتر عمل می کند. Gemma 3 27B ، به طور خاص ، در تست های نمره نمره Chatbot Arena Elo به Deepseek-R1 رسید. این مدل در صدر مدل کوچکتر Deepseek ، Deepseek V3 ، Openai's O3-Mini ، Meta's Llama-405b و Mistral Large قرار داشت.

با کمیت کردن GEMMA 3 ، کاربران می توانند عملکرد را بهبود بخشند ، مدل را اجرا کنند و برنامه هایی را بسازند “که می تواند در یک میزبان واحد پردازش TENSOR و TENSOR (TPU) قرار بگیرد.”

GEMMA 3 با ابزارهای توسعه دهنده مانند بغل کردن ترانسفورماتورهای صورت ، اولاما ، جکس ، کروس ، پیرتر و دیگران ادغام می شود. کاربران همچنین می توانند از طریق استودیوی Google AI ، در آغوش گرفتن Face یا Kaggle به Gemma 3 دسترسی پیدا کنند. شرکت ها و توسعه دهندگان می توانند از طریق استودیوی AI به API Gemma 3 دسترسی پیدا کنند.

سپر Gemma برای امنیت

Google گفت که این پروتکل های ایمنی را در Gemma 3 ساخته است ، از جمله یک بررسی ایمنی برای تصاویر به نام Shieldgemma 2.

گوگل در یک پست وبلاگ می نویسد: “توسعه Gemma 3 شامل حاکمیت داده های گسترده ، هماهنگی با سیاست های ایمنی ما از طریق ارزیابی دقیق و معیار قوی است.” وی گفت: “در حالی که آزمایش دقیق مدلهای توانمندتر ، اغلب ارزیابی ما از مدل های کمتری را نشان می دهد ، عملکرد تقویت شده STEM Gemma 3 باعث می شود ارزیابی های خاص بر پتانسیل آن برای سوء استفاده در ایجاد مواد مضر متمرکز شود. نتایج آنها نشانگر سطح کم خطر است. “

Shieldgemma 2 یک بررسی کننده ایمنی تصویر پارامتر 4B است که در بنیاد Gemma 3 ساخته شده است. این مدل با تصاویر حاوی محتوای صریح جنسی ، خشونت و سایر مواد خطرناک ، مدل را پیدا و مانع می کند. کاربران می توانند Shieldgemma 2 را متناسب با نیازهای خاص خود سفارشی کنند.

مدل های کوچک و تقطیر در حال افزایش

از آنجا که Google برای اولین بار Gemma را در فوریه 2024 منتشر کرد ، SLMS شاهد افزایش علاقه بوده است. سایر مدل های کوچک مانند PHI-4 مایکروسافت و Mistral Small 3 نشان می دهد که شرکت ها می خواهند برنامه هایی را با مدل هایی به اندازه LLMS قدرتمند بسازند ، اما لزوماً از کل وسعت آنچه LLM قادر است استفاده نمی کنند.

شرکت ها همچنین شروع به روی آوردن به نسخه های کوچکتر از LLM هایی که از طریق تقطیر ترجیح می دهند. برای روشن شدن ، Gemma تقطیر Gemini 2.0 نیست. در عوض ، با همان مجموعه داده و معماری آموزش دیده است. یک مدل مقطر از یک مدل بزرگتر یاد می گیرد ، که Gemma چنین نمی کند.

سازمان ها اغلب ترجیح می دهند موارد استفاده خاصی را در یک مدل قرار دهند. به جای استقرار LLM مانند O3-Mini یا Claude 3.7 Sonnet به یک ویرایشگر کد ساده ، یک مدل کوچکتر ، چه SLM یا یک نسخه مقطر ، می تواند به راحتی این کارها را انجام دهد بدون اینکه یک مدل عظیم را بیش از حد کند.

بینش روزانه در مورد موارد استفاده تجاری با VB Daily

اگر می خواهید رئیس خود را تحت تأثیر قرار دهید ، VB Daily شما را پوشش داده است. ما از آنچه شرکت ها با هوش مصنوعی تولید می کنند ، از تغییرات نظارتی گرفته تا استقرار عملی ، به شما دست و پنجه نرم می کنیم ، بنابراین می توانید بینش های حداکثر ROI را به اشتراک بگذارید.

خط مشی رازداری ما را بخوانید

با تشکر از مشترک شدن خبرنامه های بیشتر VB را در اینجا ببینید.

خطایی رخ داد

Google از مدل منبع باز Gemma 3 با پنجره زمینه 128K پرده برداری می کند

Gemma عملکرد قوی می دهد

سپر Gemma برای امنیت

مدل های کوچک و تقطیر در حال افزایش

Baroque Breakout Hit Clair Obscur: Expedition 33 برخلاف هر بازی ای است که قبلاً بازی کرده اید | بازی

حقیقت خرد کردن معده در مورد گوشت گاو آمریکایی که برای سیل قفسه های سوپر مارکت انگلستان سیلاب شده است

Google Pixel 10 Pro XL vs iPhone 16 Pro Max: انتظارات

برایتیکا نمودار 3 میلیون دلار در رایانه شخصی و فضای کنسول را نشان می دهد

شرکت های فناوری ایالات متحده معاملات هوش مصنوعی را به عنوان TRUMP TOURS CHATS GLF | فناوری

DJI Mavic 4 Pro-Triple Camera هواپیمای بدون سرنشین پرچمدار معرفی شده در بازارهای جهانی

این موز است! فیلم های باورنکردنی با استفاده از برگهای دارویی برای انجام کمک های اولیه ، شامپانزه ها را نشان می دهند

سامسونگ Galaxy Z Fold 7 vs Galaxy Z Fold 6: چه چیزی تغییر خواهد کرد؟

خوانندگان پاسخ می دهند: اگر آماده می شوید ، پنج مورد برتر شما چیست؟ | زندگی و سبک

IQOO NEO 10 PRO+، IQOO PAD 5 SERIES ، IQOO WATCH 5 و IQOO TWS AIR 3 جزئیات کلیدی دوباره خسته شده است

جو روگان درباره نژاد باستانی انسانهای غول پیکر که روی زمین زندگی می کنند ادعای وحشی می کند

یکی دیگر

بررسی Despelote – یک بازی زیبا و کاملاً حمل و نقل از فوتبال تصادفی | بازی

با CAPACABRA ملاقات کنید! اسرار موجودات مومیایی شده “عجیب” با دستهای مانند انسان که توسط دانشمندان مورد بررسی قرار می گیرد

این لپ تاپ Lenovo Thinkbook آماده تجارت با قیمت 1.050 دلار در آمازون است

Square Enix اکشن RPG Game Kingdom Hearts Missed-Link را لغو می کند

دولت انگلستان برای راه اندازی ابزار هوش مصنوعی برای سرعت بخشیدن به مشاوره های عمومی | هوش مصنوعی (AI)

تماشا می شود؟ هشدار در مورد AirPods به عنوان متخصصان فاش می کنند رئیس شما می تواند حرکات شما را ردیابی کند

Tab Lenovo Legion Gen 3 سریع و پررنگ بیشتر و مقرون به صرفه تر می شود

شما از دئودورانت اشتباه استفاده می کنید! کارشناسان اشتباه رایج “کاهش اثربخشی” را نشان می دهند – و چرا هرگز نباید در طول روز دوباره استفاده کنید