برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
راه اندازی هوش مصنوعی کانادا در سال 2019 به طور خاص هدف قرار دادن شرکت راه اندازی شد ، اما تحقیقات مستقل نشان داده است که تاکنون تلاش کرده است تا بخش عمده ای از سهم بازار را در بین توسعه دهندگان شخص ثالث در مقایسه با ارائه دهندگان مدل اختصاصی ایالات متحده مانند OpenAi و Anthropic به دست آورد ، نه اینکه به ظهور رقبای آزاد چین Deepseek اشاره نکند.
با این حال ، Cohere همچنان به تقویت پیشنهادات خود ادامه می دهد: امروز ، بخش تحقیقاتی غیر انتفاعی آن برای هوش مصنوعی اعلام کرد که یک مدل چشم انداز اول خود ، AYA Vision ، یک مدل جدید AI با وزن باز که باعث ادغام زبان و قابلیت های چشم انداز می شود و دارای تمایز ورودی در 23 زبانهای مختلف است که توسط Cohere گفته می شود که در یک وبلاگ رسمی ، Nalf ating indegualse در یک وبلاگ رسمی قرار دارد. “
AYA Vision برای تقویت توانایی AI در تفسیر تصاویر ، تولید متن و ترجمه محتوای بصری به زبان طبیعی ، طراحی هوش مصنوعی چند زبانه در دسترس و مؤثر تر است. این امر به ویژه برای شرکت ها و سازمانهایی که در بازارهای مختلف در سراسر جهان با ترجیحات مختلف زبان فعالیت می کنند ، مفید خواهد بود.
این در حال حاضر در وب سایت Cohere و در جوامع کد AI در دسترس است و در آغوش گرفتن چهره و کاگگل تحت یک مجوز Creative Commons Attribution-Noncommercial 4.0 International (CC BY-NC 4.0) ، به محققان و توسعه دهندگان اجازه می دهد تا تا زمانی که ویژگی مناسب به آنها داده می شود ، مدل را برای اهداف غیر تجاری استفاده کنند ، اصلاح و به اشتراک بگذارند.
علاوه بر این ، AYA Vision از طریق WhatsApp در دسترس است و به کاربران امکان می دهد مستقیماً در یک محیط آشنا با مدل ارتباط برقرار کنند.
این امر استفاده از آن را برای شرکت ها و به عنوان موتور برای برنامه های پرداخت شده یا گردش کار پولی ، متأسفانه محدود می کند.
این نسخه در نسخه های پارامتر 8 میلیارد و 32 میلیارد می آید (پارامترها به تعداد تنظیمات داخلی در یک مدل AI ، از جمله وزن و تعصب آن ، اشاره می کنند که معمولاً بیشتر از یک مدل قدرتمندتر و عملکردی تر استفاده می کند).
از 23 زبان و شمارش پشتیبانی می کند
حتی اگر مدل های هوش مصنوعی پیشرو از رقبا بتوانند متن را به زبان های مختلف درک کنند ، گسترش این توانایی در انجام وظایف مبتنی بر بینایی یک چالش است.
اما Aya Vision با اجازه کاربران به تولید زیرنویس های تصویر ، پاسخ به سؤالات بصری ، ترجمه تصاویر و انجام وظایف زبان مبتنی بر متن در مجموعه متنوعی از زبانها ، بر این امر غلبه می کند:
1. انگلیسی
2. فرانسوی
3 آلمانی
4. اسپانیایی
5. ایتالیایی
6. پرتغالی
7. ژاپنی
8. کره ای
9 چینی
10. عربی
11 یونانی
12. فارسی
13. لهستانی
14. اندونزیایی
15. چک
16. عبری
17. هندی
18 هلندی
19. رومانیایی
20. روسی
21. ترکی
22. اوکراینی
23. ویتنامی
در پست وبلاگ خود ، Cohere نشان داد که چگونه AYA Vision می تواند تصاویر و متن را در مورد بسته بندی محصول تجزیه و تحلیل کند و ترجمه یا توضیحات را ارائه دهد. همچنین می تواند سبک های هنری را از فرهنگ های مختلف شناسایی و توصیف کند و به کاربران کمک می کند تا از طریق درک بصری با هوش مصنوعی ، در مورد اشیاء و سنت ها بیاموزند.
قابلیت های Aya Vision پیامدهای گسترده ای در زمینه های مختلف دارد:
• یادگیری زبان و آموزش: کاربران می توانند تصاویر را به چند زبان ترجمه و توصیف کنند و محتوای آموزشی را در دسترس تر کنند.
• حفظ فرهنگی: این مدل می تواند توضیحات مفصلی در مورد هنر ، نقاط دیدنی و آثار باستانی تاریخی ایجاد کند ، و از مستندات فرهنگی به زبان های کم نماینده حمایت می کند.
• ابزارهای دسترسی: هوش مصنوعی مبتنی بر بینایی می تواند با ارائه توضیحات دقیق تصویر به زبان مادری خود ، به کاربران کم بینایی کمک کند.
• ارتباط جهانی: ترجمه مولتییمال در زمان واقعی ، سازمانها و افراد را قادر می سازد تا به طور مؤثرتر در بین زبانها ارتباط برقرار کنند.
عملکرد قوی و راندمان بالا در معیارهای پیشرو
یکی از ویژگی های برجسته Aya Vision ، کارآیی و عملکرد آن نسبت به اندازه مدل است. علیرغم اینکه به طور قابل توجهی کوچکتر از برخی از مدل های پیشرو چند حالته است ، AYA Vision در چندین معیار کلیدی از گزینه های بسیار بزرگتر بهتر عمل کرده است.
• Aya Vision 8B از Llama 90B بهتر عمل می کند ، که 11 برابر بزرگتر است.
• AYA Vision 32B از Qwen 72B ، Llama 90B و Molmo 72B بهتر عمل می کند ، که همه آنها حداقل دو برابر بزرگ (یا بیشتر) هستند.
• نتایج محک در Ayavisionbench و M-Wildvision نشان می دهد AYA VISION 8B با دستیابی به نرخ برد تا 79 ٪ ، و AYA Vision 32B با رسیدن به 72 ٪ برد در کارهای درک چند زبانه.
مقایسه بصری کارآیی در مقابل عملکرد ، مزیت AYA Vision را برجسته می کند. همانطور که در نمودار کارآیی در مقابل عملکرد نشان داده شده است ، AYA Vision 8B و 32B عملکرد بهترین کلاس را نسبت به اندازه پارامتر خود نشان می دهند ، و ضمن حفظ راندمان محاسباتی ، از مدل های بسیار بزرگتر بهتر عمل می کنند.

نوآوری های فنی که چشم انداز AYA است
برای ویژگی های هوش مصنوعی ، عملکرد AYA Vision را به چندین نوآوری کلیدی برساند:
• حاشیه نویسی مصنوعی: این مدل برای افزایش آموزش در کارهای چندمودالی ، از تولید داده های مصنوعی استفاده می کند.
• مقیاس داده های چند زبانه: با ترجمه و تغییر مجدد داده ها در زبان ها ، این مدل درک گسترده تری از زمینه های چند زبانه کسب می کند.
• ادغام مدل چند حالته: تکنیک های پیشرفته بینش از مدل های دید و زبان را با هم ترکیب می کنند و عملکرد کلی را بهبود می بخشند.
این پیشرفت ها به AYA Vision اجازه می دهد تا ضمن حفظ قابلیت های چند زبانه قوی ، تصاویر و متن را با دقت بیشتری پردازش کند.
نمودار بهبود عملکرد گام به گام نشان می دهد که چگونه نوآوری های افزایشی ، از جمله تنظیم دقیق مصنوعی (SFT) ، ادغام مدل و مقیاس گذاری ، به نرخ پیروزی بالای AYA Vision کمک کرده است.

پیامدهای تصمیم گیرندگان سازمانی
علیرغم اینکه ظاهراً از آیا ویژن پذیرایی به شرکت می کند ، با توجه به شرایط محدود کننده صدور مجوز غیر تجاری ، ممکن است مشاغل با استفاده از آن بسیار سخت استفاده کنند.
با این وجود ، مدیران عامل ، CTO ، رهبران فناوری اطلاعات و محققان هوش مصنوعی ممکن است از این مدل ها برای کشف قابلیت های چند زبانه و چند ضلعی AI در سازمان های خود استفاده کنند-به ویژه در تحقیقات ، نمونه سازی و معیار.
شرکت ها هنوز هم می توانند از آن برای تحقیقات و توسعه داخلی ، ارزیابی عملکرد چند زبانه هوش مصنوعی و آزمایش با برنامه های چند حالته استفاده کنند.
تیم های CTOS و AI AI Vision را به عنوان یک مدل با وزن بسیار کارآمد و با وزن باز می یابند که در عین حال نیاز به منابع محاسباتی کمتری دارد.
این امر باعث می شود تا ابزاری مفید برای معیار در برابر مدلهای اختصاصی ، کاوش در راه حل های بالقوه AI محور و آزمایش تعامل چند زبانه چندمودال قبل از تعهد به یک استراتژی استقرار تجاری باشد.
برای دانشمندان داده و محققان هوش مصنوعی ، AYA Vision بسیار مفیدتر است.
ماهیت منبع باز و معیارهای دقیق آن پایه ای شفاف برای مطالعه رفتار مدل ، تنظیم دقیق در تنظیمات غیر تجاری و کمک به پیشرفت های هوش مصنوعی باز فراهم می کند.
چه برای تحقیقات داخلی ، چه همکاری های دانشگاهی و چه از نظر اخلاق هوش مصنوعی استفاده می شود ، AYA Vision به عنوان یک منبع برش برای شرکت هایی که به دنبال ماندن در خط مقدم هوش مصنوعی چند زبانه و چند حالته هستند-بدون محدودیت مدل های اختصاصی و منبع بسته خدمت می کند.
تحقیقات و همکاری منبع باز
Aya Vision بخشی از AYA است ، یک ابتکار گسترده تر توسط Cohere متمرکز بر ساخت هوش مصنوعی و فناوری مرتبط با چند زبانه تر.
از زمان آغاز به کار در فوریه 2024 ، ابتکار عمل AYA یک جامعه تحقیقاتی جهانی با بیش از 3000 محقق مستقل در 119 کشور جهان را درگیر کرده است و برای بهبود مدل های AI زبان همکاری می کند.
برای ادامه تعهد خود به علوم آزاد ، Cohere وزنهای باز را برای هر دو Aya Vision 8B و 32B در Kaggle و Bugging Face منتشر کرده است ، و اطمینان حاصل می کند که محققان در سراسر جهان می توانند به مدل ها دسترسی پیدا کنند و آزمایش کنند. علاوه بر این ، Cohere for AI AyavisionBenchmark را معرفی کرده است ، یک مجموعه جدید ارزیابی چشم انداز چند زبانه طراحی شده برای ارائه یک چارچوب ارزیابی دقیق برای هوش مصنوعی چندمودال.
در دسترس بودن AYA Vision به عنوان یک مدل با وزن باز یک گام مهم در انجام تحقیقات چند زبانه هوش مصنوعی فراگیرتر و در دسترس است.
Aya Vision بر موفقیت Aya Expanse ، یکی دیگر از خانواده های LLM از Cohere برای هوش مصنوعی متمرکز بر هوش مصنوعی چند زبانه است. Cohere For AI با گسترش تمرکز خود به هوش مصنوعی چند حالته ، موقعیت AYA Vision را به عنوان ابزاری اصلی برای محققان ، توسعه دهندگان و مشاغل به دنبال ادغام هوش مصنوعی چند زبانه در گردش کار خود قرار می دهد.
از آنجا که ابتکار عمل AYA همچنان در حال تحول است ، Cohere for AI همچنین اعلام کرده است که قصد دارد در هفته های آینده یک تلاش جدید تحقیق مشترک را آغاز کند. محققان و توسعه دهندگان علاقمند به مشارکت در پیشرفت های هوش مصنوعی چند زبانه می توانند به جامعه علمی علنی بپیوندند یا درخواست کمک های مالی تحقیق کنند.
در حال حاضر ، انتشار Aya Vision نشانگر جهشی قابل توجه در هوش مصنوعی چند زبانه چند زبانه است و یک راه حل با عملکرد بالا و با وزن باز را ارائه می دهد که تسلط مدل های بزرگتر و منبع بسته را به چالش می کشد. با ایجاد این پیشرفت ها در دسترس جامعه تحقیقاتی گسترده تر ، Cohere for AI همچنان به مرزهای آنچه در ارتباطات چند زبانه AI محور است ، ادامه می دهد.
ارسال پاسخ