Cohere شرکتهای جهانی را با فرمان بسیار چند زبانه جدید هدف قرار می دهد مدلی که فقط به 2 GPU نیاز دارد
Credit: Cohere

Cohere شرکتهای جهانی را با فرمان بسیار چند زبانه جدید هدف قرار می دهد مدلی که فقط به 2 GPU نیاز دارد

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


Cohere Startup AI CANADIAN – که توسط یکی از نویسندگان مقاله اصلی ترانسفورماتور که انقلاب بزرگ زبان (LLM) را در سال 2017 شروع کرده است – که امروز از دستور A رونمایی کرد ، آخرین مدل AI تولیدی آن که برای برنامه های سازمانی طراحی شده است.

به عنوان جانشین Command-R ، که در مارس 2024 آغاز به کار کرد ، و فرمان R+ را دنبال کرد ، دستور A را بر تمرکز Cohere بر تولید بازیابی (RAG) ، استفاده از ابزار خارجی و راندمان هوش مصنوعی شرکت می کند-به ویژه در مورد محاسبه و سرعتی که در آن پاسخ می دهد.

این امر باعث می شود گزینه ای جذاب برای شرکتهایی باشد که به دنبال دستیابی به یک مزیت هوش مصنوعی بدون شکستن بانک و برنامه هایی هستند که در آن به پاسخ های سریع نیاز است – مانند امور مالی ، بهداشت ، پزشکی ، علوم و قانون.

با سرعت سریعتر ، نیازهای سخت افزاری پایین تر و قابلیت های چند زبانه گسترش یافته ، خود را به عنوان یک جایگزین قوی برای مدل هایی مانند GPT-4O و Deepseek-V3-LLM های کلاسیک ، نه مدل های استدلال جدید که اخیراً صنعت AI را با طوفان به دست آورده اند ، قرار می دهد.

بر خلاف سلف خود ، که از طول زمینه 128،000 توکن پشتیبانی می کند (با مراجعه به میزان اطلاعاتی که LLM می تواند در یک مبادله ورودی/خروجی ، تقریباً معادل یک رمان 300 صفحه ای انجام دهد) ، به یک دو برابر تبدیل می شود تا 256،000 توکن (معادل 600 صفحه متن) در حالی که باعث بهبود کارایی کلی و آمادگی ورودی می شود.

همچنین در پاشنه پا برای هوش مصنوعی-شرکت تابعه غیرانتفاعی شرکت-یک مدل چشم انداز چند زبانه به نام AYA Vision در اوایل ماه جاری منتشر می شود.

یک قدم از Command-R

هنگامی که Command-R در اوایل سال 2024 راه اندازی شد ، نوآوری های کلیدی مانند عملکرد بهینه شده RAG ، بازیابی بهتر دانش و استقرار AI با هزینه کمتری را معرفی کرد.

این شرکت با شرکت ها به دست آورد و در راه حل های تجاری شرکت هایی مانند اوراکل ، مفهوم ، مقیاس هوش مصنوعی ، Accenture و McKinsey ادغام شد ، اگرچه گزارش نوامبر 2024 از Menlo Ventures Advriprise Enterprise ، سهم بازار Cohere را در بین شرکت ها 3 ٪ ، بسیار زیر Openai (34 ٪) ، آنترونی (24 ٪) و حتی Small Misrups قرار داد.

اکنون ، در تلاش برای تبدیل شدن به یک قرعه کشی بزرگتر ، فرماندهی A این قابلیت ها را حتی بیشتر تحت فشار قرار می دهد. به گفته Cohere ، آن:

  • مسابقات یا عملکردهای Openai GPT-4O و Deepseek-V3 در کارهای تجاری ، STEM و برنامه نویسی
  • فقط در دو GPU (A100 یا H100) کار می کند ، که یک افزایش عمده کارایی در مقایسه با مدلهایی است که تا 32 GPU نیاز دارند
  • به نسل توکن سریعتر دست می یابد و 156 نشانه در ثانیه تولید می کند-1.75x سریعتر از GPT-4O و 2.4x سریعتر از Deepseek-V3
  • تأخیر را کاهش می دهد ، با 6،500ms زمان به اولین بار ، در مقایسه با 7،460ms برای GPT-4O و 14،740ms برای Deepseek-V3
  • قابلیت های هوش مصنوعی چند زبانه ، با بهبود گویش عربی و پشتیبانی گسترده برای 23 زبان جهانی را تقویت می کند.

یادداشت های Cohere در مستندات توسعه دهنده خود به صورت آنلاین که: “فرمان A چته است. به طور پیش فرض ، این مدل برای مکالمه تعاملی و بهینه شده است ، به این معنی که آن را لفظی می کند و از Markdown برای برجسته کردن کد استفاده می کند. برای غلبه بر این رفتار ، توسعه دهندگان باید از مقدمه ای استفاده کنند که از مدل می خواهد به سادگی جواب را ارائه دهد و از نشانگرهای بلوک Markdown یا کد استفاده نکند. “

ساخته شده برای شرکت

Cohere استراتژی اول شرکت خود را با فرمان A ادامه داده است ، و اطمینان حاصل می کند که یکپارچه در محیط های تجاری ادغام می شود. ویژگی های کلیدی عبارتند از:

  • نسل پیشرفته بازیابی (RAG): پاسخهای قابل تأیید و با دقت بالا را برای برنامه های سازمانی امکان پذیر می کند
  • استفاده از ابزار عامل: با ادغام با ابزارهای سازمانی از گردش کار پیچیده پشتیبانی می کند
  • ادغام سکوی AI شمالی: با پلت فرم AI North Cohere کار می کند و به مشاغل اجازه می دهد تا با استفاده از نمایندگان ایمن و درجه AI ، وظایف خود را به صورت خودکار انجام دهند
  • مقیاس پذیری و راندمان هزینه: استقرار خصوصی تا 50 ٪ ارزان تر از دسترسی مبتنی بر API است.

چند زبانه و بسیار اجرا کننده به زبان عربی

یکی از ویژگی های برجسته فرمان A ، توانایی آن در ایجاد پاسخ های دقیق در 23 از زبان های گفتاری در سراسر جهان ، از جمله بهبود برخورد با لهجه های عربی است. زبانهای پشتیبانی شده (مطابق اسناد توسعه دهنده در وب سایت Cohere) عبارتند از:

  • انگلیسی
  • فرانسوی
  • اسپانیایی
  • ایتالیایی
  • آلمانی
  • وابسته به پرتغالی
  • وابسته به ژاپنی
  • کره ای
  • چینی
  • عربی
  • روسی
  • صیقل دادن
  • ترکی
  • وابسته به ویتنامی
  • هلندی
  • وابسته به چک
  • وابسته به اندونزی
  • وابسته به اوکراینی
  • وابسته به رومانی
  • یونانی
  • هندی
  • عبری
  • فارسی

در ارزیابی معیار:

  • Command A در پاسخ دادن به زبان های عربی به انگلیسی-بالاتر از هر دو Deepseek-V3 (94.9 ٪) و GPT-4O (92.2 ٪) دقت 98.2 ٪ را به دست آورد.
  • این به طور قابل توجهی از رقبا در قوام گویش بهتر عمل کرد و به نمره ADI2 24.7 ، در مقایسه با 15.9 (GPT-4O) و 15.7 (Deepseek-V3) رسید.
اعتبار: CORHERE

ساخته شده برای سرعت و کارآیی

سرعت یک عامل مهم برای استقرار AI شرکت است و فرماندهی A برای ارائه سریعتر از بسیاری از رقبای خود مهندسی شده است.

  • سرعت جریان توکن برای درخواست های زمینه 100K: 73 توکن در ثانیه (در مقایسه با GPT-4O در 38/ثانیه و Deepseek-V3 در 32/ثانیه)
  • تولید توکن سریعتر: زمان پاسخ را به طور قابل توجهی در مقایسه با سایر مدل های در مقیاس بزرگ کاهش می دهد

قیمت گذاری و در دسترس بودن

Command A اکنون در سکوی Cohere و با وزنه های باز برای استفاده فقط در بغل کردن Face تحت یک مجوز Creative Commons Attribution Non Commercial 4.0 International (CC-BY-NC 4.0) در دسترس است و به زودی پشتیبانی ارائه دهنده ابری گسترده تر خواهد بود.

  • نشانه های ورودی: 2.50 دلار در هر میلیون
  • نشانه های خروجی: 10.00 دلار در هر میلیون

استقرار خصوصی و مقدماتی در صورت درخواست در دسترس است.

واکنشهای صنعت

چندین محقق هوش مصنوعی و اعضای تیم Cohere شور و شوق خود را برای فرماندهی A به اشتراک گذاشته اند.

Dwaraknath Ganesan ، پیشگویی در Cohere ، در مورد X اظهار داشت: “بسیار هیجان زده است تا آنچه را که ما در چند ماه گذشته روی آن کار کرده ایم ، فاش کنیم! فرمان A شگفت انگیز است. فقط می توان در 2 GPU H100 مستقر شد! طول زمینه 256K ، پشتیبانی چند زبانه گسترش یافته ، استفاده از ابزار عامل … بسیار افتخار می کند. “

پیر ریچموند ، محقق هوش مصنوعی در Cohere ، افزود: “فرمان A سطح جدید GPT-4O/Deepseek V3 ، مدل با وزن 111B با طول 256K است که برای کارآیی در موارد استفاده شرکت بهینه شده است.”

فرمان Cohere ، با تکیه بر پایه و اساس Command-R ، مرحله بعدی در شرکت مقیاس پذیر و مقرون به صرفه AI را نشان می دهد.

با سرعت سریعتر ، یک پنجره زمینه بزرگتر ، بهبود کار چند زبانه و هزینه های استقرار کمتر ، به مشاغل جایگزین قدرتمندی برای مدل های هوش مصنوعی موجود ارائه می دهد.