برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
نویسنده ، شرکت AI تولید کننده شرکت با ارزش 1.9 میلیارد دلار ، امروزه Palmyra X5 را منتشر کرد ، یک مدل بزرگ زبان بزرگ (LLM) که دارای یک پنجره زمینه گسترده 1 میلیون-توکاک است که نوید تسریع در پذیرش عوامل هوش مصنوعی خودمختار در محیط های شرکت ها را می دهد.
این شرکت مستقر در سانفرانسیسکو ، که در بین صدها مشتری شرکت خود Accenture ، Marriott ، Uber و Vanguard را به حساب می آورد ، این مدل را به عنوان یک جایگزین مقرون به صرفه برای عرضه از غول های صنعت مانند Openai و Anthropic قرار داده است ، با قیمت گذاری 0.60 دلار در هر میلیون نشانگر ورودی و 6 میلیون دلار در هر میلیون دلار خروجی.
ماتن پاول شتریت ، مدیر محصول نویسنده ، در مصاحبه با VentureBeat گفت: “این مدل واقعاً دنیای عامل را باز می کند.” “این سریعتر و ارزان تر از مدل های پنجره بزرگ متناسب با متن مانند GPT-4.1 است ، و هنگامی که آن را با پنجره زمینه بزرگ و توانایی مدل در انجام ابزار یا تماس با عملکرد ترکیب می کنید ، به شما امکان می دهد واقعاً کارهایی مانند جریان های عامل چند مرحله ای را انجام دهید.”
پیشرفت اقتصاد هوش مصنوعی: چگونه نویسنده یک مدل نیروگاه را فقط با 1 میلیون دلار آموزش داد
بر خلاف بسیاری از رقبا ، نویسنده Palmyra X5 را با داده های مصنوعی با هزینه تقریبی 1 میلیون دلار در هزینه GPU آموزش داد – بخشی از آنچه سایر مدلهای پیشرو به آن نیاز دارند. این راندمان هزینه نشان دهنده عزیمت قابل توجهی از رویکرد غالب صنعت در هزینه های ده ها یا صدها میلیون برای توسعه مدل است.
شتریت توضیح داد: “اعتقاد ما این است كه به طور كلی نشانه ها ارزان تر و ارزان تر می شوند و محاسبات ارزان تر و ارزان تر می شود.” “ما در اینجا هستیم تا مشکلات واقعی را حل کنیم ، نه اینکه نیکل و کمرنگ مشتریان خود را در قیمت گذاری.”
مزیت هزینه این شرکت ناشی از تکنیک های اختصاصی است که طی چند سال توسعه یافته است. در سال 2023 ، نویسنده تحقیقاتی را در مورد “تبدیل شدن به خود” منتشر کرد که معیارهای توقف زود هنگام برای تنظیم حداقل دستورالعمل را ارائه داد. به گفته شتریت ، این به نویسنده اجازه می دهد تا در طی فرایند آموزش “هزینه های قابل توجهی را کاهش دهد”.
شتریت گفت: “برخلاف سایر مغازه های بنیادی ، نظر ما این است که ما باید مؤثر باشیم. ما باید در اینجا کارآمد باشیم.” “ما باید سریعترین و ارزانترین مدل ها را به مشتریان خود ارائه دهیم ، زیرا ROI در این موارد واقعاً اهمیت دارد.”
Million-Token Marvel: معماری فنی که سرعت و دقت Palmyra X5 را دارد
Palmyra X5 می تواند در حدود 22 ثانیه یک فوریت کامل را در حدود 22 ثانیه پردازش کند و تماس های عملکرد چند چرخش را در حدود 300 میلی ثانیه انجام دهد-معیارهای عملکردی که نویسنده ادعا می کند “رفتارهای عامل را که قبلاً مقرون به صرفه بودند یا زمان بروز می کردند ، امکان پذیر می کند.
معماری این مدل شامل دو نوآوری فنی کلیدی است: یک مکانیسم توجه ترکیبی و ترکیبی از رویکرد متخصصان. شتریت گفت: “مکانیسم توجه هیبریدی … مکانیسم توجه را معرفی می کند که در داخل مدل به آن اجازه می دهد تا هنگام تولید هر خروجی ، روی قسمت های مربوطه ورودی ها تمرکز کند.” این رویکرد در حالی که دقت را در پنجره متن گسترده حفظ می کند ، تولید پاسخ را تسریع می کند.

در تست های معیار ، Palmyra X5 نسبت به هزینه آن به نتایج قابل توجهی رسید. در آزمون MRCR 8 سوزن OpenAi-که مدل هایی را برای یافتن هشت درخواست یکسان پنهان در یک مکالمه عظیم به چالش می کشد-Palmyra X5 19.1 ٪ به دست آورد ، در مقایسه با 20.25 ٪ برای GPT-4.1 و 17.63 ٪ برای GPT-4O. همچنین هشتمین برنامه نویسی را در معیار BigCodebench با نمره 48.7 قرار می دهد.
این معیارها نشان می دهد که در حالی که Palmyra X5 ممکن است هر دسته از عملکرد را هدایت نکند ، قابلیت های نزدیک به شعله ور را با هزینه های قابل توجهی پایین تر ارائه می دهد-معامله ای که نویسنده معتقد است با مشتریان شرکت متمرکز بر ROI طنین انداز خواهد شد.
از Chatbots گرفته تا اتوماسیون تجاری: چگونه نمایندگان AI در حال تغییر گردش کار شرکت هستند
انتشار Palmyra X5 اندکی پس از رونمایی از نویسنده AI HQ در اوایل این ماه – یک بستر متمرکز برای شرکت ها برای ساخت ، استقرار و نظارت بر عوامل هوش مصنوعی. این استراتژی محصول دوگانه نویسنده را برای سرمایه گذاری در حال رشد تقاضای شرکت برای هوش مصنوعی که می تواند فرآیندهای تجاری پیچیده ای را به صورت خودمختار انجام دهد ، قرار می دهد.
نویسنده CTO و بنیانگذار Waseem Alshikh در بیانیه ای گفت: “در عصر مأمورین ، مدل هایی که کمتر از 1 میلیون نشانه از متن را ارائه می دهند ، به سرعت برای موارد استفاده مهم در تجارت بی ربط می شوند.”
شتریت در این مورد توضیح داد: “مدت طولانی ، بین وعده عوامل هوش مصنوعی و آنچه آنها واقعاً می توانند ارائه دهند ، شکاف بزرگی وجود دارد. اما در نویسنده ، اکنون ما شاهد اجرای نمایندگی در دنیای واقعی با مشتریان اصلی شرکت هستیم.
پذیرندگان اولیه در حال استقرار Palmyra X5 برای گردش کار های مختلف شرکت ها ، از جمله گزارشگری مالی ، پاسخ های RFP ، اسناد پشتیبانی و تجزیه و تحلیل بازخورد مشتری هستند.
یکی از موارد استفاده به ویژه قانع کننده شامل گردش کار چند مرحله ای است ، جایی که یک عامل هوش مصنوعی می تواند محتوای منسوخ شده را پرچم گذاری کند ، اصلاحات پیشنهادی را تولید کند ، آنها را برای تأیید انسان به اشتراک بگذارد و به طور خودکار به روزرسانی های تأیید شده را به یک سیستم مدیریت محتوا فشار دهد.
این تغییر از تولید متن ساده به اتوماسیون فرآیند نشان دهنده یک تکامل اساسی در نحوه استقرار شرکت ها AI – حرکت از افزایش کار انسانی به اتوماسیون کل عملکردهای تجاری است.

استراتژی گسترش ابر: مشارکت AWS هوش مصنوعی نویسنده را به میلیون ها توسعه دهنده سازمانی می آورد
در کنار انتشار مدل ، نویسنده اعلام کرد که هم Palmyra X5 و هم پیشین آن ، Palmyra X4 ، اکنون در آمازون Bedrock ، سرویس کاملاً مدیریت شده خدمات وب آمازون برای دسترسی به مدل های بنیاد در دسترس هستند. AWS اولین ارائه دهنده ابر است که مدلهای کاملاً مدیریت شده را از نویسنده ارائه می دهد و به طور قابل توجهی دسترسی بالقوه شرکت را گسترش می دهد.
آتول دئو ، مدیر آمازون Bedrock در AWS ، در این اعلامیه گفت: “دسترسی یکپارچه به Palmyra X5 نویسنده ، توسعه دهندگان و شرکت ها را قادر می سازد تا عوامل هوش مصنوعی را بسازند و مقیاس کنند و چگونه آنها را نسبت به مقادیر زیادی از داده های سازمانی استدلال می کنند – امنیت ، مقیاس پذیری و عملکرد AWS.”
ادغام AWS یک مانع مهم برای پذیرش AI شرکت: پیچیدگی فنی استقرار و مدیریت مدل ها در مقیاس است. نویسنده با در دسترس ساختن Palmyra X5 از طریق API ساده شده Bedrock ، نویسنده به طور بالقوه می تواند به میلیون ها توسعه دهنده که فاقد تخصص تخصصی برای کار مستقیم با مدل های بنیادی هستند ، برسد.
هوش مصنوعی خود یادگیری: دید نویسنده برای مدلهایی که بدون مداخله انسان بهبود می یابند
نویسنده ادعای جسورانه ای راجع به ویندوز زمینه مطرح کرده است و اعلام کرده است که 1 میلیون نشانه برای تمام مدلهای آینده ای که منتشر می کند ، حداقل اندازه خواهد بود. این تعهد نشان دهنده دیدگاه شرکت است که زمینه بزرگ برای عوامل AI درجه شرکت که با چندین سیستم و منابع داده تعامل دارند ، ضروری است.
با نگاهی به آینده ، شترت مدل های خود تکامل را به عنوان پیشرفت عمده بعدی در شرکت هوش مصنوعی معرفی کرد. وی گفت: “واقعیت امروز است ، مأمورین در سطح مورد نظر ما عمل نمی کنند و برای انجام آنها به آنها احتیاج دارند.” “آنچه من فکر می کنم واقع بینانه است ، زیرا کاربران به AI HQ می آیند ، آنها شروع به انجام این نقشه برداری می کنند … و سپس شما در بالای آن یا در درون آن ، مدلهای خودسوزی که از نحوه انجام کارها در شرکت خود یاد می گیرند ، لایه بندی می کنید.”
این قابلیت های خود در حال تحول اساساً نحوه بهبود سیستم های هوش مصنوعی را با گذشت زمان تغییر می دهد. این مدل ها به جای نیاز به آموزش مجدد دوره ای یا تنظیم دقیق توسط متخصصان هوش مصنوعی ، به طور مداوم از تعامل آنها یاد می گیرند و به تدریج عملکرد آنها را برای موارد خاص استفاده از شرکت ها بهبود می بخشند.
شتریت هنگام بحث در مورد نیازهای متنوع تیمهای مختلف تجاری ، خاطرنشان کرد: “این ایده که یک عامل می تواند همه آنها را رد کند ، واقع بینانه نیست.” “حتی دو تیم مختلف محصول ، آنها بسیاری از روش های مختلف برای انجام کار ، خود PMS دارند.”
ریاضی جدید شرکت AI: چگونه استراتژی 1.9B $ نویسنده Openai و Anthropic را به چالش می کشد
رویکرد نویسنده به شدت با آن Openai و Anthropic ، که میلیارد ها نفر در بودجه جمع آوری کرده اند اما بیشتر به توسعه هوش مصنوعی عمومی متمرکز شده است. در عوض ، نویسنده در ساخت مدلهای خاص سازمانی با پروفایل های هزینه متمرکز شده است که امکان استقرار گسترده را فراهم می کند.
این استراتژی علاقه سرمایه گذاران قابل توجهی را به خود جلب کرده است و این شرکت در نوامبر گذشته 200 میلیون دلار بودجه سری C را با ارزش 1.9 میلیارد دلاری جمع آوری کرده است. این دور با مشارکت سرمایه گذاران استراتژیک از جمله Salesforce Ventures ، Adobe Ventures و IBM Ventures با همکاری Premji Invest ، Radical Ventures و Iconiq با هم همکاری کرد.
طبق گفته فوربس ، نویسنده دارای 160 ٪ قابل توجهی در حفظ خالص است و نشان می دهد که مشتریان به طور معمول پس از تصویب اولیه ، قراردادهای خود را 60 ٪ گسترش می دهند. طبق گزارش ها ، این شرکت بیش از 50 میلیون دلار در قراردادهای امضا شده و پروژه های امضا شده در سال جاری به 100 میلیون دلار خواهد رسید.
برای شرکت هایی که سرمایه گذاری های تولید AI را ارزیابی می کنند ، Palmyra X5 نویسنده یک گزاره ارزش قانع کننده را ارائه می دهد: قابلیت های قدرتمند در کسری از هزینه راه حل های رقیب. با بلوغ اکوسیستم عامل AI ، شرط بندی شرکت در مورد هزینه های کارآمد ، شرکت های متمرکز بر شرکت می توانند آن را در برابر رقبای با بودجه بهتر که ممکن است به عنوان الزامات ROI تجاری نباشد ، قرار دهد.
شتریت تأکید کرد: “هدف ما این است که هرچه سریعتر پذیرش نماینده گسترده را در پایگاه مشتری خود انجام دهیم.” “اقتصاد ساده است-اگر ما راه حل خود را بیش از حد بالا ببریم ، شرکت ها به سادگی هزینه یک عامل هوش مصنوعی را در مقابل یک کارگر انسانی مقایسه می کنند و ممکن است ارزش کافی را ببینند. برای تسریع در تصویب ، ما باید هر دو سرعت برتر و به طور قابل توجهی پایین را ارائه دهیم. این تنها راه برای دستیابی به استقرار در مقیاس بزرگ این عوامل در درون شرکت های بزرگ است.”
در صنعتی که غالباً از توانایی های فنی و سقف های عملکرد نظری اسیر می شود ، تمرکز عملی نویسنده بر کارایی هزینه ممکن است در نهایت انقلابی تر از نقطه اعشاری دیگر بهبود معیار باشد. از آنجا که شرکت ها در اندازه گیری تأثیر تجاری AI به طور فزاینده ای پیچیده می شوند ، ممکن است این سؤال از “مدل شما چقدر قدرتمند باشد؟” به “هوش شما چقدر مقرون به صرفه است؟” – و نویسنده شرط بندی می کند که آینده خود را بر عهده دارد که اقتصاد ، نه فقط قابلیت ها ، برندگان شرکت AI را تعیین می کند.
ارسال پاسخ