برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
Salesforce در حال مقابله با یکی از مداوم ترین چالش های هوش مصنوعی برای برنامه های تجاری است: شکاف بین هوش خام سیستم هوش مصنوعی و توانایی آن در انجام مداوم در محیط های غیرقابل پیش بینی شرکت – آنچه شرکت می نامد “هوشمندی”.
در یک اعلامیه جامع امروز ، تحقیقات Salesforce AI چندین معیار ، مدل ها و چارچوب های جدید را نشان داد که به منظور ایجاد هوشمندتر ، قابل اعتماد و همه کاره برای استفاده از شرکت ها ، عوامل هوش مصنوعی آینده را طراحی کرده اند. هدف از نوآوری ها ، بهبود قابلیت ها و سازگاری سیستم های هوش مصنوعی ، به ویژه هنگامی که به عنوان عوامل خودمختار در تنظیمات پیچیده تجارت مستقر می شوند.
“در حالی که LLMS ممکن است در تست های استاندارد شده ، سفرهای پیچیده ای را برنامه ریزی کند ، و شعر پیچیده ای را تولید کند ، درخشش آنها غالباً هنگام مواجهه با نیاز به اجرای کار قابل اعتماد و مداوم در محیط های شرکت پویا و غیرقابل پیش بینی ،” گفت: Silvio Savarese ، Salesorce Scientist و رئیس اصلی تحقیقات AI ، در جریان یک کنفرانس مطبوعاتی.
این ابتکار نشان دهنده فشار Salesforce به سمت آنچه Savarese “Enterprise Intelligence” (EGI) می نامد – AI به طور خاص برای پیچیدگی تجارت طراحی شده است نه پیگیری نظری هوش عمومی مصنوعی (AGI).
Savarese توضیح داد: “ما EGI را به عنوان عوامل هدفمند AI برای تجارت تعریف می کنیم نه تنها برای توانایی بلکه برای قوام نیز.” “در حالی که AGI ممکن است تصاویری از ماشینهای سرپرست را که از هوش انسانی فراتر می روند ، نشان دهد ، مشاغل منتظر آن آینده ای از راه دور و توهم نیستند. آنها اکنون از این مفاهیم بنیادی استفاده می کنند تا چالش های دنیای واقعی را در مقیاس حل کنند.”
نحوه اندازه گیری و رفع مشکل ناسازگاری هوش مصنوعی در تنظیمات شرکت
تمرکز اصلی این تحقیق ، کمیت و پرداختن به ناسازگاری هوش مصنوعی در عملکرد است. Salesforce مجموعه داده های ساده را معرفی کرد ، یک معیار عمومی با 225 سؤال استدلال مستقیم طراحی شده برای اندازه گیری اینکه واقعاً قابلیت های یک سیستم هوش مصنوعی را می کند.
شلیبی هاینک ، مدیر ارشد تحقیقات در Salesforce ، در طول کنفرانس مطبوعاتی توضیح داد: “هوش مصنوعی امروز دچار مشکل شده است ، بنابراین ما باید روی آن کار کنیم. اما چگونه می توانیم بدون اندازه گیری آن روی چیزی کار کنیم؟ این دقیقاً همان چیزی است که این معیار ساده است.”
برای برنامه های سازمانی ، این ناسازگاری صرفاً یک نگرانی دانشگاهی نیست. یک اشتباه اشتباه از یک نماینده هوش مصنوعی می تواند عملیات را مختل کند ، اعتماد مشتری را از بین ببرد یا خسارت مالی قابل توجهی وارد کند.
ساواراس در تفسیر خود خاطرنشان کرد: “برای مشاغل ، هوش مصنوعی یک سرگرمی گاه به گاه نیست ؛ این یک ابزار مهم برای ماموریت است که نیاز به پیش بینی غیرقابل پیش بینی دارد.”
Inside Crmarena: زمین آزمایش مجازی Salesforce برای نمایندگان AI شرکت
شاید مهمترین نوآوری Crmarena باشد ، یک چارچوب معیار جدید که برای شبیه سازی سناریوهای مدیریت ارتباط با مشتری واقع گرایانه طراحی شده است. این امکان آزمایش جامع عوامل هوش مصنوعی را در زمینه های حرفه ای فراهم می کند و به شکاف بین معیارهای دانشگاهی و نیازهای تجاری در دنیای واقعی می پردازد.
ساوارس گفت: “با تشخیص اینکه مدل های هوش مصنوعی فعلی غالباً در بازتاب مطالبات پیچیده محیط های سازمانی کوتاه می آیند ، ما Crmarena را معرفی کرده ایم: یک چارچوب معیار جدید با دقت طراحی شده برای شبیه سازی سناریوهای CRM واقع گرایانه و مبتنی بر حرفه ای.”
این چارچوب عملکرد نماینده را در سه شخصیت اصلی ارزیابی می کند: نمایندگان خدمات ، تحلیلگران و مدیران. آزمایش های اولیه نشان داد که حتی با هدایت راهنمایی ، عوامل پیشرو کمتر از 65 ٪ از زمان در کارکرد عملکرد برای موارد استفاده از این شخصیت ها موفق می شوند.
ساواروس توضیح داد: “CRM Arena در اصل ابزاری است که در داخل برای بهبود عوامل معرفی شده است.” “این به ما اجازه می دهد تا این عوامل را تست کنیم ، درک کنیم که چه موقع ناکام هستند ، و سپس از این درسهایی که از آن موارد شکست یاد می گیریم برای بهبود عوامل خود استفاده می کنیم.”
مدل های جدید تعبیه شده که زمینه سازمانی را بهتر از گذشته درک می کنند
از جمله نوآوری های فنی اعلام شده ، Salesforce SFR-Embedding را برجسته کرد ، الگویی جدید برای درک عمیق تر متنی که منجر به معیار عظیم تعبیه شده متن (MTEB) در 56 مجموعه داده می شود.
هاینک خاطرنشان کرد: “جاسازی SFR فقط تحقیق نیست. خیلی زود به داده های ابر می رسد.”
یک نسخه تخصصی ، SFR-Embedding-Code ، همچنین برای توسعه دهندگان معرفی شد و امکان جستجوی کد با کیفیت بالا و توسعه ساده سازی را فراهم کرد. طبق گفته Salesforce ، نسخه پارامتر 7B منجر به معیار بازیابی اطلاعات کد (COIR) می شود ، در حالی که مدل های کوچکتر (400 متر ، 2b) گزینه های کارآمد و مقرون به صرفه را ارائه می دهند.
چرا مدل های هوش مصنوعی کوچکتر و با محوریت عمل ممکن است از مدل های زبان بزرگتر برای کارهای تجاری بهتر عمل کنند
Salesforce همچنین XLAM V2 (مدل اکشن بزرگ) را اعلام کرد ، خانواده ای از مدل ها که به طور خاص برای پیش بینی اقدامات به جای تولید متن طراحی شده اند. این مدل ها فقط از 1 میلیارد پارامتر شروع می شوند – بخشی از اندازه بسیاری از مدل های پیشرو زبان.
هاینک توضیح داد: “نکته ویژه در مورد مدل های XLAM ما این است که اگر به اندازه مدل ما نگاه کنید ، ما یک مدل 1B داریم ، همه ما تا یک مدل 70B داریم. به عنوان مثال ، این مدل 1B ، بخشی از اندازه بسیاری از مدل های بزرگ زبان امروز است.” “این مدل کوچک فقط قدرت زیادی را برای انجام عملکرد بعدی در اختیار دارد.”
بر خلاف مدل های زبان استاندارد ، این مدل های اکشن به طور خاص برای پیش بینی و اجرای مراحل بعدی در یک دنباله کار آموزش داده می شوند و آنها را برای عوامل خودمختار که نیاز به تعامل با سیستم های سازمانی دارند ، به ویژه ارزشمند می کند.
هاینک افزود: “مدل های بزرگ اکشن LLM در زیر کاپوت هستند و نحوه ساخت آنها این است که ما یک LLM را می گیریم و آن را به خوبی در مورد آنچه که ما مسیرهای اکشن می نامیم تنظیم می کنیم.”
Enterprise AI Safety: چگونه لایه اعتماد Salesforce GuardRails را برای استفاده در تجارت ایجاد می کند
برای پرداختن به نگرانی های سازمانی در مورد ایمنی و قابلیت اطمینان هوش مصنوعی ، Salesforce SFR-Guard را معرفی کرد ، خانواده ای از مدل های آموزش داده شده در هر دو داده های در دسترس عمومی و داده های داخلی خاص CRM. این مدل ها لایه اعتماد شرکت را تقویت می کنند ، که برای رفتار عامل AI GuardRails فراهم می کند.
این شرکت در اعلامیه خود اظهار داشت: “نگهبان های AgentForce مرزهای روشنی را برای رفتار نمایندگان بر اساس نیازهای تجاری ، سیاست ها و استانداردها ایجاد می کنند و تضمین می کنند که نمایندگان در محدوده از پیش تعریف شده عمل کنند.”
این شرکت همچنین ContextualJudgebench ، معیار جدید برای ارزیابی مدل های قاضی مبتنی بر LLM را در متن راه اندازی کرد-با توجه به 2،000 جفت پاسخ چالش برانگیز برای صحت ، مختصر بودن ، وفاداری و امتناع مناسب از پاسخ.
Salesforce با نگاهی به فراتر از متن ، از Taco ، یک خانواده مدل اکشن چند حالته که برای مقابله با مشکلات پیچیده و چند مرحله ای از طریق زنجیرهای اندیشه و عمل (COTA) طراحی شده اند ، رونمایی کرد. این رویکرد هوش مصنوعی را قادر می سازد تا به نمایش داده های پیچیده مربوط به انواع رسانه های مختلف تفسیر و پاسخ دهد ، در حالی که Salesforce تا 20 ٪ پیشرفت در معیار MMVET به چالش کشیده است.
نوآوری در عمل: چگونه بازخورد مشتری نقشه راه AI شرکت Salesforce را شکل می دهد
Itai Asseo ، مدیر ارشد جوجه کشی و استراتژی برند در تحقیقات AI ، بر اهمیت مشترک مشتری در توسعه راه حل های AI آماده شرکت تأکید کرد.
Asseo توضیح داد: “هنگامی که ما با مشتریان صحبت می کنیم ، یکی از اصلی ترین نکات درد که ما داریم این است که هنگام برخورد با داده های سازمانی ، تحمل بسیار کمی برای ارائه پاسخ هایی وجود دارد که دقیق نیستند و مرتبط نیستند.” “ما پیشرفت زیادی کرده ایم ، خواه با موتورهای استدلال ، با تکنیک های پارچه ای و روش های دیگر در اطراف LLMS.”
Asseo نمونه هایی از جوجه کشی مشتری را به دست آورد و پیشرفت های چشمگیری در عملکرد هوش مصنوعی داشت: “وقتی ما از موتور استدلال اطلس استفاده کردیم ، از جمله برخی از تکنیک های پیشرفته برای نسل تقویت شده بازیابی ، همراه با استدلال و روش حلقه عامل و معماری ، ما شاهد صحت بودیم که دو برابر به اندازه مشتریان می توانستند در هنگام کار با نوع دیگری از رقابت های اصلی ما انجام دهند.”
جاده به اطلاعات عمومی بنگاه اقتصادی: چه چیزی برای Salesforce AI بعدی است
فشار تحقیقاتی Salesforce در یک لحظه مهم در پذیرش AI Enterprise قرار می گیرد ، زیرا مشاغل به طور فزاینده ای به دنبال سیستم های هوش مصنوعی هستند که قابلیت های پیشرفته را با عملکرد قابل اعتماد ترکیب می کنند.
در حالی که کل صنعت فناوری مدلهای همیشه بزرگتر را با قابلیت های خام چشمگیر دنبال می کند ، تمرکز Salesforce بر شکاف قوام ، رویکردی ظریف تر برای توسعه هوش مصنوعی را برجسته می کند-مواردی که نیازهای تجاری در دنیای واقعی را بر روی معیارهای دانشگاهی اولویت بندی می کند.
فن آوری های اعلام شده روز پنجشنبه در ماه های آینده شروع به کار می کنند ، با این که SFR-Embedding ابتدا به Data Cloud می رود ، در حالی که سایر نوآوری ها نسخه های آینده AgentForce را قدرت می دهند.
همانطور که Savarese در کنفرانس مطبوعاتی خاطرنشان کرد ، “این به معنای جایگزینی انسان نیست. این در مورد مسئول بودن است.” در مسابقه به تسلط بر شرکت AI ، Salesforce شرط می بندد که ثبات و قابلیت اطمینان – نه فقط هوش خام – در نهایت برندگان انقلاب هوش مصنوعی تجاری را تعریف می کنند.
ارسال پاسخ