برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
Patronus AI امروز یک بستر نظارت جدید را راه اندازی کرد که به طور خودکار خرابی ها را در سیستم های عامل AI مشخص می کند و نگرانی های شرکت را در مورد قابلیت اطمینان هدف قرار می دهد زیرا این برنامه ها پیچیده تر می شوند.
محصول جدید راه اندازی ایمنی AI مستقر در سانفرانسیسکو ، Percival ، خود را به عنوان اولین راه حل قادر به شناسایی خودکار الگوهای مختلف خرابی در سیستم های عامل AI و پیشنهاد بهینه سازی برای پرداختن به آنها قرار می دهد.
آناند کاناپان ، مدیرعامل و بنیانگذار Patronus AI ، در مصاحبه اختصاصی با VentureBeat گفت: “Percival اولین راه حل صنعت است که به طور خودکار انواع الگوهای خرابی را در سیستم های عامل تشخیص می دهد و سپس به طور سیستماتیک اصلاحات و بهینه سازی ها را برای پرداختن به آنها پیشنهاد می کند.”
بحران قابلیت اطمینان عامل هوش مصنوعی: چرا شرکت ها کنترل سیستم های خودمختار را از دست می دهند
اتخاذ سازمانی از عوامل هوش مصنوعی-نرم افزاری که می توانند به طور مستقل برنامه های پیچیده چند مرحله ای را برنامه ریزی و اجرا کنند-در ماه های اخیر شتاب می یابد و باعث ایجاد چالش های مدیریتی جدید می شود زیرا شرکت ها سعی می کنند این سیستم ها را با اطمینان در مقیاس انجام دهند.
بر خلاف مدل های یادگیری ماشین معمولی ، این سیستم های مبتنی بر عامل اغلب شامل توالی های طولانی از عملیات هستند که خطاها در مراحل اولیه می توانند عواقب پایین دست داشته باشند.
کاناپان گفت: “چند هفته پیش ، ما مدلی را منتشر کردیم که تعیین می کند که عوامل احتمالی چگونه می توانند شکست بخورند ، و چه تأثیراتی که ممکن است بر روی برند داشته باشد ، بر روی مشتری و مواردی از این دست.” “یک احتمال خطای ترکیب ثابت با عوامل که ما می بینیم وجود دارد.”
این مسئله در محیط های چند عامل که در آن سیستم های مختلف هوش مصنوعی با یکدیگر تعامل دارند ، به ویژه حاد می شود و باعث می شود رویکردهای سنتی آزمایش به طور فزاینده ای ناکافی شود.
نوآوری حافظه اپیزودیک: چگونه معماری عامل AI Percival در تشخیص خطا متحول می شود
Percival خود را از طریق معماری مبتنی بر عامل خود و آنچه که این شرکت “حافظه اپیزودیک” می نامد ، خود را از سایر ابزارهای ارزیابی متمایز می کند-توانایی یادگیری از خطاهای قبلی و سازگاری با گردش کار خاص.
این نرم افزار می تواند بیش از 20 حالت شکست مختلف را در چهار دسته تشخیص دهد: خطاهای استدلال ، خطاهای اجرای سیستم ، خطاهای برنامه ریزی و هماهنگی و خطاهای خاص دامنه.
دارشان دسپند ، محقق Patronus AI ، توضیح داد: “بر خلاف LLM به عنوان قاضی ، Percival خود عامل است و بنابراین می تواند تمام وقایعی را که در طول مسیر اتفاق افتاده است ، پیگیری کند.” “این می تواند آنها را با هم ارتباط داشته و این خطاها را در متن ها پیدا کند.”
برای شرکت ها ، به نظر می رسد فوری ترین سود کاهش زمان اشکال زدایی است. به گفته Patronus ، مشتریان اولیه زمان صرف شده برای تجزیه و تحلیل گردش کار را از حدود یک ساعت به یک تا یک تا 1.5 دقیقه کاهش داده اند.
معیار دنباله شکافهای مهم در قابلیت های نظارت هوش مصنوعی را نشان می دهد
در کنار راه اندازی محصول ، Patronus در حال انتشار یک معیار به نام Trail (استدلال ردیابی و محلی سازی مسئله عامل) برای ارزیابی چگونگی خوب سیستم ها می تواند مسائل مربوط به گردش کار AI را تشخیص دهد.
تحقیقات با استفاده از این معیار نشان داد که حتی مدل های پیشرفته هوش مصنوعی با تجزیه و تحلیل ردیابی مؤثر ، با بهترین عملکرد سیستم تنها 11 ٪ در معیار به ثمر می رسند.
این یافته ها تأکید بر ماهیت چالش برانگیز نظارت بر سیستم های پیچیده AI است و ممکن است به توضیح اینکه چرا شرکت های بزرگ در ابزارهای تخصصی برای نظارت هوش مصنوعی سرمایه گذاری می کنند ، کمک کند.
رهبران شرکت AI شرکت Percival را برای برنامه های عامل مهم ماموریت در آغوش می گیرند
پذیرندگان اولیه شامل AI ظهور ، که تقریباً 100 میلیون دلار بودجه جمع آوری کرده است و در حال توسعه سیستم هایی است که نمایندگان هوش مصنوعی می توانند سایر عوامل را ایجاد و مدیریت کنند.
Satya Nitta ، بنیانگذار و مدیرعامل Emergence AI ، در بیانیه ای که به VentureBeat ارسال شده است ، گفت: “دستیابی به موفقیت اخیر ظهور-آژانس های ایجاد نمایندگان-یک لحظه مهم نه تنها در تکامل سیستم های سازگار ، خود تولید کننده ، بلکه در نحوه اداره و نحوه مسئولیت پذیری و مقیاس پذیر نیز در آن قرار دارند.”
نوا ، یکی دیگر از مشتری های اولیه ، از این فناوری برای سکویی استفاده می کند که به شرکتهای بزرگ کمک می کند تا از طریق ادغام SAP با قدرت AI ، کد میراث را مهاجرت کنند.
این مشتریان چالش چالش Percival را برای حل آن تایپ می کنند. به گفته کاناپان ، برخی از شرکت ها اکنون سیستم های عامل را با “بیش از 100 مرحله در یک دایرکتوری عامل واحد” مدیریت می کنند ، و پیچیدگی هایی را ایجاد می کنند که فراتر از آنچه اپراتورهای انسانی می توانند به طور مؤثر نظارت کنند.
بازار نظارت هوش مصنوعی برای رشد انفجاری به عنوان سیستم های خودمختار گسترش می یابد
این پرتاب در میان افزایش نگرانی های سازمانی در مورد قابلیت اطمینان و مدیریت هوش مصنوعی انجام می شود. از آنجا که شرکت ها به طور فزاینده ای سیستم های خودمختار را مستقر می کنند ، نیاز به ابزارهای نظارتی به طور متناسب افزایش یافته است.
کاناپان خاطرنشان کرد: “آنچه چالش برانگیز است این است که سیستم ها به طور فزاینده ای خودمختار می شوند.”
پیش بینی می شود بازار ابزارهای نظارت و قابلیت اطمینان هوش مصنوعی با حرکت شرکتها از استقرار آزمایشی به برنامه های هوش مصنوعی منتقدان ، به طور قابل توجهی گسترش یابد.
Percival با چندین چارچوب هوش مصنوعی ، از جمله بغل کردن چهره های بغل ، پییدانتیک AI ، Openai Agent SDK و Langchain ادغام می شود و آن را با محیط های مختلف توسعه سازگار می کند.
در حالی که Patronus AI پیش بینی قیمت گذاری یا درآمد را فاش نکرد ، تمرکز شرکت بر نظارت درجه یک شرکت نشان می دهد که خود را برای بازار ایمنی AI AI با حاشیه بالا قرار می دهد که تحلیلگران پیش بینی می کنند با سرعت بخشیدن به تصویب AI ، رشد قابل ملاحظه ای دارند.
ارسال پاسخ