برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
تیمی از محققان در ارتباطات زوم ، تکنیک دستیابی به موفقیت را ایجاد کرده اند که می تواند هزینه و منابع محاسباتی مورد نیاز برای سیستم های هوش مصنوعی را برای مقابله با مشکلات استدلال پیچیده کاهش دهد ، و به طور بالقوه نحوه استقرار شرکت ها در مقیاس را تغییر می دهد.
این روش ، به نام زنجیره پیش نویس (COD) ، مدل های بزرگ زبان (LLMS) را قادر می سازد تا مشکلات را با حداقل کلمات حل کنند – با استفاده از 7.6 ٪ از متن مورد نیاز روش های فعلی ضمن حفظ یا حتی بهبود دقت. این یافته ها هفته گذشته در مقاله ای در مورد مخزن تحقیق ARXIV منتشر شد.
نویسندگان ، به رهبری سیلی Xu ، محقق در زوم می نویسند: “با كاهش كشتی و تمرکز بر روی بینش های مهم ، مسابقات كد یا پیشی گرفتن از COT (زنجیره ای از فکر) در ضمن استفاده از حداقل 7.6 ٪ از نشانه ها ، به طور قابل توجهی هزینه و تأخیر را در کارهای مختلف استدلال كاهش می دهد.”
چگونه کمتر “کمتر” استدلال هوش مصنوعی را بدون قربانی کردن دقت تغییر می دهد
COD الهام بخش از چگونگی حل انسان مشکلات پیچیده است. افراد به جای بیان هرگونه جزئیات هنگام کار از طریق یک مشکل ریاضی یا معمای منطقی ، معمولاً فقط اطلاعات اساسی را به صورت خلاصه می کنند.
محققان توضیح می دهند: “هنگام حل وظایف پیچیده – خواه مشکلات ریاضی ، تهیه مقاله یا برنامه نویسی – ما اغلب فقط بخش های مهم اطلاعاتی را که به ما در پیشرفت کمک می کنند ، می پردازیم.” “با تقلید از این رفتار ، LLMS می تواند بر پیشبرد راه حل ها بدون سربار استدلال کلامی متمرکز شود.”
این تیم رویکرد خود را بر روی معیارهای بی شماری از جمله استدلال حسابی (GSM8K) ، استدلال عوام (درک تاریخ و درک ورزش) و استدلال نمادین (کارهای تلنگر سکه) آزمایش کرد.
در یک مثال جالب توجه که در آن Claude 3.5 غزه سؤالات مربوط به ورزش را پردازش می کند ، رویکرد COD میانگین خروجی را از 189.4 توکن به تنها 14.3 توکن کاهش می دهد-کاهش 92.4 ٪-در حالی که همزمان دقت را از 93.2 ٪ به 97.3 ٪ بهبود می بخشد.
کاهش هزینه های شرکت AI: پرونده تجارت برای استدلال ماشین مختصر
Ajith Vallath Prabhakar ، محقق AI در تجزیه و تحلیل مقاله می نویسد: “برای یک شرکت پردازش 1 میلیون پرس و جوهای استدلال ماهانه ، COD می تواند هزینه ها را از 3800 دلار (COT) به 760 دلار کاهش دهد و بیش از 3000 دلار در ماه پس انداز کند.”
این تحقیق در یک زمان مهم برای استقرار شرکت هوش مصنوعی شرکت انجام می شود. از آنجا که شرکت ها به طور فزاینده ای سیستم های پیشرفته AI را در عملیات خود ادغام می کنند ، هزینه های محاسباتی و زمان پاسخ به عنوان موانع قابل توجهی برای پذیرش گسترده پدید آمده است.
تکنیک های استدلال پیشرفته فعلی مانند (COT) ، که در سال 2022 معرفی شد ، توانایی AI را به طرز چشمگیری در حل مشکلات پیچیده با شکستن آنها به استدلال گام به گام بهبود بخشیده است. اما این رویکرد توضیحات طولانی ایجاد می کند که منابع محاسباتی قابل توجهی مصرف می کنند و تأخیر پاسخ را افزایش می دهند.
Prabhakar می نویسد: “ماهیت کلامی COT منجر به سربار محاسباتی قابل توجه ، افزایش تأخیر و هزینه های عملیاتی بالاتر می شود.”
آنچه COD را برای شرکت ها قابل توجه می کند ، سادگی اجرای آن است. بر خلاف بسیاری از پیشرفت های هوش مصنوعی که نیاز به آموزش مدل گران قیمت یا تغییرات معماری دارند ، می توان COD را بلافاصله با مدل های موجود از طریق یک اصلاح سریع سریع مستقر کرد.
Prabhakar توضیح می دهد: “سازمان هایی که از COT استفاده می کنند می توانند با یک اصلاح سریع سریع به COD تغییر دهند.”
این تکنیک می تواند به ویژه برای برنامه های حساس به تأخیر مانند پشتیبانی مشتری در زمان واقعی ، هوش مصنوعی موبایل ، ابزارهای آموزشی و خدمات مالی بسیار ارزشمند باشد ، جایی که حتی تأخیرهای کوچک می تواند به طور قابل توجهی بر تجربه کاربر تأثیر بگذارد.
کارشناسان صنعت پیشنهاد می کنند که پیامدهای آن فراتر از صرفه جویی در هزینه است. COD با ایجاد استدلال پیشرفته هوش مصنوعی پیشرفته ، می تواند دسترسی به قابلیت های پیشرفته هوش مصنوعی را برای سازمان های کوچکتر و محیط های محدود شده از منابع دموکراتیک کند.
با ادامه سیستم های هوش مصنوعی ، تکنیک هایی مانند COD تأکید روز افزون بر کارآیی را در کنار قابلیت خام برجسته می کنند. برای شرکت هایی که در منظره AI به سرعت در حال تغییر هستند ، چنین بهینه سازی می تواند به همان اندازه پیشرفت هایی در مدل های اساسی خود ارزشمند باشد.
Prabhakar نتیجه گرفت: “از آنجا که مدل های هوش مصنوعی در حال تکامل هستند ، بهینه سازی کارآیی استدلال به همان اندازه بهبود قابلیت های خام آنها بسیار مهم خواهد بود.”
کد تحقیق و داده ها به صورت عمومی در GitHub در دسترس قرار گرفته است و به سازمانها اجازه می دهد تا رویکرد را با سیستم های هوش مصنوعی خود پیاده سازی و آزمایش کنند.
ارسال پاسخ