Tao of Data: چگونه Databricks بهینه سازی خوب AI LLM بدون برچسب داده است
Tao of Data: چگونه Databricks بهینه سازی خوب AI LLM بدون برچسب داده است

Tao of Data: چگونه Databricks بهینه سازی خوب AI LLM بدون برچسب داده است

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


مدل های AI فقط و همچنین داده هایی که برای آموزش یا تنظیم دقیق آنها استفاده می شود ، عملکرد دارند.

داده های دارای برچسب یک عنصر اساسی در یادگیری ماشین (ML) و هوش مصنوعی تولیدی برای بیشتر تاریخ آنها بوده است. داده های دارای برچسب اطلاعاتی است که برای کمک به مدل های هوش مصنوعی در درک زمینه در طول آموزش نشان داده شده است.

از آنجا که شرکت ها برای اجرای برنامه های هوش مصنوعی مسابقه می دهند ، تنگنای پنهان اغلب فناوری نیست-این یک فرآیند ماهانه جمع آوری ، تهیه و برچسب زدن داده های خاص دامنه است. این “مالیات برچسب زدن به داده ها” رهبران فنی را وادار کرده است تا بین تأخیر در استقرار یا پذیرش عملکرد زیر قطبی از مدلهای عمومی انتخاب کنند.

Databricks هدف مستقیم در این چالش است.

این هفته ، این شرکت تحقیقاتی را در مورد رویکرد جدیدی به نام آزمون تطبیقی ​​تطبیقی ​​(TAO) منتشر کرد. ایده اصلی این رویکرد فعال کردن تنظیم مدل زبان بزرگ درجه (LLM) با استفاده از داده های ورودی است که فقط شرکت ها در حال حاضر وجود دارند-هیچ برچسب مورد نیاز-در حالی که به نتیجه می رسند که از هزاران نمونه برچسب زده شده بهتر است. Databricks به عنوان یک فروشنده پلتفرم Data Lakehouse آغاز شد و در سالهای اخیر به طور فزاینده ای روی AI متمرکز شد. Databricks Mosaicml را با قیمت 1.3 میلیارد دلار به دست آورد و به طور پیوسته ابزارهایی را در دست می گیرد که به توسعه دهندگان کمک می کند تامن به سرعت برنامه ها تیم تحقیقات موزاییک در Databricks روش جدید TAO را توسعه داد.

براندون کوی ، رهبر یادگیری تقویت کننده و دانشمند ارشد تحقیقاتی در Databricks به VentureBeat گفت: “دریافت داده های برچسب زده سخت است و برچسب های ضعیف به طور مستقیم منجر به خروجی های ضعیف می شوند ، به همین دلیل آزمایشگاه های مرزی از فروشندگان برچسب زدن به داده ها برای خرید داده های گران قیمت انسانی استفاده می کنند.” “ما می خواهیم با مشتریانی که در آن قرار دارند ملاقات کنیم ، برچسب ها مانعی برای پذیرش شرکت هوش مصنوعی بودند و با تائو دیگر.”

نوآوری فنی: چگونه تائو دوباره تنظیم می کند

در هسته اصلی خود ، تائو پارادایم چگونگی شخصی سازی توسعه دهندگان مدل ها را برای دامنه های خاص تغییر می دهد.

تائو به جای رویکرد تنظیم دقیق ، که به نمونه های ورودی و خروجی زوجی نیاز دارد ، از یادگیری تقویت کننده و اکتشافات سیستماتیک برای بهبود مدل ها با استفاده از تنها نمایش داده های مثال استفاده می کند.

خط لوله فنی از چهار مکانیسم مجزا که در کنسرت کار می کنند استفاده می کند:

تولید پاسخ اکتشافی: این سیستم نمونه های ورودی بدون برچسب را می گیرد و چندین پاسخ بالقوه را برای هر یک با استفاده از تکنیک های پیشرفته مهندسی سریع که فضای راه حل را کشف می کند ، ایجاد می کند.

مدل سازی پاداش کالیبراسیون شرکت: پاسخ های تولید شده توسط مدل پاداش Databricks (DBRM) ارزیابی می شوند ، که به طور خاص برای ارزیابی عملکرد در کارهای شرکت با تأکید بر صحت طراحی شده است.

تقویت بهینه سازی مدل مبتنی بر یادگیری: سپس پارامترهای مدل از طریق یادگیری تقویت شده بهینه می شوند ، که اساساً تدریس می کند مدل برای تولید پاسخ های با امتیاز بالا به طور مستقیم.

داده های مداوم داده های پرواز: از آنجا که کاربران با سیستم مستقر در تعامل هستند ، ورودی های جدید به طور خودکار جمع آوری می شوند و بدون تلاش اضافی برای برچسب زدن انسانی ، یک حلقه خود پیشرفته ایجاد می کنند.

محاسبه زمان آزمون ایده جدیدی نیست. OpenAI از محاسبه زمان آزمایش برای توسعه مدل استدلال O1 استفاده کرد و Deepseek تکنیک های مشابهی را برای آموزش مدل R1 به کار برد. آنچه TAO را از سایر روشهای محاسبات زمان آزمایش متمایز می کند این است که در حالی که در طول آموزش از محاسبات اضافی استفاده می کند ، مدل تنظیم نهایی دارای همان هزینه استنباط است که مدل اصلی است. این یک مزیت مهم برای استقرار تولید است که در آن هزینه های استنتاج با استفاده از آن مقیاس می شود.

CUI توضیح داد: “تائو فقط از محاسبات اضافی به عنوان بخشی از فرایند آموزش استفاده می کند ؛ این هزینه استنباط مدل را پس از آموزش افزایش نمی دهد.” “در دراز مدت ، ما فکر می کنیم تائو و رویکردهای محاسبه زمان آزمایش مانند O1 و R1 مکمل خواهند بود. شما می توانید هر دو را انجام دهید.”

معیارها حاشیه عملکرد غافلگیرکننده نسبت به تنظیم دقیق سنتی را نشان می دهند

تحقیقات Databricks نشان می دهد که تائو فقط با تنظیم دقیق سنتی مطابقت ندارد-از آن فراتر می رود. در میان معیارهای متعدد مرتبط با شرکت ، Databricks ادعا می کند که این رویکرد با وجود استفاده از تلاش بسیار کمتر انسانی ، بهتر است.

در FinanceBench (یک سند مالی پرسش و پاسخ) ، تائو عملکرد LLAMA 3.1 8B را با 24.7 درصد امتیاز و Llama 3.3 70b با 13.4 امتیاز بهبود بخشید. برای نسل SQL با استفاده از معیار پرنده-SQL اقتباس شده با گویش Databricks ، تائو به ترتیب 19.1 و 8.7 امتیاز را بهبود بخشید.

قابل توجه ترین ، Llama 3.3 70B با تنظیم Tao به عملکرد GPT-4O و O3-Mini در این معیارها نزدیک شد-مدل هایی که به طور معمول 10-20 برابر بیشتر برای اجرای محیط های تولید هستند.

این یک گزاره ارزش قانع کننده برای تصمیم گیرندگان فنی ارائه می دهد: امکان استقرار مدل های کوچکتر و مقرون به صرفه تر که نسبت به همتایان حق بیمه خود در کارهای خاص دامنه انجام می شود ، بدون نیاز به هزینه های برچسب زدن گسترده.

TAO مزیت زمان به بازار را برای شرکت ها امکان پذیر می کند

در حالی که TAO با فعال کردن استفاده از مدلهای کوچکتر و کارآمدتر ، مزایای هزینه روشنی را ارائه می دهد ، بیشترین ارزش آن ممکن است در تسریع در زمان به بازار برای ابتکارات هوش مصنوعی باشد.

کوی تأکید کرد: “ما فکر می کنیم تائو شرکت های ارزشمندتر از پول را ذخیره می کند: این باعث صرفه جویی در وقت آنها می شود.” “دریافت داده های دارای برچسب به طور معمول نیاز به عبور از مرزهای سازمانی ، تنظیم فرآیندهای جدید ، گرفتن متخصصان موضوع برای انجام برچسب زدن و تأیید کیفیت دارد. شرکت ها ماه هایی برای تراز کردن چندین واحد تجاری فقط برای نمونه اولیه یک مورد استفاده از هوش مصنوعی ندارند.”

این زمان فشرده سازی یک مزیت استراتژیک ایجاد می کند. به عنوان مثال ، یک شرکت خدمات مالی که یک راه حل تجزیه و تحلیل قرارداد را اجرا می کند می تواند با استفاده از تنها قراردادهای نمونه ، استقرار و تکرار را آغاز کند ، نه اینکه منتظر تیم های حقوقی باشند تا هزاران سند را برچسب گذاری کنند. به طور مشابه ، سازمان های مراقبت های بهداشتی می توانند بدون نیاز به پاسخ های متخصص زوج ، سیستم های پشتیبانی از تصمیم گیری بالینی را با استفاده از فقط پرس و جوهای پزشک بهبود بخشند.

کوی گفت: “محققان ما زمان زیادی را صرف صحبت کردن با مشتریان ، درک چالش های واقعی آنها هنگام ساخت سیستم های هوش مصنوعی و توسعه فن آوری های جدید برای غلبه بر این چالش ها می کنند.” “ما در حال حاضر تائو را در بسیاری از برنامه های سازمانی اعمال می کنیم و به مشتریان کمک می کنیم تا به طور مداوم مدلهای خود را تکرار و بهبود بخشند.”

این برای تصمیم گیرندگان فنی چه معنی دارد

برای شرکت هایی که به دنبال رهبری در تصویب AI هستند ، TAO یک نقطه تورم بالقوه در نحوه استقرار سیستم های AI تخصصی را نشان می دهد. دستیابی به عملکرد با کیفیت بالا و خاص دامنه بدون مجموعه داده های دارای برچسب گسترده ، یکی از مهمترین موانع اجرای گسترده AI را از بین می برد.

این رویکرد به ویژه به نفع سازمانهایی است که دارای سه گانه های غنی از داده های بدون ساختار و الزامات خاص دامنه هستند اما منابع محدودی برای برچسب زدن دستی-دقیقاً موقعیتی که بسیاری از شرکت ها خود را پیدا می کنند.

از آنجا که هوش مصنوعی به طور فزاینده ای برای مزیت رقابتی محوری می شود ، فناوری هایی که زمان را از مفهوم به استقرار فشرده می کنند و در عین حال بهبود همزمان ، رهبران را از Laggards جدا می کند. به نظر می رسد تائو چنین فناوری ای است ، و به طور بالقوه شرکت هایی را قادر می سازد تا بتوانند قابلیت های تخصصی هوش مصنوعی را در هفته ها و نه ماه ها یا محله ها پیاده سازی کنند.

در حال حاضر ، TAO فقط در پلت فرم Databricks موجود است و در پیش نمایش خصوصی است.