برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
عوامل هوش مصنوعی همه عصبانیت هستند ، اما چگونه یکی از آنها به طور خاص در تجزیه و تحلیل ، مرتب سازی و نتیجه گیری از حجم گسترده داده ها متمرکز شده است؟
امروز ، گوگل اعلام کرد که نماینده علوم داده خود ، یک دستیار جدید و رایگان هوش مصنوعی که توسط مدل خود Gemini 2.0 برای خودکار سازی تجزیه و تحلیل داده ها ساخته شده است ، اکنون در کشورهای منتخب و زبان به صورت رایگان در دسترس کاربران 18+ است.
این سرویس از طریق Google Colab ، سرویس هشت ساله این شرکت برای اجرای کد Python Live Online در بالای واحدهای پردازش گرافیکی (GPU) متعلق به غول جستجو و واحدهای پردازش تانسور داخلی خود (TPU) موجود است.
در ابتدا برای آزمایش کنندگان قابل اعتماد در دسامبر سال 2024 راه اندازی شد ، Agent Data Science برای کمک به محققان ، دانشمندان داده و توسعه دهندگان با تولید نوت بوک های کاملاً کاربردی مشتری از توضیحات زبان طبیعی ، همه در مرورگر کاربر ، گردش کار خود را ساده تر می کند.
این گسترش با تلاش های مداوم Google برای ادغام ویژگی های برنامه نویسی AI و علوم داده در COLAB ، با ایجاد به روزرسانی های گذشته مانند کمک کدگذاری AI با کدی ، در ماه مه 2023 اعلام شده است.
همچنین به عنوان نوعی Rejoinder پیشرفته و با تأخیر در تجزیه و تحلیل داده های Advanced Advanced Advanced Advanced Advanced (که قبلاً به عنوان کد مترجم شناخته می شد) عمل می کند ، که اکنون هنگام اجرای GPT-4 در چتپ قرار دارد.
Google Colab چیست؟
Google Colab (کوتاه برای Colaboratory) یک محیط نوت بوک Jupyter مبتنی بر ابر است که کاربران را قادر می سازد کد پایتون را مستقیماً در مرورگر خود بنویسند و اجرا کنند.
Notebook Jupyter یک برنامه وب منبع باز است که کاربران را قادر می سازد اسناد حاوی کد زنده ، معادلات ، تجسم و متن روایت را ایجاد و به اشتراک بگذارند. با سرچشمه از پروژه IPython در سال 2014 ، اکنون بیش از 40 زبان برنامه نویسی از جمله پایتون ، R و جولیا پشتیبانی می کند. این بستر تعاملی به طور گسترده در علوم داده ، تحقیقات و آموزش برای کارهایی مانند تجزیه و تحلیل داده ها ، تجسم و آموزش مفاهیم برنامه نویسی استفاده می شود.
از زمان راه اندازی آن در سال 2017 ، نسخه Google ، Google Colab ، به یکی از پرکاربردترین سیستم عامل برای یادگیری ماشین ، علوم داده و آموزش تبدیل شده است.
همانطور که Ori Abramovsky ، Data Science Lead at Spectralops.io ، که در یک پست متوسط عالی از سال 2023 به تفصیل شرح داده شده است ، سهولت استفاده Colab و دسترسی رایگان به GPU و TPU آن را به گزینه ای برای بسیاری از توسعه دهندگان و محققان تبدیل می کند.
وی خاطرنشان کرد: سد کم ورود ، ادغام یکپارچه با Google Drive ، و پشتیبانی از TPU به تیمش اجازه داد تا هنگام کار روی مدل های AI ، چرخه های تمرینی را به طرز چشمگیری کوتاه کند.
با این حال ، آبراموفسکی همچنین به محدودیت های کلاب ، مانند:
• محدودیت زمان جلسه (مخصوصاً برای کاربران سطح آزاد).
• تخصیص منابع غیرقابل پیش بینی در زمان اوج استفاده
• کمبود ویژگی های مهم، مانند اجرای کارآمد خط لوله و برنامه ریزی پیشرفته.
• از چالش ها حمایت کنید، همانطور که Google گزینه های محدودی برای کمک مستقیم ارائه می دهد.
علیرغم این اشکالات ، آبراموفسکی تأکید کرد که Colab یکی از بهترین راه حل های نوت بوک بدون سرور موجود است – به ویژه در مراحل اولیه یادگیری ماشین و پروژه های تحلیل داده.
ساده سازی تجزیه و تحلیل داده ها با هوش مصنوعی
نماینده علوم داده با از بین بردن نیاز به راه اندازی دستی ، بر روی محیط نوت بوک بدون سرور Colab ساخته می شود.
کاربران با استفاده از Google's Gemini AI ، می توانند اهداف تحلیلی خود را به زبان انگلیسی ساده توصیف کنند (به عنوان مثال ، “تجسم روندها” ، “ “یک مدل پیش بینی را آموزش دهید ،” یا “مقادیر گمشده تمیز”) ، و نماینده در پاسخ به نوت بوک های کاملاً اجرایی COLAB تولید می کند.
این ویژگی های زیر را ارائه می دهد:
• تجزیه و تحلیل خودکار – نوت بوک های کامل و کار را به جای قطعه های کد جدا شده تولید می کند.
• صرفه جویی در وقت – تنظیمات دستی و برنامه نویسی تکراری را از بین می برد.
• همکاری را تقویت می کند -از ویژگی های اشتراک داخلی Colab برای پروژه های مبتنی بر تیم استفاده می کند.
• راه حل های قابل اصلاح را ارائه می دهد – کاربران می توانند کد تولید شده را تنظیم و سفارشی سازی کنند.
در حال حاضر تسریع در تحقیقات علمی در دنیای واقعی
طبق گفته گوگل ، آزمایش کنندگان اولیه هنگام استفاده از عامل علوم داده ، پس انداز قابل توجهی را گزارش کرده اند.
دانشمند آزمایشگاه ملی لارنس برکلی ، که در انتشار گازهای تالاب گرمسیری در تالاب های گرمسیری کار می کند ، تخمین زد که زمان پردازش داده های آنها از یک هفته به پنج دقیقه با استفاده از عامل کاهش یافته است.
این ابزار همچنین در معیارهای صنعت عملکرد خوبی داشته است و در رده چهارم در DABSTEP قرار گرفته است: معیار عامل داده برای استدلال چند مرحله ای در بغل کردن صورت ، پیش از عوامل هوش مصنوعی مانند React (GPT-4.0) ، Deepseek ، Claude 3.5 Haiku و Llama 3.3 70b.
با این حال ، مدل های رقیب O3-Mini و O1 Openai ، و همچنین غزل Claude 3.5 Anthropic ، هر دو از نماینده جدید علوم داده Gemini خارج شدند.
شروع
کاربران می توانند با رعایت این مراحل ، استفاده از Agent Data Science را در Google Colab شروع کنند:
1 یک نوت بوک جدید Colab را باز کنیدبشر
2 یک مجموعه داده بارگذاری کنید (CSV ، JSON و غیره).
3 تجزیه و تحلیل را به زبان طبیعی توصیف کنید با استفاده از پانل جانبی جمینی.
4 نوت بوک تولید شده را اجرا کنید برای دیدن بینش و تجسم.
Google داده های نمونه و ایده های سریع را برای کمک به کاربران در کشف قابلیت های آن ، از جمله:
• بررسی توسعه دهنده پشته – “تجسم محبوب ترین زبان های برنامه نویسی”
• مجموعه داده های گونه عنبیه – “همبستگی پیرسون ، اسپرمن و کندال را محاسبه و تجسم کنید”
• مجموعه داده طبقه بندی شیشه – “یک طبقه بندی کننده جنگلی تصادفی”
هر زمان که یک کاربر بخواهد از عامل جدید Data Science استفاده کند ، آنها باید به COLAB حرکت کنند و روی “File” و سپس “New Notebook in Drive” کلیک کنند و نوت بوک حاصل در حساب Google Drive Cloud خود ذخیره می شود.
استفاده از نسخه ی نمایشی کوتاه من مخلوط تر بود
اعطا می کنم من یک روزنامه نگار فنی و بی پروا هستم و یک دانشمند داده نیستم ، اما استفاده من از نماینده جدید علوم داده Gemini 2.0 در Colab تاکنون کمتر از یکپارچه بوده است.
من پنج پرونده CSV (مقادیر جدا شده کاما ، پرونده های صفحه گسترده استاندارد از اکسل یا برگه) را بارگذاری کردم و از آن پرسیدم “من هر ماه و چهارم برای خدمات خود چقدر هزینه می کنم؟”بشر
نماینده جلوتر رفت و عملیات زیر را انجام داد:
• مجموعه داده های ادغام شده، عدم تناقض تاریخ و شماره حساب.
• داده ها را فیلتر و تمیز کرد، اطمینان از تنها هزینه های مربوطه باقی مانده است.
• معاملات گروهی ماه و چهارم برای محاسبه هزینه ها.
• تجسم تولید شده، مانند نمودارهای خط برای تجزیه و تحلیل روند.
• یافته های خلاصه به یک گزارش واضح و ساخت یافته.
قبل از اجرای ، COLAB پیام تأیید را برانگیخت و به من یادآوری کرد که ممکن است با API های خارجی تعامل داشته باشد.
این کار را خیلی سریع و یکدست در مرورگر ، در عرض چند ثانیه انجام داد. و تماشای آن از طریق تجزیه و تحلیل و برنامه نویسی با توضیحات گام به گام قابل مشاهده در مورد آنچه انجام می داد ، چشمگیر بود.
با این حال ، این در نهایت یک نمودار نادرست ایجاد کرد که فقط یک ماه هزینه ابزار را نشان می داد ، و نتوانست ورق ها را به رسمیت بشناسد ، شامل یک سال کامل است که ماه ها شکسته شده است. وقتی از آن خواستم تجدید نظر کند ، آن را امتحان کرد ، اما در نهایت نتوانست رشته کد صحیح را برای پاسخ به سریع من تولید کند.

من از ابتدا با همان سریع در یک نوت بوک جدید در Google Colab سعی کردم و نتیجه ای به مراتب بهتر و در عین حال عجیب و غریب را به دست آورد.

من مجبور خواهم شد که آن را بیشتر امتحان کنم ، و همانطور که گفتم ، نتیجه اولیه اشتباه ممکن است به دلیل عدم تجربه من در استفاده از ابزارهای علوم داده باشد.
قیمت گذاری Colab و ویژگی های AI
در حالی که Google Colab رایگان باقی مانده است ، کاربرانی که نیاز به قدرت محاسبات اضافی دارند می توانند به برنامه های پرداخت شده ارتقا دهند:
• Colab Pro (9.99 دلار در ماه) – 100 واحد محاسباتی ، GPU های سریعتر ، حافظه بیشتر ، دسترسی ترمینال.
• Colab Pro+ (49.99 دلار در ماه) – 500 واحد محاسباتی ، ارتقاء GPU اولویت ، اجرای پس زمینه.
• شرکت Colab -Google Cloud Integration ، تولید کد دارای هوش مصنوعی.
• شما – 9.99 دلار برای 100 واحد محاسباتی ، 49.99 دلار برای 500 واحد محاسباتی.
علاوه بر عامل علوم داده ، Google در حال گسترش قابلیت های هوش مصنوعی در Colab است.
Google برای بهبود مدل های هوش مصنوعی خود ، درخواست ها ، کد تولید شده و بازخورد کاربر را جمع آوری می کند. در حالی که داده ها تا 18 ماه ذخیره می شوند ، ناشناس است و ممکن است درخواست های حذف همیشه برآورده نشوند. به کاربران توصیه می شود که اطلاعات حساس یا شخصی را ارائه ندهند ، زیرا ممکن است داوران انسانی درخواست های خود را پردازش کنند. علاوه بر این ، کد تولید شده AI باید با دقت مورد بررسی قرار گیرد ، زیرا ممکن است حاوی نادرستی باشد.
بازخورد خوش آمدید
Google کاربران را ترغیب می کند تا از طریق انجمن Discord Google Labs در کانال #Agent Agent ، بازخورد خود را در مورد Agent Data Science ارائه دهند.
با تبدیل شدن به اتوماسیون هوش مصنوعی به یک روند کلیدی در علم داده ، نماینده علوم داده Google در COLAB می تواند به محققان و توسعه دهندگان کمک کند تا بیشتر روی بینش و کمتر در تنظیم برنامه نویسی تمرکز کنند. از آنجا که این ابزار به کاربران و مناطق بیشتری گسترش می یابد ، جالب خواهد بود که ببینیم چگونه آینده تجزیه و تحلیل های کمک شده به AI را شکل می دهد.
ارسال پاسخ