چه کسی این ماهی دودی را خریداری کرده است؟ چگونه "نمایندگان AI" اینترنت (و لیست های خرید) را تغییر می دهند | هوش مصنوعی (AI)
AI in the aisle: ‘There are plenty of examples of them making amusing mistakes, such a trying to deliver groceries back to the shop they bought them from.’ Illustration: Observer Design

چه کسی این ماهی دودی را خریداری کرده است؟ چگونه “نمایندگان AI” اینترنت (و لیست های خرید) را تغییر می دهند | هوش مصنوعی (AI)

به گزارش سرویس بین الملل رسانه اخبار تکنولوژی روز دنیا تک فاکس،

من'M تماشای هوش مصنوعی مواد غذایی من را سفارش می دهد. مسلح با لیست خرید من ، هر مورد را در نوار جستجو یک وب سایت سوپر مارکت ها تایپ می کند ، سپس از مکان نما خود برای کلیک استفاده می کند. تماشای آنچه که به نظر می رسد یک شبح دیجیتالی است ، این کار معمولاً دنیوی است به طرز عجیبی تغییر می کند. “آیا مطمئن هستید که فقط یک شخص در هند نیست؟” شوهرم می پرسد ، نگاهی به شانه من.

من در حال امتحان کردن اپراتور ، یک عامل جدید هوش مصنوعی از Openai ، سازنده Chatgpt هستم. ماه گذشته در دسترس کاربران انگلستان قرار گرفت ، یک رابط متن مشابه و لحن مکالمه ای با ChatGPT دارد ، اما به جای اینکه فقط به سؤالات پاسخ دهد ، واقعاً می تواند انجام دادن چیزها – به شرط آنکه شامل پیمایش در یک مرورگر وب باشد.

داغ روی پاشنه مدلهای بزرگ زبان ، مأمورین هوش مصنوعی به عنوان چیز بزرگ بعدی مورد تسویه حساب قرار گرفته اند ، و شما می توانید جذابیت را مشاهده کنید: یک دستیار دیجیتالی که می تواند کارهای عملی را انجام دهد ، قانع کننده تر از آنچه است که فقط می تواند صحبت کند. مشابه با ارائه Openai ، Anthropic قابلیت های “استفاده از رایانه” را به پایان سال گذشته به Claude Chatbot خود معرفی کرد. Perplexity و Google همچنین ویژگی های “عامل” را در دستیاران هوش مصنوعی خود منتشر کرده اند ، با شرکت های بعدی که نمایندگان در حال توسعه وظایف خاص مانند برنامه نویسی یا تحقیق هستند.

بحث در مورد آنچه که دقیقاً به عنوان یک عامل هوش مصنوعی حساب می شود وجود دارد ، اما ایده کلی این است که آنها باید بتوانند با برخی از استقلال اقدامات خود را انجام دهند. مارگارت میچل ، دانشمند ارشد اخلاق در شرکت هوش مصنوعی در آغوش گرفتن چهره می گوید: “به محض اینکه چیزی در خارج از پنجره گپ شروع به اجرای اقدامات کرد ، از این که یک چت بیت به یک عامل تبدیل شده است ، از بین رفته است.”

روزهای اولیه است اکثر نمایندگان در دسترس تجاری با این سلب مسئولیت وجود دارند که هنوز هم آزمایشی هستند – Openai اپراتور را به عنوان “پیش نمایش تحقیق” توصیف می کند – و می توانید نمونه های زیادی از آنها را به صورت آنلاین پیدا کنید که اشتباهات سرگرم کننده ای را انجام می دهند ، مانند خرج کردن 31 دلار برای ده ها تخم مرغ یا تلاش برای تحویل مواد غذایی به مغازه ای که آنها را از آن خریداری کرده اند. بسته به اینکه از چه کسی سؤال می کنید ، نمایندگان فقط اسباب بازی های فنی بیش از حد بعدی یا طلوع آینده هوش مصنوعی هستند که می تواند نیروی کار را لرزاند ، اینترنت را تغییر شکل دهد و نحوه زندگی ما را تغییر دهد.

گری مارکوس ، دانشمند و شکاک در مدلهای بزرگ زبان می گوید: “در اصل ، آنها شگفت انگیز خواهند بود ، زیرا می توانند بسیاری از دلهره ها را خودکار کنند.” “اما من فکر نمی کنم که آنها به زودی با اطمینان کار کنند ، و این تا حدودی یک سرمایه گذاری در اعتیاد به مواد مخدره است.”

من در اپراتور ثبت نام می کنم تا خودم را ببینم. بدون غذا در خانه ، خرید مواد غذایی به نظر می رسد اولین کار خوب است. من درخواست خود را تایپ می کنم و از من می پرسد که آیا یک فروشگاه یا مارک ارجح دارم یا خیر. من به آن می گویم که با هر کدام ارزانترین است. یک پنجره به نظر می رسد که یک مرورگر وب را نشان می دهد و من آن را جستجو می کنم “تحویل مواد غذایی آنلاین در انگلستان”. مکان نما موش اولین نتیجه را انتخاب می کند: Ocado. این شروع به جستجوی موارد درخواست شده من می کند و نتایج را براساس قیمت فیلتر می کند. این محصولات را انتخاب می کند و “اضافه کردن به چرخ دستی” را کلیک می کند.

من از ابتکار عمل اپراتور تحت تأثیر قرار گرفته ام. این سؤال من را با سؤالاتی فلفل نمی دهد ، در عوض وقتی فقط توضیحات مختصری مانند “ماهی قزل آلا” یا “مرغ” داده می شود ، تصمیم اجرایی می گیرید. هنگامی که تخم مرغ را جستجو می کند ، با موفقیت چندین مورد غیر EGG را که به عنوان پیشنهادات ویژه ظاهر می شوند ، پیمایش می کند. لیست من از “چند سبزیجات مختلف” درخواست می کند: این یک سر کلم بروکلی را انتخاب می کند ، سپس می پرسد که آیا چیز دیگری را دوست دارم یا خیر. من به آن می گویم که دو مورد دیگر را انتخاب کنید و این مربوط به هویج و تره فرنگی است – احتمالاً چیزی که خودم را انتخاب کرده ام. جسارت کردم ، من به آن می گویم که “یک درمان شیرین” را اضافه کنید و تماشا کنید زیرا به معنای واقعی کلمه “درمان شیرین” را به نوار جستجو می پردازد. من مطمئن نیستم که چرا 70 ٪ شکلات را انتخاب می کند – مطمئناً ارزانترین گزینه نیست – اما من به آن می گویم که من شکلات تیره را دوست ندارم و آن را برای یک نوار کهکشان تعویض می کند.

توماس دوهمکه ، رئیس Github ، که در حال توسعه یک دستیار برنامه نویسی خودمختار به نام Project Padawan است. عکس: Aliance DPA Picture/Alamy

ما وقتی اپراتور متوجه می شود که اوکادو حداقل هزینه دارد ، به یک ضربه محکم و ناگهانی برخورد کردیم ، بنابراین موارد بیشتری را به لیست اضافه می کنم. سپس وارد ورود به سیستم می شود و نماینده از من وادار می شود که مداخله کنم: در حالی که کاربران می توانند در هر نقطه مرورگر را به دست بگیرند ، OpenAi می گوید اپراتور برای درخواست این موضوع “هنگام ورود اطلاعات حساس به مرورگر ، مانند اعتبار ورود به سیستم یا اطلاعات پرداخت” طراحی شده است. اگرچه اپراتور معمولاً به منظور “دیدن” آنچه انجام می دهد ، تصاویر ثابت را می گیرد ، اما Openai می گوید وقتی کاربر کنترل را کنترل می کند ، این کار را انجام نمی دهد.

در پرداخت ، من با درخواست از اپراتور برای تکمیل پرداخت ، آبها را آزمایش می کنم. با این حال ، هنگامی که با درخواست جزئیات کارت من پاسخ می دهد ، دست و پا زدن را پس می گیرم. من قبلاً اطلاعات پرداخت خود را OpenAi به او داده ام (اپراتور به یک حساب Chatgpt Pro نیاز دارد ، که ماه در ماه 200 دلار هزینه دارد) اما احساس می کنم به اشتراک گذاری این موضوع به طور مستقیم با هوش مصنوعی احساس ناراحتی می کنم. سفارش قرار داده شده ، من منتظر تحویل خود روز بعد هستم. اما این شام را حل نمی کند. من به اپراتور کار جدیدی می دهم: آیا می تواند یک پنیربرگر و تراشه از یک رستوران محلی و دارای رتبه بندی را به من سفارش دهد؟ کد پستی من را درخواست می کند ، سپس وب سایت Deliveroo را بارگیری می کند و “Cheeseburger” را جستجو می کند. باز هم ، هنگامی که باید وارد سیستم شوم ، مکث وجود دارد ، اما همانطور که Deliveroo در حال حاضر جزئیات کارت من را ذخیره کرده است ، اپراتور می تواند مستقیماً به پرداخت بپردازد.

رستوران مورد نظر محلی است و به عنوان یک فروشگاه ماهی و تراشه بسیار دارای امتیاز است. من با یک پنیر قابل قبول و یک کیسه بزرگ تراشه های به سبک Chippy به پایان می رسم. دقیقاً همان چیزی نیست که من تصور می کردم اما نه اشتباه، یا. با این حال ، من فانی می شوم ، وقتی می فهمم که اپراتور از سوار شدن سوار تحویل می شود. من به طرز فجیعی غذای خود را می گیرم و بعد از واقعیت یک نکته سخاوتمندانه اضافه می کنم.

البته ، تماشای اپراتور در عمل نه نقطه صرفه جویی در وقت استفاده از یک عامل هوش مصنوعی را برای کارهای آنلاین شکست می دهد. درعوض ، می توانید در حالی که روی زبانه های دیگر تمرکز می کنید ، آن را در پس زمینه کار کنید. هنگام تهیه این قطعه ، من درخواست دیگری می کنم: آیا می تواند یک مانیکور ژل را در یک سالن محلی برای من رزرو کند؟

اپراتور بیشتر با این کار تلاش می کند. این به سکوی رزرو زیبایی Fresha می رود ، اما وقتی من را وادار به ورود به سیستم می کند ، می بینم که یک هفته را خیلی دیر و بیش از یک ساعت دور از خانه من در شرق لندن انتخاب کرده است. من به این مسائل اشاره می کنم و یک شکاف برای تاریخ مناسب اما در میدان لستر پیدا می کند – هنوز هم فاصله ای از آن فاصله دارد. فقط در این صورت از موقعیت من سؤال می کند ، و من می دانم که نباید این دانش را بین وظایف حفظ کرده باشد. در این مرحله ، من می توانستم قبلاً رزرو خودم را انجام دهم. سرانجام اپراتور یک قرار ملاقات مناسب را پیشنهاد می کند ، اما من این کار را رها می کنم و آن را به عنوان یک پیروزی برای تیم انسانی گچ می کنم.

دستیاران خرید AI در هنگام ورود به وب سایت های سوپر مارکت یا پرداخت آنلاین ، مکث می کنند و نیاز به ورود انسان دارند. عکاسی: مارکو مارک/گتی تصاویر

واضح است که این نسل اول عوامل هوش مصنوعی محدودیت هایی دارد. نیاز به متوقف کردن و ورود به سیستم نیاز به نظارت نسبتاً نظارتی دارد ، اگرچه اپراتور کوکی ها را ذخیره می کند تا به کاربران اجازه دهد در بازدیدهای بعدی به وب سایت ها بمانند (OpenAi می گوید که این امر به نظارت دقیق تری در سایت های “حساس” مانند مشتری یا خدمات مالی نیاز دارد). نتایج ، اگرچه معمولاً دقیق است ، همیشه چیزی نیست که من در ذهن داشته باشم. وقتی مواد غذایی من وارد می شوند ، می فهمم که اپراتور به جای فیله ، ماهی قزل آلا دودی را سفارش داده است و احتمالاً به دلیل یک پیشنهاد ویژه ، ماست دو برابر شده است. این “برخی از کیک های ماهی” را به معنای سه بسته (من فقط یک در نظر داشتم) تفسیر کرد و فقط از عصبانیت خرید شیر شکلات به جای دشت نجات یافت زیرا محصول خارج از آن بود. برای منصفانه بودن در مورد ربات ، من این فرصت را داشتم که سفارش را مرور کنم ، و اگر در بندهای خود خاص تر بودم (“بسته ای از دو فیله ماهی قزل آلا خام”) نتایج بهتری کسب می کردم – اما این مراحل اضافی نیز از تلاش ذخیره شده جلوگیری می کند.

علیرغم نقص های فعلی ، تجربه من با اپراتور مانند یک نگاه اجمالی به چیزهای آینده است. با پیشرفت این سیستم ها و کاهش هزینه ، من به راحتی می توانم ببینم که آنها در زندگی روزمره تعبیه شده اند. شما ممکن است لیست خرید خود را روی یک برنامه بنویسید. چرا این سفارش را نیز نمی دهد؟ مأمورین همچنین به گردش کار فراتر از قلمرو یک دستیار شخصی نفوذ می کنند. سام آلتمن ، رئیس اجرایی اوپای ، پیش بینی کرده است که نمایندگان هوش مصنوعی امسال می توانند “به نیروی کار بپیوندند”.

توسعه دهندگان نرم افزار از جمله پذیرندگان اولیه هستند. بستر برنامه نویسی GitHub اخیراً قابلیت های عامل را به ابزار AI Copilot خود اضافه کرده است. توماس دوهمکه ، مدیرعامل Github ، می گوید که از توسعه دهندگان برای برخی از کمک های خودکار استفاده می شود. تفاوت با عوامل هوش مصنوعی سطح استقلال است. او می گوید: “به جای اینکه فقط یک سؤال بپرسید و پاسخی به شما می دهد ، شما به آن مشکل می دهید و سپس آن مشکل را همراه با کدی که به آن دسترسی دارد تکرار می کند.”

GitHub در حال حاضر روی یک نماینده با استقلال بیشتر کار می کند ، که آن را پروژه Padawan می نامد (الف جنگ ستارگان اصطلاح مراجعه به یک شاگرد جدی). این امر به یک عامل هوش مصنوعی اجازه می دهد تا به جای نیاز به نظارت مداوم ، به صورت ناهمزمان کار کند. یک توسعه دهنده می تواند تیم های نمایندگان را به آنها گزارش دهد و برای بررسی خود کد تولید کند. Dohmke می گوید که او معتقد نیست که شغل توسعه دهندگان در معرض خطر است ، زیرا مهارت های آنها تقاضای فزاینده ای پیدا می کند. وی می گوید: “من استدلال می كنم كه میزان كاری كه AI به بیشتر برنامه نویسان اضافه كرده است ، بالاتر از میزان كاری است كه انجام داده است.” مأمورین همچنین می توانند وظایف برنامه نویسی مانند ساخت یک برنامه را انجام دهند ، در دسترس افراد غیر فنی قرار دارند.

مارگارت میچل از شرکت هوش مصنوعی در آغوش چهره در مورد توسعه عوامل کاملاً خودمختار هشدار می دهد. عکس: Bloomberg/Getty Images

در خارج از توسعه نرم افزار ، Dohmke آینده ای را پیش بینی می کند وقتی همه جارویس شخصی خود را داشته باشند ، AI صحبت کردن در مردبشر نماینده شما عادات شما را یاد می گیرد و به سلیقه شما سفارشی می شود و آن را مفیدتر می کند. او از او برای رزرو تعطیلات برای خانواده خود استفاده می کرد.

با این حال ، هرچه عوامل استقلال بیشتری داشته باشند ، خطرات بیشتری را در خود جای می دهند. میچل ، از بغل کردن چهره ، با همكاری كاغذی در مورد توسعه عوامل کاملاً خودمختار همکاری كرد. او می گوید: “کاملاً خودمختار به این معنی است که کنترل انسان کاملاً تحت تأثیر قرار گرفته است.” یک عامل کاملاً مستقل به جای کار در مرزهای تعیین شده ، می تواند به چیزهایی که شما متوجه نمی شوید یا به روش های غیر منتظره ای رفتار نمی کنید ، دسترسی پیدا کند ، به خصوص اگر بتواند کد خاص خود را بنویسد. اگر یک عامل هوش مصنوعی سفارش شما را اشتباه کند ، کار بزرگی نیست ، اما اگر شروع به اشتراک گذاری اطلاعات شخصی شما با وب سایت های کلاهبرداری یا ارسال محتوای رسانه های اجتماعی وحشتناک تحت نام شما کند ، چه می شود؟ مکانهای کار پرخطر می توانند سناریوهای خطرناک را معرفی کنند: اگر بتواند به یک سیستم فرمان موشکی دسترسی پیدا کند ، چه می شود؟

میچل امیدوار است که تکنسین ها ، قانونگذاران و سیاست گذاران برای کاهش چنین حوادثی ، نگهبانان را تحریک کنند. در حال حاضر ، او پیش بینی می کند که قابلیت های عامل برای کارهای خاص تصفیه تر شود. به زودی ، او می گوید ، ما مأمورین را در تعامل با نمایندگان خواهیم دید – نماینده شما می تواند با من همکاری کند تا جلسه ای را برگزار کند.

این گسترش عوامل می تواند اینترنت را تغییر شکل دهد. در حال حاضر ، اطلاعات زیادی به صورت آنلاین برای زبان انسانی تخصص دارد ، اما اگر AIS به طور فزاینده ای با وب سایت ها در تعامل باشد ، این می تواند تغییر کند. میچل می گوید: “ما می خواهیم اطلاعات بیشتری را از طریق اینترنت مشاهده کنیم که مستقیماً زبان انسانی نیست ، اما اطلاعاتی است که برای یک عامل لازم است که بتواند روی آن عمل کند.”

Dohmke این ایده را تکرار می کند. او معتقد است که مفهوم صفحه اصلی اهمیت خود را از دست می دهد و رابط ها با استفاده از عوامل هوش مصنوعی در ذهن طراحی می شوند. مارک ها ممکن است شروع به رقابت برای توجه هوش مصنوعی نسبت به چشم های انسان کنند.

یک روز ، مأمورین حتی ممکن است از محدوده رایانه فرار کنند. ما می توانیم نمایندگان هوش مصنوعی را در روبات ها مجسم کنیم ، که می تواند دنیایی از کارهای جسمی را برای کمک به آنها باز کند. میچل می گوید: “پیش بینی من این است که ما می خواهیم نمایندگانی را ببینیم که می توانند لباسشویی خود را برای ما انجام دهند و ظروف خود را انجام دهند و ما را صبحانه درست کنند.” “فقط آنها را به سلاح دسترسی ندهید.”