گوناگون

سیلیکون‌ولی برای تربیت ایجنت‌های هوش مصنوعی سرمایه‌گذاری می‌کند

سیلیکون‌ولی برای تربیت ایجنت‌های هوش مصنوعی سرمایه‌گذاری می‌کند

شرکت‌ها و سرمایه‌گذاران بزرگ فناوری در آمریکا به‌طور فزاینده‌ای به توسعه محیط‌های یادگیری تقویتی (RL Environments) روی آورده‌اند؛ شبیه‌سازهایی که می‌توانند ایجنت‌های هوش مصنوعی را برای انجام وظایف چندمرحله‌ای و پیچیده آموزش دهند.

به گزارش خبرگزاری ایمنا و به نقل از تک کرانچ، پس از سال‌ها وعده درباره ایجنت‌های هوش مصنوعی که بتوانند به‌طور خودکار نرم‌افزارها را برای انجام کارهای انسانی به کار گیرند، اکنون تمرکز صنعت بر ساخت محیط‌های یادگیری تقویتی قرار گرفته است. این محیط‌ها شبیه‌سازهایی هستند که وظایف واقعی همچون خرید آنلاین یا کار با نرم‌افزارهای سازمانی را بازسازی می‌کنند تا ای جنت‌ها بتوانند در شرایط کنترل‌شده تمرین کنند.

جنیفر لی، شریک سرمایه‌گذاری در Andreessen Horowitz، گفت: همه آزمایشگاه‌های بزرگ AI در حال ساخت محیط‌های RL داخلی هستند، اما به دلیل پیچیدگی بالا، به تأمین‌کنندگان شخص ثالث نیز روی آورده‌اند. این روند موجب شکل‌گیری استارتاپ‌های پرسرمایه‌ای همچون Mechanize Work و Prime Intellect شده است.

شرکت‌های باسابقه برچسب‌گذاری داده همچون Scale AI، Surge و Mercor نیز وارد این حوزه شده‌اند. Surge که سال گذشته ۱.۲ میلیارد دلار درآمد داشت، یک واحد داخلی ویژه برای توسعه محیط‌های RL ایجاد کرده است. Mercor نیز با ارزشی ۱۰ میلیارد دلاری، محیط‌هایی برای حوزه‌های تخصصی همچون کدنویسی، سلامت و حقوق می‌سازد.

برخی استارتاپ‌ها رویکرد متمرکزتری دارند. Mechanize Work با هدف اتوماسیون همه مشاغل در حال حاضر بر محیط‌های RL برای ایجنت‌های کدنویس تمرکز کرده و حتی به مهندسان نرم‌افزار حقوق ۵۰۰ هزار دلاری پیشنهاد می‌دهد. Prime Intellect نیز با حمایت آن دری کارپاتی و Founders Fund، یک «هاب محیط‌های RL» راه‌اندازی کرده تا توسعه‌دهندگان متن‌باز به منابع مشابه آزمایشگاه‌های بزرگ دسترسی داشته باشند.

مزیت این محیط‌ها نسبت به دیتاست‌های ایستا، امکان تعامل ای جنت با ابزارها و اینترنت و دریافت بازخورد لحظه‌ای است. با این حال، چالش‌هایی همچون (هک پاداش) زمانی که مدل برای گرفتن امتیاز، راه میانبر پیدا می‌کند بدون انجام واقعی وظیفه همچنان وجود دارد.

برخی کارشناسان نسبت به مقیاس‌پذیری این روش تردید دارند، اما موفقیت مدل‌هایی مانند o1 از OpenAI و Claude Opus 4 از Anthropic که با RL بهبود یافته‌اند، امیدها را افزایش داده است.

به گفته تحلیلگران، اگر محیط‌های RL بتوانند به‌طور مؤثر مهارت‌های چندمرحله‌ای را به ای جنت‌ها بیاموزند، ممکن است به «Scale AI» بعدی در این حوزه تبدیل شوند و موج جدیدی از پیشرفت‌های هوش مصنوعی را رقم بزنند.

منبع | ایمنا

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا