سیلیکونولی برای تربیت ایجنتهای هوش مصنوعی سرمایهگذاری میکند
سیلیکونولی برای تربیت ایجنتهای هوش مصنوعی سرمایهگذاری میکند
شرکتها و سرمایهگذاران بزرگ فناوری در آمریکا بهطور فزایندهای به توسعه محیطهای یادگیری تقویتی (RL Environments) روی آوردهاند؛ شبیهسازهایی که میتوانند ایجنتهای هوش مصنوعی را برای انجام وظایف چندمرحلهای و پیچیده آموزش دهند.
به گزارش خبرگزاری ایمنا و به نقل از تک کرانچ، پس از سالها وعده درباره ایجنتهای هوش مصنوعی که بتوانند بهطور خودکار نرمافزارها را برای انجام کارهای انسانی به کار گیرند، اکنون تمرکز صنعت بر ساخت محیطهای یادگیری تقویتی قرار گرفته است. این محیطها شبیهسازهایی هستند که وظایف واقعی همچون خرید آنلاین یا کار با نرمافزارهای سازمانی را بازسازی میکنند تا ای جنتها بتوانند در شرایط کنترلشده تمرین کنند.
جنیفر لی، شریک سرمایهگذاری در Andreessen Horowitz، گفت: همه آزمایشگاههای بزرگ AI در حال ساخت محیطهای RL داخلی هستند، اما به دلیل پیچیدگی بالا، به تأمینکنندگان شخص ثالث نیز روی آوردهاند. این روند موجب شکلگیری استارتاپهای پرسرمایهای همچون Mechanize Work و Prime Intellect شده است.
شرکتهای باسابقه برچسبگذاری داده همچون Scale AI، Surge و Mercor نیز وارد این حوزه شدهاند. Surge که سال گذشته ۱.۲ میلیارد دلار درآمد داشت، یک واحد داخلی ویژه برای توسعه محیطهای RL ایجاد کرده است. Mercor نیز با ارزشی ۱۰ میلیارد دلاری، محیطهایی برای حوزههای تخصصی همچون کدنویسی، سلامت و حقوق میسازد.
برخی استارتاپها رویکرد متمرکزتری دارند. Mechanize Work با هدف اتوماسیون همه مشاغل در حال حاضر بر محیطهای RL برای ایجنتهای کدنویس تمرکز کرده و حتی به مهندسان نرمافزار حقوق ۵۰۰ هزار دلاری پیشنهاد میدهد. Prime Intellect نیز با حمایت آن دری کارپاتی و Founders Fund، یک «هاب محیطهای RL» راهاندازی کرده تا توسعهدهندگان متنباز به منابع مشابه آزمایشگاههای بزرگ دسترسی داشته باشند.
مزیت این محیطها نسبت به دیتاستهای ایستا، امکان تعامل ای جنت با ابزارها و اینترنت و دریافت بازخورد لحظهای است. با این حال، چالشهایی همچون (هک پاداش) زمانی که مدل برای گرفتن امتیاز، راه میانبر پیدا میکند بدون انجام واقعی وظیفه همچنان وجود دارد.
برخی کارشناسان نسبت به مقیاسپذیری این روش تردید دارند، اما موفقیت مدلهایی مانند o1 از OpenAI و Claude Opus 4 از Anthropic که با RL بهبود یافتهاند، امیدها را افزایش داده است.
به گفته تحلیلگران، اگر محیطهای RL بتوانند بهطور مؤثر مهارتهای چندمرحلهای را به ای جنتها بیاموزند، ممکن است به «Scale AI» بعدی در این حوزه تبدیل شوند و موج جدیدی از پیشرفتهای هوش مصنوعی را رقم بزنند.
منبع | ایمنا