یادگیری تقویتی
چندتا ایده در مورد یادگیری تقویتی داشتم که می بایست می نوشتمشون
- اینکه اون عامل هوشمند بتونه با خوندن قسمتهای مختلف متن بفهمه کدومشون مهم هستند و کدومشون مهم نیستند... کدوموشون رو باید گوش بده کدومشون رو نیاز نیست گوش بده...
- اینکه ما انگیزه های درونی و بیرونی داریم که معمولا در یادگیری تقویتی انگیزه های بیرونی مدل میشه... این که ما برنامه داریم برای رسیدن به هدف و رسیدن به یک هدف بزرگتر از رسیده به اهداف کوچکتر تشکیل می شه ....
- شناخت توانایی ها: معمولا توی یادگیری تقویتی می گیم ما عملی رو انجام میدیم تا به یک وضعیت جدید بریم و ارزش وضعیت جدید و یا عمل انجام شده Q(s,a) رو بسنجیم... اما ایده این هست که ما بعضی وقتها می خواهیم خودمون رو بشناسیم اینکه آیا این عمل رو می تونیم انجام بدیم... یا چقدر خوب می تونیم انجام بدیم و با تکرار و سعی و خطا شناختی از تواناییها و اعمالی که خوب بلدیم بدست میاریم... این قضیه هم در اعتماد به نفس ما (نسبت به اعمال خاص) اثر داره و هم در برنامه ریزی و حتی هدف گذاری ما اثر داره چون دامنه اعمال رو هم بهتر مشخص می کنه...
+ نوشته شده در پنجشنبه نوزدهم تیر ۱۳۹۹ ساعت 10:15 توسط بینام
|