Facebook Kembangkan Algoritma AI yang Belajar Bermain Poker dengan Cepat
Nilai dari setiap tindakan yang diberikan tergantung pada probabilitas itu dipilih. Lebih umum, pada keseluruhan strategi game. Peneliti Facebook mengusulkan ReBeL menawarkan perbaikan.
ReBeL dibangun di atas pekerjaan di mana gagasan tentang kondisi permainan diperluas untuk mencakup kayakinan para agen tentang keadaan mereka, berdasarkan pengetahuan umum dan kebijakan agen lain.
ReBeL melatih dua AI mode, jaringan nilai dan kebijakan untuk stage melalui pembelajaran penguatan game mandiri. Ini menggunakan kedua model untuk pencarian selama bermain sendiri.
Hasilnya, algoritma sederhana dan fleksibel yang diklaim peneliti mampu mengalahkan pemain manusia terbaik di game informasi berskala besar dan dua pemain yang tidak sempurna. Pada tingkat tinggi, ReBeL beroperasi pada bagian kepercayaan publik dibanding dunia.
Editor: Dini Listiyani