RLHI: Vahvistava oppiminen ihmisten välisestä vuorovaikutuksesta • Ylittää asiantuntijoiden kommentoimat tiedot → oppii todellisista käyttäjien keskusteluista • Kaksi menetelmää: 1. Käyttäjän ohjaamat uudelleenkirjoitukset 2. Käyttäjäpohjaiset palkinnot • Päihittää perustasot personoinnissa, ohjeiden noudattamisessa ja päättelyssä