Wat misschien wel de volgende grote stap voorwaarts kan worden na R-CNN's, zijn 'capsule networks', zie
deze lezing door Geoffrey Hinton (
samenvatting). Voor objectherkenning zou het een belangrijke vooruitgang kunnen betekenen, maar grappig genoeg maakt de objectherkenning die wij willen doen juist gebruik van het 'gebrek' van R-CNN's, omdat we *alleen* kopjes onder een bepaalde hoek willen selecteren en niet verder willen generaliseren.