Deep learning é somente com imagens ? Estou querendo começar um estudo para fazer algo como jogar sozinho o jogo do dinossauro (google chrome offline) eu ja vi o videos do brasileiro que fez e fiquei curioso de como é feito o processamento... ele tira um print da tela e manda processar ou pega os dados de alguma forma ? Também se alguém puder me dar um rumo também, tipo eu preciso procurar os cactos na tela e ver a distancia com relação ao player ? ou eu processo a imagem como um todo sem precisar identificar os objetos na tela ?
Já fiz um modelo para quebrar captcha e foi somente usando imagens