.fb-comments,.fb-comments span,.fb-comments span iframe[style]{min-width:100%!important;width:100%!important}
O algoritmo da equipe, conhecido como Dreamer, usa experiências anteriores para construir um produto do ambiente planeta. O Dreamer também permite que o robótico realize cálculos de tentativa e erro em um sistema de laptop em oposição ao mundo sério, prevendo possíveis resultados de longo prazo de suas etapas prospectivas. Isso torna possível que ele domine mais rápido do que poderia simplesmente empreender. Quando o robô aprendeu a andar, passou a estudar para se adaptar a casos imprevistos, como resistir a ser derrubado por um adere.
“Ensinar robôs por meio de demonstração e erro é um problema difícil, criado ainda mais pelos longos momentos de treinamento que essa educação exige”, afirma Lerrel Pinto, professor assistente de laptop ou ciência da computação no New York College, que é especializado em robótica e masterização de máquinas. Dreamer demonstra que a descoberta de reforço profundo e os projetos de planetas estão prontos para ensinar aos robôs novas técnicas em um volume de tempo genuinamente menor, afirma ele.
Jonathan Hurst, professor de robótica da Oregon State University, afirma que os resultados, que ainda não foram revisados por pares, deixam claro que “a descoberta de reforço será uma ferramenta fundamental no futuro previsível da controle robótico.”
Retirar o simulador do treinamento robótico tem várias vantagens. O algoritmo pode ser útil para ensinar robôs a estudar habilidades no ambiente real e se adaptar a situações como falhas de componentes, diz Hafner – por exemplo, um robótico pode descobrir vagar com um motor com defeito em apenas uma perna.
A técnica também pode ter grande probabilidade de fatores muito mais desafiadores, como direção autônoma, que precisa de simuladores sofisticados e caros, afirma Stefano Albrecht, professor assistente de inteligência artificial da Universidade de Edimburgo. Uma nova tecnologia de algoritmos de descoberta de reforço poderia “escolher rapidamente no mundo real como a atmosfera funciona”, afirma Albrecht.
Avalie esta postagem
Compartilhar é cuidar!