Enciclopedia/Diccionario de Psicología y Neurociencias:
ıllı AlphaGo wiki: info, libros pdf y vídeos
- Detalles
- Categoría: PSICOLOGIA (WIKINFO)
AlphaGo
AlphaGo es un programa informático de inteligencia artificial desarrollado por Google DeepMind para jugar al juego de mesa Go. En el mes de octubre de dos mil quince se transformó en la primera máquina de Go en ganar a un jugador profesional de Go sin emplear piedras de handicap en un tablero de 19x19. Se encaró contra el jugador chino Fan Hui 2p en una serie de cinco partidas oficiales, las que AlphaGo ganó, seguidas por unas partidas informales que terminaron tres-dos en favor de la inteligencia artificial. En el mes de marzo de dos mil dieciseis se encaró a de los mejores jugadores, Lee Sedol 9p. El nueve de marzo de dos mil dieciseis, AlphaGo ganó la primera partida de este enfrentamiento. Hasta marzo del dos mil dieciseis, AlphaGo está clasificado número 2 del planeta en el ranking no oficial de Rémi Coulom, con un elo de tres mil seiscientos once hasta julio del dos mil dieciseis. En reconocimiento por vencer a Lee Sedol, AlphaGo fue premiado con un honorario nueve-dan por la Asociación Coreana de Baduk. AlphaZero supera a AlphaGo Zero y otros programas superiores de ajedrez y Shogi tras solo veinticuatro horas de juego. Tras cuatro horas de juegos adquirió un nivel superhumano. AlphaGo se probó en hardware con múltiples números de CPU s y GPU s, que se ejecuta en modo asíncrono o bien distribuido. 2 segundos de tiempo de meditar se da a cada movimiento. El Elo resultante se cuenta a continuación El equipo de AlphaGo publicó un artículo en la gaceta Nature el diecinueve de octubre de dos mil diecisiete, presentando AlphaGo Zero, una versión sin datos humanos y más sólida que cualquier otra versión humana precedente que derrotase al vencedor. Al jugar juegos contra sí mismo, AlphaGo Zero superó la fuerza de AlphaGo Lee en 3 días al ganar cien juegos a 0, alcanzó el nivel de AlphaGo Master en veintiuno días y superó todas y cada una de las versiones precedentes en cuarenta días. El algoritmo de AlphaGo usa una combinación de técnicas de aprendizaje de máquinas y árbol de busca, conjuntadas con una extensa capacitación, tanto desde el juego humano y como del PC. Emplea árbol de busca Monte Carlo, guiada por una «red de valor» y una «red de políticas», las dos incorporadas a través de la tecnología de redes neuronales de aprendizaje profundo. Una cantidad limitada de detección de peculiaridades pre-procesamiento-juego concreto se usa para producir las entradas a las redes neuronales. Las redes neuronales del sistema fueron en un inicio bootstrapeadas desde la experiencia de juego humano. AlphaGo fue entrenado en un inicio para imitar el juego humano, tratando de igualar los movimientos de los jugadores especialistas de juegos históricos registrados, usando una base de datos de cerca de treinta millones de movimientos. En el momento en que había alcanzado un cierto grado de habilidad, era entrenado todavía más siendo llamado a desempeñar un elevado número de partidos contra otras instancias de sí, utilizando aprendizaje por refuerzo para prosperar su juego. AlphaGo ha sido descrito por el jugador de nueve-dan Myungwan Kim como jugar «contra un ser humano» en sus partidos contra Fan Hui El árbitro del partido Toby Manning ha descrito el estilo del programa como «conservador». AlphaGo ha sido ovacionado como un jalón en la investigación de la inteligencia artificial, como Go anteriormente ha sido considerado como un inconveniente bastante difícil en el aprendizaje de máquinas que se aguardaba que este fuera del alcance de la tecnología de la temporada. Toby Manning, el arbitro de AlphaGo contra Fan Hui y Hajin Lee, y el secretario general de la Federación Internacional de Go han dicho que en el futuro, los jugadores de Go van a contar con la ayuda de las computadoras para aprender lo que han hecho mal en los juegos y progresar sus habilidades. Facebook asimismo ha estado trabajando en su sistema de juego de Go, el darkforest, el que asimismo se fundamenta en la combinación de máquina de aprendizaje y busca de árbol. Si bien es un jugador fuerte contra otro programas de computadora de Go, hasta principios de dos mil dieciseis, aún no había vencido a un jugador humano profesional. darkforest ha perdido contra CrazyStone y Zen y se calcula que es de una afín resistencia a CrazyStone y Zen.
búsquedaNo. de CPUNo. de GPURanking de EloAsíncrono404812,151Asíncrono404822,738Asíncrono404842,850Asíncrono404882,890Distribuido12428642,937Distribuido247641123,079Distribuido401,2021763,140Distribuido641,9202803,168