miércoles, 10 de septiembre de 2008

Programming Collective Intelligence

Este libro realmente me abrió los ojos. Para ser completamente sincero, lo compré casi por accidente. Estaba buscando otros libros de programación, quería tener una copia del K&R, y ya que hacía tiempo que lo estaba usando, quería adentrarme más en el mundo de Python. Entre las recomendaciones de Amazon apareció Collective Intelligence. Por curiosidad entré a ver la descripción y los reviews y me llamó la atención. Terminé agregándolo.

Que grata sorpresa me llevé cuando ya en las primeras páginas el libro me había absorbido completamente. Es maravilloso como encara temas que son complejos de forma simple y práctica, dejando una idea de los conceptos en los que se basa, y dando claros ejemplos de uso.

Si alguna vez se preguntaron como el motor de búsquedas de Google selecciona que páginas mostrar, como AdSense muestra enlaces que son bastante acertados o como Amazon hace sus recomendaciones, realmente van a disfrutar este libro.

El autor comienza con una introducción al tópico del libro para luego las distintas áreas donde se aplica. Se abarcan temas como encontrar grupos con caracteristicas similares(clustering), motores de busqueda y sistemas de ranking(PageRank por ejemplo), optimización por medio de algoritmos genéticos, clasificación de documentos para filtrado de spam, modelos predictivos usando arboles de desición(data mining) y programación genética(programas que crean programas usando algoritmos genéticos).
En todos los temas, se muestran pruebas sobre datos reales, con código incluido(en Python), explicaciones de las APIs para obtener los datasets y todas las instrucciones para empezar a jugar(casi casi un mecano).

Obviamente al cubrir una gran cantidad de temas, no se adentra demasiado en ninguno, pero ya conocerlos y haber visto ejemplos prácticos de uso es una enorme ventaja al momento de encarar un problema y decidir que camino tomar para solucionarlo o tener que investigar más profundamente.

Programming Collective Intelligence es un excelente libro para aquellos interesados en IA, Machine Learning y Data Mining. Cubre temas que hace que empresas como Amazon y Google sean las mejores de su campo(Google gana sus miles de millones solo con publicidad especializada, y las recomendaciones de Amazon son una de las grandes diferencias que tiene con el resto). Estoy muy contento de que forme parte de mi biblioteca.