Archivo diario: 9 de noviembre de 2011

Common Crawl

Lisa Green anuncia en el blog de la Common Crawl Foundation la disponibilidad del nuevo repositorio de datos web indexados mediante crawling. Se trata de información almacenada en Amazón S3 sobre 5.000 millones de páginas web y que puede ser … Sigue leyendo

Publicado en Iniciativas que cambiarán el mundo, Minería de Datos, Patrimonio Común de Innovación | Deja un comentario