More Related Content Similar to Hadoop: MapReduce para procesar grandes cantidades de datos (20) Hadoop: MapReduce para procesar grandes cantidades de datos44. Suposiciones y Objetivos El hardware falla Grandes cantidades de datos Máquinas comunes Mover la computación, no los datos Portabilidad 45. Suposiciones y Objetivos El hardware falla Grandes cantidades de datos Máquinas comunes Mover la computación, no los datos Portabilidad 46. Suposiciones y Objetivos El hardware falla Grandes cantidades de datos Máquinas comunes Mover la computación, no los datos Portabilidad 47. Suposiciones y Objetivos El hardware falla Grandes cantidades de datos Máquinas comunes Mover la computación, no los datos Portabilidad 48. Suposiciones y Objetivos El hardware falla Grandes cantidades de datos Máquinas comunes Mover la computación, no los datos Portabilidad 50. Arquitectura Espacio de nombres único Escribir una vez, leer varias Archivos divididos en bloques Acceso directo a los datos 51. Arquitectura Espacio de nombres único Escribir una vez, leer varias Archivos divididos en bloques Acceso directo a los datos 52. Arquitectura Espacio de nombres único Escribir una vez, leer varias Archivos divididos en bloques Acceso directo a los datos 53. Arquitectura Espacio de nombres único Escribir una vez, leer varias Archivos divididos en bloques Acceso directo a los datos 55. NameNode Controla el espacio de nombres Ficheros <> Bloques Bloques <> DataNodes Configuración de cluster Metadata 75. Job Tracker Cliente Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 76. Job Tracker Cliente Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 77. Job Tracker Cliente Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 78. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 79. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Format ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 80. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 81. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 82. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 83. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 84. Job Tracker Cliente MapTask Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 85. Job Tracker Cliente Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 86. Job Tracker Cliente Task Tracker map Task Tracker sort Input Formar ram split region region split reduce() combine() reduce() read split Output Formar Task Tracker region region Input Files Output File Task Tracker region region 100. Pig Lenguaje de script: PigLatin Nivel de abstracción Operaciones y transformaciones MapReduce Jobs No es SQL 102. Hive Análisis de datos Datos estructurados Query Language (à la SQL) No es un sistema Real Time 104. HBase Base de Datos Distribuida Orientada a columnas Basada en BigTable 108. Libros Hadoop: TheDefinitiveGuideTom White – O’Reilly (Julio 2009)http://oreilly.com/catalog/9780596521998/ Hadoop in ActionChuck Lam y James Warren –Manning (Octubre 2009)http://www.manning.com/lam/ Pro HadoopJason Venner–Apress (No publicado)http://www.apress.com/book/view/1430219424 110. Créditos imágenes Deadlock – Unknown Licensevia reddit: http://www.reddit.com/r/programming/comments/65pcg/deadlock_traffic_version_pic