En este video introducimos Apache Spark como framework para procesar grandes volúmenes de datos. Más concretamente, introducimos la API basada en Dataframes, una abstracción de datos que representa tablas distribuidas. Tras ello, se introducen algunas de las operaciones más frecuentes sobre Dataframes. Sánchez Anguix, V. (2021). Trabajando con Dataframes en Spark. http://hdl.handle.net/10251/167752
3:20 · 2012