Identificación y análisis de patrones que permitan generar propuestas en el procesamiento de grandes volúmenes de datos de E/S en un sistema de almacenamiento paralelo
Resumen
Año tras año, la implementación de sistemas HPC incrementa a pasos agigantados (Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014) y son utilizados en la construcción de Data Centers, instituciones científicas, e incluso, para propósito general. Las organizaciones que sostienen estos sistemas HPC normalmente recurren al uso de sockets para controlar el flujo de los datos que deben tratar (Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014). Sin embargo, el uso de esta tecnología presenta un gran reto: evitar que los sistemas de lectura/escritura se vean superados por la cantidad de datos que deben pasar a través de ellos, ya que una vez aglomerados, estos datos sin tratar pueden traducirse en retrasos para los distintos procedimientos que las organizaciones necesiten hacer. Es decir, las organizaciones deben evitar los cuellos de botella. Entre las estrategias para superar este problema está el diseño e implementación de sistemas de archivos en busca de organizar los datos que deban ser accedidos y modificados de forma paralela por cada uno de los sockets donde se están ejecutando distintas tareas. Existe una relación directa entre la cantidad de sockets y la complejidad de la operación (Yonggang, Jing, & Renato, 2015). Esto es: el aumento del número de servidores (núcleos de procesamiento) que finalmente influirá en el desempeño del sistema. Sin embargo, otros tipos de cuellos de botella pueden presentarse en la red, causados, entre otros, por el alto tráfico de datos que excede la capacidad del ancho de banda (Bhimj, Bard, Romanu, & Paul, 2016).Finalmente, en los procesos, cuyo número de instrucciones de lectura/escritura pueden suponer un retraso para otros procesos que deben realizarse (Isaila, Garcia Blas, Carretero, Latham, & Ross, 2011). Para hacer frente a las demoras en el acceso y modificación de los datos, se desarrollan herramientas para monitorizar el comportamiento de los sistemas de lectura/escritura en busca de estrategias y soluciones para minimizar el impacto de estos retardos.
Recurso relacionado
https://journal.poligran.edu.co/index.php/wpmis/article/view/1243Colecciones
Estadísticas Google Analytics