Volume 17 : Number 1 : Paper 2

April 2014 HPCLatAm 2013 Special Issue
Title:
Dynamic Scheduling based on Particle Swarm Optimization for Cloud-based Scientific Experiments

Authors and Affiliations:
Elina Pacini, ITIC - UNCuyo University. Also CONICET Mendoza, Mendoza, Argentina
Cristian Mateos, ISISTAN-CONICET - UNICEN University. Also CONICET Tandil, Buenos Aires, Argentina
Carlos García Garino, Universidad Nacional de Cuyo (UNCuyo) Facultad de Ingeniería e ITIC, Centro Universitario, Mendoza, Argentina, 5500

Abstract:
Parameter Sweep Experiments (PSEs) allow scientists to perform simulations by running the
same code with different input data, which results in many CPU-intensive jobs, and hence parallel
computing environments must be used. Within these, Infrastructure as a Service (IaaS)
Clouds offer custom Virtual Machines (VM) that are launched in appropriate hosts available in
a Cloud to handle such jobs. Then, correctly scheduling Cloud hosts is very important and thus
efficient scheduling strategies to appropriately allocate VMs to physical resources must be developed.
Scheduling is however challenging due to its inherent NP-completeness. We describe and
evaluate a Cloud scheduler based on Particle Swarm Optimization (PSO). The main performance
metrics to study are the number of Cloud users that the scheduler is able to successfully serve,
and the total number of created VMs, in online (non-batch) scheduling scenarios. Besides, the
number of intra-Cloud network messages sent are evaluated. Simulated experiments performed
using CloudSim and job data from real scientific problems show that our scheduler achieves
better performance than schedulers based on Random assignment and Genetic Algorithms. We
also study the performance when supplying or not job information to the schedulers, namely a
qualitative indication of job length.

Spanish Abstract:
Los Experimentos de Barrido de Parámetros (PSEs) permiten a los científicos llevar a cabo simulaciones mediante la ejecución de un mismo código con diferentes entradas de datos, lo cual genera una gran cantidad de trabajos intensivos en CPU que para ser ejecutados es necesario utilizar entornos de cómputo paralelos. Un ejemplo de este tipo de entornos son las Infraestructura como un Servicio (IaaS) de Cloud, las cuales ofrecen máquinas virtuales (VM) personalizables que son asignadas a máquinas fí­sicas disponibles para luego ejecutar los trabajos. Además, es importante planificar correctamente la asignación de las máquinas físicas del Cloud, y por lo tanto es necesario implementar estrategias eficientes de planificación para asignar adecuadamente las VMs en las máquinas físicas. Una planificación eficiente constituye un desafío, debido a que es un problema NP-Completo. En este trabajo describimos y evaluamos un planificador Cloud basado en Optimización por Enjambre de Partí­culas (PSO). Las métricas principales de rendimiento a estudiar son el número de usuarios que el planificador es capáz de servir exitosamente y el número total de VMs creadas en un escenario online (no por lotes). Además, en este trabajo se evalúa el número de mensajes enviados a través de la red. Los experimentos son realizados mediante el uso del simulador CloudSim y datos de trabajos de problemas científicos reales. Los resultados muestran que nuestro planificador logra el mejor rendimiento respecto de las métricas estudiadas con respecto a una asignación random y algoritmos genéticos. En este trabajo también evaluamos el rendimiento, a través de las métricas propuestas, cuando se provee al planificador información cualitativa relacionada a la longitud de los trabajos o no se provee la misma.

Keywords:
Parameter Sweep Experiments, Cloud Computing, IaaS, Job Scheduling, Particle Swarm Optimization, Genetic Algorithms

Spanish Keywords:
Computación en la nube, experimentos con barrido de parámetros, algoritmos genéricos, problemas de asignación

Received 2013-09-08, Revised 2014-03-10 , Editor: Carlos García Garino, Marcela Printista
Full paper, 14 pages [ PDF, 286 Kb ]