Using deep neural networks for failure prediction in hard disk drives

Lima, Fernando Dione dos Santos

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/49628

Tipo:	Dissertação
Título:	Using deep neural networks for failure prediction in hard disk drives
Título em inglês:	Using deep neural networks for failure prediction in hard disk drives
Autor(es):	Lima, Fernando Dione dos Santos
Orientador:	Gomes, João Paulo Pordeus
Coorientador:	Machado, Javam de Castro
Palavras-chave:	HDD failure prediction;Deep learning;RUL estimation
Data do documento:	2018
Citação:	LIMA, Fernando Dione dos Santos. Using deep neural networks for failure prediction in hard disk drives. 2018. 78 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2018.
Resumo:	Discos rígidos (HDDs) ainda são a tecnologia de armazenamento mais amplamente utilizada em sistemas de armazenamento de larga escala. Isso se deve principalmente à sua relação custo-benefício em termos de custo por volume de armazenamento. Várias pesquisas foram feitas para propor técnicas de detecção antecipada de falhas para estes dispositivos, visando aumentar a disponibilidade dos sistemas de armazenamento e evitar a perda de dados. A previsão de falhas em tais circunstâncias permitiria a redução dos custos decorrentes do tempo de indisponibilidade desses sistemas por meio de substituições antecipadas dos dispositivos, além da migração de dados para estes novos dispositivos, evitando perdas de dados. Muitas das técnicas propostas até agora realizam principalmente a detecção incipiente de falhas, não permitindo o planejamento adequado de tais tarefas de manutenção. Neste trabalho, apresentamos várias abordagens de estimativa de vida útil remanescente (RUL) para discos rígidos baseados em parâmetros SMART. Tais abordagens incluem duas diferentes modelagens para o problema. A primeira modelagem é a mais tradicional, baseada em regressão e que propicia uma fina granularidade na predição. A outra abordagem possibilita um maior controle sobre a granularidade necessária pelo operador, através de configuração prévia, e consiste na modelagem do problema como uma tarefa de classificação multiclasse, ou multinomial. No contexto do problema de classificação, exploramos também dois aspectos importantes para o problema de estimativa de RUL: a ordinalidade entre classes, e o viés preditivo para classes que indicam um tempo de vida reduzido, quando da ocorrência de classificações errôneas. Isso se dá através da aplicação de uma codificação ajustável para as classes. Todos os modelos propostos são baseados em redes neurais profundas (DNNs). Na avaliação dos modelos, um conjunto de dados proveniente de uma companhia de armazenamento de dados em nuvem, e contendo amostras de 1,697 dispositivos que falharam, foi utilizado. Experimentos mostraram que as abordagens propostas propiciam resultado satisfatórios na modelagem como problema de regressão, onde foi realizada uma análise aplicando métricas desenhadas para tarefas de prognóstico. Na modelagem como problema de classificação tradicional nosso modelo obteve resultados superiores ao modelo concorrente e, no problema de classificação assimétrica, melhora nas métricas que abordam a ordinalidade juntamente com a assimetria.
Abstract:	Hard disk drives (HDDs) are still the most widely used storage technology employed in large-scale storage systems. This is mainly a result of its excellent cost-benefit relation in terms of cost per gigabyte. Several research efforts have been done to propose early failure detection techniques for these devices in order to improve storage systems availability and avoid data loss. Failure prediction in such circumstances would allow for the reduction of downtime costs through anticipated disk replacements, as well as the migration of data to new devices, avoiding data loss. Many of the techniques proposed so far mainly perform incipient failure detection thus not allowing for proper planning of such maintenance tasks. In this work, we present several remaining useful life (RUL) estimation approaches for hard disk drives based on SMART parameters. These approaches include two different modelings of the problem. The first is a traditional regression-based that allows for fine-grained predictions. The other approach allows for a greater control over the granularity needed by the systems operator, through a previous configuration, and consists in the modeling of the problem as a multiclass, or multinomial, classification task. In the context of the classification problem, we also explore two important aspects of the RUL estimation task: the ordinality between classes, and the predictive bias towards classes that indicate a reduced device lifetime, when an incorrect prediction takes place. All models are based on Deep Neural Networks (DNNs). For evaluating the models, a dataset produced by a cloud storage service provider, and including the complete time-series for 1,697 failing devices, was employed. Experiments showed that the proposed methods produced satisfying results in the regression-based task when assessed with metrics well-suited and designed specifically for prognostics tasks. In the modeling as a traditional classification task, our model produced superior results to the baseline model and, in the asymmetric and ordinal classification task, it outperformed baselines in metrics where both ordinality and asymmetry were taken into account.
URI:	http://www.repositorio.ufc.br/handle/riufc/49628
Aparece nas coleções:	DCOMP - Dissertações defendidas na UFC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2018_dis_fdslima.pdf		1,12 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas