banner

Notícias

Jan 16, 2024

FracAtlas: um conjunto de dados para classificação, localização e segmentação de fraturas de radiografias musculoesqueléticas

Dados científicos volume 10, número do artigo: 521 (2023) Citar este artigo

2 Altmétrico

Detalhes das métricas

A radiografia digital é um dos padrões mais comuns e econômicos para o diagnóstico de fraturas ósseas. Para tais diagnósticos é necessária intervenção especializada, que é demorada e exige treinamento rigoroso. Com o recente crescimento dos algoritmos de visão computacional, há um aumento de interesse no diagnóstico auxiliado por computador. O desenvolvimento de algoritmos exige grandes conjuntos de dados com anotações adequadas. Os conjuntos de dados de raios-X existentes são pequenos ou carecem de anotação adequada, o que dificulta o desenvolvimento de algoritmos de aprendizado de máquina e a avaliação do desempenho relativo de algoritmos para classificação, localização e segmentação. Apresentamos o FracAtlas, um novo conjunto de dados de exames de raios X com curadoria de imagens coletadas de três grandes hospitais em Bangladesh. Nosso conjunto de dados inclui 4.083 imagens que foram anotadas manualmente para classificação, localização e segmentação de fraturas ósseas com a ajuda de dois radiologistas especialistas e um ortopedista usando a plataforma de rotulagem de código aberto, makesense.ai. São 717 imagens com 922 ocorrências de fraturas. Cada uma das instâncias de fratura possui sua própria máscara e caixa delimitadora, enquanto as varreduras também possuem rótulos globais para tarefas de classificação. Acreditamos que o conjunto de dados será um recurso valioso para pesquisadores interessados ​​em desenvolver e avaliar algoritmos de aprendizado de máquina para diagnóstico de fraturas ósseas.

Houve um aumento na demanda por sistemas de diagnóstico auxiliado por computador (CAD) nas últimas décadas. Além disso, recentemente diferentes campos da ciência médica têm visto um rápido desenvolvimento de processos de automação no diagnóstico, aproveitando grandes conjuntos de dados e algoritmos avançados de aprendizagem automática1,2. Modelos como redes neurais convolucionais (CNN)3, Você só olha uma vez (YOLO)4 e U-NET5 podem alcançar desempenho semelhante ao de um especialista na detecção de anomalias em varreduras de raios-X. O treinamento de tais modelos requer conjuntos de dados grandes e bem anotados6,7,8. É difícil coletar esses dados em hospitais e centros de diagnóstico. O processo de anotação pode ser muito caro, pois requer o envolvimento de vários médicos e radiologistas para obter consenso e remover vieses e erros humanos. Devido à natureza sensível dos dados médicos, também é muito difícil disponibilizar os dados adquiridos para uso público. Resumindo, a criação de tais conjuntos de dados é dispendiosa e demorada2,9.

Alguns dos conjuntos de dados de raios X bem conhecidos que estão disponíveis publicamente e que se concentram em anomalias incluem MURA10, MedPix11, GRAZPEDWRI-DX12, IIEST1, MOST13, VinDr-CXR2, VinDr-SpineXR14 e ChestX-ray1415. Dentre esses conjuntos de dados, o MURA é uma coleção de radiografias musculares esqueléticas 2D com 40.561 imagens de diferentes regiões como cotovelo, dedo, antebraço, mão, úmero, ombro e punho10. Cada imagem é rotulada como 'Normal' ou 'Anormal', o que a torna adequada para tarefas de classificação, porém carece de anotação adequada para localização e segmentação. MedPix é um banco de dados online de exames médicos 2D e 3D de diversas doenças que podem ser filtrados pela palavra-chave “fratura”, resultando em 954 imagens. Essas imagens incluem raios X, imagens reais, ressonância magnética (MRI), tomografia computadorizada (TC) e ultrassonografia. No entanto, o conjunto de dados apresenta problemas como anotações desorganizadas e imagens falsamente rotuladas, bem como algumas imagens de spam. GRAZPEDWRI-DX é um conjunto de dados lançado recentemente, contendo 20.327 exames com anotações para localização coletados de 6.091 pacientes. Embora este seja um conjunto de dados suficientemente grande, abrange apenas fraturas do pulso, omitindo o resto das partes do corpo humano. IIEST é um pequeno conjunto de dados de raios X 2D contendo 217 imagens, das quais 49 são saudáveis, 99 estão fraturadas e 69 são cintilografias ósseas cancerígenas. Este conjunto de dados é muito pequeno e inadequado para atividades de aprendizado de máquina. MOST é um conjunto de dados que contém 4.446 exames de raios X e ressonância magnética rotulados pelo sistema de classificação Kellgren-Lawrence (KL)16 com cinco classes de grau 0 a grau 4 com gravidade crescente de uma para outra. Este conjunto de dados não está mais disponível no domínio público devido à falta de financiamento e encerramento. Também cobre apenas fraturas nas articulações do joelho. VinDr-CXR também é um conjunto de dados publicado recentemente, que contém 18.000 imagens de radiografias de tórax (CXR) com anotação manual para localização. Este conjunto de dados contém amostras de 28 tipos diferentes de doenças e anormalidades torácicas. Embora este seja um bom conjunto de dados para identificar doenças torácicas, não é adequado para identificação de fraturas ósseas. Da mesma forma, o grupo VinDr possui outros conjuntos de dados VinDr-Mammo17, VinDr-SpineXR14 e PediCXR18 que não são adequados para estudo de fraturas por razões semelhantes. ChestX-ray14 é um conjunto de dados para gráficos de rádio contendo 112.000 exames de CXR. Este conjunto de dados também não é adequado para estudo de fraturas ósseas, pois contém apenas amostras de doenças torácicas. Alguns conjuntos de dados proeminentes de radiografias do corpo humano são comparados com o conjunto de dados FracAtlas19 na Tabela 1.

COMPARTILHAR