Pregunta ¿Es posible reidentificar datos de actividad física de la que se ha eliminado información de salud protegida mediante el uso del aprendizaje automático?
Conclusiones Este estudio transversal utilizó datos de actividad física a nivel nacional pertenecientes a 14 451 individuos de las Encuestas Nacionales de Evaluación sobre Nutrición y Salud de 2003-2004 y 2005-2006. La máquina de vectores de soporte lineal y los bosques aleatorios reidentificaron los datos sobre actividad física a un nivel de 20 minutos de aproximadamente el 80 % de los niños y el 95 % de los adultos.
Significado Las conclusiones de este estudio sugieren que las prácticas actuales para desidentificar los datos sobre actividad física son insuficientes para la privacidad y que la desidentificación debe agregar los datos sobre actividad física de muchas personas para asegurar la privacidad de los individuos.