Las empresas modernas producen cada día enormes cantidades de datos. Gracias al procesamiento electrónico de datos (PED), el registro y la organización de la información ya no es un verdadero problema. Los datos de los clientes se pueden registrar en bases de datos y es posible automatizar la gestión del personal. Para ello, basta con proporcionar suficientes datos al ordenador y los sofisticados algoritmos se encargarán del resto.
Pero con la creciente conectividad y el mayor flujo de datos aparecen nuevos problemas. Varios trabajadores tienen que poder acceder a la misma base de datos y, a ser posible, a la vez. No se deben registrar datos repetidos y tienen que poder localizarse en todo momento. Pero, ante todo, tienen que estar protegidos contra las posibles pérdidas causadas por fallos de hardware o un funcionamiento incorrecto, y contra los hackers y otros ladrones de datos en internet. Y, por último, también hay que tener en cuenta los aspectos legales, es decir, los plazos de conservación, el consentimiento informado para el almacenamiento de datos personales y el nombramiento de delegados de protección de datos.
La complejidad de este tema ha motivado el desarrollo de una nueva disciplina dentro del ámbito de la tecnología de la información: la gestión de datos (data management). Asimismo, el campo de la investigación también está progresando en esta materia. La Data Science o ciencia de datos es la nueva rama de la ciencia dedicada, entre otras cosas, a la correcta clasificación y vinculación de los datos, así como a la búsqueda efectiva en bases de datos de gran tamaño.