Toda la investigación arqueológica depende de los datos, y estos datos tienen que tomar forma digital con el fin de ser utilizados en diferentes operaciones de análisis computarizadas. Hoy en día, los datos en el formato informático se utilizan extensivamente en arqueología. Sin embargo, la aceptación de las técnicas informáticas resuelve una parte de los problemas de gestión de datos, y abre mochos de otras nuevos. A pesar de que los datos digitales ya son una realidad de la práctica arqueológica cotidiana, todavía podemos ver vivos los hábitos adquiridos en la aplicación temprana, y sobrellevar sus consecuencias. Esta documentación “asistida por ordenador” produce conjuntos de datos mal estructurados, peor formalizados y completamente aislados, que en la mayoría de los casos no sirven para nada más que replicar digitalmente los viejos cajones llenos de archivos impresos de documentación arqueológica. Cuando tenemos que utilizar este tipo de datos en cualquier proceso explicativo, estas deficiencias emergen como agudamente problemáticas.

En LAQU definimos la Gestión de datos como un campo de investigación amplio, y bajo este nombre de campo abordamos diversas líneas específicas que deberían integrarse en un sistema inclusivo. La información no es conocimiento, pero el conocimiento es imposible sin información. El marco computacional en el que la información y el conocimiento pueden interactuar, es un marco generativo en el cual la gestión de datos y la creación de conocimiento están arraigadas en una misma tarea. Llamamos a este marco Telearchaeology (Barceló, Bogdanovic, Piqué 2004), que representa un conjunto de conceptos, soluciones y herramientas para la integración y la manipulación de los datos heterogéneos distribuidos en la WWW, con el objetivo de generar conocimiento arqueológico. A través de diferentes proyectos de investigación nos centramos en el desarrollo del registro de datos en el trabajo de campo, estructuración de bases de datos, formalización de datos, almacenamiento de datos (data warehousing), integración de datos, ontología y relaciones semánticas, la minería de datos para el descubrimiento de las relaciones significativas, y representación de los datos.