La digitalización de archivos históricos-artísticos es una necesidad para el humanista ya que los documentos físicos con un soporte como el papel son efímeros, ya que su deterioro es muy elevado y están destinados a perderse. Actualmente los computadores son capaces de almacenar en bases de datos una gran cantidad de archivos.
Esta labor se realiza a través de codificación (parte fundamental para encontrar cualquier archivo), digitalización. Podemos emplear técnicas OCR o crear 'wordclouds' (text mining) para obtener información de los documentos, incluso clasificarlos.
Estamos trabajando en un software que cumpla este propósito, de forma que permita digitalizar y codificar el archivo al completo, facilitando su conservación. Como antes hemos comentado, podemos aplicar desde técnicas de 'data mining' hasta 'machine learning'. Esto aporta a la iniciativa de un potencial enorme, donde se puede obtener un éxodo de datos centralizado, siendo este fuente de todo el conocimiento.
Además nos gusta el modelo 'Open Data' de forma que toda esta digitalización sea accesible a todas las personas y que pueda ser usado para investigaciones o estudios.