Extracción manual o automática. El proceso de extracción de los componentes de la página puede realizarse en forma manual por un usuario, o ser configurado para que en forma automática busque las páginas y realice el proceso de extracción de los componentes.
En caso de ser configurado para que se realice en forma automática, el sistema realiza una búsqueda en los directorios configurados, al encontrar una página la abre y realiza la extracción de los componentes de la misma, una vez realizado el proceso cierra la página y realiza una nueva búsqueda.
Sincronización con SD Arc SQL. La extracción y almacenamiento de los distintos objetos de la página se realiza utilizando determinados criterios de nombrado, de manera que después puedan ser utilizados y relacionados por el Sistema de Archivo SD-Arc-SQL
Clasificación de los elementos para la extracción. En el proceso de extracción el sistema analiza los objetos de la página buscando textos e imágenes, en el caso de encontrar cuadros de texto, verifica los objetos a los que esta relacionado, almacenando todos los cuadros de texto relacionados como una única nota, estableciendo el título, el copete y el cuerpo principal del texto.
De existir una relación entre los cuadros de texto y algún cuadro de imagen, exporta la imagen y en el archivo generado para almacenar el texto inserta una línea informando la o las imágenes que el texto tiene relacionadas.
Clasificación de las imagenes. En el caso de las imágenes verifica el tipo de la misma, chequeando si corresponde a una foto, una publicidad o una infografía. Luego de esto busca, en directorios preestablecidos, la imagen de alta calidad que corresponde con este grafico. El sistema permite configurar múltiples directorios de búsqueda para cada tipo de gráfico, buscando en todos los directorios establecidos.