¿Digitalización? Hablemos

Deja un comentario

Eugènia Serra
Responsable de Coordinación General, Biblioteca de Catalunya
eserra@bnc.cat

Introducción

Digitalización, bibliotecas y colecciones digitales, preservación digital, repositorios o depósitos digitales… son términos que en poco tiempo han pasado a formar parte del lenguaje cotidiano de las bibliotecas, archivos, instituciones culturales y también de las empresas de servicios que intentan ampliar su cuota de mercado o reconducir su negocio.

Como ocurre a menudo cuando surge una nueva oportunidad, todos nos volcamos si los recursos lo permiten, con el afán —inherente a las bibliotecas— de difundir el conocimiento, la información, el patrimonio, la investigación, la cultura; en los últimos años, quien más quien menos, individual o colectivamente, ha iniciado alguna actividad de digitalización. Digitalizar es todavía un signo de modernidad e innovación y todos nos esforzamos en hacer visible que lo estamos haciendo. En realidad, la situación ideal sería que tuviéramos que hablar menos de ello, lo que denotaría que se habría convertido en una actividad normal incorporada a nuestra dinámica diaria, tanto a nivel de prioridades, como de procesos y recursos.

Es habitual arriesgar en la toma de decisiones, poner en marcha iniciativas dirigidas a la digitalización de nuestros fondos ha sido necesario como una manera rápida de demostrar lo que somos capaces de hacer y lograr así más financiación; esto no es negativo puesto que a veces es conveniente tirarse a la piscina —no vacía pero sí medio llena—; pero el caso es que, hasta cierto punto, hemos empezado la casa por el tejado. Al impulsar un nuevo servicio, actividad o iniciativa, es preciso que una vez superada la fase inicial, nos paremos, tomemos distancia, reflexionemos y fijemos unos pilares sólidos y sostenibles para continuar; una situación como la actual, con presupuestos disminuidos, proporciona la ocasión para hacerlo.

Seguir leyendo…

Digitalizar la biblioteca personal, una nueva tendencia

Deja un comentario

  • En Japón, Fujitsu ha doblado las ventas de escáneres de doble hoja.
  • Comunidades en Internet explican cómo fabricar un escáner que no obligue a cortar las páginas del libro

La salida de los lib ros electrónicos no supone únicamente la aparición de un nuevo mercado editorial. En Japón se está imponiendo el hábito de digitalizar la biblioteca doméstica. Esta práctica ya tiene nombre: jisui (cocinar tu propia comida) y está empujando tanto la venta de humildes cutters como la de escáneres de última generación que permiten digitalizar en un único proceso las dos páginas de una misma hoja. En junio, la empresa Macromill hizo una encuesta en Japón entre 300 propietarios de un iPad y encontró que el 20% habían digitalizado alguno de los libros que tenían en casa y un 30% estaba pensando en hacerlo. Esta conversión digital acostumbra a hacerse sobre libros gruesos y que carecen de versión electrónica.

Esta tendencia ha influído en la venta de productos relacionados con ella. Fujitsu ha admitido que la venta de sus escáneres dúplex, de doble página, se doblaron en junio con respecto al mes anterior. Fujitsu, por ejemplo,tiene en el mercado escáneres de doble hoja que trabajan a una velocidad de 18 páginas por minuto. Amazon ha detectado un incremento similar que también afecta a cortadoras de papel. La red de tiendas japonesa Yodobashi Camera ha instalado en una de ellas un espacio para adiestrar a sus clientes sobre cómo digitalizar los libros caseros.

Según Mainichi Daily News, la empresa Jissen especializada en cortar libros tiene una demanda de mil a 1.500 títulos diarios. En el pasado, las peticiones procedían de clientes masculinos y para obras especializadas, ahora se ha incrementado la clientela femenina y para obras literarias. Algunas empresas ya ofrecen el servicio completo de digitalización amparándose en el derecho a la copia privada de una obra adquirida legalmente, aunque las compañías editoras consideran que comercializar este servicio va más allá del derecho reconocido a la copia privada.

El problema es que algunas soluciones para digitalizar los libros destroza el original en papel. Sin embargo, ya hay fórmulas para salvaguardar la integridad del original. Bookliberator, un caso, propone una urna en la que se desposita el libro con las hojas abierta en un ángulo de 90 grados. Una cámara recoge la imagen de las dos páginas visibles. El único inconveniente es que el cliente debe abrir la urna cada vez que desea pasar hoja. El Bookreader de Plustek es otra de las alternativas existentes. Su escáner ha recurrido a una tapa regulable en altura que no impide colocar el libro abierto porque el lomo es un problema.

No es de extrañar que sea un profesor japonés, Masatoshi Ishikawa, de la Universidad de Tokio, quien haya diseñado un artilugio para escanear un libro en apenas un minuto. Según Gizmodo, “la lente es capaz de captar 500 imágenes por segundo a una resolución de 1280×1024 píxeles, un segundo sistema proporciona iluminación suficiente como para captar las letras y los dibujos presentes en la página, al mismo tiempo un láser proyecta unas líneas que sirven para establecer cuáles serían los renglones-patrón que seguirían los párrafos y finalmente un ordenador reconstruye tridimensionalmente la página”. El problema, por ahora, es la gran dimensión de la máquina. En Internet ya ha nacido una comunidad de personas que han creado sus propias soluciones para escanear libros sin maltratarlos.

Tomado de Asociación Española de Empresas de Consultoría

Digitalización certificada en España

Deja un comentario

Las siguientes líneas se refieren a la iniciativa de digitalización certificada emprendida en España. Aunque corresponde a una realidad específica, es valioso conocer todo tipo de experiencias. La nota se divide en tres partes: introducción, casos exitosos y algunos cuestionamientos sobre su funcionalidad real.

Tomado de “Gestión Documental para Gente (Casi) Normal

——————————————————————————————–

Digitalización certificada

Por Fernando Moreno Torres

Parte 1: Introducción

Desde la primera vez que oí comentar, hace ya bastante tiempo, que las empresas podrían destruir sus facturas en papel y sustituirlas por una imagen escaneada del documento mi relación con la digitalización certificada se ha movido entre el amor y el odio, entre la alegría y la decepción, según pasaba el tiempo y comprobaba que los legisladores españoles no están a la altura y que la modernización de las empresas e Instituciones todavía tiene un largo camino por delante, a remolque de una legislación que no avanza a la velocidad deseable.

Como no quiero dar un discurso pesimista y mucho menos la sensación de que estoy en contra de una medida que va en la dirección adecuada, es decir, la modernización de las empresas, la agilización de los trámites, la reducción de la burocracia… todo ello con el inexcusable fin de mejorar la productividad de nuestro maltratado país, he decidido dividir este interesante asunto en tres entradas: una de introducción (ésta), otra con los argumentos a favor y otra con las consideraciones negativas, no de la idea, que es perfecta, sino de la ejecución, la legislación y la dura realidad.

El problema, como tantas veces, es que una idea magnífica y esperada por “todos” se ha llevado a la práctica, esto es, se ha “reglamentado”, muy mal. Y los errores son de tal calibre que han malogrado el resultado final. De momento. Porque estoy convencido de que antes o después la “oficina sin papeles” triunfará, la firma electrónica se impondrá y la aceptarán incluso los jueces (que en estos temas avanzan, cuando lo hacen, tan desesperadamente lentos) y hablaremos de esta época de transición como algo pasajero.

Parte 2: Casos de éxito

Empecemos por el principio: escanear papeles    más o menos formales, en este caso facturas        recibidas, guardarlos de una forma segura y      destruirlos a continuación es el sueño de todos los que nos dedicamos a la gestión documental. Y de muchos contables y administrativos que viven bajo un mar de papeles. Por no hablar de las empresas de un tamaño importante que necesitan, literalmente, almacenes para guardar estas montañas de papeles que, para más inri, tienen muy poco valor una vez “contabilizados” los datos.

Para conseguir este objetivo, el camino es bien conocido:

1.- Instalar un programa homologado por la agencia tributaria, y un escáner.

2.- Cada cierto tiempo, o día a día, se escanean las facturas en papel recibidas de los proveedores, se introducen sus datos “básicos” en el programa y se firman digitalmente (tanto la imagen obtenida como los datos). Ambos se almacenan en el sistema de gestión documental “incluido” en el programa homologado.

3.- Ya se pueden destruir las facturas en papel.

4.- En caso de inspección fiscal el funcionario podrá acceder a cualquier factura a través del sistema, a partir de cualquiera de sus datos significativos.

Hay varios puntos “oscuros” que trataré en la entrada siguiente, pero lo importante es que podemos mejorar la eficacia del sistema, es decir, reducir el tiempo empleado en el proceso, con una “técnica” bien conocida: un OCR (optical character recognition, o reconocimiento óptico de caracteres). El “cuello de botella”, el paso más lento del proceso, es la introducción de los datos de cada factura (una exigencia inexplicable, como luego comentaré). Por este motivo es clave para el éxito de la implantación que el sistema automatice lo más posible este paso, lo que se puede conseguir con un buen OCR, a ser posible, zonal. Veámoslo con más detalle, porque los detalles importan, sobre todo cuando vamos a repetir un proceso miles de veces.

Mientras que el escaneado de una factura es un proceso sencillo y rápido y la gestión de una base de datos de miles de documentos es un problema resuelto, la introducción “manual” del número de factura, fecha, proveedor… es un proceso lento y laborioso. Un OCR zonal permite definir áreas del documento en las que “esperamos” encontrar determinados datos de forma que el programa asignará los valores “leídos” a los campos predefinidos. El problema es que tenemos que definir una plantilla para cada proveedor, por lo que el sistema es más “rentable” cuanto mayor es el número de facturas de un mismo tipo (proveedor) que tenemos. Y, por supuesto, la calidad del OCR, el nivel de acierto al “reconocer” los números y letras, es clave para que los datos que se rellenan automáticamente sean correctos y eviten un tratamiento manual.

Otro posible paso “conflictivo” de cara a agilizar el proceso completo es la firma digital, lo que resuelven los mejores programas permitiendo el firmado “por lotes”, por lo que el tiempo asociado a este paso se reduce enormemente.

Así que el “caso de éxito” ideal es:

Una empresa con un número elevado de facturas, del menor número de proveedores posible, con un programa de digitalización que incluya un OCR zonal (o con una tecnología similar) con un grado de acierto muy elevado y automatice la firma digital por lotes.

Si su empresa (o Administración) encaja en este perfil, enhorabuena, es candidata a instalar uno de estos programas y ahorrar mucho tiempo, y espacio, en el archivado de sus facturas de proveedores. Y estos casos se dan y están funcionando hoy, lo que sin duda es una gran noticia.

Parte 3: ¿Realmente funciona?

Ahora vamos con las malas noticias: los sistemas de digitalización certificada no se están instalando al ritmo deseado (más bien al contrario). Y la culpa es el absurdo reglamento, una legislación que ha desarrollado tan mal la idea inicial, muy buena, que la ha arruinado. Como dirían los técnicos, no se recoge el “espíritu de la ley” que era (a mi modesto entender) facilitar la gestión de las facturas recibidas, agilizar su tratamiento, reducir las necesidades de archivo de papel y, en suma, mejorar la productividad de las empresas. Lo que han hecho, en la práctica, es poner tantas trabas al proceso de digitalización que más bien parecen que quieren frenarlo.

¿Queremos avanzar en la e-Administración? Parece que los legisladores no. Otra cosa es saber si lo hacen conscientemente, o son unos incompetentes inconscientes.

Hay algunos problemas que no podemos “achacar” a la norma, pero sí que hay un par de errores incomprensibles que deberían corregirse ya, si es que el Legislador quiere que avancemos, que a veces hay que preguntárselo.

El principal error, el gran error, es la injustificable exigencia de la introducción de los datos significativos de las facturas como parte del proceso. Los escáneres son capaces de digitalizar una factura en, literalmente, un segundo. Pero introducir los datos “alfanuméricos”: número de factura, fecha, proveedor… es un proceso manual muy lento, y muy propicio a cometer errores. Es un auténtico cuello de botella. Y la pregunta que todos nos hacemos es ¿por qué se exige esta información “estructurada”?

Parece que el legislador tiene una respuesta adecuada: “Es para poder localizar las facturas de una forma rápida en caso de inspección”. El día que tuvo esta ocurrencia, este hábil funcionario debió quedarse descansando. ¡Qué gran idea! Les pido a las empresas un pequeño esfuerzo adicional y conseguimos una base de datos documental perfectamente accesible. La cuadratura del círculo.

Pero porqué le pide a un “archivo documental” en formato electrónico más que a su equivalente en papel. Que yo sepa las carpetas donde se guardan las facturas en papel no tienen un sistema de búsqueda incorporado. Normalmente las empresas guardan las facturas en papel en orden cronológico, numeradas correlativamente. Y, cuando necesitan localizar una, acuden a su programa de contabilidad, que para eso está. ¿Quizás el legislador olvida que todas las empresas que se precien disponen de un programa de contabilidad, o ERP? , y seguro que las que quieren digitalizar las facturas están en este grupo.

¿Para qué meter los datos, de nuevo, en el software de digitalización? Meterlos en la contabilidad, vale. Los necesito para gestionar pagos, deudas, liquidar el IVA o el Impuesto de Sociedades. Para mil usos muy, muy importantes. ¡Pero meterlos de nuevo para localizar una factura en una hipotética inspección! Es una aberración. Es una duplicidad absurda. Es, además, innecesario, porque puedo localizar la factura, a partir de sus datos, en mi programa de contabilidad y, ya con el número y la fecha, buscarla en mi archivo digital, o en papel, fácilmente.

¿Por qué, en resumen, se le pide mucho más al archivo electrónico que al papel?

Es un error garrafal que alguien debería corregir. No digo que haya que suavizar las medidas de seguridad para facilitar la implantación de la administración electrónica, pero al menos no le pongamos trabas.

Hay, todavía, un par de errores o carencias más. ¿Sabías que la validez de estas facturas digitalizadas se reduce al ámbito fiscal? La factura electrónica no tiene validez para un juez, no es un documento válido en el caso de tener un problema judicial. Los jueces van muy por detrás de los inspectores de Hacienda (no olvidemos que en este país lo único que funciona bien es la recaudación, ya sea de impuestos, multas, seguridad social…).

Es decir, que las facturas en papel que destruiste hace 4 años las puedes echar de menos si tienes un problema con un proveedor. Si él lleva ante al juez una copia (falsa o no) en papel y tú un ordenador con la factura digitalizada, la prueba válida es la suya. Alguien debería coordinar estos dos Ministerios (ya sé que es pedir demasiado, pero al menos lo intento).

Y, por último, hay una carencia que es un clamor: ¿por qué se reduce el procedimiento a facturas? Hay que ampliarlo a contratos, certificados, informes… en definitiva, lo que queremos es destruir todo (o casi todo) el papel de las empresas, ¡no solo las facturas!

En resumen, vamos en la dirección correcta, pero lentamente. Y algunos se dedican a poner piedras en el camino.

Muerte por celulosa

Deja un comentario

Video promocional para un programa de gestión documental contable.

Tomado de Archivística.net

24.000 documentos ticos de agronomía en Google

4 comentarios

2418784_0PROYECTO PIONERO DE DIGITALIZACIÓN DE LIBROS Y REVISTAS DEL IICA Y EL CATIE

Biblioteca global ofrece más de 16.320 tesis y 7.200 libros ticos en su web

Inversión de este proyecto asciende a los $670.000; es decir, ¢380 millones

ALEJANDRA VARGAS M

Veinticuatro mil libros y revistas de agronomía que pertenecen a dos bibliotecas costarricenses están ahora disponibles desde cualquier parte del mundo en español al alcance de un clic.

Este mes, la biblioteca digital de Google enhttp://books.google.co.cr incorporó en su oferta a 24.000 documentos que hablan de política agrícola y forestal, así como de comercialización agropecuaria, sanidad e inocuidad de los alimentos. También puso en línea libros y revistas sobre tecnología e innovaciones agropecuarias y agroforestales.

Todos estos materiales pertenecen a las bibliotecas del Instituto Interamericano de Cooperación para la Agricultura (IICA) y del Centro Agronómico Tropical de Investigación y Enseñanza (Catie). La primera tiene su sede en San Isidro, Coronado, y el Catie, en Turrialba.

Federico Sancho, jefe de Documentación y Publicaciones del IICA, precisó que del total de documentos que fueron digitalizados un 30% son libros; es decir, unos 7.200 volúmenes.

Entre ellos destacan libros de autores nacionales como Introducción a la fitopatología , del profesor de la Universidad de Costa Rica (UCR), Luis Carlos González; Química de suelos, del catedrático Elemer Bornemisza, y Botánica de los cultivos tropicales , del científico Jorge León.

Además, cerca del 68% es lo que se conoce como literatura gris. Esto incluye más de 16.320 tesis, conferencias y memorias de actividades varias realizadas por estudiantes y expertos de ambas academias.

El restante 2% son revistas, entre ellas los 200 volúmenes de la revistaTurrialba –de agricultura tropical– y los otros 200 de la revistaDesarrollo Rural .

Trascendencia. “El IICA es el primer socio de Google en América Latina en digitalizar su archivo histórico, que es no de los más grandes que existen en la región”, dijo Federico Sancho, jefe de documentación y Publicaciones de IICA.2418785_0

“Por nuestra cuenta nosotros habríamos tenido la capacidad de digitalizar apenas unos 400 documentos al año. Esto significa que esta misma iniciativa de digitalización de nuestros libros y revistas nos habría tomado unos 62 años. De allí la importancia de la alianza con Google”, agregó Sancho.

Por su parte, Mark Nelson, gerente de Socios Estratégicos de Google reconoció a La Nación : “La incorporación de libros y documentos procedentes de IICA y Catie en Google hace más relevante nuestro índice para las búsquedas de los usuarios”.

Agregó: “Trabajar con afiliados ticos nos permite avanzar más hacia el objetivo central de la empresa Google, que es organizar la información mundial para que sea universalmente accesible y útil”.

¿Cómo se hizo? Para lograr la digitalización del material lo primero que se hizo fue el convenio en el cual Google se comprometía a asumir los gastos de digitalización.

Este es un aporte muy significativo. La digitalización de una sola página de un libro o una tesis cuesta unos 10 centavos de dólar (unos ¢58). Eso significa que si el documento tiene más de 200 páginas el costo es de unos $25 (o ¢14.500). “En principio, no parece tanto dinero, pero cuando se habla de una colección de 25.000 documentos sí pesa”, dijo Federico Sancho, quien sugiere que solamente digitalizar este material costó unos $625.000

2418786_0El siguiente paso fue seleccionar el material de ambas bibliotecas sobre las cuales se tienen los derechos de autor y empacar esos libros –con toda precaución– en cajas para enviarlas en avión a lasede de Google en California.

Enviar esas cajas con libros y documentos costó unos $24.000 que fueron financiados por Google. El retorno de todo este material al país también vale $24.000 y esto fue pagado por el IICA.

Tomado de La Nación, Aldea Global, Costa Rica

Internautas ayudan a digitalizar miles de libros respondiendo a acertijos

1 comentario

Internautas a quienes se pide que resuelvan crucigramas con palabras distorsionadas para poder entrar en portales como Facebook están ayudando, sin saberlo, a compañías como New York Times Co. a convertir viejos artículos de la prensa al formato digital.
Agencias – Sin que los internautas lo adviertan, los científicos se están valiendo de millones de ellos por todo el mundo para convertir libros y artículos de antes de la era de Internet en documentos digitales. El método, que se usa desde hace un año, permite procesar 160 libros al día con casi perfecta fidelidad, según la Universidad Carnegie Mellon, que creó el programa.

Las computadoras han podido leer libros viejos y periódicos archivados por años usando los llamados ciberprogramas de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés). El nuevo método toma palabras distorsionadas o borrosas que el ciberprograma no reconoció y las presenta en portales electrónicos para que las personas las descifren.

”El problema es que el OCR no es perfecto”, dijo Luis von Ahn, profesor adjunto del departamento de ciencias de la información de Carnegie Mellon.

Tomado de: Noticiasdot.com

Digitalización de libros y revistas viejos

Deja un comentario

Sistema Nacional de Bibliotecas digitaliza libros y revistas viejos

 

 

105 libros ya están listos para ponerlos en la página web de la instituciónSe incluirán varias publicaciones antiguas, como un boletín del siglo XIX

 

 

Doriam Díaz

 

 

El Sistema Nacional de Bibliotecas (Sinabi) crea su propia biblioteca virtual y ya digitalizó 105 libros de diferentes épocas y varias publicaciones antiguas, entre las que se destaca un boletín gubernamental del siglo XIX.
La idea es que estos textos, así como varias bibliografías que se hallan en discos compactos, formen parte de los materiales que el usuario costarricense podrá consultar a partir de dos meses en su nueva página en Internet.
“Esto tiene como objetivo claro la democratización del acceso a la cultura. Queremos que una persona en Barra del Colorado, en Sierpe o en cualquier parte del país tenga acceso a los materiales que resguarda la Biblioteca Nacional”, expresó Margarita Rojas, directora del Sinabi.
Se trabaja en la digitalización de la revista Triquitraque .Adriana Ovares
Aunque estos documentos digitales ya se encuentran listos, la página no ha sido lanzado debido a que falta un “muro de fuego” ( firewall ), que es una barrera de protección contra virus y piratas cibernéticos ( hackers ).
La Secretaría Técnica del Gobierno Digital les dará ese firewall , así como servidores y un programa de gestión bibliotecaria. Con esto, se pretende no solo poner en línea la biblioteca digital sino también que las 60 bibliotecas públicas y la Nacional trabajen en red.
Poco a poco. Los 105 libros que han sido digitalizados y que se podrán leer página por página son textos representativos de la literatura, la historia y la cultura nacionales.
Entre esas obras se halla El ABC de la geografía , de Miguel Obregón Loría, y La evolución del comercio exterior y del transporte marítimo 1891-1900 , de Jorge León Sáenz.
Además, se cuenta con el Boletín oficial desde 1853 a 1856, que era una publicación que aparecía tres veces por semana con diferentes informaciones generadas por el Gobierno. Por ejemplo, allí se encuentra desde información de primera mano acerca de la Campaña Nacional de 1856 hasta una prohibición para cazar venados.

 

Actualmente, se trabaja en la digitalización de dos de las revistas infantiles más importantes de principios del siglo XX: Triquitraque y San Selerín .
Triquitraque fue una revista mensual que circuló entre 1936 y 1947, costaba ¢0,10 y era una publicación de Carlos Luis Sáenz y Adela Ferreto, ilustrada por artistas como Francisco Paco Amighetti y Juan Manuel Sánchez.
Ayer, la bibliotecóloga Ana Isabel Quirós escaneó algunas de las páginas de la publicación, que es el inicio de la digitalización del texto.
Tras tener cada página en formato digital se procesa para poder manipular y tener acceso al texto. Solo algunos libros, cuyos caracteres no reconoce el programa, se dejan solo en formato de imagen.
¿Cuáles textos se van a digitalizar? Margarita Rojas explicó que se privilegiarán obras muy antiguas o difíciles de conseguir en el país.
Junto a esta incursión en la era digital, el Sinabi mantendrá los servicios actuales en todas sus bibliotecas y seguirá conservando libros, revistas y periódicos.

Seguir

Get every new post delivered to your Inbox.