Portada :: Conocimiento Libre
Aumentar tamaño del texto Disminuir tamaño del texto Partir el texto en columnas Ver como pdf 05-12-2016

3.000 millones de archivos
As es la mayor biblioteca de cdigo abierto del mundo

Jos Manuel Blanco
elconfidencial.com


Igual que las pelculas o los libros se preservan, el software tampoco se puede perder. Y hay quienes estn trabajando para ello. Software Heritage es un proyecto a escala mundial que busca archivar todo el software libre que se ha creado y se crea. Desde los proyectos casi annimos que cada da aparecen en GitHub hasta programas mticos como el Open Office, esta pgina web con menos de dos aos de vida (aunque fue publicada hace unos meses) pretende acoger todo ese saber con el fin de que pronto est disponible para muchos.

Desde Francia, el profesor Roberto Di Cosmo est al frente de la iniciativa, que naci como idea hace tres aos. Cuando empec a trabajar en eso [investigar el cdigo abierto existente], buscbamos una gran coleccin de todo el cdigo disponible. No solo disponible hoy, sino que vaya a quedar disponible a largo plazo, explica a Teknautas. Tras mucho investigar, l y su equipo no encontraron recopilacin alguna: No haba nadie que se encargara de preservar el cdigo fuente. Para ellos, el problema era muy grave y haba que solucionarlo: El verdadero conocimiento est en el cdigo fuente del software, no tanto en el archivo ejecutable, y estamos perdiendo ese conocimiento.

Visto el problema, haba que definir una estrategia a largo plazo. Optaron por crear una especie de consorcio internacional formado por voluntarios. En l estaran representados no solo personas individuales, sino tambin organizaciones, centros de investigacin o universidades. Trabajaron un ao y medio en secreto, diseando y montando la infraestructura. La web de Software Heritage se hizo pblica el pasado 30 de junio, con todo el material que haban ido recopilando en ese tiempo.

Una Wikipedia del 'software'

El objetivo es que cualquiera tenga acceso a un gran repositorio de cdigo fuente. Di Cosmo ve muchas utilidades no solo para el investigador que haga anlisis, sino para miles de aplicaciones diferentes. Puede ser para la industria, para buscar vulnerabilidades. Es ms, uno podra construir alguna Wikipedia del software: la historia, por qu tal programa fue desarrollado por quin, en qu momento, ver cmo evolucion con el tiempo Ellos no solo almacenan cdigo fuente, tambin toda la historia del desarrollo. Cada seis horas se actualiza su contador: cuando se escribe este artculo, hay ms de 47 millones de proyectos, que suman 3.100 millones de archivos en su seno.

En esa biblioteca hay de todo. En primer lugar, una copia integral de GitHub, la plataforma ms famosa para compartir proyectos informticos y desarrollarlos de forma colaborativa: millones de desarrolladores cooperan y comparten su trabajo para que el resto de la comunidad lo disfrute. Tambin estn repositorios como los de Debian y Google Code. Est todo el cdigo fuente de la mayora de software libre que se usa hoy en da: Linux, Firefox, Open Office Hay gente que puso tambin todo el historial de Unix desde 1970, el cdigo fuente del Apolo XI Y entre los colaboradores que aportan este contenido se cuentan empresas como Microsoft Francia.

A la vez que aportan el software, piden la participacin de todos aquellos interesados en seguir mejorando el proyecto: para desarrollar, para drselo a conocer a otras personas Y ojo, porque tambin contratan. Es un proyecto transparente y colaborativo donde se agradece tanto una nueva pieza de software libre como el aviso de un bug. Hay una lista de correo y un canal IRC para suscribirse.

De momento el archivo no est disponible para su descarga pblica. El objetivo es no perder todo ese software que podra dejar de estar disponible

Otra opcin es patrocinar Software Heritage. De acuerdo a la cantidad de dinero que destinen cada ao, los patrocinadores aparecern reflejados como donantes en la pgina web y en otros apartados como las notas de prensa del proyecto. El dinero se destina a reforzar la infraestructura para seguir creciendo, as como a financiar los gastos derivados. De momento, Software Heritage es un proyecto sin nimo de lucro del INRIA, el instituto francs de investigacin informtica, y sus promotores esperan que pronto se pueda independizar.

De momento, eso s, el archivo no est disponible para su descarga pblica: Por ahora, nosotros nos ocupamos sobre todo de almacenar y salvar esos datos antes de que desaparezcan, explica Di Cosmo. Es posible verificar si algo se encuentra all, aunque no se pueda acceder a ello. Cada archivo del cdigo fuente suele tener un identificador, un cifrado de seguridad de los denominados SHA. Si se conoce uno de esos cdigos, se puede introducir en el buscador y comprobar si el archivo ya est almacenado. Tambin se puede subir un nuevo archivo para que el equipo lo almacene o asegurarse de que alguien no lo haya hecho antes.

El objetivo es no perder todo ese software que est disponible y que podra dejar de estarlo. Di Cosmo pone como ejemplo lo que pas en 2015, cuando Google Code y Gitorius anunciaron su cierre: Haba que buscar todo eso antes de que desapareciera. Una vez guardados, se preocupan de garantizar su supervivencia y, an ms, de procurar que en unos aos vuelvan a funcionar. Es un tema difcil, reconoce el profesor. Hay mucha gente que trabaja en eso. Para intentar pasar del cdigo fuente al ejecutable se necesita el compilador, la librera, el entorno de desarrollo Ellos no se ocuparn directamente de esa parte, pero quieren trabajar codo con codo con aquellos que ya lo estn haciendo.

El proyecto sigue adelante gracias a la voluntad de mucha gente con ganas de cooperar y de aportar dinero. El mayor archivo de software libre ya est en marcha para preservar la historia de una parte esencial de nuestro da a da. Y puede que el trabajo nunca termine.

Fuente: http://www.elconfidencial.com/tecnologia/2016-12-04/software-libre-informatica-open-source-linux-github_1298849/



Envía esta noticia
Compartir esta noticia: delicious  digg  meneame twitter