A medida que la industria de las noticias sigue adaptándose, se les pide a los periodistas que amplíen sus conocimientos para que más allá de investigar y escribir también sepan programar. El ideal romántico del periodista hacker que encuentra lo que es relevante en medio del ruido de las increíbles cantidades de datos generados cada día se ha convertido en uno de los desarrollos más interesantes del periodismo en los últimos años.
Muchos periodistas empiezan con la esperanza de crear el próximo Homicide Watch o Dollars for Docs, pero aprender a programar requiere tiempo y esfuerzo, y muchos aspirantes a hackers se agotan rápidamente, como lo señaló Jake Levine, gerente de Digg, en un blog a principios de esta primavera. De hecho, hay un número sorprendentemente alto de artículos dedicados a disuadir a los periodistas de aprender programación, a pesar de la necesidad de contar con mayores conocimientos técnicos y especializados.
Lo más importante, según muchos expertos en periodismo de datos, es recordar que se trata de contar la historia por primera vez. Levine señaló que de hecho construir algo por primera vez es una de las herramientas de aprendizaje más valiosas – y más divertidas – que el hecho de programar por programar. Comience con unproyecto específico en mente y parta de allí.
Vuelva a lo básico
Aunque los resultados son atractivos, el proceso de programación no lo es. Afortunadamente, una de las herramientas más básicas del periodismo de datos es la hoja de cálculo. Expertos entrevistados para el Manual de Periodismo de Datos nombraron a Excel y a la hoja de cálculo de Google Docs como algunas de las herramientas más utilizadas en sus operaciones diarias. Microsoft Excel, por ejemplo, puede manejar archivos de hasta 1 millón de filas y 16.000 columnas así que no dude de su capacidad para contribuir al procesamiento de grandes cantidades de datos para sus reportes.
Los primeros pasos
Una vez que esté familiarizado con las hojas de cálculo hay muchas direcciones que puede tomar para su proyecto de datos sin tener que escribir ningún código. Google Fusion Tables le permite combinar dos hojas de cálculo o archivos CSV para visualizar los datos en tablas, gráficos e incluso en mapas interactivos. A pesar de que todavía está en versión beta, Google Fusion Tables es utilizado regularmente por grandes nombres como el Guardian Data Blog para sus visualizaciones.
Dele un vistazo a este artículo sobre herramientas para la visualización de datos e infografías publicado por elCentro Knight para el Periodismo en las Américas si está interesado en explorar otra faceta del periodismo de datos.
También puede empezar a explorar el web scraping sin tener conocimientos avanzados de programación. El web scraping le permite obtener información de sitios web con un cierto grado de automatización (en otras palabras, no tiene que copiar y pegar cada pequeña cosa que esté buscando). ProPublica cuenta con ScraperWiki que tiene grandes recursos para principiantes y bases de datos para obtener información de sus historias. Una aplicación web gratuita para Chrome llamado Table Capture le permite copiar rápidamente las tablas de las páginas web y pegarlas en otra hoja de cálculo. El Centro Knight también recopiló una serie deherramientas para extraer datos de archivos PDF protegidos.
Trabajar con múltiples hojas de cálculo es uno de los procesos que más tiempo consume en el periodismo de datos – la limpieza de datos desordenados. Google Refine es otro programa gratuito que unifica la nomenclatura a través de varias hojas de cálculo. ProPublica también muestra cómo utilizar Refine para limpiar sus bases de datos.
HTML, CSS y JavaScript
En algún momento, tendrá que aprender algo de programación. Recuerde el consejo de Levine, construir algo puede ser la mejor manera de aprender. Cree su propio blog en WordPress, u otro servicio, y experimente con el código HTML a medida que lo personaliza. Codeacademy es uno de los más populares tutoriales online gratuitos para aprender JavaScript, HTML, CSS y otros lenguajes de programación. Tuts + también ofrece un curso gratuito de 30 días sobre HTML y CSS.
Dado que programar es algo que consume tiempo, hay un montón de recursos en la Web para ayudarle a evitar tener que volver a inventar la rueda. Dele un vistazo a recursos como jQuery para obtener acceso a funciones interactivas para su blog o página web.
Editores de código
Si está listo para zambullirse en algo más profundo, la primera cosa que necesita es un editor de código.NotePad++ es una opción gratuita para usuarios de PC y TextMate ofrece una versión de prueba gratis para usuarios de Mac. Sublime Text es otro editor de código recomendado tanto para Mac como para PCs.
Lenguajes Script y Frameworks Web
El lenguaje script compone la arquitectura detrás de las aplicaciones de noticias. Dos de los lenguajes que llevan la delantera en el periodismo son Ruby y Python. Losframeworks para aplicaciones web son utilizados juntos con los scripts para facilitar el proceso de programación para acceder y manipular datos. Los desarrolladores Ruby usanRuby on Rails y los de Python usan Django. Hackety Hack y TryRuby.org ofrecen tutoriales Ruby y ejercicios.Google ofrece una clase de Python y Django Book es un libro electrónico gratuito sobre introducción a la programación basada en Python.
Únase a un club
Por último, busque una organización profesional que pueda conectarlo con otros aspirantes a programadores.Hacks/Hackers organiza encuentros en todo el mundo para desarrolladores, periodistas y diseñadores.