제공 :
한빛 네트워크
저자 : Mac Slocum
역자 : 김민혁
원문 :
The work of data journalism: Find, clean, analyze, create ... repeat
데이터 저널리즘은 중대한 국면을 맞이하였습니다 : 만약 이 토론이 지속되어야 한다면, 어떻게 저널리스트들이 데이터셋에서 정확한 이야기를 발췌 할 수 있는 지를 찾아보아야 합니다.
물론, 이것은 실행을 보장하지 않는 "어떻게(How)"에 대해서만 초점이 맞추어져 있습니다. 이야기는 마법처럼 스프레드시트 밖으로 나오지 않으며, 데이터가 깔끔하게 오는 것은 드문 일입니다. 데이터 저널리즘은 - 대부분의 저널리즘과 같이 - 힘들고 고통스러운 작업이 많이 요구됩니다.
그런 이유로, 나는 The Guardian"s Datablog의 편집자이며, 다음주 있을 Strata Summit의 연설 예정인 Simon Rogers와 데이터 저널리즘의 제반 사항에 대해 이야기하기 위해 연락을 취했습니다. The Guardian사는 데이터기반 스토리텔링의 선두주자이기에 그것이 명백한 복제품임에도 많은 관심을 받고 있습니다.
우리의 인터뷰는 다음과 같습니다.
무엇이 데이터 중심의 이야기를 만드는 것입니까?
Simon Rogers: 그것은 정말 90%의 땀입니다. 전체의 프로세스는 데이터를 만들고 스토리에서 어디에 둘 것인지 위치를 잡는 것입니다. 그 과정은 이렇게 진행됩니다.
- 우리는 데이터를 위치시키거나 다양한 소스 - 최신 소식 기사, 정부 자료, 저널 리스트의 연구 등등 - 에서 데이터를 받는 것으로 시작합니다.
- 그리고 난 후 우리는 우리가 데이터로 무엇을 할 수 있는지 보기 시작합니다. 다른 데이터셋과 섞는 것이 필요한가? 어떻게 하면 시간이 지났음을 보여줄 수 있나?
- 스프레드 시트는 종종 아주 깔끔하게 정리해야 합니다 - 모든 외부 열 및 이상하게 합쳐진 셀은 정말 도움이 되지 않습니다. 그리고, 만약 그것이 PDF가 아니라면, 인류에게 알려진 최악의 데이터 형태입니다.
- 이제 우리는 슬슬 그곳에 근접해 가려 합니다. 그 다음은 그것에 이야기가 있던 없던 우리가 실제 적으로 작업할 것에 대한 계산을 해야 합니다.
- 해당 프로세스의 끝은 결과물입니다. 결과물을 이야기 또는 그래픽이나 시각화 수 있을까? 어떤 도구를 사용할까?
우리는 실제로 우리가 어떻게 일을 진행하는지에 대한
그래픽을 제작했습니다.
[그림] "데이터 저널리즘이 세분화"의 일부 스크린 샷.
전체 그림을 보려면 클릭하십시오 .
데이터 저널리스트가 만드는 가장 일반적인 실수는 무엇입니까?
Simon Rogers: 가벼운 여흥으로 몇 달을 소비하는 경향이 있습니다. 일반적으로 주제에 벗어나 관심거리가 될만한 부분을 위해 몇 달을 써버리는 경우입니다. 그것은 기억 될 놀라운 작품을 제작하기 위해 분투하는 것으로 훨씬 더 중요합니다. 당신은 항상 성공하진 않지만, 가까이 하게 될 것입니다.
데이터 저널리즘은 팀을 필요합니까, 아니면 한 사람이 모든 일을 할 수 있습니까?
Simon Rogers: 당신은 혼자 할 수 있습니다. 나는 데이터 저장소를 설정하고 혼자서 1년 이상을 해왔습니다. 하지만 당신이 함께 할 수 있는 팀이 있는 것은 매우 유용합니다. 우리는 사이트를 스크랩 하는 사람, 데이터베이스를 가지고 작업할 수 있는 사람, 그리고 결과물을 아름답게 만들어줄 그래픽 디자이너와 만날 수 있습니다. 우리는 또한 우리의 일에 그들의 전문 지식을 가지고, 그 곳의 세상에서 일할 것입니다. 웹을 사용하면 당신은 혼자 작업하지 않아도 됩니다.
데이터 기반의 이야기는 업데이트 가능한가요?
Simon Rogers: 그것은 지속적인 이슈입니다. 업데이트를 놀라울 정도로 쉽게 하거나, 그것에 대해 너무 많이 생각하지 않고 어떻게 뭔가를 만들려고 하는 것은 현명한 일입니다. 우리는 아직 그런 단계가 아니지만 우리는 최선을 다하고 있습니다.
어떤 데이터 도구를 사용합니까?
Simon Rogers: 그것은, 아주 개인적인 일입니다. 우리는 다음의 것들을 이용합니다. :
Excel,
TextEdit (코드 또는 서식 없는 수식에서 얼마나 자주 사용하는 지 모릅니다.),
Google Fusion Tables,
Google Spreadsheets,
Timetric,
Many Eyes,
Adobe Illustrator, and
Tableau.
***
이 인터뷰는 편집과 요약 되었습니다.