355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Д. Грей » Пособие по журналистике данных » Текст книги (страница 2)
Пособие по журналистике данных
  • Текст добавлен: 26 сентября 2016, 16:16

Текст книги "Пособие по журналистике данных"


Автор книги: Д. Грей


Жанр:

   

Справочники


сообщить о нарушении

Текущая страница: 2 (всего у книги 21 страниц)

Новый подход к созданию сюжетов

Журналистика данных – это зонтичный термин, который, по моему мнению, охватывает многое, включая в себя все новый и новый набор инструментов, техник и подходов к рассказыванию историй, описанию событий, созданию сюжетов. Она может включать в себя все – от традиционных репортажей, которые готовятся при помощи компьютера (с использованием данных в качестве «источника») до самых современных и передовых способов визуализации данных и новостных приложений. Объединяющая цель – журналистская: предоставление информации и анализа, чтобы помогать информировать нас обо всех важных проблемах дня.

Арон Пилхофер, New York Times

Словно фотожурналистика с ноутбуком

«Журналистика данных» отличается от «журналистики слов» лишь тем, что мы используем другой набор инструментов. Мы все разнюхиваем–разузнаем, сообщаем и связываем в сюжеты, зарабатывая на жизнь. Это как «фотожурналистика», только вместо фотоаппарата – ноутбук.

Брайан Бойер, Chicago Tribune

Журналистика данных – это будущее

Журналистика, основанная на данных – это будущее. Журналисты должны хорошо уметь работать с данными и ориентироваться в них, как рыба в воде. Мы привыкли к тому, что сюжеты создаются, допустим, по итогам общения с людьми в барах, и периодически такой способ все еще актуален. Но сейчас все больше и больше приходится углубляться в данные и снабжать себя инструментами их анализа и отбора того, что действительно интересно. Представлять информацию в истинном свете, помогать людям действительно увидеть, как все данные сочетаются друг с другом, и что происходит в государстве.

Тим Бернерс–Ли, основатель всемирной паутины

То, благодаря чему обработка числовой информации встречается с работой мастеров слова

Журналистика данных наводит мосты между техническими статистиками и мастерами художественного слова. Она отделяет ненужное и определяет тенденции, которые не только являются статистически значимыми, но и позволяют отобрать то, что по сути своей составляет основу сложного современного мира.

Дэвид Эндертон, независимый журналист

Обновление своего набора навыков

Журналистика данных – это новый набор навыков для поиска, понимания и визуализации цифровых источников во времена, когда базовых навыков из области традиционной журналистики уже недостаточно. Это не замена традиционной журналистики, а добавка к ней.

Во времена, когда источники становятся цифровыми, журналисты могут и вынуждены быть ближе к этим источникам. Интернет открыл такие возможности, которые ныне находятся за пределами нашего понимания. Журналистика данных – это только начало процесса развития нашего прошлого опыта с целью адаптировать его к режиму онлайн.

Журналистика данных помогает новостным организациям решить две задачи: поиска уникальных сюжетов (не с новостных лент) и выполнения нашей сторожевой и отслеживательской функции. Особенно во времена финансовых рисков это очень важные цели для газет, которых им нужно достичь.

С точки зрения региональной газеты, журналистика данных критически важна. У нас есть поговорка: «нехватка одной плитки перед дверью вашего дома считается более важной, чем восстание в далекой стране». Она бьет вас по лицу и влияет на вашу жизнь более непосредственно. В то же самое время цифровизация наблюдается везде. Из–за того, что местные газеты получают это прямое, непосредственное воздействие прямо у себя по соседству, а источники цифровизируются, журналист должен знать, как найти, проанализировать и визуализировать сюжет из этих данных.

Джерри Верманен

Средство для борьбы с асимметричностью информации

Асимметричность информации –  не недостаток информации, а невозможность проникнуть в нее и обработать ее из–за высокой скорости и огромных объемов, в которых она поступает к нам – является одной из наиболее значительных проблем, с которыми сталкиваются граждане, делая выбор относительно того, как жить своей жизнью. Информация, извлекаемая из печатных, визуальных и аудио средств массовой информации влияет на выбор и действия граждан. Качественная журналистика данных помогает бороться с асимметричностью информации.

Том Фриз, Фонд Bertelsmann Stiftung

Ответ на создаваемый при помощи данных пиар

Доступность средств измерения и снижение цен на них, в устойчивой, самоподдерживающейся комбинации с упором на производительность и эффективность во всех аспектах деятельности общества, вынудили руководителей, лиц, принимающих решения, давать количественную оценку достижениям своей политики, отслеживать тенденции и определять возможности.

Компании продолжают выдавать новые количественные показатели и проводить измерения, показывающие, насколько хорошо они работают. Политики любят хвастаться, говоря о сокращениях цифр безработицы и росте числовых показателей ВВП. Отсутствие или нехватка журналистской проницательности в делах Enron, Worldcom, Madoff или Solyndra является доказательством неспособности многих журналистов ясно видеть суть происходящего за потоками цифр. Цифры чаще принимаются за чистую монету, чем другие факты, так как они несут с собой ауру серьезности, даже когда они являются полностью сфабрикованными.

Уверенная работа с данными поможет журналистам заострить их критическое ощущение, когда они будут иметь дело с цифрами, и, хочется надеяться, поможет им отвоевать обратно некоторые территории в схватке с пиар–отделами.

Николас Кайзер–Бриль, Journalism++

Предоставление независимой интерпретации официальной информации

После разрушительного землетрясения и последовавшей за ним ядерной катастрофы на АЭС «Фукусима» в 2011 году важность журналистики данных была наглядно продемонстрирована работниками медиасферы в Японии, стране, которая отстает в плане цифровой журналистики.

Мы были в недоумении, когда оказалось, что у правительства и экспертов нет надежных и достоверных данных о нанесенном ущербе. Когда чиновники спрятали данные SPEEDI (информация о предполагаемом распространении радиоактивных материалов) от общественности, мы были не готовы к их расшифровке, даже если бы они стали доступны вследствие какой–нибудь утечки. Добровольцы начали собирать данные о радиоактивности при помощи своих собственных устройств, но нам не хватало знаний статистики, интерполяции, визуализации, и так далее. Журналистам нужно иметь доступ к исходным данным, и учиться не полагаться на официальную интерпретацию оных.

Исао Мацунами, Chunichi/Tokyo Shimbun

Работа с лавиной данных

Вызовы и возможности, предлагаемые цифровой революцией, продолжают подрывать и дезорганизовывать журналистику. В век информационного изобилия журналисты и граждане, как и все остальные, нуждаются в лучшем инструментарии, будь то когда мы имеем дело с самиздатом XXI века на Ближнем Востоке, или с обработкой и разгрузкой данных поздней ночью, или ища наилучший способ визуализации качества воды для нации потребителей. Когда мы боремся с потребительскими вызовами, которые представляет эта куча данных, новые публикационные платформы также дают возможность всем собирать данные и делиться ими цифровым образом, превращая их в информацию. В то время как журналисты и редакторы являются традиционными векторами для сбора и распространения информации, выдыхающееся и становящееся вялым и безвкусным информационное окружение 2012 года приводит к тому, что новости сначала появляются в онлайне, а не на редакционном столе.

По всему миру фактически связь между данными и журналистикой становится сильнее. В век больших данных растущая важность журналистики данных берет свою основу в возможности тех, кто ею занимается, обеспечивать контекст, чистоту, и, возможно, самое важное, находить правду во все увеличивающемся количестве цифрового контента в мире. Это не означает, что интегрированные медийные организации сегодняшнего дня не играют критически важной роли. Отнюдь. В информационный век журналистам нужно большее, нежели просто извлечение, верификация, анализ и синтез потоков данных. В этом контексте журналистика данных имеет глубокую важность для общества.

Сегодня, извлечение смысла из больших объемов данных, в частности, неструктурированных данных, станет главной целью для ученых, работающих с данными по всему миру, неважно, работают ли они в ньюсрумах, на Уолл–Стрит или в Кремниевой долине. И самое важное, что эта цель будет реализовываться за счет растущего набора общих инструментов, неважно, используются ли они правительственными технологами, открывающими Чикаго, технологами в области здравоохранения или работниками ньюсрумов.

Алекс Говард, O’Reilly Media

Наша жизнь – это данные

Качественная журналистика данных – сложное дело, потому что качественная журналистика – вообще сложное дело. Это означает знать, как получить данные, как понять их, и как найти сюжет. Порой выходит дохлый номер, порой заходишь в тупик, а порой просто оказывается, что нет хорошей темы. В конце концов, если бы все сводилось к тому, чтобы нажать на нужную кнопку, это была бы не журналистика. Но именно это делает ее целесообразной, и – в мире, в котором наши жизни все больше превращаются в данные – категорически необходимой для свободного и справедливого общества.

Крис Тэггарт, OpenCorporates

Способ сэкономить время

У журналистов нет времени, которое они могли бы бездарно потратить на переписывание чего–то от руки, и бездельничанье в попытке вытащить данные из PDF–файлов, поэтому некоторое знакомство с основами программирования, или знание того, где искать людей, которые могут помочь, невероятно ценно.

Один журналист из газеты «Фола де Сан–Паулу» (Folha de São Paulo) работал с местным бюджетом и позвонил мне поблагодарить за то, что мы выложили счета муниципалитета Сан–Паулу в онлайн (два дня работы одного хакера!). Он сказал, что он переписывал их от руки последние три месяца, пытаясь создать сюжет. Я также помню решение «PDF–ной проблемы» для Contras Abertas, парламентской организации, занимающейся мониторингом новостей: 15 минут и 15 строк в программе – и сделана работа, которая в противном случае занимает месяцы.

Педро Маркун, Transparência Hacker

Неотъемлемая часть набора инструментов журналиста

Я думаю, важно подчеркнуть слово «журналистика», или репортерский аспект «журналистики данных». Дело должно быть не в том, чтобы анализировать данные или визуализировать данные ради самих данных, а в использовании этого метода как инструмента для того, чтобы подобраться ближе к правде о том, что происходит в мире. Я вижу в анализе и интерпретации данных жизненно необходимую часть современного багажа инструментов журналистики, а не отдельную дисциплину. В конечном итоге все это имеет отношение к качественной журналистике, к созданию профессиональных репортажей и рассказыванию историй самым подходящим способом.

Журналистика данных – еще один способ критически изучать мир и сдерживать власти, призывая их к ответу. В условиях, когда объемы доступной информации все увеличиваются, сейчас более чем когда–либо важно, чтобы журналисты знали о технике журналистики данных. Она должна быть инструментом, присутствующим в арсенале любого журналиста: будь то за счет изучения того, как работать с данными напрямую, или посредством сотрудничества с кем–то, кто умеет это делать.

Ее реальная сила – в том, чтобы помочь вам получить информацию, которую в противном случае было бы трудно отыскать или доказать. Хорошим примером этого является статья Стива Дойга (Steve Doig), в которой он проанализировал примеры ущерба от урагана «Эндрю». Он объединил два разных набора данных: один, показывающий уровень разрушений, причиненных ураганом, и второй, демонстрирующий скорости ветра. Это позволило ему выделить зоны, где слабые законы в области жилищного строительства и практика некачественного строительства внесли свой вклад в результаты урагана. Он завоевал Пулитцеровскую премию за эту свою статью в 1993 году, и это отличный, вдохновляющий пример того, чего можно достичь.

В идеале вы используете данные для того, чтобы точно определить и выделить секреты и провалы и всплески значений, очертить области интереса, или выделить факты, которые удивляют. В этом смысле данные могут служить исходником или источником конфиденциальной информации. Но хотя сами цифры тоже могут быть интересными, просто написать о данных недостаточно. Надо на их основе сделать репортаж, чтобы объяснить, что они значат.

Синтия О'Мурчу, Financial Times

Приспособление к изменениям в нашем информационном окружении

Новые цифровые технологии приносят новые способы производства и распространения знаний в обществе. Журналистика данных может пониматься как попытка средств массовой информации адаптироваться к изменениям в нашем информационном окружении и отреагировать на эти перемены – в том числе, путем более интерактивного, более многомерного представления тем и сюжетов, давая возможность читателям использовать источники, лежащие в основе новостей, и подталкивая их к участию в процессе создания и развития историй и сюжетов.

Сезар Виана, Университет Гойяс

Способ видеть вещи таким образом, каким бы вы их иначе не увидели

Некоторые сюжеты и темы можно понять и объяснить только с помощью анализа – и порой визуализации – данных. Связи между влиятельными людьми или организациями могли бы остаться нераскрытыми; смерти, связанные с борьбой с наркотиками, остались бы тайной; политика в области экологии, которая наносит вред окружающей среде, по–прежнему оставалась бы без внимания. Но все вышеозначенное изменилось – из–за данных, которые получили журналисты – получили, проанализировали и предоставили читателям. Данные могут быть простыми как простая таблица или список телефонных звонков, или сложными, как школьные таблицы или данные о больничных инфекциях, но внутри себя все они содержат истории, которые стоит рассказать.

Шерил Филлипс, The Seattle Times

Способ создавать более насыщенные сюжеты

Мы можем рисовать картину всей нашей жизни при помощи цифровых следов. Начиная с того, что мы потребляем и просматриваем, и заканчивая тем, куда и когда мы путешествуем, нашими музыкальными предпочтениями, нашей первой любовью, важными моментами в жизни наших детей, даже нашей последней волей – все это может быть отслежено, переведено в цифровой вид, может храниться в облаке и распространяться. Эту вселенную данных можно использовать, извлекая из нее нужную информацию, чтобы создавать сюжеты, отвечать на вопросы и распространять понимание жизни такими способами, которые сейчас превосходят даже самые строгие и тщательные исторические реконструкции.

Сара Слобин, Wall Street Journal

Несколько известных примеров

Мы попросили некоторых из наших авторов привести их любимые примеры журналистики данных, и рассказать о том, что им в них нравится. Вот они.

Не навредив Las Vegas Sun

Рис 5. Не навреди(The Las Vegas Sun)

Мой любимый пример – это проект «Не навреди» Do No Harmв газете Las Vegas Sun 2010 года – серия статей о больничной помощи (смотри Рис 5). Sun проанализировала более 2,9 миллиона больничных записей, счетов, которые позволили раскрыть информацию о 3 600 предотвратимых травмах, инфекциях и хирургических ошибках. Они получили данные из запросов о предоставлении информации из открытых источников и идентифицировали более трехсот случаев, когда пациенты умирали из–за ошибок, которые можно было предотвратить. Этот проект содержит различные элементы, включая: интерактивный график, который дает возможность читателю просматривать информацию по каждой больнице, какие хирургические травмы происходили наиболее часто, чаще, чем можно было бы ожидать; картус временной шкалой и графиком, который показывает распространение инфекций от больницы к больнице; и интерактивный график, который позволяет пользователям отсортировать данные по предотвратимым травмам или по больницам, чтобы посмотреть, где людям наносится вред. Мне нравится этот проект, потому что он очень понятный и по нему легко ориентироваться. Пользователи могут пользоваться данными очень интуитивно понятным способом. Также от него есть реальная польза: законодательный орган Невады отреагировал шестью законодательными актами. Участвовавшие в реализации проекта журналисты упорно работали над тем, чтобы собрать данные и очистить их от ненужного. Один из журналистов, Алекс Ричардс (Alex Richards), отправлял данные обратно в больницы, а также в органы государственной власти, как минимум, десяток раз, чтобы ошибки были исправлены. – Ангелика Перальта–Рамос, La Nación, Аргентина

База данных о зарплатах государственных служащих

Рис 6. Зарплаты государственных служащих (The Texas Tribune)

Мне нравится работа, которую каждый день выполняют небольшие независимые организации, такие как ProPublica или Texas Tribune, у которой есть великолепный журналист данных в лице Райана Мерфи (Ryan Murphy). Если бы меня попросили выбрать, я бы отметил Базу данных о зарплатах государственных служащих ( Government Employee Salary Database)Government Employee Salary Database), проект Texas Tribune ( Рис 6). В этом проекте собраны данные о зарплатах 660 000 государственных служащих, они сведены в базу данных, в которой пользователи могут осуществлять поиск и на основе которой могут создавать сюжеты. Можно осуществлять поиск по организации, по фамилии или по уровню зарплаты. Этот проект прост, выразителен, полон смысла и делает недоступную информацию публичной. Его легко использовать, и не менее легко автоматически генерировать сюжеты на его основе. Это великолепный пример того, почему большую часть трафика Texas Tribune набирает за счет своих страниц данных.

Саймон Роджерс, The Guardian

Полнотекстовая визуализация документов о войне в Ираке, Associated Press

Рис 7. Анализ военных отчетов (Associated Press)

Работа Джонатана Стрэя (Jonathan Stray) и Джулиан Берджесс (Julian Burgess) на основе документов о войне в Ираке ( Iraq War Logs) ) является воодушевляющим примером проникновения в текстовый анализ и визуализацию с использованием экспериментальной техники, чтобы разобраться в темах, заслуживающих пристального внимания, за счет большого набора текстовых данных ( Рис 7).

Средствами техники текстового анализа и алгоритмов Джонатан и Джулия создали метод, который позволяет демонстрировать кластеры ключевых слов, содержащихся в тысячах отчетов американских властей по Иракской войне, которые подверглись утечке благодаря WikiLeaks, в визуальной форме.

Хотя у представленных методов есть ограничения, и подход носит экспериментальный характер, он представляет собой инновационный подход. Вместо того, чтобы пытаться прочитать все файлы или просматривать записи о войне с предвзятым мнением о том, что там можно найти, вводя определенные ключевые слова и анализируя полученный на выходе результат, эта техника подсчитывает и визуализирует темы/ключевые слова, имеющие особое значение.

В условиях увеличивающихся объемов данных – как текстовых (сообщения электронной почты, отчеты), так и цифровых, оказывающихся в распоряжении общественности, поиск путей для выделения ключевых областей интересов будет становиться все более и более важным – это великолепная подобласть журналистики данных.

Синтия О'Мурчу, Financial Times

Тайны убийств

Рис 8. Тайны убийств(Scripps Howard News Service)

Одним из моих любимых примеров журналистики данных является проект «Тайны убийств»Тома Харгроува (Tom Hargrove) из Scripps Howard News Service ( Рис 8). На основе правительственных данных и запросов на получение данных из открытых источников он составил демографически детализованную базу данных из более чем 185 тысяч нераскрытых убийств, а потом сконструировал алгоритм для поиска по ней образцов, позволяющих объединять те или иные дела на основании предположений о наличии серийных убийц. В этом проекте есть все: упорный труд по сбору данных и составлению базы лучше, чем правительственная, мудрый анализ с использованием техники социальной науки, и интерактивное представление данных в режиме онлайн таким образом, чтобы читатели могли сами в этой базе работать.

Стив Дойг, Школа журналистики Уолтера Кронкайта, Университет штата Аризона

Машина текстовых сообщений (Message Machine)

Рис 9. Message Machine(ProPublica)

Мне нравится проект ProPublica под названием «Машина текстовых сообщений» ( Message Machine) и поств блоге ( Рис 9). Все это началось тогда, когда несколько пользователей твиттера выразили любопытство по поводу получения разных сообщений электронной почты во время проведения избирательной кампании Обамы. Ребята в ProPublica заметили это и попросили читателей форвардить им любые e–mail–ы, которые они получают от деятелей избирательной кампании. Представление этих данных весьма элегантно, а визуализация выгодно отличается от обычных сообщений электронной почты, которые обычно отправляешь вечерами. Этот проект классный, потому что они собрали свою собственную информацию (хотя, признаем, и небольшую по объему, но достаточную для того, чтобы рассказать историю). Но что еще более здорово, так это то, что они рассказывают историю развивающегося явления, повествуют о масштабных данных, используемых в политических кампаниях с целью целевой рассылки сообщений конкретным лицам. Это лишь первое знакомство, позволяющее попробовать на вкус то, что грядет.

Брайан, Chicago Tribune


    Ваша оценка произведения:

Популярные книги за неделю