355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Д. Грей » Пособие по журналистике данных » Текст книги (страница 4)
Пособие по журналистике данных
  • Текст добавлен: 26 сентября 2016, 16:16

Текст книги "Пособие по журналистике данных"


Автор книги: Д. Грей


Жанр:

   

Справочники


сообщить о нарушении

Текущая страница: 4 (всего у книги 21 страниц)

Состав нашей команды:

 Веб–разработчик и дизайнер

 Ведущий журналист

 Внештатный исследователь с опытом в области извлечения данных, работы с таблицами в Excel и очистки данных

 Внештатный младший журналист

 Консультант–директор производства

 Научный консультант с опытом в области сбора и добычи данных, графической визуализации, и с передовыми исследовательскими навыками

 Услуги проект–менеджера и административная помощь со стороны мультиплатформенного отдела АВС

 Важно также, что у нас была референтная группа журналистов и иных экспертов, с которыми мы консультировались в случае возникновения необходимости

Откуда мы брали данные?

Данные для интерактивных карт были извлечены из шейп–файлов (популярный векторный формат географических файлов), загруженных с правительственных вебсайтов.

Остальные данные по соли и воде были взяты из разных отчетов и источников.

Данные по химическим выбросам были взяты из экологических разрешений, выданных властями.

Что мы узнали?

«Газ угольных пластов в цифрах» был амбициозным проектом как по содержанию, так и по масштабу. Самым главным, на мой взгляд, было то, чему мы научились и как мы могли бы сделать это по–другому в следующий раз.

Проект из области журналистики данных собрал в одном месте много людей, которые обычно не встречаются друг с другом в АВС. Говоря простыми словами, наемных авторов, газетных репортеров, и компьютерщиков–хакеров. Многие из нас не могли разговаривать на одном языке или даже оценить то, что делают другие. Журналистика данных – просто очень мощная, радикальная вещь!

Практические выводы:

 Совместное размещение, работа в одном месте – жизненно важный фактор. Наши разработчик и дизайнер работали в другом месте, и приезжали только на встречи и совещания. Это определенно не оптимальный вариант! Они должны работать в том же помещении, что и журналисты.

 Наш производственный консультант обитал на другом этаже здания. Нам нужно было быть гораздо ближе, чтобы всегда можно было заскочить к нему за советом.

 Выбирайте сюжет, который будет основан только на данных.

Картина в целом: некоторые идеи

Крупные медийные организации должны участвовать в процессе наращивания потенциала и повышения компетентности для того, чтобы принять вызов журналистики данных, встретить ее во всеоружии и удовлетворять ее требованиям. У меня есть предчувствие, что в технических департаментах СМИ прячется огромное количество компьютерных фанатов и хакеров, экспертов и программистов высшего класса, которые отчаянно хотят выбраться. Поэтому нам нужны семинары из серии «журналист встречается с программистом», где тайные компьютерные фанаты, молодые журналисты, веб–разработчики и дизайнеры будут работать с более опытными журналистами, в рамках обмена навыками и процессов наставления. Задача: скачиваем этот набор данных и действуем!

В силу самого факта журналистика данных является комплексной, межотраслевой дисциплиной. Команды и группы, которые занимаются журналистикой данных, составляются из людей, которые в прошлом не стали бы никогда работать вместе. Цифровое пространство размыло границы.

Мы живем в треснувшем, не вызывающем доверия и полном сомнений и подозрительности политическом образовании. Бизнес–модель, которая раньше обеспечивала возможность профессиональной, независимой журналистики – несовершенной самой по себе – находится на грани краха. Мы должны спросить себя – и многие уже так поступают – как бы выглядел мир без жизнеспособной «четвертой власти»? Американский журналист и представитель мыслящей интеллигенции Уолтер Липман (Walter Lippman) писал в 1920–х годах: «всеми признается, что гласное общественное мнение не может существовать без доступа к новостям». Это заявление ничуть не утратило своей актуальности и верности и сегодня. В XXI веке каждый тусуется в блогосфере. Трудно определить сплетников, лжецов, лицемеров или группы, представляющие личную заинтересованность из числа профессиональных журналистов. Практически любой сайт или источник может быть сделан так, что он будет выглядеть вызывающим доверие, убедительным и честным. Надежные и солидные издания бьются до конца, но они при смерти. И в этом новом пространстве нежелательной, «мусорной» журналистики гиперссылки могут бесконечно водить читателя от одного источника к другому, причем все они будут великолепно выглядящими, но бесполезными, и в итоге весь этот процесс похода по гиперссылкам будет оставаться в эдакой цифровой комнате смеха с ее искривленными зеркалами. Вот какой технический термин для этого есть: «чушь сбивает с толку мозги» (bullshit baffles brains). В цифровом пространстве каждый сейчас является рассказчиком, так? Не так. Если профессиональная журналистика – а под этим я подразумеваю тех, кто занимается этичным, уравновешенным, смелым сторителлингом, цель коего – поиск истины – собирается выжить, тогда профессия должна переформулировать и вновь утвердить свой авторитет в цифровом пространстве. Журналистика данных – просто еще один инструмент, посредством которого мы будем осуществлять навигацию в цифровом пространстве. Именно в ней мы будем составлять карты, изучать, отсортировывать, отфильтровывать, извлекать и выискивать сюжет, историю, за всеми этими нулями и единицами. В будущем мы будем работать плечом к плечу с программистами и хакерами, разработчиками, дизайнерами и кодерами. Это процесс, который требует серьезного наращивания потенциала, мобилизации сил и повышения компетентности. Нам нужны ньюс–менеджеры, которые «заставят» связку между цифровым миром и журналистикой начать вкладывать силы и средства в это строительство.

Вэнди Карлайл, Австралийская вещательная корпорация (АВС)

Журналистика данных в ВВС

Рис 15. Мир в семь миллиардов.(BBC)

Термин «журналистика данных» может охватывать ряд дисциплин и используется разными способами в новостных организациях, так что может быть полезным определить, что мы подразумеваем под «журналистикой данных» у нас в ВВС. В широком смысле термин охватывает проекты, которые используют данные, чтобы сделать одно из следующего:

 Дать возможность читателю найти информацию, которая будет для него персонально значимой.

 Рассказать историю или осветить тему, которая будет значимой и ранее не освещенной.

 Помочь читателю лучше понять сложный вопрос.

Эти категории могут пересекаться, частично совпадать, и в онлайн–среде могут зачастую заиграть новыми красками благодаря определенному уровню визуализации.

Сделать это личным

На сайте BBC News мы используем данные для предоставления услуг и инструментов для наших пользователей уже ощутимо больше десяти лет.

Самый подходящий и самый последовательный пример, который мы впервые опубликовали в 1999 году – это наши рейтинги школ, в которых используются данные, ежегодно публикуемые правительством. Читатели могут найти местные школы, введя почтовый индекс, и сравнить их по ряду показателей. Журналисты, специализирующиеся на вопросах образования, также работают вместе с командой этого проекта над просмотром и отбором данных для сюжетов перед публикацией.

Когда мы начали это делать, не было официального сайта, который давал бы возможность представителям общественности исследовать данные. Но сейчас Министерство образования имеет свой собственный сопоставимый сервис, и в связи с этим наша служба переключила свое внимание скорее уже на сюжеты, создаваемые на основе этих данных, чем на сами данные.

Основной задачей в этой сфере должно быть предоставление доступа к данным, к которым имеется явный интерес со стороны общественности. Свежим примером проекта, в котором мы раскрыли большой набор данных, в обычной ситуации недоступных широкой общественности, был специальный репортаж «Все смертельные случаи на всех дорогах» ( Every death on every road). Мы предоставили возможность поиска по индексу, который позволял пользователям искать и находить места, где происходили все смертельные случаи на дорогах Великобритании за последнее десятилетие.

Мы визуализировали некоторые из основных цифр и фактов, взятых из данных полиции, и, чтобы придать проекту более динамичный характер и человеческое лицо, объединились с Лондонской ассоциацией скорой помощи (London Ambulance Association) и с телерадиодепартаментом BBC London, чтобы отследить аварии в столице, когда они происходили. Результаты этого исследования сообщались в режиме онлайн, а также через Твиттер посредством хэштега #crash24, кроме того, все столкновения и аварии наносились на картусразу, как только они происходили.

Простые инструменты

Вместе с предоставлением способов для изучения больших объемов данных, мы также добились успеха в создании простых инструментов для пользователей, которые обеспечивают выделение лично значимых фрагментов информации. Эти инструменты апеллируют в первую очередь к тем, у кого мало времени, и кто не особо захочет осуществлять длительный анализ. Возможность легко поделиться «персональным» фактом – это то, что мы начали встраивать в наши проекты в качестве стандартной функции.

Непринужденным примером данного подхода является наш материал «Мир при семи миллиардах: Каков ваш номер?» ( The world at 7 billion: What’s your number?The world at 7 billion: What’s your number?), опубликованный в соответствии с официальными данными о дате, в которую население планеты превысит 7 миллиардов человек. Введя дату своего рождения, пользователь мог выяснить, какой у него самого был порядковый номер, в плане глобального населения, когда он родился, и потом поделиться этим номером через Твиттер или Facebook. В приложении использовались данные, предоставленные фондом ООН в области народонаселения. Этот проект был очень популярным, и ссылка на него стала самой популярной ссылкой в Facebook в Великобритании в 2011 году.

Еще одним свежим примером является бюджетный калькуляторBВС, который дает возможность пользователям выяснить, насколько лучше или хуже им будет жить в финансовом плане с вводом в действие нового бюджета – и затем поделиться полученной цифрой. Мы скооперировались с бухгалтерско–аудиторской компанией KPMG LLP, которая предоставила нам расчеты, основанные на данных годового бюджета, и затем мы упорно потрудились над тем, чтобы создать привлекательный интерфейс, который побудит пользователей сделать предлагаемое им задание.

Добывание данных

Но где во всем в этом журналистика? Поиск сюжетов в данных – это более традиционное определение для журналистики данных. Имеется ли тут эксклюзив, закопанный в этой базе данных? Все ли цифры точны? Они доказывают или опровергают? Все это – те вопросы, которые должен задавать себе журналист, работающий с данными, или журналист, занимающийся компьютерной журналистикой. Но можно потратить очень много времени на то, чтобы перелопатить огромные массивы данных в надежде найти что–нибудь примечательное.

В этом смысле мы обнаружили, что самым продуктивным является вариант вступить в партнерские отношения с исследовательскими группами или программами, у которых есть опыт и время на то, чтобы расследовать ту или иную историю. Информационная программа ВВС под названием «Панорама» (Panorama) потратила месяцы, работая с Центром расследовательской журналистики и собирая данные о зарплатах в государственном секторе. Результатом стал телевизионный документальный фильм и онлайн–материал в виде специального репортажа «Зарплаты в госсекторе: Цифры» ( Public Sector pay: The numbers), где все данные были опубликованы и визуализированы, и сопровождались анализом – область за областью, сектор за сектором.

Вместе с партнерством с журналистами, работающими в секторе расследовательской журналистики, наличие доступа к умеющим считать и разбирающимся в математике журналистам, обладающим специальными знаниями, является жизненно важным и необходимым. Когда коллега по бизнесу нашей команды проанализировал данные о сокращении расходов, озвучиваемые правительством, он пришел к выводу, что правительственное изложение этих данных заставляет их звучать более весомо и выглядеть более значимыми и более масштабными, чем они есть на самом деле. Результатом стал эксклюзивный материал, «Извлекая смысл из данных» ( Making sense of the data), дополнением к которому служила четкая и ясная визуализация, которая даже получила награду Королвеского статистического общества.

Понимание проблемы

Но журналистике данных не обязательно нужно быть эксклюзивом, который не заметил никто другой. Работа группы по визуализации данных заключается в том, чтобы объединить отличный дизайн с четким редакционным повествованием – чтобы дать пользователю убедительный и аргументированный опыт. Создание визуализационных решений на основе правильных данных может использоваться для того, чтобы дать людям лучшее понимание проблемы или сюжета, и мы часто используем этот подход в процессе создания наших сюжетов на ВВС. Одним из методов, используемых, например, в нашем проекте по отслеживанию количества подающих заявления на пособия по безработице ( UK claimant count tracker), стало составление карты, данные на которой время от времени меняются, чтобы дать пользователю четкое представление о происходящих переменах.

Проект в области данных под названием «Сеть долгов еврозоны» ( Eurozone debt web) исследует запутанную паутину межгосударственных долговых отношений. Этот проект помогает объяснить сложный вопрос визуально воспринимаемым способом, с использованием цветов и пропорциональных стрелок вместе с ясным и понятным текстом. Важным соображением является задача побудить пользователя исследовать проект, или следовать теме повествования, а также задача обеспечить то, чтобы он не чувствовал себя перегруженным цифрами.

Описание команды

Команда, которая занимается производством продуктов из области журналистики данных для сайта BBC News, состоит примерно из двадцати журналистов, дизайнеров и разработчиков.

Наряду с проектами в области данных и визуализациями, команда делает всю инфографику и интерактивные мультимедиа–решения на новостном вебсайте. Все вместе это образует набор сюжетной техники, который мы стали называть «визуальной журналистикой». У нас нет людей, которых отдельно идентифицируют как «журналистов данных», но весь редакционный персонал команды должен уметь пользоваться базовыми табличными приложениями, такими как Excel и Google Docs, для анализа данных.

Главным и ключевым для любых проектов в области данных являются технические навыки и советы наших разработчиков, а также навыки наших дизайнеров в области визуализации. И хотя все мы либо журналисты, либо дизайнеры, либо разработчики «в первую очередь», мы продолжаем упорно трудиться над увеличением степени нашего понимания и умения ориентироваться в профессиональных областях другого.

Ключевыми продуктами для исследования данных являются Excel, Google Docs и Fusion Tables. Команда также использовала, но в меньшей степени, базы данных MySQL и Access, и Solr для обработки бОльших массивов данных, а также пользовалась RDF и SPARQL для того, чтобы начать искать способы, которыми мы можем моделировать события с использованием технологий Linked Data. Разработчики также использовали и используют языки программирования по своему вкусу, будь то ActionScript, Python или Perl для сверки, разбора и, возможно, опровержения наборов данных, над которыми мы работаем. Perl используется также для решения некоторых издательско–публикационных задач.

Для изучения и визуализации географических данных мы используем Google, Bing Maps и Google Earth, а также сервис ArcMAP от Esri.

Для графиков мы используем приложение Adobe Suite, включая Adobe After Effects, Adobe Illustrator, Adobe Photoshop и Adobe Flash, хотя мы редко публикуем флэш–файлы сейчас на сайте, так как JavaScript, в частности, JQuery и другие библиотеки JavaScript, такие как Highcharts, Raphael и D3, все больше отвечают нашим требованиям в области визуализации данных.

Белла Харрел и Эндрю Леймдорфер, BBС

Как работает группа подготовки новостных приложений в Chicago Tribune

Рис 16. Команда по новостным приложениям Chicago Tribune (Фото Брайана Бойера)

Команда подготовки новостных приложений в Chicago Tribune – это просто сборище радостных компьютерщиков, внедренных в ньюсрум. Мы работаем в тесном контакте с редакторами и журналистами, помогая: (1) проводить исследования и создавать информационные материалы, (2) иллюстрировать сюжеты в онлайне, и (3) создавать неувядающие, незабываемые веб–ресурсы для прекрасных людей Чикаго.

Это очень важно, что мы сидим в ньюсруме. Мы обычно находим работу посредством диалогов лицом к лицу с журналистами. Они знают, что мы с удовольствием поможем написать скрин–скрэпер для отвратительного правительственного вебсайта, разорвем в клочки пачку PDF–ов, или каким–нибудь еще способом превратим то, что еще не является данными, в нечто, что вы сможете проанализировать. Это своего рода рекламная продажа с целью привлечения покупателей в нашей команде – таким способом мы узнаем о потенциальных проектах в области работы с данными еще на этапе их начала.

В отличие от многих других команд и групп подготовки в этой области, наша команда была основана технологами, для которых заняться журналистикой означало серьезную перемену в развитии карьеры. Некоторые из нас приобрели магистерскую степень в журналистике спустя несколько лет работы программистами в бизнес–целях, а других взяли из сообщества открытого правительства.

Мы работаем в очень подвижной и динамичной манере. Чтобы убедиться в этом и гарантировать, что мы всегда в синхронизированном режиме и готовы к бою, каждое утро начинается с пятиминутной летучки. Мы часто программируем парами – два разработчика за одной клавиатурой – зачастую такой вариант оказывается более продуктивным, чем вариант «два разработчика за двумя клавиатурами». Процесс производства большинства проектов занимает не более недели, но иногда бывают и более длительные проекты, над которыми мы работаем недельными циклами, а потом показываем результаты нашей работы заинтересованным группам лиц – обычно журналистам и редакторам – каждую неделю. Как мантра произносятся слова «Терпи неудачу быстро» (Fail fast). Если ты делаешь что–то неправильно, то нужно узнать об этом как можно скорее, особенно когда ты пишешь программу, что называется, «в жесткие сроки»!

Существует огромный плюс в программировании итерационно, в жесткие сроки. Мы всегда обновляем наш набор инструментов. Каждую неделю мы выдаем в свет одно или два приложения, потом, в отличие от обычных фабрик и магазинов программного обеспечения, мы имеем возможность задвинуть его на самую дальнюю полку нашего мозгового склада и перейти к следующему проекту. Это та радость, которую мы разделяем с журналистами, каждую неделю мы узнаем что–то новое.

Все идеи относительно приложений поступают от редакторов и журналистов в ньюсруме. Это, я уверен, отличает нас от команд, занимающихся приложениями, в других ньюсрумах, которые часто рожают свои собственные идеи. Мы построили крепкие личные и профессиональные отношения в редакции, и парни знают, что когда у них есть данные, они приходят к нам.

БОльшая часть нашей работы в ньюсруме – это поддержка журналистов. Мы помогаем репортерам раскапывать данные, превращать PDF–файлы в таблицы, разрабатывать скрин–скрэповые сайты, и так далее. Это услуги, которые нам нравится предоставлять, потому что благодаря им мы раньше всех знакомимся с данными, с работой над этими данными, которая идет в редакции. Какая–то часть этой работы превращается в новостное приложение – карту, таблицу, или порой крупномасштабный сайт.

Ранее мы делали ссылку на приложение с опубликованного материала, и в этом случае такой вариант не давал особого трафика. Сейчас же приложения появляются где–то рядом с верхней частью главной страницы нашего сайта, и уже приложение содержит ссылку на сам материал, и такой вариант отлично работает, идя на пользу и приложению, и новостному материалу. Есть на сайте специальный раздел для результатов нашей работы, но трафик на него не очень хороший. Но это и неудивительно. «Эй, сегодня мне нужны кое–какие данные» – это не особо распространенный подход со стороны пользователей.

Нам нравится большое количество просмотров, и нам нравятся награды наших коллег, но это, тем не менее, слабая приправа к интересу. Мотивация все время должна наносить удар, воздействовать – на жизнь людей, на законы, на призвание к отчету политиков, и так далее. Написанная статья будет высказываться в поддержку тенденции и гуманизировать ее парой историй или рассказов. Но что должен делать читатель, когда мы закончим историю? В безопасности ли его семья? Обучаются ли должным образом его дети? Наша работа оправдывает себя, когда она помогает читателю найти его или ее собственную историю в массиве данных. Примеры имеющей ударную силу, эффективной и персонализированной работы, которую мы проделали, можно найти в наших приложениях «Отчеты по безопасности в домах престарелых» ( Nursing Home Safety Reports) и «Сводные таблицы школ» ( School Report Card).

Брайан Бойер, Chicago Tribune


    Ваша оценка произведения:

Популярные книги за неделю