Текст книги "Пособие по журналистике данных"
Автор книги: Д. Грей
Жанр:
Справочники
сообщить о нарушении
Текущая страница: 19 (всего у книги 21 страниц)
Визуализация как «рабочая лошадка» журналистики данных
Прежде чем вы приступите к попытке построить график или нанести на карту ваши данные, возьмите и подумайте минутку о том, сколь многочисленную и многозначную роль играет статичная и интерактивная графика в вашей журналистской работе.
На стадии создания материала визуализации могут:
Помочь вам найти и определить темы и поставить вопросы для остальной части вашего репортажа
Идентифицировать какие–либо аномалии, резко выделяющиеся значения: превосходнейшие истории или, возможно, ошибки в ваших данных
Помочь вам найти и выделить типичные примеры
Показать вам пробелы в вашем репортаже – чего недостает
Визуализации также играют разные роли непосредственно при публикации:
Могут проиллюстрировать какой–то момент сюжета более наглядным способом
Могут убрать из повествования ненужную техническую информацию
Особенно в тех случаях, когда они интерактивные, они могут давать возможность осуществлять исследовательские работы, а также обеспечивать прозрачность в отношении вашей репортажной работы в глазах ваших читателей
Эти роли заставляют предполагать, что вы должны начинать делать визуализации именно сразу при создании материала, независимо от того, начали вы уже собирать электронные данные или записи или нет. Не считайте это отдельным шагом, вопросом, который можно будет решить уже после того, как большая часть материала будет написана. Данный раздел призван помочь вам вести подготовку сюжета в правильном направлении.
Начать порой означает просто превратить в визуальную форму те записи, которые вы уже сделали. Посмотрите на график на Рис 80, который был в Washington Post в 2006 году.
Рис 80. Развитие сельскохозяйственных субсидий во времени(Washington Post)
Этот график демонстрирует долю сельскохозяйственных доходов, связанную с субсидиями, и ключевые события в этой области за последние 45 лет, он был создан в течение нескольких месяцев. При этом было достаточно проблематично искать и находить данные за разные периоды времени, которые могли бы использоваться и сводиться воедино с аналогичными определениями и значениями. При этом исследование и изучение всех высших и низших точек графика помогло нам удерживать этот контекст в памяти, когда мы делали остальную часть репортажа. Это также означало, что одна работа была практически закончена еще до того, как сюжеты и материалы были написаны.
Вот несколько подсказок, советов по использованию визуализации в начале изучения ваших наборов данных.
Совет 1: Используйте небольшие однотипные составляющие, чтобы быстро ориентироваться в больших наборах данныхЯ пользовался этой техникой в Washington Post, когда мы искали подсказку, намек на то, что администрация Джорджа Буша–младшего выдавала гранты по политическим, а не предметно–содержательным мотивам. Большинство из этих программ помощи реализуются по формуле, а оставшиеся финансировались годами, так что нам было любопытно, сможем ли мы найти какой–то характерный образец поведения и вычленить повторяющийся сценарий, просмотрев примерно 1 500 различных произвольным образом выбранных денежных потоков.
Рис 81. HHS Grants: искрографики помогают найти и ухватить суть истории(Washington Post)
Я создал график для каждой программы помощи, где красные точки обозначали год президентских выборов, а зеленые точки – годы выборов в конгресс. Трудная задача: да, наблюдается резкий всплеск в период за шесть месяцев до выборов президента по нескольким из анализируемых программ – красные точки с пиковыми значениями рядом с ними – но это не тот предвыборный год. Вместо года, когда переизбирался Джордж Буш, мы видим, что пики постоянно приходятся на президентские выборы 2000 года, когда в Белом доме был Билл Клинтон, а его вице–президент, Альберт Гор, избирался на этот пост.
И все это было очень легко заметить именно на серии графиков, а отнюдь не в таблицах с цифрами, и интерактивная форма представления информации дала нам возможность проверить разные типы грантов, разные регионы и разные управления и агентства. Карты в небольших количествах могут стать способом показать время и место на статичной картинке, и информацию будет легко сравнить – порой, даже легче, чем в случае с интерактивом.
Этот пример был создан при помощи коротенькой программы, написанной на PHP, но теперь это гораздо проще делать при помощи искрографиков Excel 2007 и 2010. Эдвард Тафт (Edward Tufte), эксперт в области визуализации, изобрел эти «впечатляющие, насыщенные, простые и похожие на слова графики» для передачи информации таким образом, чтобы ее можно было воспринимать буквально с первого взгляда, даже когда речь идет о больших объемах данных. Теперь их можно увидеть повсюду – начиная с маленьких графиков под биржевыми котировками до записей о победах и поражениях в спорте.
Совет 2: Обрабатывайте и анализируйте ваши данные сверху вниз, вдоль и поперекКогда вы пытаетесь понять сюжет или материал, построенный на базе набора данных, на него просто невозможно взглянуть с неправильной точки зрения; попробуйте сделать это любым способом, который только придет вам в голову, и вы получите разные точки зрения. Если вы делаете материал по преступности, вы, вероятно, будете смотреть на один набор графиков и диаграмм, повествующих о том, как изменилась ситуация с преступлениям против личности за год; можно анализировать процентные изменения, можно делать сравнения с другими городами, а еще можно делать акцент на изменениях с течением времени. Используйте все – исходные цифры, проценты и коэффициенты.
Смотрите на данные, используя разные шкалы. Сначала попробуйте делать это, соблюдая правило, что ось Х – это нулевой уровень. Потом нарушьте это правило, и посмотрите, не появилась ли у вас перед глазами какая–то новая информация. Пробуйте логарифмы и квадратные корни для данных с асимметричным распределением.
Не забывайте об исследовании, проведенном на основе визуального восприятия. Эксперименты Уильяма Кливленда (William Cleveland) показали, что глаз видит изменения в изображении, когда средний уклон составляет 45 градусов. Это означает, что вы можете игнорировать наставления всегда начинать с нуля, и вместо этого работаете над тем, чтобы создать максимально глубокую, поучительную и интуитивно понятную графику. Другое исследование в области эпидемиологии предлагает вам обозначить целевой уровень в качестве границы для вашей диаграммы. Каждый из этих способов помогает вам взглянуть на данные разными способами и с разных точек зрения. Когда они перестанут говорить вам что–то новое, тогда вы будете знать, что этот этап работы закончен.
Совет 3: Не предполагайтеТеперь, когда вы взглянули на ваши данные разными способами, вы, возможно, нашли записи, которые не выглядят верными – возможно, вы не поняли сначала, что они означают, или там есть какие–то отклонения, резко выделяющиеся значения, которые выглядят как ошибки, или есть тенденции, которые кажутся обратными.
Если вы хотите опубликовать что–либо на основании вашего первичного изучения, или сделать это в виде опубликованной визуализации, вам нужно решить эти вопросы, но при этом нельзя делать никаких предположений. Либо это интересные истории, либо это ошибки; интересный вызов здравому смыслу или недоразумение, недопонимание.
Для местных органов власти не является чем–то из ряда вон выходящим публикация таблиц данных, в которых полно ошибок, и кроме того, настолько же легко можно неправильно понять правительственный жаргон, профессиональный канцелярский язык в наборах данных.
Во–первых, пробегитесь обратно по вашей работе. Вы прочли документацию, все ее оговорки – так имеется ли проблема в оригинальной версии данных? Если с вашей стороны все выглядит правильным, тогда пришло время снять трубку. Вы собираетесь решить эту проблему, если вы планируете использовать эти данные, так что можно начать прямо сейчас.
И вместе с тем, не всякая ошибка важна. Например, в записях о финансировании предвыборной кампании часто встречаются несколько сотен почтовых индексов, которых нет в базе данных со 100 000 записей. Пока не случится так, что все эти непонятные индексы не окажуться в одном и том же городе или не будут иметь отношение к одному и тому же кандидату, эти случайные ошибки не имеют никакого значения.
Надо задать себе вопрос: если бы я собирался это использовать, будет ли для читателей принципиально важно иметь точное представление о том, что говорят данные именно в этом конкретном вопросе?
Совет 4: Избегайте вдаваться в излишние подробности, не зацикливайтесь на точности и аккуратностиОбратной стороной ситуации, когда вы не задаете достаточного количества вопросов, является зацикливание на излишней точности и аккуратности, в ущерб сути. Ваша исследовательская графика должна быть в общем и целом правильной, но не нужно волноваться, если у вас попадаются разные уровни округления, если они не дают в целом ровно 100%, или если у вас не хватает данных за один или два года из двадцати. Это часть исследовательского процесса. Вы по–прежнему будете способны видеть крупные тенденции, и будете знать, что еще вам нужно собрать, перед тем, как наступит время публикации.
На самом деле вы можете решить убрать все обозначения и масштабные отметки, примерно как на приведенных выше графиках, чтобы получить еще лучшее общее ощущение от данных.
Совет 5: Создавайте хронологические подборки случаев и событийВ самом начале какого–нибудь сложного проекта начинайте строить хронологию ключевых событий и моментов. Можно использовать Excel, Word или специальный инструмент типа TimeFlow для этих целей, но в какой–то момент вы наткнетесь на набор данных, который вы сможете подложить под нее. Потом, если периодически пробегаться по этой хронологии, вы сможете увидеть, где у вас есть пробелы, которые необходимо заполнить.
Совет 6: Встречайтесь с вашим графическим отделом как можно раньше и почащеУстройте коллективное обсуждение, «мозговой штурм», решая вопрос о том, какую можно сделать графику, вместе с художниками–иллюстраторами и дизайнерами в вашем ньюсруме. Они взглянут другим взглядом на ваши данные, выскажут предположения о том, как они могут сработать в интерактивном режиме, и помогут с ноу–хау о том, как объединить данные с сюжетами и материалами. Ваша журналистская работа будет сильно облегчена, если вы будете знать, что вам нужно собрать с самого начала, или если вы сможете в экстренном порядке сообщить вашей команде подготовки, что сделать график не представляется возможным, так как вам не хватает данных.
СОВЕТЫ ДЛЯ ПУБЛИКАЦИИВы могли потратить всего несколько дней или даже часов на ваше исследование, или же ваша история могла потребовать месяцев на подготовку. Но когда речь заходит о том, чтобы перейти к стадии публикации, наиболее важными становятся два момента.
Помните тот потерянный год, который вы провели, занимаясь ранними, заблаговременными исследованиями? Вдруг оказывается, что без них вы не можете двигаться дальше. Все эти плохие данные, которые вы проигнорировали в свое время? Они вернутся и будут преследовать вас.
Причина в том, что вы не можете писать на основе некачественных данных. Когда дело касается графика, то либо у вас есть все, что вам нужно, либо нет ничего. И никакой середины быть не может.
1. Объединяйте усилия по сбору данных с интерактивной графикой
В интерактивной графике нет никакой тайны или сокрытия. Если вы действительно собираетесь сделать так, чтобы ваши читатели изучали данные любым желаемым ими способом, тогда каждый элемент данных должен быть именно тем, чем он кажется. Пользователи в любой момент могут обнаружить какую–нибудь ошибку, и она может преследовать вас месяцы или годы.
Если вы строите вашу собственную базу данных, это означает, что вы должны ожидать того, что вам придется ее вычитывать в плане корректуры, проверять факты, и постоянно копировать и редактировать всю базу. Если вы используете данные разных органов власти, вы должны принять решение о том, сколько выборочных проверок вы сделаете, и что вы планируете делать, когда обнаружите неизбежную ошибку.
2. Разрабатывайте дизайн для двух типов читателей
График – будь то в виде отдельного интерактивного элемента или в виде статичной визуализации, который сопровождает ваш материал – должен удовлетворять запросам двух разных типов читателей. Он должен быть легко понятным с первого взгляда, но при этом и достаточно сложным, чтобы предложить что–нибудь интересненькое людям, которые хотят копнуть глубже. Если вы делаете его интерактивным, убедитесь, что ваши читатели получат от этого что–то большее, чем просто цифру или название.
3. Выражайте одну идею – потом упрощайте
Вы уверены, что есть что–то одно, самое главное, что вы хотите, чтобы люди увидели? Тогда решите вопрос о том, какое общее впечатление, на ваш взгляд, должен получить читатель, и сделайте так, чтобы все остальное исчезло. Во многих случаях это означает удалить какую–то информацию даже когда интернет позволяет вам предоставить все. За исключением случаев, когда вашей основной целью является демонстрация прозрачности журналистской работы, бОльшая часть тех деталей и подробностей, которые вы вставили в вашу временную шкалу и хронологию, просто не очень важны. В статичной графике они будут смущать и отпугивать. В интерактивной графике это будет просто скучно.
Использование визуализаций для рассказывания историй и создания материалов
Визуализация данных заслуживает внимания по нескольким причинам. Она не только может быть поразительно красивой и привлекающей внимание – ценной социальной валютой для того, чтобы ею делиться и привлекать читателей – она также является средством, дающим мощное познавательное преимущество: целая половина человеческого мозга предназначена для обработки зрительной, визуальной информации. Когда вы представляете пользователю информационную графику, вы захватываете его внимание посредством того пути в мозге, который обладает самой высокой пропускной способностью. Хорошо продуманная и качество сконструированная визуализация данных может обеспечить зрителям незамедлительное и глубокое, очень полное впечатление, и дать путь прохода через беспорядок сложной истории, чтобы добраться прямо до сути.
Но в отличие от других визуальных медиа – таких как статичные фотографии и видео – визуализация данных также имеет глубокие корни в поддающихся измерению фактах. При том, что она является эстетически привлекательной и, что называется, цепляющей, она в меньшей степени эмоционально перегружена, более сконцентрирована на том, чтобы пролить свет, нежели на том, чтобы возбудить и нагнать страсти. В эпоху узко ориентированных медиа, которые часто подгоняются под аудиторию с определенным взглядом или точкой зрения, визуализация данных – и журналистика данных в целом – предлагает дразнящую и манящую возможность рассказывания историй, основанных прежде всего на фактах, на данных, а не на фанатизме.
Более того, как и другие формы повествовательной журналистики, визуализация данных может быть эффективной как в плане подачи срочных новостей – быстро вводя новую информацию, такую как место происшествия и количество жертв, – так и в плане тематических статей и очерков, в случае с которыми она позволяет глубже проникнуть в тему и предлагает новую точку зрения, чтобы помочь вам увидеть что–то знакомое совершенно новым способом.
Увидеть знакомое новым способомРис 82. Уровень безработицы для таких людей, как вы(New York Times)
На самом деле, способность визуализации данных дать возможность проверить расхожее мнение или общепринятую точку зрения подтверждается, например, примером интерактивной графики, опубликованной New York Times в конце 2009 года, год спустя после начала глобального экономического кризиса. В условиях, когда общенациональный уровень безработицы в США колебался в районе 9%, пользователи имели возможность задать фильтр для населения США по различным демографическим и образовательным показателям, чтобы посмотреть, насколько резко варьировались уровни безработицы для разных слоев и групп населения. Как оказалось, этот самый уровень безработицы варьировался от менее чем 4% для женщин среднего возраста с учеными степенями выше бакалавра до примерно 50% среди молодых чернокожих граждан, которые не закончили среднюю школу, и более того, в этой диспропорции не было ничего нового – о чем свидетельствовало лихорадочное изменение, неустойчивость линии, показывающей исторические ценности для каждой из этих групп.
Даже после того, как вы перестаете на нее смотреть, хорошая визуализация данных остается у вас в мозгу и оставляет прочную, длительного действия ментальную модель факта, тенденции или процесса. Сколько всего люди смогли увидеть посредством анимации, распространенной исследователями цунамив декабре 2004 года, которая показывала каскадные волны, распространяющиеся в стороны от индонезийского землетрясения в Индийском океане, угрожающие миллионам жителей прибрежных районов в Южной Азии и Восточной Африке?
Визуализации данных – и эстетические ассоциации, которые они порождают – могут даже стать культурными эталонами, как это было с представлением глубоких политических расхождений в Соединенных Штатах после выборов 2000 и 2004 годов, когда «красные», удерживаемые республиканцами штаты заполнили центральную часть страны, а «синие» демократические штаты сконцентрировались на северо–востоке и дальнем западе страны. И неважно, что в американских СМИ до 2000 года основные вещательные сети свободно переключались между синими и красными, чтобы показать каждую партию, а некоторые даже выбрали вариант чередования каждые четыре года. Таким образом, некоторые американцы вспоминают об эпохальной сокрушительной победе над «синими» силами 49 штатов, когда в 1984 году победу одержал Рональд Рейган.
Но для каждой графики, которая пробуждает визуальное клише, появляется другая, обеспечивающая мощное фактическое подтверждение, такая как карта 2006 годаNew York Times, в которой круги разного размера использовались для того, чтобы показать, как сейчас живут тысячи эвакуировавшихся из Нового Орлеана в связи с ураганом, как их разбросало по континенту, и это было показано посредством соотношения между личными связями и программами переселения. Вернутся ли когда–нибудь эти «затерянные» переселенцы домой?
Так что теперь, когда мы обсудили силу и мощь визуализации данных, справедливо задаться вопросом: когда нам нужно ее, визуализацию, использовать, и когда не нужно.
Когда использовать визуализацию данных?
Прежде всего, посмотрим на несколько примеров, где визуализация данных может быть полезной для того, чтобы помочь рассказать ту или иную историю вашим читателям.
Показать изменения с течением времениРис 83. Как долго идет создание технологической империи?(Wall Street Journal)
Возможно, наиболее частое использование визуализации данных – это когда требуется показать, как с течением времени меняются ценности. Хорошие примеры – рост населения Китая с 1960 годаили всплеск безработицы после экономического краха 2008 года. Но визуализации данных также могут сильным образом продемонстрировать изменения во времени – причем лучше, чем иные формы графического представления информации. Португальский исследователь Педро Круз (Pedro M. Cruz) использовал анимированную графику с кругами, чтобы наглядно и драматично продемонстрировать упадок западноевропейских империйс начала XIX века. Взятые по размеру населения, Британия, Франция, Испания и Португалия лопались, как мыльные пузыри, по мере того, как их заокеанские территории получали независимость. Ушли Мексика, Бразилия, Австралия, Индия, оставалось только ждать… ушли многие африканские колонии в начале 1960–х годов, практически уничтожив Францию.
График от Wall Street Journalпоказывает количество месяцев, которое потребовалось предпринимателям, чтобы достичь магической цифры в 50 миллионов долларов по своим доходам. Созданный при помощи бесплатного инструмента создания графиков и анализа данных Tableau Public, сравнительный график напоминает следы от многочисленных взлетающих самолетов – некоторые взлетают быстро, некоторые медленно, некоторые идут тяжело, накладываясь друг на друга.
Если уж мы заговорили о самолетах, то другой интересный график показывает изменения с течением времени в доле рынка, которую занимали крупнейшие американские авиакомпаниив течение нескольких десятилетий процесса консолидации отрасли. После того, как администрация Картера отменила государственное регулирование в гражданской авиации, серия финансируемых в долг приобретений создала из маленьких региональных авиалиний общенациональных перевозчиков, и этот процесс иллюстрирует график от New York Times.
Учитывая то, что почти что все обычные читатели воспринимают горизонтальную ось «Х» графиков как представляющую время, порой можно легко подумать, что все визуализации должны показывать изменения с течением времени.