355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Д. Грей » Пособие по журналистике данных » Текст книги (страница 20)
Пособие по журналистике данных
  • Текст добавлен: 26 сентября 2016, 16:16

Текст книги "Пособие по журналистике данных"


Автор книги: Д. Грей


Жанр:

   

Справочники


сообщить о нарушении

Текущая страница: 20 (всего у книги 21 страниц)

Сравнить ценности

Рис 84. Подсчет человеческих потерь в войнах.(BBC)

Однако визуализация данных также показывает себя с лучшей стороны и в области помощи читателям в осуществлении сравнения двух и более дискретных значений, будь то в том, что касается восприятия в контексте событий трагических потерь среди военнослужащих в Ираке и Афганистане (путем сравнения их с тысячами убитых во Вьетнаме и миллионами погибших во Второй мировой войне, как сделала ВВС в анимированном слайд–шоу, сопровождающем их базу данных по потерям); или в том, что касается канала National Geographic, использовавшего очень минималистичный график, показывающий, насколько у вас больше шансов умереть от болезни сердца (1 шанс из пяти) или от сердечного приступа (1 шанс из 24), чем в результате авиакатастрофы (1 шанс из 5 051) или от укуса пчелы (1 шанс из 56 789), при помощи демонстрации относительных шансов умереть (при этом все это перекрывается огромной дугой, демонстрирующей шансы умереть в общем и целом: один из одного!). ВВС в сотрудничестве с агентством Berg Design также разработала вебсайт под названием «Размеры и измерения» (« Dimensions»), который позволяет вам наложить контуры крупных событий в мире – разлива нефти в результате аварии на буровой платформе Deepwater Horizon или наводнений в Пакистане, например – на карту вашей собственной местности обитания в Google. (howbigreally.com).

Показать связи

Рис 85. Зарплата и производительность(Ben Fry)

Введение в действие во Франции системы высокоскоростного железнодорожного сообщения в 1981 году в буквальном смысле не сделало страну меньше, но умным образом сделанная визуальная презентация показывает, насколько меньше времени теперь занимает задача добраться до разных мест, чем на обычном поезде. Наложенная на изображение страны сетка выглядит ровной и упорядоченной равным образом по всей стране в изображении ситуации «до», но потом предстает централизованной, направленной в сторону Парижа, в изображении ситуации «после», показывая, что «ближе» стали только населенные пункты в исходящем от столицы направлении, а также то, что большая часть выигрыша во ремени приходится на первую часть пути, прежде чем поезда достигнут неулучшенных железнодорожных трасс, и вынуждены будут замедлить скорость.

Чтобы получить сравнение двух отдельных переменных, взгляните на график, оценивающий выступления бейсбольных команд высшей лигипо отношению к зарплатам в них. В левой колонке команды ранжированы по их результатам на данный момент, а справа приведены цифры, показывающие суммарную зарплату их игроков. Строчки, окрашенные в красный (неадекватно высокая зарплата по сравнению с результатами) и синий (неадекватно низкая зарплата по сравнению с результатами в играх) связывают эти два показателя, давая удобное для понимания ощущение того, владельцы каких команд сожалеют о том, что их дорогие игроки себя не оправдывают. Более того, прокручивание ситуации по временной шкале дает живое и яркое анимированное впечатление о том, как развивается ситуация в текущем сезоне.

Отслеживать потоки

Рис 86. Tropicana(Sourcemap)

Сара Коэн, Университет Дьюка

Дизайн для данных

Примерно так же, как и обычные диаграммы и графики, функциональные и структурные диаграммы также кодируют информацию, превращая ее в соединительные линии, основная суть которых кроется в их толщине и/или цвете. Например, для ситуации с кризисом еврозоны, когда несколько ее государств–членов оказались неспособны платить по своим долгам, New York Times решила распутать паутину заимствований, которая связывает страны–члены ЕС с из торговыми партнерами на другом берегу Атлантики и в Азии. В одном из «режимов» визуализации ширина линий отражает суммы кредитов, идущие от одной страны к другой, а изменение цвета в диапазоне от желтого до оранжевого показывает, насколько этот поток вызывает тревогу или беспокойство – в смысле, что деньги вряд ли вернутся!

Если взять более приятную и радостную тему, то вот, например, журнал National Geographic сделал обманчиво простой график, показывающий связи между тремя американскими городами  – Нью–Йорком, Чикаго и Лос–Анджелесом – и ведущими районами производства вина, демонстрируя, как осуществляются транспортные перевозки продукта из каждого из источников, и насколько разные уровни негативных экологических последствий в плане выбросов парниковых газов дают разные маршруты. Так, например, получается, что вина из региона Бордо для жителей Нью–Йорка оказываются более «экологичными», чем калифорнийские.

«SourceMap», проект, начатый в бизнес–школе Массачусетского института технологий, использует функциональные, структурные диаграммы, чтобы скрупулезно взглянуть на глобальные закупки производственных товаров, их компонентов и сырья. Благодаря обширным и серьезным исследованиям, пользователь теперь может осуществлять поиск самой разной продукции, начиная с обуви под брендом Eccoи заканчивая апельсиновым соком, и выяснить, из каких уголков земного шара эти товары были взяты, и каков будет след именно от их производства в объемах углеродных выбросов.

Показать иерархию

Рис 87. OpenSpending.org(Фонд Open Knowledge)

В 1991 году исследователь Бен Шнейдерман (Ben Shneiderman) изобрел новый вид визуализации под названием « treemap», состоящий из многочисленных прямоугольников, концентрически вложенных друг в друга. Площадь данного прямоугольника соответствует количеству, которое он представляет, как сам собой, так и беря в совокупности все свое содержимое. Будь то при визуализации национального бюджета по тем или иным органам или их подразделениям, в случае с визуализацией фондового рынка по секторам и компаниям, или языка программирования по классам и подклассам, формат treemap представляет собой компактный и интуитивно понятный интерфейс для представления всей совокупности в целом и ее составных частей. Другим эффективным и действенным форматом является дендрограмма, который выглядит более похожей на обычный организационный график, где подкатегории продолжают отходить в виде ветвей от одного изначального ствола.

Ориентирование в больших базах данных

Рис 88. Каждая смерть на каждой дороге в Великобритании в 1999–2010 годах.(BBC)

В то время как некоторые визуализации данных очень эффективны, когда нужно взять знакомую, известную информацию и представить ее в совершенно новом свете, что происходит, когда у вас имеется совершенно новая информация, в которой люди хотят ориентироваться? Век данных приносит с собой потрясающие новые открытия практически каждый день, начиная с великолепного географического анализа фотографий FlickrЭрика Фишера (Eric Fischer), и заканчивая публикацией властями Нью–Йорка тысяч ранее недоступных и конфиденциальных оценок учителей.

Эти наборы данных приобретают максимальную силу, когда пользователи получают возможность копаться в них и дойти в своей детализации до той информации, которая будет иметь максимальное отношение непосредственно к ним.

В начале 2010 года New York Times получила доступ к обычно имеющим частный, скрытый характер записям и документам Netflix о том, в каких районах какие чаще всего брали в прокат фильмы. И хотя Netflix отказалась раскрыть точные цифры, New York Times смогла создать привлекательную интерактивную базу данных, которая позволяет пользователям просматривать прокатные данные по фильмам из топ–100 в 12 крупнейших метрополиях страны, разбитые по почтовым индексам. При этом по каждому коммьюнити можно смотреть, где именно какой фильм был более популярен – визуально это отображено при помощи цветов разной степени насыщенности.

К концу того же года New York Times опубликовала результаты проводящейся раз в десять лет переписи населения США  – всего через несколько часов после того, как эти результаты были обнародованы. Интерфейс, сделанный в Adobe Flash, предложил целый ряд возможных вариантов визуализаций и позволил пользователям просматривать информацию со степенью подробности вплоть до каждого конкретного избирательного участка в стране (коих насчитывается 8,2 миллиона), и увидеть, как распределяются на этих участках жители по расовому признаку, по уровню доходов и по уровню образования. При этом степень детализации данных была настолько высокой, что при просмотре информации в первые часы после публикации создавалось впечатление, что вы, возможно, первый человек в мире, который изучает данный конкретный уголок базы данных.

Аналогичное достойное похвалы использование визуализации в качестве интерфейса базы данных можно отметить в расследовании трагических инцидентах со смертельным исходом на дорогах, проведенном ВВС, а также в многочисленных попытках быстро проиндексировать масштабные массивы не всегда структурированных данных, таких как, например, публикации Wikileaks военных отчетов по Ираку и Афганистану.

Рисовать в своем воображении альтернативное развитие событий

Рис 89. Бюджетные прогнозы, сравнение с действительностью(New York Times)

В New York Times «дикобразоподобный график» Аманды Кокс (Amanda Cox) оказавшихся трагическим образом слишком оптимистичных прогнозов по бюджетному дефициту СШАза последние годы показывает, что порой бывает так, что то, что произошло, менее интересно, чем то, что не произошло. График температуры Кокс показывает всплеск бюджетного дефицита после десятилетия войн и налоговых льгот, и великолепно иллюстрирует, насколько нереалистичными могут стать прогнозы на будущее.

Бреет Виктор (Bret Victor), давний разработчик интерфейса для продуктов Apple (и создатель теории под названием «Отменить математику» (проект Kill Math), позволяющей использовать визуализацию для удобного представления количественной информации – получился нтерактивный интерфейс, где даже самые сложные уравнения не просто понятны каждому, но и являются новой формой искусства), создал прототип своего рода реагирующего документа . В его примере идеи экономии электроэнергии включают в себя доступные для редактирования исходные условия и положения, в соответствии с которыми даже такой простой шаг как выключение света в пустых комнатах может помочь американцам сэкономить энергию, которую производят от двух до сорока (!) работающих на угле электростанций. Изменение процентных показателей в середине текстового абзаца вызывает соответствующие изменения в остальном тексте на странице!

Если вы хотите ознакомиться с другими примерами и предположениями, то вот список различного использования визуализаций, карт и интерактвной графики, составленный Мэтью Эриксоном (Matthew Ericson) из New York Times.

Когда не использовать визуализацию данных

В конечном итоге эффективная и качественная визуализация данных зависит от качества, чистоты, точности и значимости информации. Ровно как хорошие цитаты, ценные факты и описанию способствуют созданию качественных материалов в рамках повествовательной журналистики, визуализация данных может быть хороша ровно настолько, насколько хороши данные, ее наполняющие.

Когда вашу историю можно рассказать лучше при помощи текста или мультимедиа

Порой бывает так, что одни только данные не могут рассказать историю самым убедительным и наглядным образом. И хотя тут может помочь простой график, иллюстрирующий тенденции или итоговую статистику, текстовый комментарий или описание фактов, связывающих данные с их последствиями в реальном мире, может оказаться более непосредственным, оперативным и впечатляющим, имеющим ударную силу для читателя.

Когда у вас очень мало отправных точек

Как гласит известное изречение, «цифры в отрыве от всего, сами по себе, ничего не значат». И как обычно отвечают редактора в ответ на цитирование статистики – «а по сравнению с чем?» Какова тенденция – понижательная или повышательная? Каковы нормальные показатели? В общем, с чем сравнивать–то?

Когда у вас очень незначительная изменчивость в ваших данных, отсутствует четкая тенденция или выводы

Порой вы собираете и организуете ваши данные в Excel или аналогичном позволяющем строить графики приложении, и обнаруживаете, что информация «зашумлена» и насыщена помехами – много колебаний или относительно плоская тенденция. Поднимаете ли вы в таком случае ось икс до какой–то величины, отличной от нуля, ровно под самое низкое значение, с целью придать графику немного более адекватную форму? Нет! Похоже, у вас имеются неоднозначные, нечеткие, двусмысленные или сомнительные данные, и вам нужно больше копать и анализировать.

Когда карта – не карта

Когда пространственный элемент невыразителен или неубедителен, или отвлекает внимание от более актуальных числовых тенденций, таких как, например, изменение во времени или демонстрация схожих элементов в неблизких областях.

Не забывайте о таблицах

Если у вас сравнительно мало отправных точек, но есть информация, которая может пригодиться некоторым из ваших читателей, рассмотрите такой вариант как просто изложение данных в форме таблицы. Это ясный и легкий для прочтения метод, который не создает нереалистичных ожиданий «сюжета». На самом деле, таблицы могут быть очень эффективным, действенным и элегантным способом изложения основной информации.

Брайан Суда, (optional.is)

Разные графики рассказывают разные истории

В современном цифровом мире, с перспективой погружения в 3D–опыт, мы склонны забывать о том, что так долго писали исключительно чернилами по бумаге. Сейчас мы думаем об этом статичном и плоском способе как о некоем гражданине второго сорта, но на самом деле на протяжении тех сотен лет, когда мы писали и печатали, нам удалось достичь невероятного уровня богатства знаний и опыта в области представления данных на бумаге. И хотя интерактивные графики, визуализации данных и инфографика и являются последним писком моды, они отказываются от лучших наработок и методов, которым мы научились. И лишь когда мы бросаем взгляд в историю совершенных и искусно выполненных графиков и диаграмм, мы можем осознать этот багаж знаний и использовать его в новой среде.

Некоторые из самых известных графиков и диаграмм появились из необходимости лучше объяснять малопонятные и непрозрачные таблицы данных. Уильям Плэйфэйр (William Playfair) был шотландским полиглотом, который жил в конце 1700–х – начале 1800–х годов. Он единолично представил миру многие из тех же видов графиков и диаграмм, которые мы до сих пор используем и сегодня. В своей книге 1786 года – «Коммерческий и политический атлас» (Commercial and Political Atlas), Плэйфэйр представил гистограмму, столбчатый график, чтобы ясно показать количественные показатели импорта в Шотландию и экспорта из нее новым, визуальным способом.

Рис 90. Ранние гистограммы и столбчатые графики(Уильям Плэйфэйр)

Потом он продолжил популяризировать разные графики, представив в своей книге 1801 года под названием «Статистический конспект» (Statistical Breviary) то, что мы ныне называем круговой, секторной диаграммой. Нужда в этих новых формах графиков и диаграмм возникла из торговой области, но с течением времени появились и другие графики и диаграммы, благодаря которым удавалось даже спасать жизни. В 1854 году Джон Сноу (John Snow) создал свою ныне ставшую знаменитой «Карту распространения холеры в Лондоне», добавив маленькую черную полоску к каждому адресу, по которому был зарегистрирован случай заболевания. Со временем можно было заметить очевидную увеличенную плотность вспышки заболевания, и принять меры к решению проблемы.

Рис 91. Карта распространения холеры в Лондоне(Джон Сноу)

С течением времени

Шло время, и те, кто работал с этими графиками и диаграммами, становились все смелее и смелее, и начинали все больше экспериментировать, приводя это средство отображения информации к тому виду, в котором мы знаем его сейчас. Андре–Мишель Герри (André–Michel Guerry) был первым, кто опубликовал идею карты, где разные регионы окрашивались в разный цвет в зависимости от чего–либо, поддающегося измерению. В 1829 году он создал первую хороплет–карту, взяв регионы во Франции и заштриховав их по уровню преступности. Сегодня мы видим подобные карты, представляющие позиции разных регионов на выборах, кто за кого голосовал, распределение богатства, и многие другие связанные с географическими параметрами переменные. Идея выглядит такой простой, но даже сегодня сложно освоить и понять ее, если она не использована с умом.

Рис 92. Хороплет–карта Франции, демонстрирующая уровень преступности(Андре–Мишель Герри)

Есть много инструментов, которые хороший журналист должен понять и иметь в своем арсенале для создания визуализаций. В том, что касается графиков и диаграмм, важно не бросаться с головой в рискованное предприятие, а заложить отличную основу. Все, что вы создаете, должно исходить из серии элементарных графиков, схем и диаграмм. Если вы способны овладеть основами, то потом вы можете перейти к построению более сложных и продвинутых визуализаций, которые будут состоять из этих базовых элементов.

Двумя основными видами графиков и схем являются гистограммы, сиречь столбчатые графики, и линейные диаграммы. Хотя они и очень похожи в своих вариантах и сценариях использования, они также могут сильно различаться по своему замыслу и смысловому содержанию. Давайте возьмем для примера продажи какой–нибудь компании за каждый месяц года. Мы получим 12 столбцов, представляющих суммы денег, полученные за каждый месяц.

Рис 93. Простая гистограмма: полезная для представления прерывистой, дискретной информации

Давайте посмотрим, почему в этом примере должна быть столбчатая диаграмма, а не линейный график. Линейная диаграмма очень хорошо подходит для непрерывного, сплошного, продолжительного потока данных. А наши цифры продаж – это итог за месяц, там ничего не меняется, они уже статичны. Если эти данные представить в форме столбца, то мы знаем, что в январе компания заработала 100 долларов, а в феврале 120. Если мы представим эту же информацию в виде линейной диаграммы, то тут по–прежнему будет 100 и 120 долларов по состоянию на начало каждого месяца. Но при этом, смотря на линейный график, мы автоматически представляем, что 15 числа компания заработала 110 долларов. Что неправда. Столбцы используются для дискретных, раздельных единиц измерения, а линии – когда данные носят непрерывный характер, например, температура.

Рис 94. Простой линейный график: полезный для представления непрерывной информации

Тут мы можем видеть, что в 8.00 утра температура составляла 20 градусов Цельсия, а 9.00 утра – 22 градуса. Если мы посмотрим на линию, то представим себе, что в 8.30 у нас был 21 градус, что является вполне корректным, так как температура носит непрерывный характер и каждая точка не является суммой других значений, а представляет собой точную величину на данный момент или возможное значение между двумя точными величинами.

И столбцы, и линии могут быть составными. Это отличный инструмент для представления материала, который может работать разными способами. Давайте возьмем для примера компанию, у которой имеется 3 территории, три месторасположения.

Рис 95. Сгруппированная гистограмма

Для каждого месяца у нас будет три столбца, по одному для каждого из магазинов, в общей сложности 36 за год. Если мы поместим их друг рядом с другом, мы сможем быстро увидеть, в каком месяце какой магазин принес самую большую выручку. Это интересная и убедительная история, но в тех же данных кроется и еще кое–что. Если мы поставим столбцы друг на друга, то у нас получится только один столбец для каждого месяца, и мы утратим возможность с легкостью увидеть, какой магазин больше всего принес денег, но зато мы можем увидеть, в какой из месяцев компания в целом поработала лучше всего и заработала больше всего денег.

Рис 96. Составной столбчатый график

Оба этих варианта являются убедительными и действенными способами отображения одной и той же информации, но при этом они рассказывают две разные истории, используя одни и те же первоначальные данные. Как для журналиста, для вас самым важным аспектом работы с данными является то, чтобы в первую очередь выбрать, какую именно историю вы хотите рассказать. О том ли, какой месяц – лучший для бизнеса, или о том, какой магазин может считаться флагманским, по крайней мере, по доходам? Это, конечно, простой пример, но на самом деле, в этом вся суть, это центральный момент журналистики данных: нужно задать правильный вопрос прежде, чем вы зайдете слишком далеко. Сам сюжет, сам материал будет направлять вас и обусловливать ваш выбор варианта визуализации.

Столбчатый график и линейная диаграмма – это действительно повседневные, базовые инструменты, буквально–таки хлеб насущный любого журналиста данных. Отталкиваясь отсюда, вы можете уже расширять ваш инструментарий посредством включения в него гистограмм, горизонтальных графиков, искрографиков, потоковых графиков и других инструментов, которые обладают сходными свойствами, но предназначены для слегка отличающихся друг от друга ситуаций, в том числе по количеству данных, по источникам данных, по местоположению графика в тексте.

В журналистике одна из наиболее часто использующихся графических функций – это карта. Время, количество и географические данные – все это свойственно картам. Мы всегда хотим знать, сколько имеется того или иного в одной области по сравнению с другой, или как данные перетекают из одного региона в другой. Функциональные диаграммы и хороплеты – это очень полезные инструменты, и их обязательно нужно иметь в вашем арсенале и вы должны уметь ими пользоваться, когда работаете над визуализациями в журналистских целях. Знать, как превратить карту в набор разноцветных элементов должным образом, не вводя читателей в заблуждение и не путая его – это крайне важно. Политические карты обычно окрашиваются в разные цвета и сортируются по цветам по принципу «все или ничего» для каждого региона, даже если разница в какой–то части страны не превысила одного процентного пункта. Но работа с цветом не предполагает обязательного бинарного выбора, жесткого выбора одного из двух. Можно с достаточной степенью осторожности использовать оттенки цветов. Умение понимать карты – это значительная часть журналистики. Карты могут с легкостью ответить на вопрос «ГДЕ» из серии «пяти W» .

Когда вы хорошо освоите основные виды графиков и диаграмм, то потом можете приступить к созданию более сложных, разнообразных и фантазийных визуализаций данных. Если вы не понимаете основ, тогда получится, что вы, условно говоря, строите на зыбкой почве. Подобным же образом вы учитесь быть хорошим писателем, хорошим автором, умеющим делать предложения короткими и емкими, умеющим всегда помнить о своей аудитории, и не занимающимся искусственным усложнением вещей, чтобы казаться более умным, а старающимся в максимальной степени передать смысл для читателя. Однако же не стоит перебарщивать с данными. Начинать с небольших объемов – это самый эффективный и действенный способ рассказать историю, медленно наращивая объемы только в случае необходимости.

Решительная и энергичная манера письма подразумевает краткость, лаконичность. В предложении не должно быть ненужных слов, в абзаце – необязательных предложений. По той же причине, по которой в рисунке не должно быть лишних линий, а в машине – лишних деталей. Речь тут не о том, чтобы автор делал все свои предложения максимально короткими, или избегал любых подробностей, или говорил о своей теме лишь в общих чертах, а о том, чтобы каждое слово несло смысл и не выглядело лишним и не необходимым.

Вполне нормально не использовать каждый–каждый элемент данных в вашем сюжете или материале. Вы не должны спрашивать разрешения, можно ли быть сжатым и лаконичным, это просто должно быть правилом.

– Уильям Странк–младший («Элементы стиля» (Elements of Style) – 1918)

Брайан Суда, (optional.is)


    Ваша оценка произведения:

Популярные книги за неделю