Мы живем в эпоху 21 века в области оцифровки современной науки и техники, где ежесекундно собираются данные: пользуясь интернетом, проходя контроль в аэропорту, получая медицинское лечение и т.д. – все эти действия оставляют дигитальный отпечаток. Данные собираются и документируются, несся с собой важную информацию. Благодаря этой информации, мы сегодня можем быстрее реагировать на изменения и повлиять тем самым на ход происходящего. Как пример могу привести Google предсказание тенденции гриппа.

Последовательно появились новые профессии как Анналист данных (Data Analyst), Дизайнер дэшбордов (Dashboard Designer), Визуализатор данных (Data Visualizer). Одно из важнейших заданий этих профессий является превращения данных в нужную и правильную информацию.

Работая по этим профессиям, нужно разбираться в статистических расчётах. Дополнительно, нужно уметь визуально представлять информацию. Для чего это нужно?

Рассмотрим следующий пример Квартет Энскомба. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом для иллюстрации важности применения графиков для статистического анализа, и влияния выбросов значений на свойства всего набора данных.

https://bit.ly/1RnJLIG

Постарайтесь ответить на следующие вопросы:

  • Что является средним арифметическим переменной Х в каждой колонке?
  • Что является средним арифметическим переменной У в каждой колонке?
  • Теперь просчитайте стандартное отклонение переменной Х в каждой колонке
  • И так же стандартное отклонение У в каждой колонке

Что вы заметили после ваших просчётов? Четыре набора числовых данных имеют абсолютно идентичные статистические свойства. Но если мы изобразим эти числа на графике, то мы получим 4 совершенно разных графика:

https://bit.ly/1RnJLIG

Только благодаря визуальному представлению данных вне таблицы можно увидеть, что каждый из набор данных представляет собой различную информацию, не смотря на то что их статистические характеристики идентичны.

Но это ещё не все!

Следующие побуждение тому, что нужно визуализировать данные и не только доверять их статистическим характеристикам, привел Алберто Кайро.

Он создал таблицу с данными к 13 различным графикам:

Просчитав среднее арифметическое, стандартное отклонение  и корреляцию переменных Х и У можно снова убедится в том, что доверять только лишь статистическим характеристикам не достаточно, а нужно данные визуализировать, т.к. эти статистические характеристики могут быть абсолютно одинаковыми. Реальную картину происходящего увидеть тот, кто данные визуализирует.

И на последок рассмотрим пример данского физика Тора Норретрандерса, который создал диаграмму „Ширина полосы пропускания наших чувств“.  Эта диаграмма демонстрирует, почему визуализация так эффективна при передаче огромного объема информации в считанные секунды.

https://bit.ly/2JH8afd

На этой  диаграмме сравнивается количество информации, воспринимаемой каждым из наших органов чувств в секунду. Например, визуальное восприятие по сравнению с другими нашими органами восприятия занимает большую часть графика. Автор сравнивает визуальное восприятие со скоростью компьютерных сетей. Чувство вкуса сравнивается со способностью калькулятора передавать информацию. Маленький белый квадрат в нижнем правом углу, представляет собой чувство осознания о происходящем. Его площадь составляет всего лишь 0,7%.

Один лишь текст, описывающий какой либо акт, запомнится вряд ли долго. Если же в этом тексте имеется график, поддерживающий контекст, то это способствует тому, что читатель может:

  • быстрее освоить текст
  • избежать недопонимания контекста
  • запомнить содержание статьи на долгое время

Визуализированние данных это модерный метод коммуницировать информацию. Его не возможно избежать, учитывая тот факт, сколько информации в дигитальной форме мы сегодня обладаем. Объём информации в дигитальной форме растёт день за днём, минута за минутой. Нам нужно учиться быстрее перерабатывать эти данные, для того чтобы получить важную информацию, которую они с собой несут. Визуализированные данных это один из важнейших фокусов в этом развитии.