Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных - Дэвид Хэнд

Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных

Страниц

90

Год

2021

В современном мире человечество успешно справляется с огромными объемами данных, которые собираются и используются в научных исследованиях, бизнесе и повседневной жизни. Но что делать, когда мы сталкиваемся с отсутствием необходимых данных? Можем ли мы просто игнорировать то, что нам незаметно? Британский статистик Дэвид Хэнд считает, что такой подход является не только неразумным, но и опасным. В своей новой книге он поднимает вопрос о 15 типах данных, которые остаются скрытыми от нас и оказывают влияние на наши решения и действия. Например, автор обсуждает важность учета сигналов бедствия, которые могут быть предоставлены жителями малообеспеченных районов через смартфоны, исследования в области медицины, которые могут быть намеренно скрыты или искажены, а также данных, которые стали "темными" из-за недостаточно точных критериев выборки. Хэнд также предлагает различные подходы к тому, как уменьшить влияние "темных данных" и использовать их в свою пользу. Эта книга будет полезна широкому кругу читателей, интересующихся такими областями, как наука о данных, программирование и статистика. Дополнительно, я бы хотел добавить, что Дэвид Хэнд - ведущий эксперт в области статистики и авторитетный исследователь, чьи работы являются референсными материалами в своей области. Чтение его книги позволит глубже понять важность учета "темных данных" и научиться правильно использовать их в своей работе и повседневной жизни.

Читать бесплатно онлайн Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных - Дэвид Хэнд

Переводчик М. Белоголовский

Редактор В. Ионов

Главный редактор С. Турко

Руководитель проекта А. Василенко

Корректоры Е. Аксёнова, А. Кондратова

Компьютерная верстка К. Свищёвв

Художественное оформление и макет Ю. Буга


© 2020 by David J. Hand

This edition published by arrangement with the Science Factory, Louisa Pritchard Associates and The Van Lear Agency LLC.

© Издание на русском языке, перевод, оформление. ООО «Альпина Паблишер», 2021


Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.

Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.

Посвящается Шелли


Предисловие

Перед вами необычная книга. Почти все, что издается на эту тему – будь то популярная литература о больших или открытых данных, обработке данных или пособия по статистическому анализу, – основывается на том, что у вас уже есть. Речь идет об информации, хранящейся в компьютере, ящиках рабочего стола или аудио-, видеозаписях вашего смартфона. Но эта книга совсем о другом. Она о данных, которых у вас нет. Возможно, вы пытаетесь получить их прямо сейчас или когда-то безуспешно пытались сделать это, а может быть, ошибочно полагаете, что они у вас имеются. Как бы то ни было, речь пойдет о данных, которых у вас нет.

Я утверждаю и далее продемонстрирую это на многих примерах, что отсутствующие данные важны не менее тех, которыми мы располагаем. Вы сможете сами убедиться, что неизвестные нам данные являются причиной многих заблуждений, порой имеющих катастрофические последствия. Я покажу, как и почему это происходит. Затем я расскажу, как этого можно избежать – на что именно стоит обращать внимание, чтобы обойти неприятности. А в завершение, когда вы поймете, как возникают темные данные и как они создают нам проблемы, я покажу, как с их помощью перевернуть с ног на голову традиционное представление об анализе данных и, если вы достаточно проницательны, глубже вникнуть в свою область, улучшить процесс принятия решений и выбора действий.

Мое собственное понимание темных данных развивалось постепенно, на протяжении всей карьеры. Я благодарю всех, кто подкидывал мне проблемы, которые, как я постепенно осознал, были не чем иным, как проблемами темных данных. Я выражаю признательность всем, кто вместе со мной искал способы их решения. Сферы, где возникали эти проблемы, варьировались от медицинских исследований и фармацевтической промышленности до государственной и социальной политики, финансового сектора и производства – ни одна сфера человеческой деятельности не свободна от рисков, которые несут с собой темные данные.