Многих людей пугают цифры, они чувствуют себя беспомощными в мире чисел, считая, что понимать их могут только математические гении. Но, как утверждает автор, большие данные намного проще, чем думают люди. В пример он приводит подбор ему невесты на семейном совете. У каждого члена семьи было свое мнение. Сестра говорила, что ему нужна такая же сумасшедшая девушка, как он сам. Брат – что девушка, наоборот, должна его уравновешивать и быть спокойной и покладистой. Мать и отец спорили на тему, сумасшедший ли их сын. И тут в разговор вступила бабушка, которой было под 90 лет. Она сказала, что лучшая кандидатура – не слишком красивая, но очень умная девушка, коммуникабельная, с чувством юмора – потому что у потенциального жениха тоже с чувством юмора все в порядке. И все спорщики затихли. Бабушка в таких вопросах – лицо авторитетное: никто в семье не видел такого количества удачных и неудачных браков. За десятилетия у нее сложился алгоритм успешных отношений. Другими словами, она имеет доступ к большому количеству данных.
В память бабушки загружены данные почти за столетие – это истории, которые она наблюдала лично или слышала от друзей, знакомых и родственников. Она выбрала из этих данных образец мужчины, похожего на автора книги, и определила ключевые качества женщины, с которой они составили бы гармоничную пару. Или, переходя на язык математики, она в течение жизни подмечала многие закономерности и может предсказать, как одна переменная влияет на другую. В этом смысле бабушка – специалист по данным.
То же самое можно сказать о любом человеке. Ребенок подмечает, что его мама проявляет к нему больше внимания, когда он плачет. Так он впервые приобщается к науке о данных. Взрослый человек замечает, что с ним меньше общаются, если он часто жалуется – это тоже пример науки о данных, то есть о том, как одна переменная влияет на другую, о причинно-следственной связи.
Так что не стоит бояться цифр и слов «большие данные», советует автор. На самом деле все мы так или иначе имеем с ними дело.