Мяу-мяу-мяу!
Сюрприз. Эта колонка будет необычной. Впервые в истории журнала я не стану баловать вас собственными изящными рассуждениями, а предоставлю слово достойному единомышленнику. Однажды утром я нашёл в коробке письмо, прочёл его, взволнованно подёргал ус и не колеблясь обратился к редакторам с просьбой опубликовать это послание. Они любезно согласились. Вот оно:
«Здравствуй, дорогой Кот! Меня зовут Маша, мне 26 лет, я работаю редактором в серьёзном журнале, читаю лекции школьникам и студентам, вхожу в оргкомитет крупного образовательного проекта и не боюсь сказать: я ничего толком не знаю про большие данные. Могу только догадываться.
Если вдуматься в смысл словосочетания “большие данные”, понимаешь, что речь идёт об объёме информации, но… Если весь мир так или иначе состоит из информации, то с какой её частью работают те, кто занимается большими данными? Откуда и зачем они её берут, как классифицируют и что потом делают с результатами? Какое практическое применение может быть у больших данных? И, кстати, как называются люди, работающие с ними? Бигдатеры? Бигдатисты? Большеданники? Большевики?
Когда мне было пять лет, я прочитала, что система счёта у первобытных людей была такая: “один-два-много”. Им хватало. Выходит, это самое “много” было для них большими данными. А что же “много” для нас? Если простых чисел бесконечно много, значит, большие данные тоже бесконечны? И в чём их считают?
В те же пять лет я любила советский мультик про Дюймовочку. Есть в этой мелодраме такой момент: полевая мышь, у которой живёт главная героиня, сватает её за соседа, состоятельного крота, и тот решает прикинуть расходы на семейную жизнь. “Половина зёрнышка в день — это немного. А в год? В году 365 дней, по половине зёрнышка получается 182,5 зерна. В год получается не так уж и мало”, — рассуждает не в меру бережливый крот, щёлкая костяшками счётов.
Так вот, можно ли утверждать, что он работал с большими данными? Кстати о счётах. На какой аппаратуре работают реальные специалисты по большим данным? На супермегакомпьютерах, оснащённых сверхпроизводительными программами, или есть что-то другое?
Интуиция подсказывает, что с большими данными сталкивается каждый из нас. Накануне 1 сентября я долго не могла вызвать такси через приложение — то тариф на поездку был завышен в три раза, то свободных машин не было. Откуда какое-то приложение знает, где находится пассажир? Как выбирает идеальный маршрут и определяет стоимость поездки? Кто или что стоит за рекомендациями о книгах, фильмах, концертах? И ведь эти рекомендации не раз выручали меня: я находила людей, чьи имена не помнила, выгодно покупала билеты, оказывалась на мероприятиях, о которых всегда мечтала. Думаю, без волшебства больших данных тут не обошлось. Что же они такое на самом деле?»
Мда. Ну что ж, всегда любопытно узнать, какого рода вопросами об устройстве мира задаются неглупые люди в редкие минуты досуга. Лично я с тех пор, как уважаемые коллеги сообщили о намерении сделать номер «про большие данные», спрашиваю себя о том же, что и Маша.
Удалось ли мне найти точные, исчерпывающие ответы? Скорее всего нет. Ведь, как это бывает, завтрашний день поставит новые вопросы, а большие данные станут ещё больше. Я привык к мысли, что погоня за истиной — процесс бесконечный. Так что желаю нам всем, особенно Маше, терабайтов силы духа и петабайтов воли в нелёгком деле поиска ответов.
Мур.
Опубликовано в специальном выпуске журнала «Кот Шрёдингера» за октябрь 2017 г.
Подписаться на «Кота Шрёдингера»