Наверняка вам знакома ситуация, когда гаджет или другое цифровое устройство будто читает ваши мысли или следит за жизнью. Например, вы посмотрели комедию, и всю неделю онлайн-кинотеатр в вашем телевизоре предлагает подборку фильмов именно в этом жанре.
Делает это, конечно, не многочисленный штат шпионов-наблюдателей, а машина. А научили её этому специалисты — дата-сайентисты, или Data Scientists. Они разработали алгоритмы, которые реагируют на ваши действия, анализируют шаги и делают выводы.
С помощью таких алгоритмов социальные сети рекомендуют музыку и друзей, приложения по подбору фильмов — кино и сериалы, геоинформационные системы показывают пробки, а метеорологические компании предсказывают погоду. Разработки дата-сайентистов лежат в основе чат-ботов, программ для распознавания лиц и поисковых систем. Всего и не перечислить.
Сейчас во многих отраслях экономики необходимы эти специалисты. Они работают в финансовой сфере, медицине, образовании. И это не всё. Чтобы узнать больше, читайте статью.
Как проходят рабочие дни специалиста
Задачи дата-сайентиста разнообразны и зависят от конкретного проекта. Чтобы лучше ознакомиться с рабочими буднями этого специалиста и узнать самые распространённые обязанности, рассмотрим их на конкретном примере.
Представьте, мэрия крупного города хочет оптимизировать маршруты общественного транспорта, чтобы не было пробок на дорогах и люди не стояли в очередях на остановках. К работе привлекают дата-сайентиста или специалиста по Data Science, то есть профессионала, который специализируется на науке о данных.
Вот как над этой задачей может работать дата-сайентист:
- Исследует и анализирует данные. Дата-сайентист работает с массивами данных. Он получает их из самых разнообразных источников — статистических сведений, показаний приборов, данных со спутников, из контента соцсетей и средств массовой информации, информации о заказах услуг и товаров и многих других.
Так, в начале работы над задачей мэрии дата-сайентист изучит маршруты и расположение жилых кварталов в городе, проанализирует трафик на дорогах, оценит протяжённость метро. - Работает с алгоритмами. Это строгая последовательность действий, которые нужны совершить для выполнения задачи. Последовательность задаёт программирование. Дата-сайентист может использовать в работе уже готовые алгоритмы или программировать их самостоятельно. Например, с помощью языка Python.
При выполнении задачи от мэрии, дата-сайентист может использовать алгоритмы, чтобы оптимизировать маршруты. Например, алгоритмы кластеризации помогают группировать районы с высокой плотностью населения и определять ключевые точки спроса на транспорт. - Строит модель машинного обучения. Так называется метод, когда специалист учит машину работать по конкретным алгоритмам. Модель получает данные и обрабатывает их с помощью искусственного интеллекта, а затем выдаёт ответ на заданный вопрос в форме прогноза или решения. А чтобы построить модель, специалисту нужны статистический анализ и математика.
В нашем примере компьютер предложит специалисту несколько способов решения задачи: например, увеличить количество трамваев в одном районе, сократить число автобусов в другом, перенести часть остановок или поменять траекторию движения маршруток. - Внедряет модель в рабочие процессы. Когда машина обучена, она может самостоятельно прогнозировать трудности и предлагать решение проблем.
Например, если где-то в городе начнутся ремонтные работы на дорогах, машина подскажет, как оптимизировать маршруты с учётом этой проблемы. - Составляет отчёт. Дата-сайентист продумывает, как рассказать о результатах так, чтобы его поняли заказчики, и создаёт визуализированный отчёт. На его основе и принимаются решения о том, как развивать проект дальше.
Так, транспортный департамент мэрии может инициировать строительство дорог или остановок транспорта по результатам работа дата-сайентиста.
Часто на этом работа дата-сайентиста не заканчивается — его привлекают также к мониторингу и поддержке внедрённых моделей. То есть обучить модель и внедрить её в бизнес-процессы раз и навсегда вряд ли получится — дата-сайентист будет постоянно следить за её работой и совершенствовать систему.
Кому подойдёт профессия
Если вам нравится структурировать разрозненную информацию и вы готовы овладеть глубокими знаниями в информационных технологиях и стратегическом планировании — то эта специальность для вас.
А вот ещё несколько качеств, которые пригодятся в профессии:
- Аналитическое мышление. Надо верно оценить источники данных, выбрать нужные и отбросить лишние, а потом эту разрозненную информацию, как пазл, сложить в цельную картинку.
- Способности в математике. Исследования и анализ построены на математических методах, поэтому здесь никак не обойтись без этой науки.
- Бизнес-мышление. Без понимания целей бизнеса не получится ни решить задачу, ни успешно внедрить решение в жизнь. Например, вы не поможете банку выбрать кредитную стратегию, если не понимаете зачем это нужно бизнесу.
Профессия дата-сайентиста требует особенной внимательности. Ошибки в анализе данных или обучении модели могут быть критичными. Скажем, если неправильный алгоритм будет учитывать в статистике только одну группу людей и игнорировать другую, это может повлечь нарушение этики и даже обвинение в дискриминации от клиентов компании. Дополнительной сложностью можно назвать то, что пока не все организации понимают, зачем именно нужны эти специалисты. Поэтому компании могут требовать от дата-сайентистов того, что напрямую не относится к их работе.Сложность профессии
Где работает дата-сайентист
Дата-сайентист востребован в разных сферах. Назовём самые крупные:
- Финансы — банки, инвестиционные фонды, фондовые биржи, страховые компании. Там специалисты делают прогнозы, анализируют риски, оценивают инвестиции. Например, создают алгоритмы, которые автоматически выявляют подозрительные транзакции и соответственно мошеннические действия.
- Промышленное производство — например, металлургия, энергетика, транспорт, машиностроение, агрокомплекс. Анализ данных позволяет снижать издержки, оптимизировать процессы, повышать производительность. В частности, как снизить процент брака продукции или как перераспределить обязанности между сотрудниками, чтобы избежать сокращения.
- Государственная служба. Работа специалиста влияет на оптимизацию бюджета, скорость принятия решений, повышение качества жизни людей.
В крупных или быстрорастущих компаниях дата-сайентист в одиночку со всеми потребностями не справится. Нужна команда, в которой есть также аналитики данных, программисты и инженеры. Например, последний следит за работой моделей и исправляет ошибки.
Интересный факт
Считается, что термин «большие данные», на которых основана работа дата-сайентиста, ввёл в оборот редактор журнала Nature Клиффорд Линч в 2008-м году. Но это не так. Историю больших данных можно начать отсчитывать с 1941-го года, когда в Оксфордском словаре появилось понятие «Информационный взрыв».
Как может развиваться карьера
Дата-сайентист может менять проекты и выбирать интересные сферы. Например, сначала сфокусироваться на прогнозировании в области промышленности, а затем уйти в машинное обучение в информационные технологии.
Карьерный рост может быть разным:
- Руководящие должности. В крупных компаниях дата-сайентисту с опытом могут доверить крупные проекты. Он может следить за работой других специалистов. Например, тестировать работу обученных моделей или проверять отчёты специалистов.
- Бизнес. Дата-сайентист может открыть своё дело и предлагать услуги разным компаниям. Это нужно, например, если молодой стартап не может взять специалиста в штат и привлекает дата-сайентиста на аутсорсе.
- Экспертная оценка. Многим компаниям нужен консультант с опытом, который помогает с бизнес-процессами. Так, организации привлекают дата-сайентистов на разных этапах проекта: например, в начале — чтобы эксперт посоветовал, каких сотрудников нанять для конкретных задач; в процессе — дата-сайентист может оценить качество обучения машин.
Сколько зарабатывает дата-сайентист
Дата-сайентисты — редкие специалисты, поэтому часто в них нуждаются крупные компании, которые готовы достойно оплатить труд работника.
Мы подобрали несколько вакансий для специалистов с опытом от 3 до 6 лет (май 2025-го года):
- Data Scientist. Платформе, которая занимается размещением рекламы в мобильной среде, требуется опытный сотрудник для работы над предсказательными моделями. Зарплата от 200 000 до 250 000 рублей.
- Middle Data Scientist. Сахалинский центр искусственного интеллекта ищет «талантливого и амбициозного исследователя данных» для работы над проектами в области искусственного интеллекта. Доход — от 200 000 до 250 000 рублей.
- Senior Data Scientist. В финансовой компании в Москве требуется специалист на зарплату от 350 000 до 450 000 рублей в месяц. В числе обязанностей: разработка и масштабирование сервисов на основе, настройка и адаптация моделей глубокого обучения под потребности компании, участие в планировании продуктов, сотрудничество с продуктовыми менеджерами и разработчиками.
Новички и продвинутые специалисты участвуют в научных соревнованиях по Data Science. Их регулярно проводят крупные компании Сбер, Яндекс, VK, ВТБ и другие. Подробнее о таких соревнованиях можно узнать на сайте сообщества Open Data Science.Справка
Как стать дата-сайентистом
Дата-сайентисты могут работать по профессии как со средним профессиональным, так и с высшим образованием. Однако в учебных заведениях редко можно встретить программы, на которых готовят именно дата-сайентистов. Обычно студенты, которые хотят работать по этой профессии, учатся на смежных направлениях — программирование, информатика или аналитика.
Рассмотрим подробнее разные варианты обучения.
Первый вариант: среднее профессиональное образование. Его можно получить в колледжах, техникумах или училищах. Базовые знания и навыки студенты осваивают на направлении «Информационные системы и программирование». Это классическое образование для программистов, аналитиков, IT-инженеров и не только. Учатся студенты от 3 лет и 10 месяцев.
Посмотрите несколько подходящих учебных заведений:
- Колледж «Синергия». У нас есть программа «Специалист по тестированию в области информационных технологий».После окончания учёбы выпускники получают квалификацию программиста и тестировщика программного обеспечения. Учиться можно дистанционно.
- Колледж информационных технологий Московского государственного университета технологий и управления. Формат только очный. Студенты получают разные квалификации — разработчик, программист, технический писатель.
- Санкт-Петербургский колледж информационных технологий. Учиться здесь можно только очно. В конце обучения выпускникам присваивается квалификация программиста.
Второй вариант обучения: высшее образование. Диплом с квалификацией бакалавра или специалиста получают выпускники вузов. В некоторых учреждениях есть специализированные программы, которые готовят специалистов в области Data Science.
Так, в Университете «Синергия» есть профильная программа Data Science, которая выпускает именно дата-сайентистов. Студентов учат работать с большим объёмом данных с помощью методов статистического анализа и построения математических моделей. Можно учиться онлайн или очно 4 года.
Также есть смежные программы в других вузах:
- Российская академия народного хозяйства и государственной службы (РАНХиГС). Здесь есть программы «Прикладные цифровые технологии» и «Анализ данных и искусственный интеллект».
- Нижегородский государственный университет имени Н.И. Лобачевского. Подойдут программы «Прикладная математика и информатика» и «Фундаментальная информатика и информационные технологии».
- Санкт-Петербургский политехнический университет Петра Великого. Профессии в сфере информационных технологий осваивают на программах «Анализ данных в экономике» и «Математическое моделирование и искусственный интеллект».
Однако какой бы вариант вы ни выбрали, профессия требует постоянного обновления знаний. Есть специализированные курсы, то есть программы дополнительного профессионального образования. Так можно получить новые знания и освоить новые навыки, необходимые для профессии. Подробнее о таком уровне образования мы рассказали в статье «Справочников» «Что такое дополнительное профессиональное образование».
Например, в «Синергии» за 9 месяцев можно пройти курс Machine Learning Engineer для специалистов в области машинного обучения. Владение навыками машинного обучения открывает широкие возможности для того, чтобы построить высокооплачиваемую карьеру в сфере информационных технологий, а особенно в области Data Science.