Job

Data Scientist (Архив)

Архив
ЛОКАЦИЯ:
Удаленно (кроме РФ/РБ).
ВИЛКА: отталкиваются от зарплатных пожеланий кандидатов.

Американский стартап ищет Data Science специалистов (общего профиля и с уклоном в NLP) для разработки трэвел-продукта. Продукт компании помогает пользователям создавать персонализированные и интересные маршруты во время поездок. Помимо маршрутов, в рамках платформы будет реализовано еще несколько приложений помогающих пользователю в планировании досуга во время путешествия (организация/поиск событий, например, покататься на серфе, сыграть в настолки, и т.п.), ML-powered подбор компаньонов для событий (в дальнейшем возможно и для путешествий), обсуждение интересного контента с собеседниками подобранными ML. Упор на интелектуальный подбор различных опций (места, события, маршруты, люди), которые помогут пользователю испытать лучшие впечатления.

Компания уже запустила продукт на американском рынке и стремится расширить свою деятельность в Европе, Канаде, ОАЭ.

На сегодняшний день в компании cформирована сильная команда из 40 специалистов (Backend Developers, Frontend Developers, Data Engineer, Data Scientists, System Analyst, QA Engineers, DevOps Engineers, Project Manager, etc).

Продукт стремительно развивается и коллеги ищут Data Science специалиста, который поможет им создавать модели для оптимизации и улучшения пользовательского опыта.

Задачи, которыми предстоит заниматься:
  • Разработка алгоритмов для генерации маршрутов для путешествий с использованием нейросетей (Seq2seq).
  • Сбор, преобразование и предварительная обработка необработанных данных для их подготовки к анализу.
  • Получение описательной статистики из предварительно обработанных данных.
  • Построение статистических и вероятностных моделей.
  • Проектирование, разработка, обучение и тестирование моделей и алгоритмов интеллектуального анализа данных, машинного обучения и искусственного интеллекта.
  • Проведение сравнительного исследования различных алгоритмов и моделей.
  • Реализация модели в форме, которая может быть легко использована инженерами, документирование ее интерфейсов.
  • Поставка модели в форме, которую можно легко развернуть и поддерживать.
  • Понимать бизнес-проблемы, понимать возможности и ценности аналитических моделей для клиента.
  • Общение с заказчиком.

Технический стэк, который используют в команде: Python, PyTorch, Elasticsearch, Pandas, Airflow, Numpy, Git, etc.

Для данной позиции вам пригодится:

  • Знание техник обработки и трансформации данных (выявление аномалий, обработка пропусков и т.д.).
  • Знание и понимание алгоритмов классификации, кластеризации, регрессии, ранжирования.
  • Знание Python, PyTorch и опыт промышленной разработки ПО. Знакомство с фреймворками TensorFlow или Keras будет плюсом.
  • Наличие опыта успешного внедрения ML-моделей в production будет плюсом.
  • Знание базовых алгоритмов NLP, как строится BoW, TF-IDF, word2vec, doc2vec, и т.д. (требование для Data Scientist с уклоном в NLP).
  • Знание архитектур CNN, LSTM, Transformer (требование для Data Scientist с уклоном в NLP).
  • Понимание различий между BERT/GPT/T5 и задач, которые они решают (требование для Data Scientist с уклоном в NLP).
  • Опыт работы с Elasticsearch или NoSQL базами данных (некритично).
  • Опыт оформление результатов исследований в виде отчетов и презентаций.

В свою очередь, компания предлагает трудоустройство по B2B контракту с американским или европейским офисом. Заработную плату в USD, отталкиваясь от ваших пожеланий и компетенций. Также, компания предлагает удаленный формат работы. Работа коллег распределена по всему миру в пределах европейских часовых поясов.

У вас будет возможность работать над продуктом, который меняет индустрию туризма. Если вы обладаете соответствующим опытом и навыками, присоединяйтесь к команде и помогите достичь новых высот в области путешествий.