ЛОКАЦИЯ: Удаленно (кроме РФ/РБ). ВИЛКА: отталкиваются от зарплатных пожеланий кандидатов.
Американский стартап ищет Data Science специалистов (общего профиля и с уклоном в NLP) для разработки трэвел-продукта. Продукт компании помогает пользователям создавать персонализированные и интересные маршруты во время поездок. Помимо маршрутов, в рамках платформы будет реализовано еще несколько приложений помогающих пользователю в планировании досуга во время путешествия (организация/поиск событий, например, покататься на серфе, сыграть в настолки, и т.п.), ML-powered подбор компаньонов для событий (в дальнейшем возможно и для путешествий), обсуждение интересного контента с собеседниками подобранными ML. Упор на интелектуальный подбор различных опций (места, события, маршруты, люди), которые помогут пользователю испытать лучшие впечатления.
Компания уже запустила продукт на американском рынке и стремится расширить свою деятельность в Европе, Канаде, ОАЭ.
На сегодняшний день в компании cформирована сильная команда из 40 специалистов (Backend Developers, Frontend Developers, Data Engineer, Data Scientists, System Analyst, QA Engineers, DevOps Engineers, Project Manager, etc).
Продукт стремительно развивается и коллеги ищут Data Science специалиста, который поможет им создавать модели для оптимизации и улучшения пользовательского опыта.
Задачи, которыми предстоит заниматься:
Разработка алгоритмов для генерации маршрутов для путешествий с использованием нейросетей (Seq2seq).
Сбор, преобразование и предварительная обработка необработанных данных для их подготовки к анализу.
Получение описательной статистики из предварительно обработанных данных.
Построение статистических и вероятностных моделей.
Проектирование, разработка, обучение и тестирование моделей и алгоритмов интеллектуального анализа данных, машинного обучения и искусственного интеллекта.
Проведение сравнительного исследования различных алгоритмов и моделей.
Реализация модели в форме, которая может быть легко использована инженерами, документирование ее интерфейсов.
Поставка модели в форме, которую можно легко развернуть и поддерживать.
Понимать бизнес-проблемы, понимать возможности и ценности аналитических моделей для клиента.
Общение с заказчиком.
Технический стэк, который используют в команде: Python, PyTorch, Elasticsearch, Pandas, Airflow, Numpy, Git, etc.
Для данной позиции вам пригодится:
Знание техник обработки и трансформации данных (выявление аномалий, обработка пропусков и т.д.).
Знание и понимание алгоритмов классификации, кластеризации, регрессии, ранжирования.
Знание Python, PyTorch и опыт промышленной разработки ПО. Знакомство с фреймворками TensorFlow или Keras будет плюсом.
Наличие опыта успешного внедрения ML-моделей в production будет плюсом.
Знание базовых алгоритмов NLP, как строится BoW, TF-IDF, word2vec, doc2vec, и т.д. (требование для Data Scientist с уклоном в NLP).
Знание архитектур CNN, LSTM, Transformer (требование для Data Scientist с уклоном в NLP).
Понимание различий между BERT/GPT/T5 и задач, которые они решают (требование для Data Scientist с уклоном в NLP).
Опыт работы с Elasticsearch или NoSQL базами данных (некритично).
Опыт оформление результатов исследований в виде отчетов и презентаций.
В свою очередь, компания предлагает трудоустройство по B2B контракту с американским или европейским офисом. Заработную плату в USD, отталкиваясь от ваших пожеланий и компетенций. Также, компания предлагает удаленный формат работы. Работа коллег распределена по всему миру в пределах европейских часовых поясов.
У вас будет возможность работать над продуктом, который меняет индустрию туризма. Если вы обладаете соответствующим опытом и навыками, присоединяйтесь к команде и помогите достичь новых высот в области путешествий.