Мы уже практиковали разбор задач с предстоящих хакатонов. В этом формате мы делимся своим мнением по задачам, на основе информации, которая есть на сайте конкурса и в интернете.
В этом конкурсе призовой 10 миллионов рублей, есть за что побороться. В разборе вы найдёте подробный разбор задач: первые пять сейчас, остальные задачи – в следующей статье. Подробные ТЗ и датасеты организаторы опубликуют в день начала разработки 10 октября.
Учтите, что комментарии по задачам – наше мнение.
И, кстати, регистрация на ЛЦТ ещё идёт: http://rhck.me/leaders2021

На связи Александр Малышев, основатель Russian Hackers. Решил посмотреть на задачки предстоящего конкурса и поделиться своим фидбеком для участников, которые планируют зарегистрироваться на Лидеры Цифровой Трансформации 2021. Организатор конкурса: Департамент предпринимательства и инновационного развития города Москвы и Агентство инноваций Москвы, с 10 октября откроет доступ к дата-сетам и расскажет подробнее про задачи. Тем не менее, уже сейчас можно поразмышлять, какие идеи следует воплотить в жизнь для постановщиков задач.

01. ПЕРСОНАЛИЗИРОВАННАЯ РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА ПО СЕРВИСАМ МОСКВЫ ДЛЯ СТАРТАПОВ

Описание задачи

Разработайте рекомендательную систему для стартапов, которая будет предлагать компаниям доступные меры поддержки и сервисы от структур Правительства Москвы, частных и государственных корпораций, акселераторов, венчурных фондов. Система позволит персонализировать программы поддержки в зависимости от профиля, потребностей и опыта предпринимателей в городе Москве, а для физических лиц и команд подобрать инструменты для развития идеи и старта своего бизнеса.

Комментарий

В задаче командам предлагается помочь подобрать релевантную программу поддержки. Разобраться в условиях получения грантов, акселерационных программ, субсидий и прочего – сложно, часто в компаниях есть отдельный человек, который занимается преимущественно этим, а если вы стартап – то такого человека нет, а это делает задачу использования программ близко к невозможной. Если говорить про Москву, то речь идёт об относительно посильном объеме данных – суммарно акселлераторов, программ поддержки бизнеса запускается порядка несколько сотен в год. Будет здорово, если командам дадут заранее данные об этих возможностях, тогда можно сфокусироваться на продукте – рекомендациях. Алгоритм победы будет таким – узнаёте истинную нужду постановщика задачи, бьёте в эту нужду на питче. В этой задаче важно понять в чём будет наибольшая ценность сервиса – в сэкономленном времени фаундеру, в дополнительных ресурсах, деньгах или в упрощении порога входа в программы, гранты?

Не имея ответов на эти вопросы сейчас, я бы подошёл к этой задаче с разных точек зрения, постарался обсудить каждый из пунктов ниже с постановщиками задач и выбрал тот, который наиболее приоритетный

  • Cold-start подход – выделил топ-10 характеристик бизнеса и для программ, разработал грамотный опрос для бизнесов. В этом подходе "в холодную" пытаетесь оценить бизнес и ценность продукта в качественной оценке, отцифровки показателей бизнеса, по которым можно принять решение какую программу рекомендовать
  • Сервисный подход – т.к. акселерация, гранты, субсидии продукты для предпринимателей, то многие из них привыкли к высокому уровню сервиса. Удобный и функциональный сервис для менеджеров, которые проконсультируют предпринимателей по выбору релевантного продукта может стать сильным конкурентным преимуществом

Наверное, в этой задаче самое важное – выделить то, почему сервисом будут пользоваться основатели стартапов/бизнесов. Кажется важным разделить ценностное предложение в соответствии со зрелостью проектов, при этом наибольший эффект от решения будет, если его интегрировать с чем-то работающим в Москве и не пытаться сделать из этого большой проект. Хорошая методология + немного магии аналитики/data science + упаковка в API/виджет с примером готового продукта – и вы великолепны. Именно методология и экспертность будет решать на этом треке – поэтому в дрим-тим по этой задаче я бы взял 1 бизнес-аналитика, 1 дизайнера, 1-3 разработчиков/дата-саентистов.

02. РЕШЕНИЕ ДЛЯ РАСПОЗНАВАНИЯ И РАЗМЕТКИ ПЕШЕХОДНЫХ МАРШРУТОВ

Описание задачи

В Москве появляется все больше тропинок и пешеходных маршрутов на неасфальтированной поверхности, формируемых горожанами, что указывает на неудобство расположения существующих тротуаров. Разработайте модель, обеспечивающую автоматическую обработку пространственной информации территории города Москвы и прилегающих территорий для автоматического детектирования и построения карты пешеходных троп с использованием технологий искусственного интеллекта в целях последующего наложения указанных пространственных данных на Единую городскую картографическую основу Москвы.

Комментарий

В этой задаче много заинтересованных лиц (стейкхолдеров):

  • горожане
  • организации предоставляющие данные для разметки
  • ответственные за построение карт пешеходных троп
  • Единая городская картографическая основа
  • ответственные за расположение тротуаров и их строительство

и многие другие.

Решая эту задачу, лучше начать с правильных вопросов к постановщикам задания – важно узнать как уже решалась эта задача, в чём есть острая необходимость использования искусственного интеллекта, а в частности, кто будет предоставлять данные для модели, какие сопутствующие задачи есть у города, есть ли запрос решать задачу с точки зрения бизнеса или же требуется разработать исключительно ML-модель?

Свежим взглядом на задачу, без этих вводных от экспертов, я бы стал решать задачу как бизнес-кейс: продумал ввод новых данных: от волонтёров, с камер, спутников, данных, что информация "провалидирована", учёл регулярность обновления данных, а также продумал инструмент для принятия решения по изменению расположения тротуаров. Фантазируя, можно подумать и о разных механиках обработки пространственной информации:

  • Автоматическая разметка (ML-модель unsupervised методами определяет где и как лежит тропинка)
  • Краудсорсинговая разметка (волонтёры указывают где какая тропинка)
  • Пользовательские рекомендации (жители голосуют за новые тропинки)

На задачу я бы брал с собой парочку термоядерных спецов по компьютерному зрению, в идеале с опытом в картографии, либо с опытом в краудсорсинге, плюс почти обязательно взял человека, который понимает в User Experience пешеходных маршрутов и вариативно Mobile/Web в зависимости от того, что будете делать.

В завершение отмечу, что если задача перед участниками будет продуктовой – нужно, чтобы решение чётко ложилось в стандарты работы города: поэтому, если город выбирает закрытый способ сбора и анализа данных, нельзя предлагать краудсорсинг и открытые голосования, и, наоборот, если город готов к прозрачности и открытости принятия решения, имеет место делать модели и сервис, которые будут популяризировать разметку тропинок и тротуаров. Ну и прибудет с участниками сила Толоки

03. РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА ДЛЯ ПОЛЬЗОВАТЕЛЕЙ МОСКОВСКИХ БИБЛИОТЕК

Описание задачи

В целях популяризации библиотек у москвичей необходимо сформировать персонифицированную подборку литературы на основе истории получения книг. Разработайте рекомендательную систему (веб-интерфейс) для формирования истории прочитанных книг, полученных жителями Москвы в библиотеках, а также для формирования персональной подборки литературы на основе прочитанных книг.

Комментарий

Интересная задача, которая понравится дата саентистам, работающим с рекомендательными движками. В мире есть мало примеров, когда рекомендации являются основным продуктом. Даже в Amazon, Netflix, Spotify основным содержимым сервиса является контент, поэтому в задаче просто необходимо отразить весь клиентский путь: в какой именно момент происходит рекомендация и как пользователь о ней узнаёт. Хорошим тоном будем прийти в одну из библиотек и провести пользовательские интервью с посетителями библиотек, чтобы лучше сегментировать их боли, а как следствие, разработать более удобный сервис рекомендаций. Также важно спросить самих заказчиков задачи: "Какие метрики вы хотите оптимизировать?", "Как вы видите встраивание персонифицированной подборки в жизни посетителей библиотек?".

В этой задаче есть несколько подходов:

  • Для читателей – веб-интерфейс, который улучшит опыт посещения библиотеки
  • Для библиотекарей – дополнительная информация о читателе и возможность подсказать книгу на основе опыта библиотекаря
  • Для библиотеки – отцифровка спроса и предложения, в будущем сбор и анализ данных по нуждам читателей и библиотекарей

Если бы я углублялся в задачу, однозначно отметил ещё некоторые важные мысли:

  • Библиотеки активно конкурируют с доставками книг, онлайн-книгами, аудио-книгами. Может ли веб-интерфейс рекомендаций дать схожий опыт и открыть новые возможности для библиотек Москвы?
  • Читая задачу, вспоминается одна из успешных нишевых соц. сетей в Англии – Good Reads – она как раз работает по модели рекомендаций книг, и должна использоваться как референс при решении задачи

Задача – клёвая, мне лично нравится, только с организаторами можно немного подискутировать, почему именно острый запрос в вебе, а не в мобилке. Оставляя этот спор за кулисами, в команду на эту задачу я бы брал 1-2 веб-разработчиков, в идеале, чтобы был опыт работы с профилями пользователей, либо разработчиков личных кабинетов, 1-2 дата-саентиста, которые реализуют алгоритмы рекомендаций, дизайнера и аналитика-хастлера. С технической стороны, можно подумать о serverless-архитектуре, ведь большинство рекомендаций/запросов не требуют молниеностного расчёта, да и в библиотеку люди ходят не каждый час. А также присмотреться к VK Mini Apps / Telegram-ботам, которые будут дополнять веб-версию. Развернуть их можно на Dokku / Heroku

04. ИНТЕРАКТИВНАЯ КАРТА ЭКОЛОГИЧЕСКОГО МОНИТОРИНГА

Описание задачи

В целях повышения качества экологического мониторинга в Москве необходимо разработать карту, которая позволит объединить системы контроля для своевременного реагирования на изменения ситуации. Разработайте комплексную интерактивную карту экологической ситуации в городе на основе измерений состояния воды, почвы и загрязнений атмосферы с предиктивной моделью состояния экологии по районам и распознаванию аномальных ситуаций загрязнения окружающей среды.

Комментарий

В Москве уже есть карты загрязнения воздуха, в том числе и от Мосэкомониторинга и Greenpeace. Поэтому в этой задаче будет полезно взять имеющиеся карты, а также данные, которые могут дать организаторы за основу и углубиться в повышение качества мониторинга и своевременное реагирование. ****В том числе, экспресс-анализ существующих карт, даст понять, что они не используют изменения состояния воды, почвы, а используют только данные об атмосфере. Важно спросить постановщиков задачи о ключевых функциях, необходимых для карты, а также модель использования: будет ли это публичный сервис для всех желающих или внутриведомственный функционал, подразумевающий интеграцию с сервисами, используемых в правительстве и соответствующих органах по экологии. В этой задаче можно много развивать идей:

  • углубиться в проблемы экологии и популяризацию решений для экологии
  • сфокусироваться на Data Science – в задаче нужно предсказывать изменения воды, использовать данные почвы, загрязнений
  • интеграцию с существующими сервисами, которые прямо сейчас распознают аномальные ситуации и информируют людей
  • сфокусироваться на удобстве подключения новых источников данных – чтобы даже обычный пользователь мог быстро добавить новый источник данных
  • подключение B2B продаж с предложением компаниям получать бенефиты за контроль экологии

Если понадобиться визуал – API Яндекс Карт, т.к. это самые популярные карты в Москве, микросервисы, которые дёргают данные из разных источников и складывают в S3 или аналогичное хранилище и пара скриптов, обновляющие данные на картах или помогающие модераторам своевременно обновлять эти данные. Из команды – здесь нужно внимательнее изучить что нужно заказчику. Есть гипотеза, что нужен хороший фронтэндер, но помимо этого – вероятно понадобиться дата-саентисты, т.к. нужно предиктить аномальные ситуации, определять почему они произошли (=задачи по uncertainty estimation). Отмечу, что если будете делать продукт – вполне подойдёт зирокод. Например, Zapier/Integromat будут дёргать данные и собирать их куда нужно, а может быть вы хотите строить монолитный data flow, тогда зовите своего друга дата-архитекта (у вас же есть такой?)

05. ИНТЕРАКТИВНАЯ КАРТА ДЛЯ РАЗМЕЩЕНИЯ СПОРТИВНОЙ ИНФРАСТРУКТУРЫ

Описание задачи

В Москве находится большое количество спортивных городских объектов, которые остаются незамеченными гражданами из-за недостатка информации о них.

Разработайте интерактивную карту с фильтрами под каждый вид спорта и рекомендациями по развитию инфраструктуры района, составленную на основе анализа открытой спортивной инфраструктуры в городе.

Комментарий

Мы уже встречали подобные задачи, например, на хакатоне на Полярном круге, поэтому перед решением посмотрите референсы какие решения предлагали команды на других конкурсах, скажем на девпосте. В Москве много интерактивных карт, например, карта Яндекса, карта воркаут площадок, поэтому в первую очередь стоит проработать пользовательский опыт работы с картой, фильтры под каждый вид спорта. Например, если вы хотите решать задачу выбора площадки "в моменте", то хорошей идеей будет прогнозирование heatmap'ов – на каких площадках сейчас много или мало людей. То, о чём стоит поговорить с судьями: как будет оцениваться эффективность карты, кто и как будет отвечать за рекомендации по развитию инфраструктуры, какие площадки (сайт, соц. сети, моб. приложение...) по работе с аудиторией они видят как наиболее приоритетное? Ответ на последний вопрос крайне важен, т.к. привлечение пользователей в подобный сервис жизненоважная задача. По опыту, решение задачи по привлечению может быть реализовано с разных ракурсов:

  • Правильная оптимизация под органический трафик (SEO, ASO и т.п.)
  • Партнёры, которые будут привлекать пользователей
  • Площадки с трафиком (например, в виде vk mini-apps)
  • Взаимодействие с самими площадками (например, через рекламу на самих спорт. площадках)
  • На долгосрок – удержание пользователей и использование лояльных юзеров для вирального трафика (например, созданием контента)
  • Реализация карты в виде виджета, SDK или API для других разработчиков и поддержка open-source

Честно говоря, если бы я пошёл решать эту задачу, больше думал бы о том, какие данные я хочу визуализировать на этой карте. После этого принял решение – хочу ли я делать что-то кроме этого – общение, state-of-the-art интерфейсы или прогрессивные технологии. Это важно, т.к. для решения этой задачи вполне подойдёт зиро-код или лендинг с удобными картами Яндекса, а возможно вы хотите делать полноценное приложение со спортивными объектами, графикой – тогда решения на зиро-коде, вроде Adalo или Glide не подойдут. Кто точно нужен – хороший аналитик со знаниями маркетинга и любовью к спорту на улице, плюс 1-3 разработчика, может быть дата-саентист, который придумает хорошее ранжирование


Полезный разбор? Поделитесь обратной связью у нас в Телеграм-канале или чате. Кстати, вторая часть разбора выйдет совсем скоро.