DATA MASTERS
Конкурс
цифровых
решений

Соревнование IT- и data-специалистов
в решениях задач регионов на основе данных

Сделай мир вокруг себя лучше!
Сегодня в России множество решений принимается интуитивно.
>>>>>
Данные позволяют решать задачи максимально точно, адресно, эффективно.
Реальные проблемы не решаются.
Развивай себя среди лучших дата-аналитиков страны
зачем участвовать?
Прокачай hard skills на реальных данных регионов
Реши реальные задачи реального заказчика
Сделай лучше жизнь вокруг себя
с помощью данных
Стань участником
не только разработки,
но и внедрения решений
Призовой фонд
от 1 млн рублей
>>>
1 этап
Конкурс задач
для регионов
февраль – апрель 2019
>>>
2 этап
Конкурс решений
для IT- и дата-специалистов
май – июль 2019
3 этап
Конкурс внедрений
для региональных властей и бизнеса
июль 2019 – февраль 2020
конкурсные задачи
Образование
Республика Татарстан
Прогноз потребности в строительстве детских садов
Описание проблемы
Отсутствие инструмента для прогноза потребностей в детских садах для принятия решения по их строительству. На текущий момент в регионе имеется актуальная очередь по детям, не получившим место в детском саду и ожидающим в очереди в течение продолжительного периода времени, что связано недостаточностью количества свободных мест в детских садах.

Задача
Необходимо проведение анализа нехватки мест в детских садах на основе данных о количестве и имеющихся мощностях детских садов, рождаемости и текущей потребности в местах в разрезе возрастных групп детей и муниципальных районов региона, и дальнейшее формирование прогноза о необходимости строительства новых детских садов с указанием предполагаемой мощности и потенциального месторасположения.

Ожидаемый результат
Инструмент для прогнозирования потребности в строительстве детских садов для обеспечения местами в детских садах всех нуждающихся детей.
    Городская среда
    Липецкая область
    Эффективное развитие сети уличного освещения


    Описание проблемы
    Недостаточно освещенные улицы преимущественно в сельских поселениях являются предметом многочисленных обращений, поступающих в отраслевые органы исполнительной власти Липецкой области.
    Органы местного самоуправления направляют в органы исполнительной власти заявки на предоставление субсидий для реализации энергосберегающих мероприятий, направленных на модернизацию сетей уличного освещения поселений.
    При этом объем финансирования, имеющийся у органов местного самоуправления, зачастую не покрывает объем средств, необходимый для выполнения всех заявок, что ведет к потребности определения очередности заявок по критериям эффективности.
    На данный момент расчёт необходимого дополнительно количества светильников осложняется отсутствием достоверных данных о площади автомобильных и пешеходных дорог. Из расчета площади освещения должны быть исключены такие объекты как поля, леса, огороды, реки и т.п.
    Выявление эффективной площади освещения, для которой целесообразна установка светильников, должно повысить ключевой показатель по освещенности улиц населённых пунктов.

    Задача
    Требуется разработать геоинформационный сервис, включающий базу населённых пунктов и улиц с площадью, необходимой к освещению, информацию о количестве и типе уже установленных светильников, данные по трафику передвижения граждан с геопривязкой. Сервис должен осуществлять функции:
    • отображения на карте принятых к расчёту площадей улиц, с учётом наложения тепловой карты перемещения населения в тёмное время суток на картографическую основу для определения первоочередной потребности установки светильников
    • расчёта требуемой освещённости в зависимости от типов улиц и нормативов освещённости
    • ранжирования населённых пунктов по признаку текущей и требуемой освещённости, при этом сначала производится ранжирование по сельским советам, затем по населённым пунктам внутри выбранного сельсовета, в конце – по улицам данного сельсовета при наличии
    Ключевой индикатор – освещенность улицы суммарный световой поток светильников, отнесенный к площади. При этом площадь принимается не только проезжей части, но и тротуарных дорожек, в том числе отделенных от проезжих частей, пешеходных зон, общественных пространств, посадочных площадок общественного транспорта, подъездов и подходов к культурно-массовым, спортивным, развлекательным и иным социальным объектам.
    Источники данных:
    • нормативы наружного освещения согласно СНиП 23-05-2010 «Наружное освещение городских и сельских поселений»: норматив освещения берётся из Таблицы 1 и может применяться в зависимости от интенсивности перемещения граждан, в случае невозможности однозначного определения интенсивности – за среднее значение освещённости для улиц и дорог сельских поселений принимается 6 лк
    • информация о текущих светоточках в населенных пунктах, отражённая в Таблице 2, включающая в том числе географические координаты
    • - информация о площади, необходимой к освещению может быть сформирована на основе данных картографических сервисов или публичной кадастровой карты, в частности, для определения площади улиц можно из общей кадастровой площади поселения вычесть площади всех кадастровых участков внутри поселения и добавить площади социально значимых объектов
    • в качестве дополнительной информации для определения площади, необходимой к освещению, можно использовать данные операторов сотовых сетей по перемещающемуся потоку граждан в тёмное время суток в Липецкой области такие данные будут получены в течение месяца.

    Ожидаемый результат
    Имея данные по ключевому индикатору всех населенных пунктов, органы местного самоуправления и органы исполнительной власти смогут формировать очередность финансирования выполнения мероприятий по замене и установке светильников с низким показателем ключевого индикатора, исходя из актуальных, постоянно обновляющихся данных. При этом будут достигнуты следующие показатели:
    • повышение качества жизни граждан, в том числе создание условий для проживания
    • увеличение эффективности расходования бюджетных средств
    • повышение качества муниципального и государственного управления, а также совершенствование социальных и экономических процессов
    • снижение издержек социально-экономических процессов и процессов муниципального и государственного управления
    • увеличение открытости процессов муниципального и государственного управления.

    Государственные услуги
    Томская область
    Мониторинг развития компаний, получивших государственную поддержку
    Описание проблемы
    Нет возможности корректно и своевременно оценить эффективность мер государственной поддержки субъектам МСП в динамике за несколько лет. Нет понимания какие меры поддержки максимально эффективны. Существуют меры поддержки, оказываемые на протяжении нескольких лет, но морально устаревшие, нерелевантные. Нет корректных объективных данных для отказа от таких мер или повода для их принципиального изменения.

    Задача
    Для определения эффективности мер поддержки, оказанных субъектам МСП, в динамике – с момента получения поддержки по настоящее время – необходимо произвести группировку субъектов МСП, получивших поддержку за последние 5 лет, выявить основные меры поддержки, отраслевую принадлежность субъектов получающих поддержку, анализ показателей, с которыми произошли изменения в положительную сторону после получения субъектом МСП государственной поддержки они могут и не совпадать с заданным KPI: например, ожидали увеличение числа рабочих мест, а получили рост производительности труда на одного работника.

    Ожидаемый результат

    Максимизация уровня эффективности мер поддержки МСП за счет:
    1. организации, структурирования сведений о субъектах МСП, получивших поддержку, и данных о влиянии мер поддержки.
    2. получения сведений о мало эффективных мерах поддержки.
    3. получения сведений о максимально эффективных мерах поддержки.
    4. исключения неэффективных мер поддержки.
    5. прокачки и увеличения трансляции эффективных мер поддержки и адаптация их под реалии и запросы бизнеса.
    Наборы данных содержат меры поддержки оказанные предпринимателям (МСП и ИП) в инфраструктуре Томска.
    Наборы обезличены и содержат только ИНН.
    Данный набор необходимо достроить данными из налоговой за последние 3 года. Существует возможность это сделать внутри, но требует дополнительного человеческого ресурса (так как данные подгружаются вручную)
    Если у организаторов будет возможность автоматического орашения набора данных, это существенно упростит задачу.
    На выходе хотелось бы получить систему анализа эффективности мер поддержки, для выстраивания более эффективной стратегии поддержки МСП.

    Здравоохранение
    Республика Саха (Якутия)
    География доступности медицинской помощи (включая транспортные средства) для жителей отдаленных районов и пострадавших в ДТП
    Описание проблемы
    Удаленность населенных пунктов и лечебных учреждений, в республике ежегодно становится причиной летальных исходов в различных происшествиях, в том числе на дорогах федерального и регионального значения. Диспетчера должны в считанные минуты принять решение о направлении той или иной бригады из районных больниц спецтранспортом или посредством санавиации. Зачастую пострадавшие направляются в районные больницы, хотя необходимую помощь им могут оказать только в республиканских больницах - таким образом теряется драгоценное время. Либо наоборот, пострадавшие направляются в республиканские больницы, хотя помощь им могли оказать и в районной.

    Задача
    Необходимо разработать геоинформационный рекомендательный сервис по автоматическому расчету расстояния до ближайшего компетентного учреждения в зависимости от местонахождения действующей инфраструктуры, наличия необходимого оборудования и специалистов.

    Ожидаемый результат

    Повышение качества принятия решений об экстренной помощи, вспомогательная система для определения наиболее эффективных точек размещения бортов санавиации.
    Здравоохранение
    Курганская область
    Ситуация в сфере здравоохранения Курганской области
    Описание проблемы
    Отсутствие инструментов для непрерывного отслеживания уровня заболеваемости с учетом динамики и обеспечения мониторинга особо опасных заболеваний на территории Курганской области

    Задача
    Разработка информационно-аналитической системы мониторинга социально обусловленных, острых респираторных, эпидемиологических заболеваний на территории Курганской области. На основе предоставленных данных разработать систему, которая обеспечит возможность отслеживания заболеваемости с учетом динамики на территории Курганской области. Система должна анализировать данные, обеспечивать вывод зон наибольшего заражения на интерактивной карте Курганской области района, населенного пункта , выдавать прогноз развития ситуации, предлагать варианты решений проблемы в соответствии с заданными алгоритмами.
    Для анализа и решения данной задачи у органов власти есть наборы данных, содержащие следующие сведения:
    • Дата обращения
    • Адрес
    • Диагноз международного классификатора болезней МБК.

    Ожидаемый результат

    Прогнозирование заболеваемости по категориям степени риска для предотвращения распространения социально обусловленных, острых респираторных, эпидемиологических заболеваний. Локализация и выработка мер, направленных на нераспространение заболеваний.
    Разработка системы, соответствующей поставленной задаче, внедрение системы в пилотном режиме для проверки в реальных условиях в учреждениях здравоохранения Курганской области.
    Социальная сфера
    Томская область
    Выявление субъектов благотворительности в Томской области
    Описание проблемы
    Актуальность связана с существованием сетевого гражданского общества, потенциал которого выше, чем у официально зарегистрированных фондов и НКО.
    Идентификация данных субъектов основана на сборе и анализе текстовых данных социальных сетей например, комментарии в сети Вконтакте . Однако, исходные данные, полученные методом поиска в сети упоминаний о благотворительном действии, по ключевым словам, содержат в себе много мусора. Так, помимо сообщений с призывами о помощи, рассказах о деятельности фондов и т.п. – существуют сообщения, не несущие целевой смысловой нагрузки для исследования. Такими сообщениями являются: биография великих людей Билл Гейтс, Уоррен Баффет и т.п., жизненные советы, описание социальных проблем. Кроме того, среди них очень сложно вручную классифицировать субъектов информации авторов .

    Задача
    Важной задачей является выявление субъектов благотворительности в регионе, анализ особенностей их взаимодействия, онлайн-активности, структуры благотворительного действия.
    В целях исследования необходимо произвести:
    1. Автоматическую классификацию мусор – не мусор на основе обучающей выборки.
    2. Определить авторство сообщений или группу-владельца
    3. Осуществить классификацию авторов и сообществ по типам: организационно-институциональный официальные благотворительные организации , коммунитарный инициативные группы, сообщества адресной помощи , индивидуальный самостоятельные жертвователи.
    Подобные классификационные задачи основаны на определении специфики генерируемого ими контента в рамках методологии Natural language processing анализ естественного языка с помощью лингвистических маркеров благотворительной деятельности.

    Ожидаемый результат

    Получить выборку субъектов благотворительной деятельности по трем уровням: организационно-институциональный (официальные благотворительные организации), коммунитарный (инициативные группы, сообщества адресной помощи), индивидуальный (самостоятельные жертвователи).
    Для развития социального предпринимательства в регионе!
    Здравоохранение
    Томская область
    Оценка качества движения пациентов с использованием безконтактных систем захвата движения
    Описание проблемы
    Нарушения двигательных функций составляют один из кардинальных симптомов проявления большого числа заболеваний, связанных с нарушениями нервной деятельности, таких как, болезнь Паркинсона, рассеянный склероз, различные виды атаксий и т.п. Утрата или снижение способности к передвижению, поддержанию равновесия и устойчивости вызывает многочисленные соматические нарушения, способствует прогрессированию морфофункциональных расстройств в организме человека, возникающих при заболеваниях опорно-двигательного аппарата, нервной системы, вестибулярного и зрительного анализаторов систем и т.д. Особенности движения различных точек тела человека при выполнении двигательных тестов являются внешним проявлением его состояния и уровня функциональных возможностей. Это отражается в характере траекторий движения и может служить дополнительным информативным источником как для оценки качества движения в целом, так для разработки новых алгоритмов оценки состояния человека в решении задач превентивной и персонализированной медицины.
    Развитие компьютерных технологий виртуальной реальности, как средства воздействия на пациента, и безмаркерного видеозахвата движения, как способа регистрации траекторий движения различных точек тела пациента, при выполнении функциональных тестов или рутинных действиях существенно расширяют возможности получения новой информации о его состоянии. Преимущества использования сред виртуальной реальности заключаются в возможности вносить изменения в окружающий мир, создавать новые реалистичные раздражители в виде подвижных и неподвижных объектов, т.е. иммитировать совокупность зрительных, тактильных и слуховых образов. Безмаркерные системы видеозахвата движения позволяют измерять трехмерные координаты большого количества точек тела человека в течение длительных временных интервалов, с высокой частотой дискретизации, что приводит к существенному увеличению объемов анализируемых первичных данных в условиях, не приводящих к негативному воздействию или дискомфорту для пациента. На настоящий момент нерешенной проблемой является отсутствие эффективных систем сбора данных трехмерных траекторий движения, алгоритмов оценки качества движения и состояния пациента на основе их интеллектуального анализа.

    Задача
    Разработка компьютерной технологии оценки качества движения пациентов, заключающаяся в создании системы регистрации и анализа траекторий движения точек тела пациента, во время выполнения двигательных тестов на основе бесконтактных систем захвата движения в среде виртуальной реальности на примере болезни Паркинсона.

    Ожидаемый результат

    1. Прототип информационной системы по сбору данных (на примере болезни Паркинсона) для интеграции среды виртуальной и дополненной реальности с устройствами безмаркерного видеозахвата движения и регистрации трехмерных траекторий движения. Для хранения первичных данных будет создана база наблюдений трехмерных траекторий движения, в дальнейшем играющая роль единой концептуальной основы для получения новых знаний о заболеваниях, связанных с нарушениями опорно-двигательного аппарата, системными реакциями на виртуальные воздействия и адаптационные возможности организма.
    2. Будут предложена методика и апробировано алгоритмическое и программное обеспечение для оценки постуральных нарушений на основе результатов анализа траекторий движения с использованием виртуальной реальности в условиях сенсорной диссоциации пациентов с двигательными нарушениями
    3. Подготовлены рекомендации по применению разработанных методик оценки степени двигательных нарушений для задач превентивной и персонализированой медицины, включая технологии удаленного доступа.
    Создать систему автоматизированного анализа. В настоящее время организован сбор, структурирование данных, а также машинный доступ.
    Здравоохранение
    Ямало-Ненецкий АО
    Прогнозирование динамики смертности населения субъекта РФ
    Описание проблемы
    Данные о смертности анализируются на основе свершившихся фактов смерти. Фактически, управление здравоохранением региона в части мониторинга смертности ведется постфактум на основании изучения статистических отчетов.

    Задача
    1. Анализ данных и информационных систем, имеющихся в сфере здравоохранения ЯНАО, анализ отечественной и мировой практик аналитики и прогнозирования смертности с целью уточнения необходимых и достаточных данных, источников этих данных, способов и методов поступления данных в прогнозную систему, выбор методов и моделей прогнозирования, обеспечивающих достоверный прогноз, а также уточнения технического задания.
    2. Разработка математических моделей и визуализации результатов их применения, встраивание этих наработок в существующий и применяемый руководителями региона Региональной информационно аналитической системе.
    3. Пилотное внедрение новой функциональности, анализ результатов и доработка математических моделей и программного обеспечения 4. 4. Анализ полученных прогнозов специалистами по организации здравоохранения и формирование научно-обоснованных практических рекомендаций по совершенствованию работы регионального управления здравоохранением.

    Ожидаемый результат

    1. В ЯНАО будет доработана существующая региональная информационно-аналитическая система, в которую будут встроены подготовленные высокопрофессиональными специалистами математические модели, осущеставляющие автоматическое формирование прогнозов динамики смертности и выявление проблемных очагов, достоверно влияющих на такую динамику.
    2. Результаты работы прогностических моделей будут изучены ведущими отраслевыми экспертами в области организации здравоохранения, которые предложат подходы и рекомендации по совершенствованию управления и организации регионального здравоохранения ЯНАО.
    3. Внедрение разработанных экспертами рекомендаций позволит обеспечить устойчивое снижение смертности населения за счет более быстрых и точечных управленческих решений, формируемых руководителями на основе прогнозирования ситуаций и усовершенствованного управления отраслью.
      Образование
      Ямало-Ненецкий АО
      #УчительЯмала2035
      Описание проблемы
      Отсутствие персонализированной системы профессионального роста педагогов в цифровом формате при растущих требованиях государства и общества к учителю

      Задача
      • гармонизация данных, имеющихся в разных системах об учителях: о достижениях и затруднениях педагогов и их обучающихся, , данные о результатах участия педагогов в олимпиадах, конкурсах, активности их участия в профессиональных сетевых сообществах, направления профессиональной подготовки, перечне и результативности прохождения курсов повышения квалификации и др.
      • разработка методики определения рекомендаций для групп педагогов по затруднениям с учетом достижений
      • разработка модели персонификации непрерывного профессионального развития педагогов на основе больших данных
      • формирование индивидуального цифрового профиля компетенций педагогов в личных кабинетах платформы
      • разработка модели формирования индивидуальных рекомендаций педагогам по развитию профессиональных компетенций по повышению квалификации, по карьерному росту, в том числе присвоение педагогического статуса и т.д.
      • разработка цифрового решения, позволяющего обеспечить обучение и развитие учителя 24/7, в удобное время, с оптимальными временными затратами и тому, в чем нуждается, на основе цифрового профиля педагога с использованием больших данных.

      Ожидаемый результат

      Портал персонализированной системы профессионального роста педагогов поможет повысить компетенции педагогов и повлияет на образовательные и академические результаты учащихся.
        Культура и туризм
        Челябинская область
        Построение эффективной маркетинговой и продуктовой стратегии привлечения туристов на курорты Южного Урала на основе анализа цифрового следа .
        Описание проблемы
        Процент туристов, бронирующих места проживания самостоятельно, растет из года в год. При этом мотивы потенциального туриста, на котором основан выбор, его цифровой путь принятия решения изучен слабо, что в свою очередь не позволяет выстроить эффективную маркетинговую и продуктовую стратегию по привлечению туристов на курорты Южного Урала.
        Также не определен цифровой портрет туриста Челябинской области . Отсутствует системная работа по сбору данных, что не позволяет принимать эффективных решений по таргетированию туристического потока. Отсутствует эффективная связка потенциальный турист - места размещения , ввиду отсутствия комплексной системы и выстроенной технологии взаимодействия с различными стейкхолдерами: органы власти, бизнес сообщества, потенциальные туристы. Основная идея проекта заключена в построении на основе данных модели принятия решения потенциальным туристом с целью воздействия в реперных точках инструментами цифрового маркетинга.
        Опыт схожих по инфраструктуре европейских курортов, в частности, Земли Зальцбург, наглядно демонстрирует эффективность системной государственной работы по привлечению туристов в регион в целом, для чего создан специальный государственный орган - Офис по туризму.

        Задача
        1. Ретроспективный анализ запросов на основе данных Яндекса и Гугла сейчас анализ поисковых запросов можно проанализировать лишь в ретроспективе за один месяц, необходимы данные по поисковым запросам за более релевантный период - 3 года минимум.
        2. Построение цифрового портрета туриста на основе данных соц.сетей и сотовых операторов необходимы датасеты от сотовых операторов TELE2, МТС, Мегафон по половозрастному, социальному признакам с привязкой к геолокации в ретроспективе за 3 года.
        3. Анализ данных различных ведомств, связанных с данной сферой
        4. Построение аналитики

        Ожидаемый результат

        Кратное Увеличение заполняемости номерного фонда действующих объектов туристической инфраструктуры региона. Повышение индекса цифрового присутствия Южного Урала в сети Интернет. Увеличение налоговых поступлений с 1 до 5%.
          Здравоохранение
          Томская область
          Информационная система для помощи в диагностике заболеваний на основе интеллектуального анализа данных
          Описание проблемы
          В условиях нарастающей потребности в персонализации медицины и необходимости ее комплексного цифрового развития ощущается дефицит решений, позволяющих обеспечить не только разностороннюю диагностику человека, но и автоматизированное сохранение персональных данных медицинской диагностики с формированием непрерывного цифрового следа и интеллектуальную обработку диагностических результатов с целью помощи медицинским специалистом в принятии решений по диагностике заболеваний.
          Персонализация медицины является приоритетным направлением в современном мире. В России это направление включено в дорожные карты Национальной технологической инициативы.
          В связи с развитием методов искусственного интеллекта и автоматического анализа данных, актуальной задачей является создание решений, направленных на помощь медицинским специалистам в поиске информации в диагностических данных пациентов, на основе которой можно осуществлять более точную диагностику заболеваний. Однако многие современные методы интеллектуального анализа требуют для использования компетенций в области программирования и разработки ПО, и потому последние эффективные разработки могут быть труднодоступными для использования специалистами в области медицины и биоинформатики. Поэтому разработка инструментов для анализа медицинских данных, которые не требуют для использования глубоких знаний в IT, но вместе с тем предоставляют современные эффективные методы обработки данных является актуальной задачей.
          Кроме того, решения, использующие современные методы интеллектуального анализа медицинских данных необходимы для разработки новых технологий в области медицинской диагностики. Например, поиск новых биомаркеров для доклинической диагностики онкологических заболеваний может стать ценным инструментом обнаружения болезней на ранних стадиях, а также рецидивов злокачественных новообразований после лечения. Было показано, что антитела вырабатываются в том числе и против антигенов, экспрессируемых опухолевыми клетками. Относительно недавно разработанная технология - иммуносигнатура представляет собой высокочувствительный метод обнаружения антител циркулирующих в крови пациента с помощью пептидных микрочипов. После получения результатов иммуносигнатурного теста в цифровом виде диагностика заболеваний производится с помощью методов интеллектуального анализа данных [1,2].

          1. 1. Stafford P., Cichacz Z., Woodbury N.W. Immunosignature system for diagnosis of cancer. Proc Natl Acad Sci USA 2014 111 30 : E3072–E3080.
          2. Шаповал А.И., Легутки Д.Б., Стаффорд Ф., Требухов А.В., Джонстон С.А., Шойхет Я.Н., Лазарев А.Ф. Иммуносигнатура — пептидный микроэррей для диагностики рака и других заболеваний. Российский онкологический журнал 2014

          Задача
          Разработка цифровых решений для хранения и автоматического интеллектуального анализа данных медицинской диагностики различных типов получаемых как в ходе повседневной клинической практики, так и в ходе актуальных экспериментальных исследований в области медицинской диагностики , позволяющих получать из этих данных значимую для медицинских специалистов информацию, помогающую в принятии решений по диагностике заболеваний. Интерфейс разработанных инструментов для анализа данных должен быть доступен для использования специалистами и исследователями в области медицины и не требовать дополнительных глубоких знаний в области IT и разработке ПО.

          Ожидаемый результат

          Комплекс цифровых решений, включающих в себя:
          1. Набор инструментов для хранения и предварительной обработки медицинских данных (например, восстановления пропущенных значений в выборках, нормализацию данных, поиск наиболее значимых признаков и т.п.).
          2. Набор инструментов для анализа медицинских данных, помогающих производить постановку диагноза пациента на основе данных медицинской диагностики посредством использования методов интеллектуального анализа данных (в частности машинного обучения).
          3. Пользовательский интерфейс для использования разработанных инструментов для анализа медицинских данных, позволяющий использовать их без глубоких знаний в области IT и разработки ПО.

          Источники данных:
          1. Базы данных медицинских учреждений с результатами медицинской диагностики , получаемыми в ходе повседневной клинической практики.
          2. Публичные репозитории с данными экспериментальных исследований в области медицинской диагностики:

          Возможные источники данных:
          1. Данные, получаемые по договоренности от медицинских учреждений.
          2. Публичные репозитории с наборами медицинских данных различных типов для обогащения обучающих выборок данных, использующихся для настройки алгоритмов интеллектуального анализа данных:
            Культура и туризм
            Белгородская область
            Классификатор контента, поступающего от учреждений культуры, спорта и туризма, на предмет качества описания и востребованности у жителей региона. Входные данные: контентное описание мест и событий + история их модерации.
            Описание проблемы
            В регионе есть более 1000 культурных, спортивных и туристических субъектов, постоянно организующих и проводящих мероприятия для жителей регионов. При этом все они создают медиа контент не самого высокого качества, что приводит к достаточно узкому информационному охвату. Отдельная проблема связана с централизацией разнородных данных на информационных ресурсах региона. Требуется разработать аналитические механизмы, повышающие структурность данных и проверяющих качество контента перед публикацией на региональных информационных площадках, а также перед выгрузкой в федеральные СМИ и другие интернет-ресурсы.

            Задача
            Необходимо создать сервис автоматической модерации анонсов мероприятий, принимающий на вход анонс мероприятия в формате JSON и генерирующий оценки вероятности необходимости отклонения по Группам причин из обучающей выборки:
            • yandexAfisha отклонение из-за несоответствие по требованиям Яндекс.Афиши
            • additional отклоние по дополнительным причинам причинам
            • exhibitions отклоние из-за не соответствия правилам оформления выставок
            • common отклонение по общим причинам
            • place отклоние из-за данных о месте и времени проведения
            • price отклоние из-за данных о цене
            • description отклоние из-за краткого или полного описания
            • image отклонение из-за главного изображения

            Ожидаемый результат

            Сервис должен поддерживать переобучение/дообучение модели на основе данных о расхождениях а оценке сервиса и модератора-человека.
                Образование
                Томская область
                Оценка направлений исследования научных коллективов (школ) Томской области
                Описание проблемы
                В Томске:
                6 - Государственных вузов
                4 - Филиалов государственных вузов
                1 - Коммерческих негосударственных вузов
                7 - Научно-исследовательских институтов
                5 - Филиалы федеральных вузов
                1 - Институт

                Заявленные актуальные направления научных исследований:
                1. Фундаментальные исследования в области классической и дискретной математики, физической мезомеханики многоуровневых сред, математических проблем современного естествознания, математического моделирования и теоретической информатики, многоуровневого компьютерного конструирования наноматериалов и нанотехнологий
                2. Комплексные фундаментальные исследования в области ядерной физики, физики конденсированных сред, тонкопленочных и многослойных систем и плазмы, оптики и лазерной физики, радиофизики, электроники и астрономии
                3. Фундаментальные исследования в области разработки и создания современных материалов, слоев и покрытий в интересах промышленности региона
                4. Комплексные фундаментальные исследования в области физической, органической и неорганической химии, направленные на получение принципиально новых свойств материалов и технологий на ресурсной базе региона
                5. Комплексные фундаментальные медицинские исследования по изучению этиологии и патогенеза социально значимых в регионе заболеваний человека, поиску путей их диагностики, профилактики и лечения в области онкологии, кардиологии, психиатрии, наркологии, акушерства, гинекологии, перинатологии, генетики, фармакологии и т.д.
                6. Комплексные фундаментальные исследования в области геологии, геофизики и физики атмосферы, направленные на изучение природных запасов и изменение климата региона
                7. Фундаментальные исследования в области информационно-вычислительных систем и сетей, защиты информации, информатизации общества в контексте развития электронной промышленности и обеспечения информационной безопасности
                8. Фундаментальные исследования в области наук о материалах, мехатроники, робототехники, лазерной сварки, сварки трением с перемешиванием, электроразрядных и пучково-плазменных технологий, электроники, приборостроения, аддитивных технологий в целях развития машиностроительного и энергетического комплекса региона
                9. Фундаментальные исследования в области энергоэффективности и энергобезопасности: нетрадиционные и возобновляемые источники энергии, энергосберегающие технологии, местные топливно-энергетические ресурсы для решения широкого спектра социальных задач
                10. Фундаментальные исследования исторических процессов и наследия региона
                11. Комплексные фундаментальные исследования закономерностей социально-экономического и отраслевого развития в контексте прогнозирования и стратегического планирования
                12. Комплексные фундаментальные исследования, направленные на изучение состояния и тенденций развития общественно-политической и социальной ситуации региона в целях повышения уровня и качества жизни
                13. Фундаментальные исследования состояния языков, культуры и искусства народов
                14. Фундаментальные исследования закономерностей и тенденций развития системы образования состояния экологии и психолого-социальных проблем человека
                15. Фундаментальные исследования, направленные на установление степени влияния процессов глобализации.

                Таким образом, в Томской области занимаются исследованием и разработкой множество научных коллективов. Данные о структуре компетенций разрозненные, а процессы связанные с их актуализацией требуют большого человеческого ресурса и как правило растянуты во времени. В итоге отсутствует единая карта научно-исследовательских коллективов Томской области. В Администрации Томской области нет возможности получить оперативную информацию о наличии в Томске коллектива с нужными компетенциями под решение новой технологической задачи.

                Задача
                Необходимо проанализировать базы ВАК, Web of Science, Scopus публикаций Томских коллективов.

                Построить аналитику:
                • по ВАК специальностям
                • по Авторам
                • по ключевым словам
                с сортировкой
                • по индексу цитируемости
                • по авторам
                • по вузам
                • по ключевым словам
                с возможностью изучения аннотации.

                Ожидаемый результат
                Получить инструмент оценки научно-исследовательского компетентного потенциала томских научных организаций. Для оперативного определения направлений научных исследований, выявления передовых коллективов.
                В результате хотелось бы получить структурированную базу данных с данными о публикациях томских научных коллективов, с возможностью наложения всевозможных фильтров, для возможности получения информации под разные задачи.
                Кроме того, есть необходимость в сборе целевой аудитории для участия в коммуникационных мероприятиях с томским бизнес сообществом, а также с крупными промышленными партнерами Томской области.
                Нужно дополнить данными хоз. договоров, и данными из базы НИОКРов.
                    Государственные услуги
                    Санкт-Петербург
                    Проактивные государственные услуги
                    Описание проблемы
                    Низкий уровень осведомленности граждан о государственных услугах, которые они имеют право/должны получить в той или иной жизненной ситуации. Как следствие, недополучение благ, временные затраты на поиск информации – со стороны граждан, временные затраты на консультирование – со стороны сотрудников ИОГВ.

                    Задача
                    Реализовать механизм, позволяющий на основе анализа полученных ранее заявителем государственных услуг, информации, хранящейся в ЕСИА, сведений, дополнительно заполненных пользователем в Личном кабинете на Портале государственных и муниципальных услуг Санкт-Петербурга, формировать рекомендации о получении государственных услуг с автоматическим предварительным заполнением необходимых данных и предложением пользователю проверить и направить заявления в ИОГВ реализация проактивного подхода . Производить анализ данных о человеке в индивидуальном порядке, но в обезличенной форме, что не позволит идентифицировать его личность и, таким образом, не предусматривает передачи персональных данных. Создать механизм, позволяющий по результатам анализа пользовательских данных для пользователей с похожими характеристиками и моделью поведения, формировать аналогичные предложения и представление персонализированной информации на Портале в приоритетном порядке.

                    Ожидаемый результат

                    Проактивный механизм государственных услуг

                    Образование
                    Томская область
                    Анализ зависимости успеваемости ребенка от выбора программы дополнительного образования
                    Описание проблемы
                    В настоящее время нет четкой системы определяющей траекторию развития ребенка. Существующая школьная образовательная программа не дает 100 положительный результат. В связи с тем, что дети могут пропускать важные основополагающие этапы образовательной программы, у них в будущем могут не сформироваться модели мышления позволяющие например составлять условия задач или составлять системы уравнений.
                    Существует потребность в определении программ дополнительного образования влияющих устанавливающих на положительную динамику успеваемости. Важно определить предметность, содержание оказывающее влияние, выделить педагогов, изучить их методику и программу.

                    Задача
                    Определить программы дополнительного образования оказывающие максимальный эффект на успеваемость ребенка.
                    Существует набор данных содержащих итоговую аттестацию детей ЕГЭ . В связи с тем, что процедура деперсонализации данных занимает много времени, а также учитывая тот факт что данные необходимо собирать из разных информационных систем, формирование общего набора данных может заятнуться за пределы 31.03.2019.
                    В настоящий момент в наличии имеются данные ЕГЭ с 2014 года. По этим данным можно решить следующие задачи:
                    1. Прогноз количество абитуриентов поступающих в другие вузы страны.
                    2. Потенциал абитуриентов для Томской области по направлениям
                    3. Эффективность образовательных программ от 2014 до 2018 года.

                    Ожидаемый результат

                    Аналитические данные связывающие текущую успеваемость ребенка, дополнительной образование и итоговый бал ЕГО, а также его выбор экзаменов.
                    Т.е. влияет ли дополнительное образование:
                    1. на успеваемость
                    2. на итоговую оценку
                    3. на выбор экзаменов (области будущей профессии)
                    В дальнейшем возможность сбора данных об образовании родителей и их социальном статусе.
                    В итоге конечно хотелось бы получить модели образовательных траекторий развития ребенка.

                    Исследование
                    Республика Саха (Якутия)
                    Лекарственное обеспечение отдельных категорий граждан (льготников)
                    Описание проблемы
                    На льготное лекарственное обеспечение обеспечение населения льготными лекарственными препаратами в рамках государственной социальной помощи, а также по программе семи высокозатратных нозологий ежегодно выделяется значительная сумма из федерального и регионального бюджетов. При этом, расчет проводится из установленного норматива 823,4 руб. на чел. , который используется неэффективно - отдельные категории льготников не пользуются данной мерой, некоторым выписываются рецепты на сотни тысяч рублей в год.

                    Задача
                    Необходимо провести кластеризацию по категориям льготников заболеваниям и определить оптимальную сумму норматива для дальнейшего принятия решения о дифференциации норматива в зависимости от структуры перечня льготников.

                    Ожидаемый результат

                    В результате будут разработаны предложения по корректировке суммы норматива исходя из категорий заболеваний и поставлен вопрос интеграции систем (ПФР и Минздрав) для более эффективного расходования бюджетных средств.
                    AI/ML
                    Рязанская область
                    Объективная оценка степени удовлетворенности населения
                    Описание проблемы
                    Существует множество разрозненных источников поступления обратной связи от населения жалобы, предложения . Заявки поступают в различном формате в различные инстанции, которые, в свою очередь, не всегда компетентны по поступающему вопросу. Поступающая информация часто теряется, что ведет к нерешению проблем, росту однотипных повторяющихся заявок от населения и, как следствие, к повышению неудовлетворенности населения.

                    Задача
                    Создать программу с машинным обучением, которая на основании содержания текста обращения могла бы определять тему обращения и ответственный орган власти.

                    Ожидаемый результат

                    Система приема обращений граждан, которая автоматически направляет обращение непосредственному исполнителю.
                    Городская среда
                    Республика Саха (Якутия)
                    Формирование карты фактической плотности населения
                    Описание проблемы
                    Несоответствие данных паспортных столов и фактического проживания населения значительно усложняет процесс планирования городской среды, развития городских округов и предоставления коммунальных услуг, где расчет идет по прописке.
                    Кроме этого, в республике 637 населенных пунктов с численностью населения менее 1 млн чел.. При этом нет понимания по количеству фактически проживающих в нас.пункте людей, некоторые из данных поселений имеют сезонный характер.

                    Задача
                    1. В разрезе г. Якутска необходимо выявить фактическую поквартальную подомовую плотность населения для развития сервисов для МСП и предоставления ЖКУ
                    2. В разрезе республики необходимо выявить населенные пункты, в которых люди не проживают, либо проживают сезонно летние дачи и т.п.
                    Карта республики с обозначением населенных пунктов и их паспортов
                    Данные будут представлены оператором сотовой связи непосредственному исполнителю заявки.
                    Для получения доступа к данным необходимо связаться с ответственным лицом, указанным в заявке.

                    Ожидаемый результат

                    Повысить эффективность городского планирования.
                    Создание актуальной схемы фактического проживания населения республики (закрытие или развитие определенных населенных пунктов, определение категории сезонных населенных пунктов)

                    Сбор данных
                    Пензенская область
                    Успешное дополнительное образование
                    Описание проблемы
                    Зависимость занятости по каналам трудоустройства выпускников образовательных организаций от занятости в дополнительном образовании.

                    Задача
                    Мониторинг занятости в кружках дополнительного образования и поступления в профессиональные образовательные организации и организации высшего образования.

                    Ожидаемый результат

                    Эффективность реализации дополнительного образования.

                    ГЕО
                    Сельское хозяйство
                    Анализ изменения границ обрабатываемых участков земель сельскохозяйственного назначения с привязкой к географическим координатам и собственникам участков
                    Описание проблемы
                    Периодический анализ изменения границ обрабатываемых участков земель сельскохозяйственного назначения с привязкой к географическим координатам и собственникам участков.

                    Задача
                    На основании данных космической съемки поверхности земли, предоставляемых Государственной корпорацией по космической деятельности «Роскосмос», произвести анализ изменения границ обрабатываемых участков земель сельскохозяйственного назначения с привязкой к географическим координатам и собственникам участков, для последующей интеграции с программным продуктом «Геоаналитический центр управления АПК Брянской области».

                    Ожидаемый результат

                    Выявление нерационально используемых земель сельскохозяйственного назначения, отслеживание изменения актуальны границ полей, контроль эрозии почв, зарастания сорной растительностью, интеграция сервиса с региональной ГИС.
                    Интеграция систем и данных
                    Приморский край
                    Система анализа качества предоставления государственных услуг в электронном виде и в сетях МФЦ
                    Описание проблемы
                    В настоящее время отсутствуют механизмы отслеживания процессов предоставления государственных и муниципальных услуг в режиме онлайн, что не позволяет оперативно выявлять отклонения процессов от регламентных параметров. Отсутствует объективная база для планирования оптимизации процессов предоставления услуг.

                    Задача
                    Предлагается создать систему BI Business Intelligence ,анализирующую параметры бизнес-процессов оказания государственных услуг. Данная система позволяет путем интеграции получать из различных ведомственных ГИС сведения о процессах обработки заилений, поступивших в электронном виде через порталы государственных услуг, ЕПГУ, поданных через сеть МФЦ либо лично в ОИВ. К таким сведениям в том числе относятся сроки получения, рассмотрения заявления, сроки и виды бумажный, электронный межведомственных запросов, сроки подготовки ответа, сроки отказа. Базовым ресурсом для сквозной идентификации и учета услуг, поданных различными способами является федеральная система Реестров госуслуг ФРГУ. Для легкой интеграции предлагается утверждение универсального формата предоставления сведений о ходе оказания услуг. Все сведения об поступивших заявлениях и оказанных услугах должны передаваться в персонализированном виде.
                    Система позволит на основе большого объема данных выявить минимальные сроки оказания услуг, наиболее автоматизированные бизнес-процессы, оптимальные сроки исполнения межведомственных запросов, лучшие сроки подготовки результатов и автоматически предоставит информацию о том, где выявлены эти лучшие практики со ссылками на конкретные НПА, регламентирующие эти процессы. Благодаря анализу большого объема данных можно будет с высокой достоверностью говорить, что выявленные результаты являются реальной сложившейся практикой и интересны для дальнейшего изучения

                    Ожидаемый результат

                    Повышение эффективности государственного управления, повышение качества оказания государственных услуг, выявление передового опыта в практике исполнения административных процедур
                    Сбор данных
                    Томская область
                    Цифровой профиль молодого предпринимателя (18-30 лет)
                    Описание проблемы
                    В связи с переориентированием коммуникационных связей на ключевые группы субъектов МСП, появляется потребность в оцифровывании портрета предпринимателя той или иной ключевой группы молодежь, военные в отставке, женское предпринимательство и т.д. Предложение начать с определения цифрового профиля молодого предпринимателя. Это обусловлено тенденцией омолаживания предпринимателей и сменой среднестатистического профиля портрета предпринимателя, а также развитием цифровых технологий, активными пользователями которых является молодежь. В последнее время при оказании мер поддержки молодым предпринимателям возникает сложность организовать своевременное и адресное информирование активной молодежи с целью вовлечения и популяризации предпринимательской деятельности. Как правило это приводит к наполнению мероприятия участниками с меньшей степенью заинтересованности и готовности заниматься предпринимательской деятельности. Помимо этого, в ряде случаев отмечается недостаточный уровень корреляции между мерами поддержки развития предпринимательства и потребностями целевой аудитории – молодых предпринимателей. Это влечет за собой недостаточную эффективность мер поддержки.

                    Задача
                    Необходимо сформировать цифровой профиль модель молодого предпринимателя, что позволит определить каналы коммуникации и инструменты взаимодействия с целью более качественного исполнения KPI.
                    1. По существующему набору данных молодых предпринимателей в возрасте от 18 до 30 лет, которые уже зарегистрировали ИП либо юридическое лицо, идентифицировать их в социальных сетях и построить цифровую модель профиль молодого предпринимателя.
                    2. На основе модели определить потенциальных молодых предпринимателей выделить целевую аудиторию .
                    3. На основе существующих связей в социальных сетях определить сообщества молодых предпринимателей.
                    4. Сформировать пул релевантных мер поддержки, каналов коммуникаций и инструментов взаимодействия с потенциальными молодыми предпринимателями для мотивирования и поддержки создания ими своего собственного дела.

                    Возможные источники данных:
                    ЕГРЮЛ, ЕГРИП
                    Соцсети: vkontakte сообщества и личные страницы пользователей , Instagram
                    Томское объединение предпринимателей
                    Клуб предпринимателей Деловар
                    Клуб предпринимателей Трансформатор
                    Фонд развития бизнеса
                    Корпорация МСП

                    Ожидаемый результат

                    В набор данных содержит обезличенные данные ID аккаунтов в VK.COM молодых предпринимателей в возрасте от 18 до 30 лет оформившие юридическое лицо либо ИП. По предоставленным данным необходимо:
                    1. сформировать модель молодого предпринимателя (цифровой портрет).
                    2. на основе существующих аккаунтов проанализировать группы в социальных сетях имеющие предпринимательскую направленность, определить общих друзей, в итоге измерить сообщество (сообщества) предпринимателей Томска и их внешние предпринимательские связи.
                    3. провести анализ наиболее популярных направлений для старта нового бизнеса
                    4. определить потребность в образовательных программах
                    Система независимого добровольного сбора данных с возможностью их обработки и накопления для формирования статистических функций прогнозирования состояния или создания искусственной нейросети.
                    На основе полученных данных инфраструктура поддержки развития предпринимательства сможет:
                    1. Повысить эффективность предоставления мер поддержки молодым предпринимателям.
                    2. Стимулировать предпринимательство путем целевого подхода к поддержке каждого молодого предпринимателя, популяризации предпринимательства и развитию сообществ молодых предпринимателей в Томской области.
                    3. Формирование целевой рассылки потенциальным молодым предпринимателям, которая выполнит роль «последней мили» на их пути к организации собственного дела

                    На этапе внедрения:
                    1. Модуль предлагающий целевой группе потенциальных предпринимателей получить дополнительное профильное образование
                    2. Выделенные сообщества молодых предпринимателей
                    3. Система сервисов для помощи в развитии предпринимательских проектов.
                    4. Подбор команд для акселерационных программ и пилотных проектов.
                    Республика Северная Осетия - Алания
                    Исследование влияния различных факторов на успеваемость школьников
                    Описание проблемы
                    В настоящее время в России идет становление новой системы образования, ориентированной на вхождение в мировое образовательное пространство. Этот процесс сопровождается существенными изменениями в педагогической теории и практике учебно-воспитательного процесса. Происходит смена образовательной парадигмы: предлагаются иное содержание, иные подходы, иное право, иные отношения, иное поведение, иной педагогический менталитет.
                    С учетом приоритета развития программы по улучшению качества образования в Российской Федерации, особенно актуальным становится использование в этой отрасли современных информационных и коммуникационных технологий.
                    Необходимо сделать исследования влияния различных факторов на успеваемость школьников

                    Задача
                    С учетом приоритета развития программы по улучшению качества образования в Российской Федерации, особенно актуальным становится использование в этой отрасли современных информационных и коммуникационных технологий.1.2. Создание списка факторов, которые могут в той или иной степени влиять на успеваемость тестируемых
                    Для каждой группы тестируемых может быть создан свой список факторов, которые могут в той или иной степени влиять на их успеваемость.
                    Факторы могут быть нескольких видов. А именно: личные данные тестируемого личные и профессиональные данные преподавателей данные, о применяющихся для обучения тестируемого методиках и учебных материалах. Например, для оценки качества знаний школьников можно составить следующий список факторов см. табл 1.:
                    Таблица 1.
                    Факторы, которые могут в той или иной степени влиять на успеваемость школьников.
                    Наименование фактора / Тип данных
                    1. Пол тестируемого Мужской / Женский
                    2. Дата рождения тестируемого Дата
                    3. Тип дошкольного образования Перечисляемый
                    4. Изучаемый иностранный язык Перечисляемый
                    5. Родной язык тестируемого Перечисляемый
                    6. Группа здоровья тестируемого Перечисляемый
                    7. Категория преподавателя Перечисляемый
                    8. Разряд преподавателя Перечисляемый
                    9. Педагогический стаж преподавателя Целое положительное число
                    10. Ученая степень преподавателя Перечисляемый
                    11. Почетное звание преподавателя Перечисляемый
                    12. Есть ли у преподавателя профессиональные награды Да / Нет
                    13. Менялся ли преподаватель в течение курса обучения Да / Нет
                    14. Пол преподавателя Мужской/Женский
                    15. Базисный учебный план Перечисляемый
                    16. Наименование курса обучения или учебника Строковой


                    Необходимо отметить, что некоторые из перечисленных факторов изменяемые регулируемые, например, изучаемый иностранный язык, другие не подаются изменению например, дата рождения тестируемого.
                    С 2007 по 2009 год было проведено четыре республиканских мониторинга по таким предметам как математика, русский язык, осетинский язык и естествознание. В общей сложности, в мониторинге приняло участие более 20000 человек. Для проведения тестирования по каждому предмету профессиональными тестологами было составлено от 12 до 22 вариантов тестов.
                    1.3. Пример автоматизированного анализа зависимости оценки от нескольких факторов
                    В качестве примера можно привести изучение влияния таких факторов, как Тип дошкольного образования и Категория учителя на успеваемость по математики школьников пятых классов.
                    При этом, средняя оценка М для группы из п тестируемых с одинаковыми значениями переменных К и Д определялась следующим образом:
                    п
                    м = ——
                    п
                    Зависимость средней оценки М от значений К\\Д можно представить
                    как:
                    М=/ К,Д ,
                    где М- средняя оценка тестируемых, баллов К - категория учителя Д - тип дошкольного образования.
                    Диапазоны значений, принимаемые независимыми переменными, варьировались следующим образом в размерном масштабе:
                    1 &lt К &lt 3 1 &lt Д &lt 3

                    Ожидаемый результат

                    Создание списка факторов, которые могут в той или иной степени влиять на успеваемость тестируемых.
                      Интеграция систем и данных
                      Пермский край
                      Повышение качества данных о недвижимости в базах органов власти и вовлечение всей недвижимости в налоговый оборот
                      Описание проблемы
                      В Пермском крае, как и в других регионах России, ряд объектов недвижимости
                      не стоит на кадастровом учете фактически являются самостроем , по значительному количеству объектов в базах органов власти отсутствуют сведения о правообладателях например, в Пермском крае в отношении торговой и офисной недвижимости, обладающей сравнительно высоким потенциалом налоговых поступлений, в указанных базах отсутствуют сведения о правообладателях порядка 30 площадей , существует ряд других проблем, связанных с наличием неполных и или некорректных данных о недвижимости, которые приводят к снижению потенциала поступлений от недвижимости в том числе имущественные налоги, доходы от сдачи в аренду и т.д. в том числе:
                      1. отсутствие установленной в ЕГРН связи или некорректная связь зданий, сооружений с земельными участками, на которых они фактически расположены
                      2. отсутствие установленной в ЕГРН связи или некорректная связь помещений со зданиями, в которых они фактически расположены
                      3. расхождение данных о недвижимости между ЕГРН, базами данных налоговых органов и фактическими характеристиками недвижимости
                      4. несоответствие фактического и разрешённого использования земельных участков.
                      5. некорректные адреса объектов недвижимости.

                      Задача
                      Необходимо разработать автоматизированные алгоритмы, с помощью которых за счет сравнения данных о недвижимости из различных источников возможно будет выявить:
                      1. объекты, не поставленные на кадастровый учет самострой
                      2. расхождения в данных об объектах в различных источниках, в том числе влияющие на корректность расчета налога
                      3. прочие ошибки, связанные с наличием некорректных/неполных данных в базах данных органов власти с оценкой прироста налогового потенциала в случае их устранения

                      Для решения указанных задач предлагается реализовать данный проект на пилотных территориях Пермского края - то есть включить в анализ данные только по пилотным территориям:
                      • Пермский муниципальный район, Добрянский муниципальный район Пермского края, микрорайоны Верхняя, Средняя и Нижняя Курья в г.Перми как пилоты территорий с преимущественной застройкой ИЖС
                      • Свердловский район г.Перми как пилот городской территории.

                      Впоследствии по результатам отработки пилотных территорий алгоритмы возможно будет тиражировать как на всю территорию Пермского края, так и на другие субъекты РФ

                      Ожидаемый результат

                      1. Инструмент, предлагающий автоматизированное решение задачи по
                        выявлению неполной/некорректной информации в базах данных органов власти, в том числе не соответствующей фактическим характеристикам недвижимости, и формирование предложений по уточнению сведений (которые потенциально можно внести в ЕГРН, базы налоговых органов).
                      2. Результаты применения указанного решения на пилотных территориях Пермского края.
                        AI/ML
                        Астраханская область
                        Исследование и мониторинг сельскохозяйственных полей с помощью беспилотных летательных аппаратов и систем машинного зрения
                        Описание проблемы
                        Высокие расходы в структуре деятельности фермерского хозяйства на энергоносители, удобрения, семена, средства защиты растений. Данные ресурсы часто расходуются неэффективно.

                        Задача
                        Создание системы сбора и обработки аэроизображений для автоматической идентификации проблемных участков сельскохозяйственного поля. Система должна оценивать характер проблемы засушливость, вредители, состав почвы и т.п. и давать базовые рекомендации по их устранению.

                        Ожидаемый результат

                        • Внедрение системы в фермерские хозяйства Астраханской области
                        • Снижение убытков в результате мониторинга и оперативного выявления проблемных мест на сельскохозяйственных полях
                        • Экономия удобрений, повышение урожайности сельхозкультур, снижение экологической нагрузки на почву, повышение качества урожая, сохранение и повышение плодородия почвы.
                          Интеграция систем и данных
                          Ростовская область
                          Анализ профиля бедности в регионе
                          Описание проблемы
                          Одна из целей Указа Президента Российской Федерации от 07.05.2018 № 204 «О национальных целях и стратегических задачах развития Российской Федерации на период до 2024 года» – снижение уровня бедности в два раза до 2024 года.
                          Для достижения поставленной цели предполагается использовать такие аналитические механизмы как: проведение оценки реального уровня и структуры бедности, анализа причин бедности граждан и семей, создание региональных реестров граждан с доходами ниже прожиточного минимума, развитие системы социальной помощи и её предоставления исходя из принципов адресности.

                          Задача
                          Исходя из рекомендаций Минтруда России по проведению оценки реального уровня и структуры бедности, формированию отдельного реестра бедных семей, в качестве источников получения данных рекомендовано использование массивов информации:
                          региональных реестров, содержащих данные о получателях мер социальной поддержки, назначенных и выплаченных социальных пособиях, в том числе на муниципальном уровне
                          Пенсионного фонда Российской Федерации и Единой государственной информационной системы социального обеспечения ЕГИССО
                          результатов научных исследований.
                          Министерство труда и социального развития Ростовской области, как региональный оператор информационной системы персональных данных граждан – получателей государственных социальных услуг обладает, обширным набором сведений для формирования с заинтересованными ведомствами и организациями цифровых решений, направленных на решение социально-экономических задач, основанных на работе с Big Data, в том числе для формирования структурной оценки бедности профиля бедности .
                          Кроме персональных данных в системе имеется масштабный набор данных нормативно-справочной информации далее - НСИ , позволяющий выполнить настройку правил базы знаний на основании нормативно-правовых актов, определение прав обратившихся граждан на МСП. Также НСИ определяет перечень необходимых документов, предоставляемых гражданином лично для получения государственных услуг, и набор запросов СМЭВ для сбора недостающих данных.
                          В качестве примера обработки больших данных может служить анализ профиля бедного гражданина и профиля бедной семьи в регионе.
                          Для анализа профиля бедного гражданина и профиля бедной семьи в регионе, необходима следующая информация:
                          1. Малоимущие граждане всего :
                          1.2. По возрастным группам:
                          - дети до 3-х лет включительно
                          - дети от 3-х до 16 лет
                          - дети от 16 до 18 лет
                          - молодежь от 18 до 30 лет
                          - взрослые граждане от 30 до 60 лет
                          - старшее поколение более 60 лет.
                          1.3. По отношению к занятости:
                          - имеющие работу лица от 18 лет
                          - безработные лица от 18 лет .
                          1.4. По гендерному признаку:
                          - мужчины всего, из них:
                          - мужчины старше 18 лет
                          - женщины всего, из них:
                          - женщины старше 18 лет.
                          2. Малоимущие семьи всего :
                          2.1. По месту проживания город/село .
                          2.2. По наличию детей:
                          - с детьми в возрасте до 18 лет
                          - без детей в возрасте до 18 лет, из них:
                          - одинокопроживающие,
                          - одинокопроживающие супружеские пары пенсионеров инвалидов .
                          2.3. Малоимущие семьи с детьми всего по составу:
                          - полные семьи отец и мать
                          - не полные семьи.
                          2.4. Малоимущие семьи с детьми по возрасту детей:
                          - с детьми до 1,5 лет
                          - с детьми от 1,5 до 3-х лет
                          - с детьми от 3-х до 14 лет
                          - с детьми от 14 до 18 лет.
                          2.5. Малоимущие семьи с детьми по количеству детей:
                          - с 1 ребенком
                          - с 2 детьми
                          - с 3 детьми
                          - с 4 и более детьми.
                          2.6. По здоровью:
                          - малоимущие семьи без детей имеющие инвалида ов
                          - малоимущие семьи без детей, состоящие только из инвалидов.
                          - малоимущие семьи с детьми имеющих инвалидов взрослых от 18 лет
                          - малоимущие семьи с детьми имеющих инвалидов детей до 18 лет
                          - малоимущие семьи с детьми имеющие инвалидов и взрослых и детей
                          - малоимущие семьи с детьми, состоящие только из инвалидов.
                          2.7. По доходу:
                          - средний среднемесячный, не среднедушевой! доход семьи без детей
                          - средний не среднедушевой! доход семьи с 1 ребенком
                          - средний не среднедушевой! доход семьи с 2 детьми
                          - средний не среднедушевой! доход семьи с 3 детьми
                          - средний не среднедушевой! доход семьи с 4 и более детьми.
                          2.8. Малоимущие семьи с детьми по структуре дохода:
                          - заработная плата есть в доходе семьи
                          - имеющаяся заработная плата меньше 11280 руб.
                          - заработная плата есть у отца и у матери
                          - заработная плата есть или у матери или у отца
                          - заработная плата отсутствует в доходе семьи.
                          3. Анализ мер социальной поддержки малоимущих граждан.
                          3.1. По видам выплат для малоимущих граждан:
                          - средний размер выплаты
                          - средний среднедушевой доход малоимущих семей
                          Однако, для формирования совокупного дохода граждан семей необходим информационный ресурс, наполненный следующими сведениями, отсутствующими у министерства:
                          компенсация части денежных средств, уплаченных за пребывание ребенка в детском саду
                          получение компенсации за расходы на организацию дополнительных образовательных услуг детей-инвалидов
                          получение компенсации по семейному образованию детей
                          социальная стипендия малоимущим студентам
                          сведения о налоговые вычетах
                          пособия по безработице
                          субсидии на приобретение жилья и компенсации по ипотечным процентам банкам
                          квоты на получение услуг здравоохранения с использованием высоких технологий
                          предоставление бесплатных лекарств
                          питание детей в школьных учреждениях
                          информация о размере доходов по данным налоговых служб
                          сведения о предоставляемых пособиях и выплатах из ФСС
                          сведения о ЛПХ.

                          Ожидаемый результат

                          Создание единого информационного ресурса, содержащего полные данные о получателях мер социальной поддержки, назначенных и выплаченных социальных пособиях, субсидиях, льгот и прочих выплатах, необходимых для анализа профиля бедного гражданина и бедной семьи в регионе.
                            Сбор данных
                            Челябинская область
                            Оборот сельскохозяйственных земель
                            Описание проблемы
                            Отсутствие полной актуальной инвентаризации с/х земель в регионе, имеются неучтенные земли, заброшенные, а также используемые не по целевому назначению
                            Данные представлены на примере Октябрьского района Челябинской области.

                            Задача
                            Разработать инструментарий анализа данных дистанционного зондирования земли в оптическом диапазоне космоснимки , обеспечивающий:
                            1. автоматическое выявление земель используемых для целей указанных ниже,
                            2. формирование геоданных о границах выявленных земель в формате GeoJSON и системе координат WGS-84,
                            3. Выгрузка сведений с получением результатов анализа в xml формате для дальнейшего самостоятельного занесения их в реестр и кадастр. Данные должны быть представлены в программе ПОЛИГОН в соответствии с требованиями ФЗ-218 О государственной регистрации недвижимости и ФЗ-221 О Государственной кадастре недвижимости.

                            Ожидаемый результат

                            Повышение эффективности деятельности территориальных подразделений Росреестра по государственному земельному надзору выраженное в увеличении доходной части бюджета региона за счет взимания штрафов за нерациональное использование, за счет увеличения сбора налогов с выявленных и поставленных на учет земель
                              Интеграция систем и данных
                              Челябинская область
                              Система таргетинговых уведомлений пользователей РПГУ
                              Описание проблемы
                              Отсутствие информации у пользователей о необходимости/возможности получения государственных и муниципальных услуг в электронном виде на региональных порталах государственных и муниципальных услуг.

                              Задача
                              Необходимо разработать систему таргетинговых уведомлений пользователей региональных порталах государственных и муниципальных услуг далее - РПГУ , которая должна иметь функционал уведомлений пользователя РПГУ о возможности получения государственных/муниципальных услуг в электронном виде, исходя из его поведенческих факторов, возникаемых событий в его жизни и информации из его профиля личного кабинета РПГУ.

                              Примеры событий, поведенческих факторов и изменений профиля личного кабинета РПГУ:
                              • первый вход пользователя на РПГУ
                              • возвращение пользователя на РПГУ отсутствие более 90 дней
                              • появление/наличие ребенка в профиле пользователя РПГУ
                              • поступление из Единого личного кабинета ЕЛК ЕПГУ информации о ранее полученных услугах
                              • наступление определенного возраста пользователя совершеннолетие, пенсионный возраст, возраст получения/смены паспорта и т.п
                              • получены государственные/муниципальные услуги информация поступила из ЕЛК или услуга была получена на РПГУ
                              • появление у пользователя автомобиля, водительского удостоверения в профиле РПГУ.
                              • смена адреса регистрации/места жительства, фамилии пользователя в профиле РПГУ.

                              Доставка уведомлений транспорт осуществляется посредством Push уведомлений на мобильное устройство, Email-рассылки, уведомлений в браузере, при авторизации пользователя на РПГУ и смс-сообщений.

                              Интерфейс администрирования:
                              • возможность настройки шаблонов уведомлений, направляемых пользователю
                              • настройка справочника атрибутов для выявления событий, поведенческих факторов и изменений профиля
                              • написание сценариев проверки атрибутов для выявления событий, поведенческих факторов и изменений профиля с возможностью использования операторов И, ИЛИ, РАВНО/НЕ РАВНО
                              • подключение шаблонов уведомлений к сценариям проверки атрибутов.

                              Описание набора данных:
                              • уникальный ID пользователя #userid
                              • код ID ФРГУ последней полученной услуги #lastservice_use_frguid и дата получения последней услуги #lastservice_use_date
                              • атрибуты профиля личного кабинета Возраст #birthdate , наличие водительского удостоверения #drivelicence , наличие автомобиля #count_cars , наличие детей #count_childs, электронная почта #email , мобильный телефон #telephone
                              • дата последнего входа на РПГУ #lastin_rpgu_date , дата последнего изменения адреса регистрации/места жительства в профиле РПГУ #adresschangedate , дата изменения информации в профиле РПГУ о водительском удостоверении #drive_licencechange , о количестве автомобилей #cars_change_date , о фамилии #familyname_change_date.

                              Ожидаемый результат

                              Пользователи РПГУ своевременно уведомлены о необходимости/возможности получения государственных и муниципальных услуг в электронном виде, в регионе повышена популярность способа получения электронных услуг через РПГУ.
                                Исследование
                                Республика Саха (Якутия)
                                Развитие электронных услуг
                                Описание проблемы
                                В нацпроекте Цифровая экономика определены показатели по переходу предоставления госуслуг в цифровой вид. При этом в оценке эффективности МФЦ главным показателем является время ожидания гражданина в зале офиса. У руководства регионального МФЦ возникает вопрос в обосновании средне-долгосрочных стратегий развития - нужно развивать отделы предоставления электронных услуг или расширять площади физических офисов в условиях ограниченных финансовых средств.

                                Задача
                                Необходимо высчитать алгоритм влияния различных мероприятий 1. на переход на предоставление услуг в цифровом виде и 2. на время ожидания в зале офиса. Гипотеза: время ожидания в зале сократиться, если большая часть населения будет получать большую часть услуг в цифровом виде. Перевод определенных услуг в цифровой вид одновременно обеспечит доступность услуги и сократить загруженность офисов.

                                Ожидаемый результат

                                Создание рекомендательных встроенных расчетов по переводу определенных услуг в цифровую форму для сокращения загруженности залов (без создания дополнительных окошек).
                                  Томская область
                                  Выявление негативных проявлений неудовлетворенности пациентов качеством оказания медицинских услуг на основе анализа больших данных
                                  Описание проблемы
                                  В настоящее время отсутствует адекватная система оценки удовлетворенности пациентами качеством предоставляемых медицинских услуг в организациях системы ОМС Томской области.
                                  Существует потребность в системе, которая в реальном времени может указать очаги негативного отношения пациентов к медицинской организации, либо к действиям врача. В настоящее же время система оценки построена на физическом анкетировании пациентов по утвержденной форме анкеты. Проблема заключается в низком охвате, и отсутствии реальной картины. Отсутствует механизм выявления системных проблем состояния сервисной модели в медицинских организациях Томской области, которые в свою очередь могут указывать на нарушение медицинскими организациями условий предоставления медицинских услуг.

                                  Задача
                                  Необходимо разработать алгоритм оценки неудовлетворенности качеством предоставления медицинских услуг основанную на анализе данных отзывов из социальных сетей и специализированных интернет ресурсов. Кроме того необходимо разработать инструмент косвенной оценки общей картиной удовлетворенности населением качеством предоставляемых медицинских услуг. Отсутствие системно повторяющихся негативных отзывов, может говорить о хорошем качестве предоставляемых услуг. Корме того, явные всплески негативных отзывов могут быть сигналом для проведения поверки как со стороны страховой медицинской организации, так и со стороны департамента здравоохранения.

                                  Ожидаемый результат

                                  Независимый инструмент оценки медицинских организаций, позволяющий получить реалистическую оценку состояния неудовлетворенности пациентов качеством предоставления медицинских услуг на основе пользовательских отзывов в социальных сетях.
                                  Реалистичная картина неудовлетворенности качеством медицинских услуг, как в разрезе организаций так и в разрезе врачей. При помощи анализа данных из социальных сетей можно снимать результат принятых управленческих решений практически в онлайн режиме. Так как чаще всего негативные отзывы оставляют в течение 24 часов после случая.
                                  Должна быть возможность из негативной оценки организации декомпозировать проблему до случая.
                                  Предоставлен набор данных содержащий отзывы об оказанных услугах в медицинских организациях Томска.
                                  В случае возможности получения адекватной картины по существующему набору данных, необходимо на этапе внедрения построить автоматизированную систему сбора отзывов из открытых источников в соцсетях.