Share This
Связаться со мной
Крути в низ
Categories
//Facebook опубликовала датасет лиц с указанием пола, возраста и тональности цвета кожи

Facebook опубликовала датасет лиц с указанием пола, возраста и тональности цвета кожи

09.04.2021Category : My Habr

Facebook AI представила открытый исходный код набора данных, предназначенного для выявления предубеждений по возрасту, полу и цвету кожи в моделях компьютерного зрения и машинного обучения. Набор «Случайные беседы» (Casual Conversations) включает 45 186 видеороликов участников и является первым в своем роде датасетом, в котором люди сами указали свой возраст и пол.

facebook opublikovala dataset lic s ukazaniem pola vozrasta i tonalnosti cveta kozhi ce28b80 - Facebook опубликовала датасет лиц с указанием пола, возраста и тональности цвета кожи

Ранее исследования показали, что в современные модели классификации изображений, обученные в ImageNet, популярном наборе данных из открытых источников, автоматически закладываются человеческие предубеждения относительно расы, пола, веса и т. д. Осенью прошлого года исследователи Университета Колорадо в Боулдере продемонстрировали, что ИИ от Amazon, Clarifai, Microsoft и других поддерживает уровень точности выше 95% для цисгендерных мужчин и женщин, но ошибочно идентифицирует трансгендерных мужчин и женщин в 38% случаев. Независимые тесты систем основных поставщиков, проведенные проектом Gender Shades и Национальным институтом стандартов и технологий (NIST), также продемонстрировали, что технология распознавания лиц демонстрирует расовую и гендерную предвзятость.

В разработке нового датасета Facebook приняли участие более 3 тысяч человек. Они проживают в Атланте, Хьюстоне, Майами, Новом Орлеане и Ричмонде.

Facebook сообщает, что тональность кожи оценивается с помощью схемы классификации цвета, разработанной в 1975 году американским дерматологом Томасом Б. Фицпатриком. Шкала Фитцпатрика — это способ приблизительно оценить реакцию типов кожи на ультрафиолетовое излучение, от типа I (бледная кожа, которая не загорает) до типа VI (глубоко пигментированная кожа, которая никогда не сгорает). Кроме того, изображения соотносили с условиями окружающего освещения, что помогло измерить, как модели считывают разные оттенки кожи в условиях низкой освещенности.

facebook opublikovala dataset lic s ukazaniem pola vozrasta i tonalnosti cveta kozhi 3e94095 - Facebook опубликовала датасет лиц с указанием пола, возраста и тональности цвета кожи

Facebook заявляет, что не собирал информацию о том, откуда родом участники проекта. Вопрос об их поле включал варианты ответа «мужской», «женский» и «другой».

facebook opublikovala dataset lic s ukazaniem pola vozrasta i tonalnosti cveta kozhi 85377fa - Facebook опубликовала датасет лиц с указанием пола, возраста и тональности цвета кожи

Для создания датасета с каждым участником записали по 15 роликов

Компания отмечает, что продолжит разрабатывать подобные методы. Набор данных планируется расширить в следующем году, чтобы он стал еще более инклюзивным.

Кристиан Кантон, менеджер по исследованиям Facebook AI Red Team, рассказал, как набор данных может быть использован разработчиками. По его словам, через него можно пропускать камеры отслеживания, чтобы выявить слабые места.

Звуковая часть видеозаписей, как указал Кантон, также представляет потенциальный интерес.

Ранее Facebook показала модель машинного зрения SEER, которая, как утверждается, превзошла существующие модели искусственного интеллекта при прохождении теста ImageNet. Точность SEER составила 84,2%. ИИ был обучен с помощью миллиарда общедоступных изображений из Instagram. Как пишут в Facebook, в то время как многие модели ИИ обучаются на тщательно отобранных датасетах, SEER научился определять объекты, анализируя случайные изображения. В Facebook надеются, что она станет шагом для разработки моделей с «интеллектом человеческого уровня».

  • 3 views
  • 0 Comment

Leave a Reply

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Свежие комментарии

    Рубрики

    About Author 01.

    blank
    Roman Spiridonov

    Моя специальность - Back-end Developer, Software Engineer Python. Мне 39 лет, я работаю в области информационных технологий более 5 лет. Опыт программирования на Python более 3 лет. На Django более 2 лет.

    Categories 05.

    © Speccy 2020 / All rights reserved

    Связаться со мной
    Close