Искусственный интеллект (ИИ) уже давно не только забава. С помощью ИИ создают новые лекарства и материалы, детектируют и классифицируют объекты на фотографиях, распознают скрытые паттерны в массивах данных и оптимизирует процессы финансового управления.
Однако залогом успешного результата применения ИИ является квалифицированное обучение моделей машинного обучения. Соответствующая потребность в аналитиках данных привела к стремительному росту стоимости их работы. Но далеко не каждый проект может позволить себе дата-сайентиста, а тем более – команду специалистов.
Как следствие, развитие получили средства ИИ, не требующие познаний в Data Science – NoCode-платформы. В таких системах ключевые этапы обработки данных визуализированы и «упакованы» во встраиваемые готовые решения. Никаких сложных математических моделей и многострочного кода.
За счет NoCode-платформ компании могут создавать и использовать собственные наборы данных, обучать и развертывать модели с минимальными познаниями в программировании или даже вовсе без них. Это отличный вариант и для продвинутых разработчиков – во всякой области есть своя специфика, а для изучения Data Science нужно немало времени. Например, мобильные разработчики могут использовать NoCode-системы, чтобы внедрить технологии машинного обучения в приложения. Понимая специфику использования программ на смартфонах, они лучше осознают, как построить обучение и использовать такие алгоритмы.
Далее мы рассмотрим несколько примеров NoCode-инструментов машинного обучения, доступных уже сейчас. Некоторые из них бесплатны, другие взимают плату при выходе за бесплатный лимит пробной версии. Но все они позволяют лучше понять возможности Data Science и попробовать эти технологии на практике в повседневных задачах.
Материал подготовлен при поддержке онлайн-школы SkillFactory – экспертов по образованию в IT и Data Science.
1. Apple: Create ML
Одним из свежих коммерческих внедрений NoCode-идей стал инструмент CreateML, поставляемый в числе Developer Tools для среды разработки Xcode (начиная с 11-й версии). Есть набор предобученных шаблонизированных моделей, достаточно лишь выбрать тип модели и передать в требуемом формате данные для обучения и теста: таблицы, текст, изображения, звук или видео.
В соответствии с перечисленными видами данных можно создать классификатор изображений, модель переноса стиля, обработчик текста, систему рекомендаций и т. д. Для ограничения времени обучения задается число итераций или требуемое значение показателя метрики.
В результате работы CreateML будет создана CoreML-модель, которую можно развертывать в собственных приложениях. CoreML-модели оптимизированы для работы на устройствах Apple с учетом объема памяти и энергопотребления.
2. Google: AutoML
Cloud AutoML от Google умеет примерно то же самое, что CreateML от Apple, но все делает в облаке. Есть и аналогичное категориальное разделение: инструмент позволяет проводить классификацию изображений, обработку естественного языка, перевод текстов, обработку табличных данных, изображений и видео. Облачный AutoML устраняет не только необходимость знания алгоритмов машинного обучения, но и проблемы с хранением информации.
Обученные модели можно экспортировать в форматы .pb, TensorFlow Lite (.tflite), CoreML (то есть формат Apple) и др.
3. Сегментация изображений: MakeML
MakeML – NoCode-инструмент создания моделей детектирования и сегментации изображений, аннотации объектов, управления соответствующими наборами данных.
На платформе есть хранилище датасетов, в том числе бесплатные наборы данных для задач компьютерного зрения и обучения нейронных сетей. Там же имеется множество туториалов для разработчиков, еще не сталкивавшихся с машинным обучением.
Кстати, если хочется изучить эти вопросы детальнее, то освоить соответствующие нейросетевые алгоритмы и создать собственный проект по компьютерному зрению, можно на 3-м и 4-м семестрах курса Data Science от SkillFactory. Там же присутствует и соответствующий кейс по распознаванию объектов на фотографиях с помощью алгоритмов глубокого обучения. Такую модель можно связать с сервером и обернуть в телеграм-бота.
4. Мобильные приложения: Fritz AI
Fritz AI – платформа машинного обучения, нацеленная на преодоление разрыва между разработчиками мобильных приложений и аналитиками данных. Разработчики iOS и Android смогут быстро обучить и развернуть модель или даже использовать уже обученный SDK с поддержкой анализа изображений.
Есть инструменты аннотации и синтетические данные для создания собственных датасетов. Платформа предоставляет решения для дообучения моделей, аналитики, простого развертывания и защиты информации от злоумышленников.
5. Генерация контента: RunwayML
RunwayML – платформа машинного обучения для создателей контента. Есть интерфейс для быстрого обучения моделей: от генерации текста и изображений до захвата движения, обнаружения объектов и т. д. Имеются модели для переноса стиля и удаления фона.
Хотя за экспорт моделей из приложения взимается плата, обученную генеративно-состязательную нейросеть можно бесплатно использовать для синтеза новых изображений. Приложение доступно на macOS, Windows и в браузере (на стадии бета-тестирования).
6. Табличные данные: Obviously AI
Obviously AI используется для решения задач с пользовательскими данными в табличном-формате CSV. Загружаем набор данных и выбираем столбец переменной, для которой хотим сделать прогноз. Вводим на обычном, естественном языке вопрос – что мы хотим узнать, например, каким будет доход в следующем месяце или как изменится спрос на товар. Платформа самостоятельно выбирает подходящий алгоритм и обучает модель.
В результате мы получаем прогностический отчет, даже не задумываясь о том, что такое регрессия, решающие деревья или метод наименьших квадратов. Но, конечно, сами эти модели очень важны, и после детального изучения и практики не покажутся такими уж сложными. О соответствующих библиотеках для анализа данных рассказывается на втором семестре курса Профессия Data Scientist.
7. Предварительная обработка изображений: SuperAnnotate
Помимо обучения модели, при разработке проектов машинного обучения существенное время отнимает предобработка данных, их очистка и маркировка. Особенно когда дело касается тысяч изображений. SuperAnnotate – платформа для ускорения процесса аннотации данных с помощью готовых прогностических моделей.
Создание наборов данных для обнаружения объектов и сегментации изображений станет проще и быстрее. Особенно хорошо командой продумана работа с видеоданными.
8. Teachable Machine
Teachable Machine – еще одна NoCode-платформа машинного обучения от программистов Google. В отличие от AutoML – инструмента, заточенного под разработчиков – Teachable Machine легко обучить прямо в браузере. Сейчас можно тренировать модели распознавать изображения, звуки и позы.
Обучение проводится как на загружаемых файлах, так и с помощью веб-камеры. Teachable Machine использует библиотеку Tensorflow.js и гарантирует, что данные об обучении останутся на устройстве. Окончательную модель можно экспортировать в форматы Tensorflow.js или tflite и использовать на собственном веб-сайте или в приложении.
Заключение
Хотя универсального решения не существует, вы всегда можете выбрать платформу исходя из текущих потребностей и знаний в области. Конечно, в NoCode-платформах машинное обучение никуда не исчезает – просто спрятано под капотом. Чтобы построить более гибкую систему, необходимо познакомиться со спрятанными внутри таких платформ алгоритмами. Если некоторые знания о профессии у вас уже есть, достаточно их систематизировать. А если вы находитесь в самом начале пути, во всём разобраться помогут квалифицированные наставники с опытом в индустрии.
Наши коллеги из Skillfactory запускают курс, на котором учат профессии Data Scientist с нуля. В нем есть все необходимые уроки, кейсы и тренажеры. С первых недель обучения ментор помогает определить карьерные цели и не сойти с намеченного пути, а карьерный центр подскажет, как оформить резюме и попасть на собеседование.
Классный специалист по Data Science нужен вне зависимости от индустрии, а спрос на рынке труда, как мы заметили в начале статьи, значительно превышает предложение.
Воспользуйтесь скидкой 50% на курс до 23 сентября