Содержание
Машины прочно вошли в жизнь людей. Механизмы разного назначения окружают человека на протяжении всей жизни, помогают быстро и качественно решать сложные задачи, избавляют от рутинных процессов.
Уровень сложности и самостоятельности выполняемых ими задач непрерывно растет. Такой прогресс стал возможен в связи с появлением технологий, в основе которых лежат искусственный интеллект и машинное обучение.
Искусственный интеллект (ИИ) – это компьютерная имитация действий человека при решении задач и выполнении функций. Выделяют 3 типа:
- ограниченный – качественно выполняет определенное количество действий;
- общий – сопоставим с человеческим разумом;
- сверхразумный – превышает способности человеческого мозга.
Что представляет собой машинное обучение
Машинное обучение или Machine learning (ML) – это часть искусственного интеллекта. Состоит из различных методов и алгоритмов, предназначенных для самообучения машин. Машины обрабатывают большие массивы входящей информации, выявляют в общем потоке данных закономерности и на их основе делают выводы. Таким путем они учатся на собственном опыте.
Основная задача машинного обучения состоит в том, чтобы частично или в полной мере поручить машинам выполнение рутинных аналитических процессов, возникающих в работе. Человеку остается лишь творческая составляющая – переговоры с заказчиками, продумывание стратегий, принятие решений на основе полученных прогнозов.
Связь с искусственным интеллектом
Искусственный интеллект или Artificial intelligence (AI) – это общее обозначение технологических решений, научных разработок, экспертных систем, с помощью которых составляются программы, имитирующие разум и логику человека.
Для самообучения систем используются методы машинного обучения (индуктивное и дедуктивное), методы извлечения информации, анализа данных, а также нейросети.
Термин «ИИ» появился в 1956 г., когда компьютеры стали применяться для решения многовариантных логических задач. Первыми из них были игра в шашки, решение головоломок. Компьютер с успехом решал эти задачи, то есть демонстрировал интеллект, только искусственный.
До 80-х годов прошлого века AI решал задачи с участием людей по следующей схеме:
- человек создавал алгоритм действий для машины;
- закодированные правила загружались в машину;
- компьютер прорабатывал варианты строго по алгоритму.
Такие способы автоматизации не могли справляться с более сложными задачами, например, анализировать тексты или отличать женские лица от мужских.
Решением проблемы стала идея научить компьютер делать выводы, имитируя человеческие умозаключения. Машинное обучение во много раз увеличило возможности и потенциал ИИ.
Сферы применения
Традиционно искусственный интеллект применяется:
- в компьютерных играх;
- автоматизированном обслуживании клиентов в банках, ресторанах, на заправках;
- роботизации технологических процессов на различных производствах.
Машинное обучение стремительно развивается под запросы новых задач во всех отраслях промышленности и экономики. Компьютерные технологии применяются в таких направлениях, как:
- медицина – при оценке степени риска заболеваний пациентов;
- страхование – при распознавании потенциальных случаев мошенничества;
- интернет-магазины и сервисы – при использовании механизма рекомендаций, предлагающего покупателю нужный товар, услугу;
- сельское хозяйство – при выборе оптимального времени посева, количества удобрений;
- искусство и развлечения – при написании музыки, создании игр, обработки фото и видео;
- системы безопасности – при обнаружении новых вирусов.
Основные виды машинного обучения
Все способы научить компьютер «думать» и самостоятельно принимать решения делятся на 3 вида:
- Обучение с учителем или Supervised Learning. Способ применяется, когда требуется среди массива информации распознать объекты с заданными характеристиками. Например, чтобы через камеры наблюдения отслеживать тигров, в машину закладывают параметры: уши, лапы, хвост, подкрепленные сотнями изображений животного. Любое млекопитающее, попавшее в объектив, сопоставляется с введенными данными, и делается вывод о том, является ли оно тигром.
- Обучение без учителя или Unsupervised Learning. Используется, когда нет четкого решения задачи. Например, в механизме рекомендаций. Система изучает выборку из множества фотографий, текстов, роликов. Затем сама моделирует методы для нахождения внутренних взаимосвязей, закономерностей, используя принцип сходства и различий анализируемого объекта с другими.
- Обучение с подкреплением или Reinforcement Learning. Способ аналогичен предыдущему. Разница состоит в том, что машина работает с четко поставленной задачей. Для ее правильного выполнения она использует обучающую выборку данных, имея большую степень свободы для нахождения нужного варианта. Используется в разработке компьютерных игр, беспилотной технике.
Что нужно для качественного машинного обучения
Чтобы быстро и правильно решать задачи любой сложности, искусственный интеллект должен располагать:
- данными;
- признаками;
- алгоритмами.
Данные – это базовая информация, выборки, сведения, с которыми система будет работать. Чем больше единиц исходной информации, тем лучше. В любом обучении сбор данных зависит от поставленной перед компьютером задачи и является самой объемной и ответственной частью процесса. От нее зависит точность прогнозирования и результат. Сбор данных можно осуществлять 2-я способами:
- вручную – медленно, но более точно;
- автоматически – быстро, но с большим количеством ошибок.
Главное на этом этапе – предоставить разрозненную информацию. Система сама «увидит» взаимосвязи между объектами, в то время как человек их не сможет установить или просто не заметит.
Признаки – это свойства, характеристики объектов, которые ИИ будет отслеживать в работе. Чтобы результат, полученный машиной, соответствовал поставленной задаче, отбор признаков должен быть тщательным, но не ограниченным личным восприятием человека.
Алгоритм – это последовательность установленных операций и правил. От выбранного способа зависит быстрота обучения и корректность результата. Алгоритмы подразделяются на 2 вида:
- Классические – типа «если 1, то Б или В», подходящие под несложные статистические работы с данными. Применяют для анализа больших объемов информации и дальнейшего прогнозирования. Например, для прогноза увеличения стоимости однокомнатных квартир на заданной территории.
- Глубокое обучение или Deep Learning (DL), состоящее из множества единиц информации и архитектурных связей между ними. Оно является частью Machine learning и предназначено для решения сложных задач с помощью больших вычислительных ресурсов, например, для машинного перевода, распознавания изображений по видеоматериалам. В качестве главного инструмента используют нейронные сети, которые при обучении должны проанализировать миллионы изображений.
Принцип работы машинного обучения
Machine learning – это одно из направлений развития искусственного интеллекта. Оно основано на возможности системы не просто решить задачу, а создать алгоритм для поиска правильного решения. В этом случае компьютер делает выводы, опираясь на исходные данные, обучаясь по ним и генерируя свои правила.
При обучении система решает сложные задачи исходя из определенных параметров, ищет закономерности и верно прогнозирует результат. Технология применяется в тех видах деятельности, в которых требуется идентификация лиц, объектов, шаблонов, техническая и медицинская диагностика, финансовый надзор, категоризации данных, прогнозирование.
Как производится обучение нейросети
В основе нейронных сетей лежит имитация человеческого мозга при помощи искусственных нейронов, слоев, сложных взаимосвязей.
Машинный нейрон – это вычислительная единица в виде микропроцессора. На входе он получает от других нейронов информацию, обрабатывает ее в зависимости от уровня значимости и выдает на выходе результат вычисления.
Под решение каждой части задачи нейроны формируют слои. После выполнения каждого этапа информация передается для дальнейшей обработки на следующий слой. Обработав вводную информацию в нескольких слоях, нейронная сеть делает вывод о правильности ответа на поставленную задачу.
Например, чтобы распознать на картинке собаку, сеть раскладывает ее на слои: тени, формы, повороты, соотношения цветов между соседними пикселями. Таких слоев может быть создано от нескольких сотен до десятков тысяч, в зависимости от сложности решаемой задачи.