Машинное обучение — для начинающих и менеджеров объяснены основы и определение.

Мы объясняем основы машинного обучения "Machine Learning" и почему это так важно.

By Stephanie Fischer und Dr. Christian Winkler On Сен 29, 2020

Для того чтобы иметь возможность оценить потенциал машинного обучения для своей деятельности, организация должна сначала правильно использовать технические термины. Эта статья объясняет «Машинное обучение» в общепринятой форме и за пределами гипотез.

Index

Обучение с помощью машин действительно новое?

Машинное обучение, Machine Learning (далее ML) является поддисциплиной искусственного интеллекта и является предметом исследований на протяжении более 50 лет. Таким образом, ML не новичок. Однако после своего «открытия» она довольно быстро пришла в забвение, так как разочарование быстро распространилось после первых успехов. Правильные приложения просто не могли быть найдены, и данные были недоступны в необходимом количестве и качестве.

Если Machine Learning не новый — почему его раздувают?

Конечно, алгоритмы ML были значительно улучшены за последние 50 лет. Тем не менее, это не является основной причиной тенденции к применению этих алгоритмов на практике сейчас.

В связи с быстрым увеличением вычислительных мощностей (и для всех доступных), в настоящее время экономически целесообразно обеспечить огромные вычислительные мощности, необходимые для этого. Благодаря быстрым графическим картам, серверы теперь доступны всего за несколько евро в час, которые еще несколько лет назад были бы на вершине списка суперкомпьютеров (и, следовательно, недоступны по цене).

Параллельно с этим возросло и количество доступных данных — это относится как к собственным данным предприятия, так и к публичным данным. Это обеспечивает прекрасную основу для картирования действительно значимых и полезных для компаний случаев использования. К ним относятся, например, прогностическое обслуживание (т.е. оценка времени отказа), распознавание произнесенных текстов и ценовые прогнозы.

Даже если в настоящее время от этого развивается шумиха, за которой, несомненно, последует (опять же) большое разочарование, многие бизнес-модели могут извлечь из этого выгоду или даже получить дальнейшее стратегическое развитие.

Понимание машинного обучения за гранью гипотез

Что такое алгоритм?

Алгоритм для компьютеров можно придумать как рецепт. В нем точно описывается, какие шаги выполняются один за другим. Компьютеры не понимают рецептов приготовления пищи, но понимают языки программирования: В них алгоритм разбивается на формальные шаги (команды), которые компьютер может понять.

Некоторые проблемы можно легко сформулировать как алгоритм, например, считать от 1 до 100 или проверить, является ли число простым числом. Для других проблем это очень сложно, например, распознавание шрифта или текста с клавиатурой. Здесь помогают процедуры машинного обучения. В течение длительного времени разрабатывались алгоритмы, позволяющие анализировать существующие данные и применять полученные на их основе знания к новым данным.

Почему некоторые алгоритмы называются «обучение»?

Алгоритм машинного обучения обладает большой свободой, так называемыми параметрами. Упрощенный параметр можно использовать, например, для размещения сообщений со словом «Козырь» в географическом контексте по отношению к североамериканскому региону. Как правило, алгоритмы ML используют многие сотни, часто до сотен тысяч параметров. Настройка параметров для получения правильных результатов для существующих данных называется обучением.

Обучение под наблюдением — Что это?

Для так называемого «контролируемого обучения» требуются известные данные, которые уже содержат логику, которую хотелось бы применить к новому набору данных.

Из этих данных выбирается набор данных для обучения и тестирования. Первый используется для соответствующей настройки параметров в алгоритме, а второй — для оценки работы алгоритма. Здесь же ты можешь вычислить показатели качества и завершить тренировочный процесс, если результаты будут признаны достаточно хорошими (это может занять много времени или не произойти вообще!).

Алгоритм изучает логику в рамках этого так называемого обучающего набора. Алгоритм, обученный таким образом, может классифицировать данные, которые имеют определенное сходство с обучающим набором с выученной логикой — например, на основе предопределенных категорий «Продукт куплен/не куплен» или «Отмена/не отменен».

Нужно быть очень осторожным с некоторыми шагами: например, когда алгоритм тренируется с тренировочным набором, он должен не просто выучить все «наизусть», но и понять логику, лежащую в его основе. Если вам не удается этого сделать, проблема, с которой вы сталкиваетесь, называется «переоснащение».

Неконтролируемое обучение — Что это?

Неконтролируемое обучение подходит для обучения под наблюдением, если для практики отсутствуют известные, логически структурированные данные. Алгоритмы, использующие неконтролируемое обучение, могут, например, структурировать базу данных клиентов в соответствии с различными группами клиентов (сегментация клиентов). Существуют алгоритмы, которые сами решают, сколько таких кластеров они образуют, и алгоритмы, которым задается количество кластеров.

После такого машинного обучения снова следует ручной труд, и для интерпретации результата требуется человеческое творчество: Для найденных кластеров теперь необходимо профессионально интерпретировать. Это связано с тем, что алгоритм не дает никакого объяснения того, почему эти кластеры были созданы таким образом.

Другая возможность неконтролируемого обучения — это так называемое дименсиональное уменьшение. Это может быть использовано для выяснения так называемых особенностей из существующего набора данных, т.е. компонентов, в которых данные действительно отличаются друг от друга. Примером этого может служить описание предметов одежды, цвет которых затем извлекается как особенность.

Усиление обучения — Что это?

Усиление обучения в настоящее время является менее важным видом обучения в экономике, а также контролируемой процедурой. Идея здесь заключается в том, чтобы вознаграждать (и тем самым способствовать) успешное поведение, подавляя при этом поведение, которое привело к нежелательным результатам.

Например, если бы вы хотели тренировать алгоритм игры на деньги на десяти одноруких бандитах (которые функционируют по-разному «хорошо»), вы бы сначала заставили их играть пять раз на каждой машине, а затем чаще на машинах, которые при первой репетиции принесли наибольший выигрыш. Алгоритм также может немного играть на машинах, которые не давали или почти не давали выигрыша, потому что это могло быть неблагоприятным (и маловероятным) совпадением в первых пяти попытках, а на самом деле это лучшие машины.

Сколько алгоритмов можно выучить?

Существует множество различных методов обучения, здесь следует упомянуть только вспомогательные векторные машины и деревья принятия решений, как представителей контролируемого обучения.

Для каждого из этих методов существуют различные алгоритмы настройки параметров с целью достижения максимально возможного согласия с известными данными. Эти алгоритмы являются фактическими процедурами обучения в машинном обучении. Примерами являются градиентное спусковое отверстие, обратное размножение и генетические алгоритмы.

В зависимости от назначения приложения некоторые алгоритмы работают лучше или хуже. На это также могут влиять данные. Некоторые специальные приложения даже требуют модификации самих алгоритмов. Во многих случаях очень хорошие результаты могут быть достигнуты с помощью стандартных алгоритмов. В отдельных случаях, однако, может потребоваться модификация алгоритма или разработка собственного.

Машинное обучение по-прежнему означает в первую очередь: Ручная работа.

Как бы автоматизировано это ни звучало, процессы обучения на станке по-прежнему включают в себя множество ручных операций: Например, известные данные часто недоступны в том качестве, которое вам действительно необходимо. По этой причине данные, как правило, должны быть очищены на первом этапе, в рамках так называемой очистки данных.

ML является статистическим методом

Все три вида машинного обучения являются статистическими процедурами, а это означает, что только большое количество повторений приводит к хорошим результатам. Компьютеры могут делать эту «глупую» работу очень хорошо, а благодаря значительно увеличенной вычислительной мощности нам не приходится долго ждать результатов.

За успешным проектом машинного обучения всегда стоит междисциплинарная команда.

Machine Learning делает продукты и услуги более удобными для пользователя, процессы более эффективными и прогнозы более надежными. Если руководство определяет использование машинного обучения как часть корпоративной стратегии, машинное обучение — в сочетании с правильными данными — способно революционизировать всю бизнес-модель.

На этом фоне текущая шумиха, которая развилась вокруг ML, очень понятна.

При всех возможностях нельзя забывать: ML не панацея. Решающим фактором является качество данных, т.е. «корм» ML: Таким образом, «мусор в — мусор из» относится особенно к ML. Кроме того, ML требует очень больших объемов данных, которые не всегда доступны.

Результаты, получаемые алгоритмом ML, хороши только у тех, кто приобрел и подготовил соответствующее количество данных с фирменными вопросами в голове и неоднократно корректировал параметры алгоритма до тех пор, пока не будет получен технически интерпретируемый результат.

Во многих случаях не технология устанавливает границы ML, а творчество людей. Очень важно найти подходящий вариант использования для бизнеса, а затем спроектировать его итеративно, используя все существующие доменные знания, которые привносят ваши собственные сотрудники. Ориентированные на клиента инновационные методы, такие как конструкторское мышление и бережливое прототипирование, вносят в это важный вклад — в том числе и за счет раннего выявления неудач.

Stephanie Fischer

Ich bin Stephanie. Gründerin im Bereich Künstliche Intelligenz. Ursprünglich komme ich aus der Managementberatung und Organisationsentwicklung. Ich praktiziere Yoga seit 15 Jahren und bin Kundalini und Yin Yogalehrerin. Ich verknüpfe alte Techniken zum Bewusstseinstraining mit innovativen Lernformaten und aktuellen Tech-Themen. Mit Upskilling Lernmodulen oder Live Webinaren begreifen Mitarbeitende ihre Rolle innerhalb ihres Arbeitsbereichs, der durch Künstlicher Intelligenz (teil-)automatisiert wird. In Leadership Workshops erlernen Teilnehmende die Skills, die in einer digitalisierten Welt überlebenswichtig sind.