Как использовать искусственный интеллект в 2024 году. Обзор нейросетей
Искусственный интеллект, нейросети, машинное обучение — последние пару лет мы постоянно сталкиваемся с этими терминами. В чем разница между этими понятиями и для чего они предназначены — в материале редакции Skillbox.by.
Как нейросети захватили цифровой мир
Внимание к искусственному интеллекту (ИИ) регулярно повышалось после выхода очередного фантастического технотриллера. «Терминатор», «Матрица», «Я, робот», «Космическая одиссея» — в прошлом эти фильмы вызвали настоящий ажиотаж к «машинам» и породили многочисленные теории заговора. Но в 2023-м году причиной разговоров стали не кино и не новая книга, а одновременное появление сразу нескольких нейросетей с творческими способностями — Chat GPT, Mid Journey, DALL-E.
Осваивайте Chat GPT и прокачивайте навыки в востребованных направлениях на рынке — 28 курсов на одной платформе за 49,90 BYN в месяц
Узнать большеКак явление искусственный интеллект (Artificial Intelligence или AI) существует уже с 60-х годов. Это математические системы и алгоритмы, которые имитируют когнитивные способности человека. Изначально такие компьютерные модели использовались для исследования человеческого мозга и разума в целом. Но сфера у них намного шире. Например, к ИИ относятся алгоритмы, которые управляют неигровыми персонажами в компьютерных играх, собирают данные из сети по заданному шаблону, управляют производственными роботами и анализируют большие массивы данных.
Искусственный интеллект не обязательно должен мыслить и принимать самостоятельные решения, как это делает человек, — о самосознании мы в принципе не говорим. Он имитирует деятельность человеческого мозга, выполняя рутинные задачи, но может действовать по заранее составленной программе. Например, так работал суперкомпьютер со специальным софтом Deep Blue, который обыграл в шахматы Гарри Каспарова.
По уровню развития AI делится на три типа:
- Artificial Narrow Intelligence, ANI — специализированный AI. Он предназначен для выполнения одной задачи. Сюда относится и Deep Blue, и системы распознавания голоса и лиц, и чат-боты (текстовые модели), которые могут писать стихи, автопилоты, переводчики текста.
- Artificial General Intelligence, AGI — общий AI. Многозадачный искусственный интеллект, по способностям сравнимый с человеческим. Такой ИИ может написать стих, положить слова на музыку, создать картинку или видео, а в свободное время торговать акциями и водить автомобиль. Он может обладать сознанием, как в фильме «Робот по имени Чаппи» или «Она». Конечно, подобный уровень развития пока недоступен и находится на этапе исследований.
- Artificial Super Intelligence, ASI. Суперинтеллект, когнитивные способности которого намного выше, чем у человека. Пример такого ИИ хорошо отражен в фильме «Превосходство».
Одно из направлений искусственного интеллекта — технологии машинного обучения. Если в обычных приложениях заранее подключается база данных, которая используется при выполнении заложенного алгоритма, то такие системы обучаются самостоятельно. Например, пишется алгоритм, в него загружают сотни, тысячи изображений с автомобильными номерами и отдельно указывают эквивалент (ред.: букву, цифру). Процесс похож на то, как учатся читать маленькие дети. После обучения система сможет распознавать на картинке автомобильные номера. По такому методу можно научить ИИ распознавать любые образы — цифры, тексты, животных, лица людей и речь.
На базе технологий машинного обучения работают приложения для распознавания текста (Abbyy Scan, Abbyy FineReader), камеры видеонаблюдения с функцией распознавания лиц или автомобильных номеров (компьютерное зрение), автофокус и система улучшения изображения в фотоаппаратах и камерах смартфонов, распознавание речи и преобразование ее в текст — все это примеры AI. Подобные технологии стали использовать еще в конце 90-х.
Нейросети — развитие технологии машинного обучения. Это системы, которые могут не только распознавать образы и обучаться на них, но и применять полученные знания, приспосабливаться к новым условиям. Фактически это комплекс программ, которые обладают когнитивными признаками и возможностями, недоступными для обычных компьютеров. Прежде всего, это умение учиться на своих ошибках, выявлять скрытые закономерности и проявлять творческие способности. Например, ответить на нестандартный вопрос, написать стих или сгенерировать картинку, ориентироваться на незнакомой местности. Именно нейронные сети проявляют способности, которые обычно приписывают в целом AI.
Современные нейросети вроде Chat GPT или Stable Diffusion — это Deep neural network или системы глубокого обучения. Главная их особенность — между входом и выходом при обучении и анализе данных используется несколько слоев или уровней оценки. Такие сети могут справляться с более сложными задачами и работать в нескольких направлениях. Например, одновременно работать с изображением и звуком или обычным текстом и программным кодом.
Если описать все кратко, то:
- ИИ. Направление компьютерных технологий, которые имитируют деятельность человека. Такие системы не всегда умеют мыслить и могут работать по алгоритму, как обычная компьютерная программа.
- Машинное обучение. Одно из направлений технологий ИИ. Это системы, которые самостоятельно обучаются на массиве данных.
- Нейросети. Компьютерные системы, в основе которых лежит машинное обучение. Они могут применять полученные знания, чтобы на ходу приспосабливаться к меняющимся условиям и проявлять творческие способности.
- DNN — Deep neural network. Нейросети могут быть полезными более чем в одном направлении и анализировать информацию по нескольким признакам. Например, GPT может писать обычный текст и программный код, выполнять вычисления.
Обзор популярных нейросетей. Где их можно использовать
Нейросети сейчас везде. Они управляют беспилотными автомобилями Tesla и Google, улучшают картинку в телевизоре, оптимизируют фотографии, сделанные камерой смартфона, отслеживают письма со спамом в ящиках электронной почты. Редакция Skillbox.by подготовила обзор инструментов, которые доступны обычному человеку и которые можно использовать в работе и креативной сфере без крупных капиталовложений.
Chat GPT
Самая нашумевшая нейросеть. Это предварительно обученная текстовая модель, которая может отвечать на вопросы и создавать контент. На этом ее возможности не ограничиваются. Chat GPT способен рерайтить тексты, переводить статьи на сотни языков, составлять бизнес-планы и рецепты на основании списка продуктов, писать программный код. Вопрос стоит лишь в качестве. Например, нейросеть пока не способна создавать качественные тексты — Chat GPT создает стилистически сложные тексты, в которых много «воды», информацию необходимо обязательно перепроверять, а уникальность текстов повышать вручную.
Базовая версия GPT-3.5 доступна бесплатно, но есть и премиум подписка с продвинутыми возможностями. Достаточно пройти регистрацию на сайте. Также на основе GPT работают десятки сервисов вроде Jasper.AI или hypotenuse.ai.
Bing AI
Он же Microsoft Copilot. Поисковый чат-бот на базе Chat GPT 4.0. Помимо функций Chat GPT, он может находить данные в интернете, делать короткую выжимку из информации, опубликованной на странице. Сервис бесплатный, доступен в поисковой системе Bing (в браузере Edge), мобильном приложении Bing и строке поиска Windows. Также он используется в Skype и других приложениях Microsoft.
Mid Journey
Генеративная нейросеть, обученная на миллионах изображений. Может генерировать изображения на основании текстового описания на английском. Поддерживает разные направления изобразительного искусства. Может создать картинку в стиле аниме, фотореализма, футуризма, киберпанк и даже написать картину, имитируя работу конкретного художника. Сервис доступен через Discord по платной подписке.
Stable Diffusion
Хотя нейросеть и уступает по популярности Mid Journey, именно ее активно используют маркетинговые компании, продакшены и даже киностудии. В отличие от предыдущих нейронных сетей, Stable Diffusion доступна в виде открытого исходного кода. Она умеет создавать не только картинки, но и видео, музыку, звуки, звуковые эффекты. Ее можно скачать самостоятельно, собрать и обучить на своем ПК.
Также есть онлайн-сервисы, которые работают на основе нейросети: clipdrop.co, официальная студия от разработчика dreamstudio.ai, stablediffusionweb.com. Также существуют и независимые проекты, которые были разработаны на основе исходного кода. Например, unstability.ai.
Как и GPT, разработка Openai. Нейросеть по текстовому описанию генерирует изображения. Доступна бесплатно практически без ограничений в поисковике Bing в разделе «Изображения».
Бесплатный генератор изображений. Генерирует портреты людей на аватарки, изображения животных, транспорта и пейзажи. Многие маркетологи используют сервис как бесплатный фотосток для заполнения рекламных профилей или создания баннеров.
Среди интересных проектов также можно отметить:
- SlidesAI — плагин для Google презентаций, который может быстро создать презентацию на основе добавленного материала.
- Yandex SpeechKit — бесплатное облачное приложение, которое умеет распознавать речь, переводить ее в текст и наоборот. Можно настраивать голоса.
- Synthesia — универсальный сервис, который умеет генерировать видео на основе текстового сценария и озвучивать текст. Доступно более 120 языков, огромный выбор голосов.
- Runway Gen‑2 — генератор видео по текстовому описанию. Сервис на основе нейросети Stable Diffusion. Позволяет создавать рекламные ролики, обучающие видео и мультики. Доступен по платной подписке, но есть пробная версия — можно бесплатно создать три видео длиной в четыре секунды.
Будущее нейросетей. Полезные ресурсы от редакции Skillbox.by
Нейросети стремительно развиваются. Существующие генеративные модели становятся лучше, появляются новые возможности. Появляются и сотни новых AI-сервисов. Например, ИИ-редактор, который может вырезать и заменить фон, повысить разрешение картинки, дорисовать дополнительные объекты на фотографии уже встроен в Photoshop, Pixlr, Canva.
Нейросети пока несовершенны и не способны полностью заменить человека. С простым баннером, картинкой, развлекательным постом для соцсетей, описанием товара для маркетплейса ИИ справится. Не без корректуры, конечно. Невозможно полагаться на AI при написании статей и лонгридов, биографий и публикаций об истории. Искусственный интеллект часто путает даты или просто придумывает информацию даже об известных личностях и событиях. При решении более сложных задач вроде генерации видеороликов придется задействовать несколько сервисов — для создания сценария, инфографики, озвучивания. Несовершенны и генераторы изображений. Они все еще не могут обрабатывать текст, часто не справляются с правильной отрисовкой кистей рук.
Но это не значит, что нейросети бесполезны. Им вполне можно делегировать рутинные задачи, которые облегчат работу и жизнь. Поэтому редакция Skillbox.by рекомендует не бояться, что нейросети заменят человека, а учиться использовать их там, где это возможно, повышая свою конкурентоспособность.
Литература:
- Я. Гудфеллоу, И. Бенджио, А. Курвилль «Глубокое обучение»;
- Д. Рутковская «Нейронные сети, генетические алгоритмы и нечеткие системы»;
- Рашид Тарик «Создаем нейронную сеть»;
- Ян Лекун «Как учится машина: революция в области нейронных сетей и глубокого обучения».
Интернет-ресурсы:
- Нейросети — блог посвящен генеративным нейросетям для создания изображений.
- OpenAI — портал компании, которая создала DALL-E и GPT. Здесь много информации и документов по нейросетям.
- Нейросеть.Info — русскоязычный форум о нейросетях.
- Machine Learning Mastery — блог, посвященный нейросетям и машинному обучению.
Редакция Skillbox.by также рекомендует к прочтению:
Не приравнивайте поступление к концу света. Экспертные советы для подростков и родителей
Осваивайте «Нейросети: практический курс» со Skillbox
Искусственный интеллект — не угроза, а инструмент для ускорения работы и увеличения дохода. Заставьте его работать на вас уже через два месяца.
Забрать доступ