Статьи
July 9, 2023

Эра искусственного интеллекта: все, что нужно знать об искусственном интеллекте

ИИ появляется, казалось бы, в каждом уголке современной жизни, от музыки и медиа до бизнеса и производительности, и даже знакомств. Это так много, что бывает трудно уследить за всем - поэтому читайте дальше, чтобы узнать обо всем: от последних крупных разработок до терминов и компаний, которые необходимо знать, чтобы оставаться в курсе событий в этой быстро меняющейся области.

Для начала давайте убедимся, что мы все на одной волне: что такое искусственный интеллект?

Искусственный интеллект, также называемый машинным обучением, - это вид программного обеспечения, основанный на нейронных сетях, методе, который был впервые применен несколько десятилетий назад, но совсем недавно расцвел благодаря новым мощным вычислительным ресурсам. ИИ позволил эффективно распознавать голос и изображения, а также генерировать синтетические изображения и речь. А исследователи упорно работают над тем, чтобы ИИ мог просматривать веб-страницы, заказывать билеты, подбирать рецепты и многое другое.

Но если вы опасаетесь, что машины начнут действовать по типу "Матрицы", не стоит. Мы поговорим об этом позже!

Наше руководство по ИИ состоит из трех основных частей, каждая из которых будет регулярно обновляться и может быть прочитана в любом порядке:

- Во-первых, самые фундаментальные понятия, которые вам необходимо знать, а также более важные в последнее время.
- Далее, обзор основных игроков в области ИИ и почему они важны.
- И наконец, список последних заголовков и событий, о которых вы должны знать.

К концу этой статьи вы будете в курсе всех событий, на которые только можно надеяться в наши дни. Мы также будем обновлять и расширять ее по мере продвижения в эпоху ИИ.

AI 101

Одна из удивительных особенностей искусственного интеллекта заключается в том, что, хотя его основные концепции возникли более 50 лет назад, лишь немногие из них были знакомы даже технически подкованным людям до недавнего времени. Так что если вы чувствуете себя потерянным, не волнуйтесь - все такие.

И еще одна вещь, которую мы хотим прояснить: Хотя его называют "искусственным интеллектом", этот термин немного вводит в заблуждение. Единого определения интеллекта не существует, но то, что делают эти системы, определенно ближе к калькуляторам, чем к мозгу. Просто вход и выход калькулятора гораздо более гибкий. Вы можете думать об искусственном интеллекте, как об искусственном кокосе - это имитация интеллекта.

С учетом сказанного, вот основные термины, которые можно встретить в любом обсуждении ИИ.

Нейронная сеть

Наш мозг состоит в основном из взаимосвязанных клеток, называемых нейронами, которые объединяются в сложные сети, выполняющие задачи и хранящие информацию. Воссоздать эту удивительную систему в программном обеспечении пытались с 60-х годов, но необходимые вычислительные мощности не были широко доступны до 15-20 лет назад, когда графические процессоры позволили процветать нейронным сетям с цифровым определением. По своей сути это просто множество точек и линий: точки - это данные, а линии - статистические связи между этими значениями. Как и в мозге, это позволяет создать универсальную систему, которая быстро принимает входные данные, пропускает их через сеть и выдает на выходе результат. Такая система называется моделью.

Модель

Модель - это фактический набор кода, который принимает входные данные и выдает выходные. Сходство терминологии со статистической моделью или системой моделирования, которая имитирует сложный природный процесс, не случайно. В ИИ модель может относиться к полной системе, такой как ChatGPT, или практически к любой конструкции ИИ или машинного обучения, что бы она ни делала или производила. Модели бывают разных размеров, что означает, сколько места они занимают в памяти и сколько вычислительной мощности требуется для их работы. А это зависит от того, как модель обучается.

Обучение

Для создания модели ИИ нейронные сети, составляющие основу системы, подвергаются воздействию большого количества информации в так называемом наборе данных или корпусе. При этом эти гигантские сети создают статистическое представление этих данных. Этот процесс обучения - самая трудоемкая часть, то есть он занимает недели или месяцы (можно сколько угодно) на огромных мощных компьютерах. Причина в том, что сети не только сложны, но и наборы данных могут быть очень большими: миллиарды слов или изображений, которые необходимо проанализировать и представить в гигантской статистической модели. С другой стороны, как только модель готова, она может стать намного меньше и менее требовательной при использовании - процесс, называемый выводом.

Умозаключение

Когда модель действительно выполняет свою работу, мы называем это умозаключением в традиционном смысле этого слова: формулирование вывода путем рассуждений на основе имеющихся доказательств. Конечно, это не совсем "рассуждение", но статистическое соединение точек в данных, которые она получила, и, по сути, предсказание следующей точки. Например, говоря: "Составьте следующую последовательность: красный, оранжевый, желтый...", он обнаружит, что эти слова соответствуют началу списка, который он проглотил, - цветам радуги, и умозаключит о следующем элементе, пока не составит остальную часть этого списка. Как правило, умозаключения требуют гораздо меньше вычислительных затрат, чем обучение: Думайте об этом как о просмотре картотеки, а не о ее сборке. Большие модели все еще работают на суперкомпьютерах и графических процессорах, но маленькие модели могут быть запущены на смартфоне или еще более простом устройстве.

Генеративный ИИ

Все говорят о генеративном ИИ, и этот широкий термин означает модель ИИ, которая создает оригинальный результат, например, изображение или текст. Некоторые ИИ обобщают, некоторые реорганизуют, некоторые идентифицируют и так далее - но ИИ, который действительно что-то генерирует (о том, "создает" он или нет, можно спорить), сейчас особенно популярен. Помните, что если ИИ что-то создал, это не значит, что это правильно, или даже что это вообще отражает реальность! Только то, что этого не существовало до того, как вы попросили об этом, как история или картина.

Главные термины сегодняшнего дня

Помимо основных, вот термины ИИ, которые будут наиболее актуальны в середине 2023 года.

Большая языковая модель

Наиболее влиятельная и универсальная форма ИИ на сегодняшний день, большие языковые модели обучаются практически на всех текстах, составляющих веб и большую часть английской литературы. В результате обработки всего этого получается модель фундамента (читать дальше) огромного размера. LLM способны вести беседу и отвечать на вопросы на естественном языке, а также имитировать различные стили и типы письменных документов, что демонстрируют такие модели, как ChatGPT, Claude и LLaMa. Хотя эти модели, несомненно, впечатляют, следует помнить, что они все еще являются механизмами распознавания образов, и когда они отвечают, это попытка завершить выявленный образец, независимо от того, отражает ли этот образец реальность. LLM часто галлюцинируют в своих ответах, о чем мы еще поговорим.

Базовая модель

Обучение огромной модели с нуля на огромных массивах данных является дорогостоящим и сложным, поэтому вы не хотите заниматься этим больше, чем нужно. Базовые модели - это большие модели "с нуля", для запуска которых требуются суперкомпьютеры, но их можно урезать, чтобы они помещались в меньшие контейнеры, обычно за счет уменьшения количества параметров. Их можно рассматривать как общее количество точек, с которыми приходится работать модели, и в наши дни оно может исчисляться миллионами, миллиардами или даже триллионами.

Тонкая настройка

Такая базовая модель, как GPT-4, умна, но она также является универсальной по своему дизайну - она впитала в себя все, от Диккенса до Витгенштейна и правил игры Dungeons & Dragons, но все это не поможет вам, если вы хотите, чтобы она помогла вам написать сопроводительное письмо для резюме. К счастью, модели можно точно настроить, если дать им немного дополнительного обучения на специализированном наборе данных, например, на нескольких тысячах заявлений о приеме на работу, которые случайно завалялись у вас под рукой. Это позволяет модели лучше понять, как помочь вам в этой области, не отбрасывая общие знания, которые она собрала из остальных учебных данных.

Обучение с усилением на основе человеческой обратной связи, или RLHF, - это особый вид тонкой настройки, о котором вы часто слышите, - в нем используются данные людей, взаимодействующих с LLM, чтобы улучшить его коммуникативные навыки.

Диффузия

Из статьи о передовой технике постдиффузии видно, как изображение может быть воспроизведено даже из очень зашумленных данных.

Генерация изображений может осуществляться множеством способов, но самым успешным на сегодняшний день является диффузия - техника, лежащая в основе Stable Diffusion, Midjourney и других популярных генеративных ИИ. Диффузионные модели обучаются путем демонстрации им изображений, которые постепенно ухудшаются путем добавления цифрового шума, пока от оригинала не останется ничего. Наблюдая за этим, диффузионные модели учатся выполнять обратный процесс, постепенно добавляя детали к чистому шуму, чтобы сформировать произвольно определенное изображение. Мы уже начинаем выходить за эти рамки для изображений, но техника надежна и относительно хорошо изучена, поэтому не стоит ожидать, что она исчезнет в ближайшее время.

Галлюцинации

Первоначально это была проблема, связанная с тем, что определенные образы в процессе обучения переходили в несвязанный результат, например, здания казались сделанными из собак из-за чрезмерной распространенности собак в обучающем наборе. Теперь говорят, что ИИ галлюцинирует, когда из-за недостатка или противоречивости данных в обучающем наборе он просто придумывает что-то.

Это может быть как преимуществом, так и недостатком; ИИ, которого просят создать оригинальное или даже производное искусство, галлюцинирует на выходе; LLM можно попросить написать любовную поэму в стиле Йоги Берры, и он с радостью это сделает - несмотря на то, что такой вещи не существует нигде в его наборе данных. Но это может стать проблемой, когда требуется фактический ответ; модели будут уверенно представлять ответ, который наполовину реален, наполовину галлюцинация. В настоящее время нет простого способа определить, кто из них прав, кроме как проверить самому, потому что сама модель не знает, что является "истинным" или "ложным", она только пытается завершить шаблон как можно лучше.

AGI или сильный ИИ

Искусственный интеллект общего назначения, или сильный ИИ, не является четко определенным понятием, но самое простое объяснение заключается в том, что это интеллект, который достаточно силен, чтобы не просто делать то, что делают люди, но учиться и самосовершенствоваться, как это делаем мы. Некоторые опасаются, что этот цикл обучения, интеграции этих идей, а затем обучения и ускоренного роста будет самоподдерживающимся, что приведет к созданию сверхинтеллектуальной системы, которую невозможно будет сдерживать или контролировать. Некоторые даже предлагают отложить или ограничить исследования, чтобы предотвратить такую возможность.

Конечно, это страшная идея, и в таких фильмах, как "Матрица" и "Терминатор", рассматривается, что может произойти, если ИИ выйдет из-под контроля и попытается уничтожить или поработить человечество. Но эти истории не основаны на реальности. Внешний вид интеллекта, который мы видим в таких вещах, как ChatGPT, впечатляет, но имеет мало общего с абстрактными рассуждениями и динамичной многоплановой деятельностью, которые мы ассоциируем с "настоящим" интеллектом. Хотя предсказать, как будут развиваться события, практически невозможно, полезно думать об AGI как о межзвездных космических путешествиях: Мы все понимаем концепцию и вроде бы работаем в этом направлении, но в то же время мы невероятно далеки от достижения чего-то подобного. И из-за огромных ресурсов и фундаментальных научных достижений, необходимых для этого, никто не собирается вдруг случайно достичь этого!

Об AGI интересно думать, но нет смысла заимствовать проблемы, когда, как отмечают комментаторы, ИИ уже сегодня представляет реальные и значительные угрозы, несмотря на свои ограничения, а на самом деле во многом благодаря им. Никто не хочет Скайнет, но для причинения реального вреда не нужен сверхразум, вооруженный ядерным оружием: люди уже сегодня теряют работу и попадаются на мистификации. Если мы не можем решить эти проблемы, то какие у нас шансы против Т-1000?

Лучшие игроки в области искусственного интеллекта

OpenAI

Если в области искусственного интеллекта и есть какое-то имя, то это именно оно. OpenAI начиналась, как следует из названия, как организация, намеревавшаяся проводить исследования и предоставлять их результаты более или менее открыто. С тех пор она реструктурировалась в более традиционную коммерческую компанию, предоставляющую доступ к своим достижениям в области языковых моделей, таких как ChatGPT, через API и приложения. Ее возглавляет Сэм Альтман, миллиардер-технотопист, который, тем не менее, предупреждал о рисках, которые может представлять ИИ. OpenAI является признанным лидером в области LLM, но также проводит исследования в других областях.

Microsoft

Как и следовало ожидать, компания Microsoft проделала изрядную долю работы в области исследований ИИ, но, как и другие компании, практически не смогла превратить свои эксперименты в крупные продукты. Самым разумным шагом компании было раннее инвестирование в OpenAI, что позволило ей заключить эксклюзивное долгосрочное партнерство с компанией, на базе которой теперь работает разговорный агент Bing. Хотя ее собственный вклад меньше и менее применим, компания проводит значительные исследования.


Google

Компания Google, известная своими лунными проектами, каким-то образом пропустила лодку в области ИИ, несмотря на то, что ее исследователи буквально изобрели технику, которая непосредственно привела к сегодняшнему взрыву ИИ: трансформатор. Сейчас компания упорно работает над своими LLM и другими агентами, но явно играет в догонялки, потратив большую часть своего времени и денег за последнее десятилетие на развитие устаревшей концепции ИИ "виртуальный помощник". Генеральный директор Сундар Пичаи неоднократно заявлял, что компания твердо стоит на позициях ИИ в поиске и производительности.

Anthropic

После того как OpenAI отошла от принципа открытости, братья и сестры Дарио и Даниэла Амодеи покинули ее и основали компанию Anthropic, намереваясь взять на себя роль открытой и этически продуманной организации по исследованию ИИ. С тем количеством наличных денег, которое у них есть, они являются серьезным конкурентом OpenAI, даже если их модели, такие как Claude, еще не так популярны и известны.


Stability

Спорный, но неизбежный, Stability представляет школу реализации ИИ с открытым исходным кодом "делай, что хочешь", собирая все в интернете и делая генеративные модели ИИ, которые он обучает, свободно доступными, если у вас есть оборудование для их запуска. Это вполне соответствует философии "информация хочет быть свободной", но также ускоряет этически сомнительные проекты, такие как создание порнографических изображений и использование интеллектуальной собственности без согласия (иногда в одно и то же время).


Илон Маск

Маск не остался в стороне, он открыто высказывал свои опасения по поводу неконтролируемого ИИ, а также после того, как он внес свой вклад в OpenAI на ранних этапах, и она пошла в направлении, которое ему не нравилось. Хотя Маск не является экспертом в этой области, его выходки и комментарии, как обычно, вызывают широкий резонанс (он подписал вышеупомянутое письмо "ИИ-пауза"), и он пытается основать собственную исследовательскую организацию.

Перевод статьи.