0: Всем привет. Рада видеть вас на сегодняшнем вебинаре, посвящённом генеративному искусственному интеллекту. Это очень хайповая распиаренная тема сегодня и мы обсудим, какие новые воз.
1: Возможности дают нам генеративные новые сети и что нас, скорее всего, ждёт в ближайшие годы или даже месяцы, а что уже стало реальностью, хотя ещё буквально пару лет назад казалось фантастикой.
2: Что ж, давайте начинать, но в начале давайте немножечко расскажу про себя. Меня зовут Мария Тихонова, я кандидат компьютерных наук и закончила механико математический факультет мгу, а также школу анализа данных, где я, собственно,
3: Полюбила такую область, как data science все, что связано с искусственным интеллектом и сегодня я работаю data сайнтистом, а именно я обучаю большие языковые модели это нейронный секс нейронные сети обрабатывающие
4: Текст в естественном языке, такие как, например, chat gpt. Ну, понятное дело, что мы исследуем и работаем с русскоязычными нейронными сетями. И помимо этого, я также преподаватель высшей школы экономики.
5: А сегодня я буду вести у вас вебинар, посвящённый теме искусственного интеллекта, и прежде всего прежде всего давайте определимся с самим понятием искусственный интеллект.
6: Ai сегодня самая мне кажется хайповая аббревиатура, которая у всех на слуху. Ну что же она означает? Каждый понимает её немножечко по своему. Кто-то думает сразу про нейросети, кто-то про умных роботов, но по
7: Сути дела с формальной точки зрения ии это область науки и технологий, которая предназначена для автоматизации различных Мозговых различных
8: Способности возможностей человека, интеллектуальных возможностей человека здесь как раз-таки интеллектуально очень важное слово, и, по сути, в самом определении искусственного интеллекта вообще нет ничего про то, что это, например, нейросеть.
9: По сути, даже тот же калькулятор, поскольку он автоматизирует интеллектуальные задачи, можно назвать достаточно примитивным искусственным интеллектом любой машинный переводчик, да не такой продвинутый, как диппе или google транслейт.
10: Даже, например, основанный на правилах и словарях, мы можем назвать примитивным искусственным интеллектом, поскольку он нам помогает в автоматизации интеллектуальных задач. Ну, понятное дело, что сегодня под термином ии понимают в 1
11: Очередь какие-то самые хайповые, самые последние нейросетевые проявления, и в 1 очередь они связаны с нейронными сетями, которые генерируют или создают что-то новое, генерируют изображение, как my джонни и Кандинский пишут текст.
12: И так далее. Собственно, также понятие искусственного интеллекта можно условно разделить на 2 категории. Это слабый искусственный интеллект или как его ещё называют, прикладной искусственный интеллект на английском это
13: Это прикладной ии, предназначенный для решения определённых задач, он уже так прочно вошёл в нашу жизнь, что мы его не замечаем тот же автоматический перевод google транслейт яндекс транслейт.
14: Мы с этим, по сути дела, сегодня живём или тот же google, тот же поисковик, он, по сути дела, автоматизирует нашу способность поиска в интернете как раз-таки яркий пример прикладного искусственного интеллекта.
15: А в противоположность ему обычно противопоставляют artificial general intelligence общий искусственный интеллект это тот самый персонаж научной фантастики, который умеет мыслить, осознавать себя и по интеллекту.
16: Возможностям равен человеческому чело, и его интеллектуальные возможности равны человеческим, и ещё недавно это был совсем далёкий персонаж научной фантастики, сейчас, кажется, мы сделали большой шаг.
17: Вперёд, в сторону edge i но опять-таки какая дорога у нас остаётся впереди вопрос сложный нам кажется, что уже вот вот эйдар наступит есть оптимисты, которые думают, что эйджа появится уже буквально через пару лет есть.
18: Пессимисты. И тут возникает сложность в том, что мы не знаем, какая дорога у нас есть. Впереди присутствует так называемый эффект искусственного интеллекта, а именно нам все время кажется, что как только машины Решат какую-то
19: Определённую задачу, которую они не решали ранее. Тогда эту машину можно будет назвать искусственным интеллектом, но как только система её решает автоматическими методами, мы сразу находим причину, почему её нельзя назвать настоящим и
20: И говорим условно, что, ну, это всего лишь машина, которая делает вот это очень хорошо так было, например, с шахматами. Раньше люди считали, что когда компьютер одолеет человека в шахматы, тог,
21: Да, это и будет действительно настоящий сильный искусственный интеллект. Но потом, в девяностые годы, состоялся исторический матч между гарри каспаровым и алгоритмом диблу диблу обыграл чемпиона мира того времени по игре в шахматы.
22: И люди сказали, ну это просто алгоритм машинного обучения, тут все понятно. А вот когда компьютер обыграет человека в го го, это игра с огромным пространством событий и вариантов, там так просто.
23: Без собственно сильного искусственного интеллекта не обойтись, но в Десятых годах пришли методы обучения с подкреплением или реинфорсмент ленинг и, соответственно, алгоритм альфа го обыграл ли седово в го после этого?
24: Люди сказали, что нет, это всего лишь игра. Вот когда компьютеры научатся, научатся творить и рисовать. Но сегодня мы видим ми джонни, который создаёт шедевры. И все равно мы не считаем его сильным искусственным интеллектом, потому что мы понимаем, что это
25: Всего лишь генеративная нейронная сеть, которая хорошо генерирует потрясающие изображения по промту и так далее. Каждый новый рубеж, как только он будет преодолён искусственным интеллектом, кажется нам все ещё
26: Достаточно для того, чтобы назвать искусственный интеллект сильным искусственным интеллектом. Поэтому когда же наступит эджай, вопрос философский, а мы пока поговорим про основные 3 ключевые причины, которые послужили тол,
27: К тому взрыву эйэй, который мы видим сегодня, а именно сегодня мы наблюдаем новую весну или лето искусственного интеллекта. И здесь это произошло благодаря слиянию 3 компонент. Во первых, у нас сегодня появились, но
28: Новые мощные алгоритмы архитектуры нейросетей, но сама по себе нейросеть сделать ничего не может, её надо обучать, и для этого нужны огромные вычислительные мощности, и вот как раз сейчас современные технологии достигли
29: Возможности производительности, когда мы можем обучать нейросети на огромных кластерах гпу. Помимо этого, нейронные сети требуют большого большого числа данных и благодаря современной цифровизации, опять-таки наша
30: В современном мире у нас достаточно данных для обучения подобных сетей. Соответственно, вот 3 компонента архитектуры, данные и мощности, на которых мы все это можем обучать. Сложившись воедино, дали такой взрыв.
31: Бум. И если говорить о том, сколько сегодня информации в цифровом мире, то можно представить себе вот такой график здесь, по оценкам экспертов, к 25 году объём
32: Дата сферы будет насчитывать 175 зеттабайт, то есть не терабайт, а зетабайт. Это очень большая цифра, действительно, но если посмотреть, то любой процессор сейчас все ещё безумно.
33: Далёк от человеческого мозга, который является в разы более эффективной системой. Если мы посмотрим на производительность человеческого мозга, то мы видим, что она на несколько порядков, то есть в сотни раз
34: Превосходит лучшие процессоры gpu при том, что энергоэффективность вычислений намного выше, а электричества мозг потребляет в десятки раз меньше, то есть пока ещё ни 1 чип даже близко не приблизился к
35: К человеческому мозгу и не очень понятно, можно ли вот просто на физическом уровне подойти к этому рубежу. Ну как есть. Тем не менее, это нас не останавливает от того, чтобы пользовать
36: Современными достижениями. Эй, и давайте как раз сейчас об этом поговорим, а именно поговорим про генеративный искусственный интеллект и каких успехов он достиг в области генерации звуков и речи.
37: Текстов, изображений и даже видео. Начнём по порядку и в начале поговорим про звуки. Сегодня нейронные сети умеют генерировать потрясающие шедевры, музыкальные, обучаясь на
38: Больших корпусах музыки они умеют по создавать композиции в заданном жанре на заданный стиль, например, у нас в SberDevices есть нейронная сеть Сим формер, которая создаёт
39: Музыку и произведения на основе заданного стиля, который пользователь ей подаёт на вход. Давайте послушаем что-нибудь из её творений.
40: Мне кажется, очень неплохо такая хорошая музыка, я бы с удовольствием слушала её где-нибудь на бэкграунде. Если говорить про голос, то сегодня у нас нейронные сети умеют генерировать качественную речь по заданному тексту.
41: Эта речь может имитировать голос определённого человека или, например, имитировать акценты и даже один и тот же голос мы можем заставить благодаря нейросетям говорить на разных языках.
42: SberDevices мы применяем эту технологию для виртуальных ассистентов салют, а именно у нас SberDevices есть семейство виртуальных ассистентов, это Сбер, Джой и Афина у яндекса есть Алиса у нас целых.
43: 3 виртуальных персонажа, они абсолютно одинаковы по своим функциям и возможностям, но у них разные характеры и голоса. Конечно же, Сбер это такой нейтральный молодой человек, самый деловой доброжела.
44: Персонаж подшутить беззаботное, которая любит немножко пофилософствовать. И да.
45: Джо, это весёлая, беззаботная молодая девушка, она может и и что-то такое весёлое сказать. А Афина это спокойная взрослая дама.
46: Персонаж джо, это весёлая, беззаботная молодая девушка, она может и подшутить, и что-то такое весёлое, беззаботное сказать. А Афина это спокойная взрослая дама, которая любит немножко пофилософствовать. И да.
47: Давайте посмотрим, как благодаря генеративным нейронным сетям мы можем почувствовать характеры наших персонажей, наших героев благодаря различным ноткам их интонации и как генера.
48: Активные нейронные сети эти характеры передают
49: Здравствуйте, меня зовут Сбер. Люблю общаться с людьми и постоянно учусь новому.
50: Активные нейронные сети эти характеры передают. Здравствуйте, меня зовут Сбер. Люблю общаться с людьми и постоянно учусь новому.
51: Добрый день, я Афина, навожу порядок в делах и помогаю с задачами.
52: Привет, мне дали имя Джой, потому что я несу радость людям.
53: Действительно, мы слышим, что голоса разные. Очень милые, очень приятные и достаточно естественные. Знаете, если бы мне не сказали, что это сгенерировала нейронная сеть, я бы даже и не догадалась. Более того, мы можем заставить наших персонажей исполнять
54: Различные композиции, например, давайте послушаем, как Джой поёт на английском знаменитую песню get lucky.
55: А вот все 3 персонажа исполняют песню looking forward это песня, которую сочинила генеративная нейронная сеть Сим форвард.
56: Я путешествую её я разбираюсь в entertain нереальных, а сейчас пою.
57: Что ж, поговорили про музыку. А что же происходит в области текстов? Ну конечно же, вы все знаете такую архитектуру, как gpt gpt 4, и, по сути дела, большинство нейронных сетей сегодня основано на архи.
58: Туре трансформер, лежащий в основе gpt. По сути дела, именно благодаря вот этой вот архитектуре трансформер, я на всякий случай привела эту классическую схему, изображающую архитектуру сети на слайде. Ну, сейчас у нас, конечно же, не
59: Урок по нейронным сетям из вуза. Сейчас мы просто познакомимся с трансформерами, и главная ключевая идея, которая лежит в сердце этой архитектуры, это механизм внимания, который помогает не
60: Сетям лучше воспринимать и читать текст и, имитируя внимание при чтении, как если бы это читал человек, а именно при чтении каждого следующего слова нейронная сеть понимает.
61: Какие слова важны для понимания текущего слова и инкорпорируют важную контекстную информацию для того, чтобы лучше интерпретировать и обработать текущее слово и благодаря этому у нейронных сетей на основе архитек?
62: Трансформер, а именно она сегодня является стандартом в данной области. Получаются те результаты, которые действительно ещё буквально пару лет назад казались фантастикой. Например, в Сбере мы опять
63: Используем генеративные диалоговые модели. У нас есть нейронная сеть гига. Чат это наша мультимодальная система искусственного интеллекта. Наш ответ, собственно, чат, gpt нейронные сети уже научились
64: Творить, например, недавно у нас в SberDevices был очень интересный проект вышла, вышел 1 нейросетевой сборник Рассказов, точнее, сборник Рассказов, написанный в соавторстве реального автора.
65: Павла пепперштейна это такой очень сюрреалистичный писатель, ещё более сюрреалистичный, чем Пелевин и нейронной сети рук GPT-3, а именно в сборнике 24 рассказа половину написал Павел пепперштейн, а половину?
66: Написала ru GPT-3, которая обучалась на рассказах Павла пепперштейна и писателей, которые вдохновляли его для того, чтобы научиться имитировать стиль этого писателя, и знаете.
67: Угадать, где какой рассказ, достаточно сложно, потому что правильных ответов нет, а догадаться может быть не так-то просто. Давайте с вами попробуем это сделать на
68: Вы видите 2 рассказа 1 из них написала нейронная сеть, 1 написал Павел пепперштейн, когда я даю лекции очные, обычно прошу зрителей поднять руки, где, по их мнению, рассказ, написанный павлом.
69: Ну, сейчас у нас нет такой возможности, поэтому даю вам просто полминутки. Прочитайте 2 фрагмента, пожалуйста, и про себя загадайте, где, по вашему, Павел пепперштейн, а где нейронная сеть?
70: Ну и, соответственно, мы видим, что на самом деле внизу Павел пепперштейн. Хотя, согласитесь, догадаться было не так-то просто. Мои студенты мне как-то сказали, что вот это предложение, 2 одинаковых домика деревенского типа были надеты на
71: Его ноги вместо выдают Павла пепперштейна это слишком необычно, чтобы такое могла позволить себе нейронная помимо.
72: Ботинок.
73: Сеть.
74: Его ноги вместо ботинок выдают Павла пепперштейна. Это слишком необычно, чтобы такое могла позволить себе нейронная сеть помимо.
75: Книг. Нейронные сети умеют генерировать нейро квесты, например, в салюте есть нейрофэнтези, и вы можете попасть в волшебный мир, где вы являетесь творцом и продол и можете спокойно продол.
76: Историю изменяя сюжет под себя и создавая персонаж, а также, конечно, поэзия в SberDevices, мы обучили нейро поэта, который пишет очень красивые стихи вы мо.
77: Спросить а в чем же сложность с поэзией? Казалось бы, давайте попробуем такой же подход возьмём нейронную сеть, такой же подход, как с павлом пепперштейн м. Возьмём нейронную сеть и обучим её на корпусе поэзии.
78: Вот она и будет вам генерировать стихи, а на самом деле такой подход не работает, потому что в стихах есть ещё 1 очень важная вещь, а именно рифма и ритмический рисунок. А когда мы обучаем
79: Нейронную сеть на голых текстах, где нет никакой информации про ударение, она вообще при обучении не знает, что там есть такая штука, как ударение, как же может она научиться писать стихи, не зная про ударение и ритмическое?
80: Рисунок. Поэтому для того, чтобы обучить, пришлось обучить предобработанных текстах там была произведена разбивка по слогам и были проставлены ударения, и тогда при обучении нейронная сеть уже поняла, что такое ритмический рисунок.
81: Поэта его на специальных
82: Рисунок поэтому для того, чтобы обучить поэта, пришлось обучить его на специальных предобработанных текстах, там была произведена разбивка по слогам и были проставлены ударения, и тогда при обучении нейронная сеть уже поняла, что такое ритмический рисунок.
83: И какой ритмический стих. Рисунок бывает у разных стихов, и получилось очень здорово на мой взгляд, у неё чудесно получается нейро шекспир у бурных чувств неистовый конец куда-то исчезает.
84: Вдохновение когда 1 ступает под венец и рифмы не сложить стихотворение когда в душе рождаются стихи, льются чувства рваными строками, мы вспоминаем все свои грехи холодными, обычными словами.
85: Поэт а картинка нарисована ми джонни.
86: Ну и, конечно, GigaChat это, как я уже упоминала, мультимодальная система искусственного интеллекта, наш ответ гпд 4 можно сказать, а благодаря нейростик, ддинский GigaChat умеет ещё и прекрасно рисовать.
87: Мне нравится, что GigaChat можно удобно использовать в telegram боте, если вы, например, активный пользователь telegram, можете сейчас перейти по QR-коду и, соответственно, задать GigaChat какой-нибудь вопрос нейрон.
88: Сеть обучена специально для русского языка, хотя знает английский и немножко говорит на других языках GigaChat может создавать сюжеты и сценарии, например, мы можем попросить его приду.
89: Сценарий продолжения мультфильма ну погоди, где волк и заяц противостоят десептикону и гига чат пишет что-то достаточно интересное.
90: А ещё гига чат хорошо умеет рассуждать, например, его можно спросить, почему в сказке про колобка лиса съела колобка, и GigaChat как рассудительный ребёнок, выдаёт очень правдоподобное объяснение лиса съела колобка, потому что она была голо.
91: Лиса не была злой, она просто хотела есть. Кроме того, колобок был достаточно большим, чтобы утолить голод лисы на долгое время. Мне кажется, это просто прекрасно. Ну и, конечно, изображение GigaChat сегодня умеет рис.
92: И делает он это благодаря интеграции с моделью Кандинский для генерации изображений и, собственно, давайте именно про генерацию изображений сейчас и поговорим под капотом у генеративных.
93: Нейронных сетей для работы с изображениями диффузионные модели. Но не бойтесь, мы сейчас не будем вдаваться в эту страшную формулу. Она пугает даже меня после 6 курсов механико математического факультета мгу. Скажу лишь, что в
94: Основной своей идеи диффузионных моделей лежит идея, расшумление данных, а именно при обучении модели мы обучаем нейронную сеть на картинках с подробным текстовым описанием, и при обучении мы в начале зашумляет картин.
95: А потом учим нейронную сеть из зашумлённого изображения восстанавливать по промту исходное изображение, и таким образом, нейронные сети из хаоса, можно сказать, из шума, учатся.
96: Генерировать те шедевры, которые сегодня видим мы, например нейронная сеть my journey, про которую вы наверняка слышали, может рисовать сказочные прекрасные изображения, а иногда поражает нас своей реалистичностью.
97: Или же мы обучаем нейронную сеть Кандинский, которая создаёт прекрасные картины по текстовому описанию. Например, на слайде вы можете видеть астронавта среди астероидов в бело голубом скафандре изображение с
98: Высокой детализации в стиле цифрового. Кандинский также доступен в боте. Мне это очень, очень нравятся, те изображения. Он генерирует. Например, здесь я попросила его
99: Искусства.
100: Нравится и мне.
101: Которые
102: Высокой детализации в стиле цифрового искусства. Кандинский также доступен в боте. Мне это очень нравится, и мне очень нравятся те изображения, которые он генерирует. Например, здесь я попросила его
103: Генерировать мой портрет у него также есть возможность как раз-таки перерисовки фотографии, которые я использовала для генерации этого портрета, вариации картинки, и, соответственно, благодаря этому Кандинский способен
104: Например, накладывать стиль берём, накладываем на девочку вот такого вот стиля и получаем портрет девочки в стиле гжели можем наложить на старый трамвай стиль техно и получить современный поезд.
105: Ещё ряд красивых примеров того, как мы можем наложить стиль уже в виде текстового описания. Вот можем попросить раскрасить вазу в стиле джелли или взять
106: И перерисовать пейзаж в стиле раскраски для детей.
107: Кондинский также умеет варьировать изображение. Мне это нравится, особенно когда есть какая-то картинка, которую хочется чуть чуть поменять. Я часто использую это, например, для каких-то постов, для создания контента. Так, ска.
108: Казать и вообще получаются очень милые, забавные картинки, на которые приятно посмотреть.
109: Давайте с текстами, мы с вами поняли, что сегодня не так-то просто убедиться, где.
110: Действительно, человек, а где нейронная сеть? Давайте посмотрим, сможем ли мы угадать, где здесь машина, созданная кандинским, а какую создал человек, нарисовал точнее.
111: Загадайте про себя. А я сейчас покажу правильный ответ. Собственно, Кандинский нарисовал машину слева. Мне кажется, здесь выдаёт отсутствие логотипа в человеке. Кандинский скорее нарисует логотип у машины, потому что ему так привычнее. У всех машин есть логотип.
112: Типа, а значит, Кандинский считает, что у машины всегда должен быть логотип и машина без логотипа. Это как раз-таки то, что-то отклонение от нормы, которое может позволить себе человек.
113: Ещё 1 пример опять-таки загадайте, что есть Кандинский и правильный ответ. Человек здесь слева.
114: Lost блокнот, лист, генерация видео ещё пару лет назад генерация видео была лишь в зачаточном стиле, но сегодня опять-таки благодаря росту вычислительных мощностей мы видим в этой области существенный прорыв.
115: Кандинский, например, умеет генерировать достаточно хорошую анимацию, и генерация этой анимации доступна сегодня в боте, она так и называется Кандинский видео опять-таки кому интересно, отсканируйте QR-код и собственно.
116: Попробовать сгенерировать какой-нибудь небольшой видеоролик.
117: И новый уровень в области генерации. Видео это модель ссора, которая появилась в начале этого года. Это модель, которая по текстовому описанию генерирует невероятные видео, поражающие своей
118: И графичностью, реалистичностью. И давайте посмотрим несколько примеров генерации ссора.
119: Например, это очень милый хомяк, и обратите внимание, как, естественно, за плывущей доской поднимаются волны.
120: А вот это вообще милашка. Он такой милый, что можно сразу брать и снимать мультик, моя любимая.
121: Можем посмотреть, как бегут мамонты.
122: И как человек рисует картину, обратите внимание, когда кисточка касается бумаги, остаются следы, и, казалось бы, такая естественная причинно следственная связь вовсе не очевидна для нейронной сети. Нам это известно из повседневного опыта, но.
123: В целом это ниоткуда не следует, и очень интересно, что, обучаясь на огромных корпусах текстов, нейронная сеть выучивает собственно, то, что по прикосновению кисточки мы должны оставлять.
124: Штрих на бумаге то что если нога мамонта наступает на снег, то поднимаются Фонтаны снежные, которые идут следом за мамонтом, безусловно, пока ещё нейронные сети допускают.
125: В таких моментах ошибки, например, бывает такое, что при генерации человек кусает яблоко, а следа от надкуса на самом яблоке не остаётся, но опять-таки месяц от месяца я бы даже не сказала, что год от года, месяц от месяца.
126: Собственно, качество становится все лучше, и уже очень скоро, кажется, мы сможем создавать себе цифровые видео миры, быть там творцами сюжета и, собственно, генерировать очень много с помощью
127: Вот давайте, кстати, посмотрим о неидеальности нейронных сетей в этом видео. Смотрим внимательно, да?
128: Все хорошо, но что-то не так с лапкой. То есть обратите внимание, на самом деле, если смотреть в полглаза, то можно даже не заметить. Ну, нейронной сети. Здесь есть явная проблема с лапкой. Смотрим на правую лапку кота.
129: Оп, оп, оп, когда замечаешь, становится страшно. Эффект. Ой ой, забыла, какой долины. Но в начале думаешь, да, вроде все хорошо и бывает так. Ещё когда 1 раз посмотрела это видео.
130: Я на самом деле.
131: Оп, оп, оп, когда замечаешь, становится страшно. Эффект. Ой, ой, забыла, какой долины. Но в начале думаешь, да, вроде все хорошо и бывает так. Ещё я на самом деле, когда 1 раз посмотрела это видео,
132: У меня мозг на подсознательном уровне заметил, что что-то не то, но я не поняла, что и вроде как красивое видео, но немножечко страшно. Это очень забавно. На самом деле, как нейронные сети генерируют что-то псевдо возможно, которое
133: Выглядит очень реалистично на 1 взгляд. Собственно, что же нас ждёт дальше, предсказать сложно. Мир меняется буквально неделя от недели, день ото дня. Но 1 можно сказать точно мы живём сегодня в
134: Очень классное время будет интересно и в области iii нас ждёт ещё большой большой прогресс что ж, на этом, на сегодня все, если у вас есть какие-то вопросы.
135: Очень классное время будет интересно и в области iii нас ждёт ещё большой большой прогресс что ж, на этом, на сегодня все, если у вас есть какие-то вопросы, может
136: Их задать у меня есть telegram канал машка дейта сайнс, там я рассказывала про data science жизнь в it делюсь какими-то интересными вещами из области генеративного искусственного интеллекта, про который я расска.
137: Сейчас и я думаю туда я обязательно выложу презентацию, так что если вы не успели отсканировать все QR коды например а вам бы хотелось запоминайте главное вот этот подписывайтесь на меня и будем с вами на связи.
138: Что ж, если вопросов нет, то большое вам спасибо, что подключились. Спасибо, что были со мной на этом вебинаре. Всем тогда хорошего вечера. Всем пока, пока.