ym104432846
Вставьте ссылку на видео из Youtube, Rutube, VK видео
Задайте вопрос по видео
Что вас интересует?
00:01:17
Автоматизация экспертизы проектной документации:
  • 1. Компания Нанософт занимается разработкой системы автоматизированного проектирования (платформа Нанокат), а также специализированных решений для BIM-технологий и созданием баз нормативных документов
  • 2. Для переработки нормативных документов используется технология искусственного интеллекта, включая машинное обучение и глубокие нейронные сети, позволяющие автоматизировать обработку и экспертизу проектной документации
  • 3. Разработаны пять модулей искусственного интеллекта, направленные на ускорение поиска и анализа информации, а также автоматизацию экспертизы проектной документации
00:21:12
Семантическая разметка нормативных документов:
  • Разработан инструмент (модуль семантической разметки), позволяющий автоматически выделять самостоятельные нормативные положения и классифицировать их по классификатору строительной информации
  • Создан второй инструмент — простая веб-среда, предназначенная для разработки текста стандарта, проведения этапа публичного обсуждения и выделения границ нормативных положений
  • Предложена поисковая система, позволяющая находить отдельные нормативные положения по заданным критериям, таким как тип объекта строительства или дата действия документа
00:28:21
Модуль семантического поиска и анализа:
  • Разработан модуль семантического поиска, объединяющий чат с искусственным интеллектом и генерационную модель ЛЛМ (большая языковая модель), осуществляющий быстрый поиск нормативных документов и формирование ответов на основе найденной информации
  • Система позволяет загружать собственные документы и извлекать из них текстовые фрагменты, которые затем обрабатываются и добавляются в общую базу знаний
  • Пользователи могут изменять настройки генерации ответов, включая температуру и шаблоны, а также самостоятельно загружать и редактировать документы для последующего анализа и получения ответов
00:40:29
Применение искусственного интеллекта в проверке проектной документации:
  • Разработан метод API для реализации функционала поиска противоречий в документах
  • Создан модуль семантического анализа, позволяющий находить противоречия и несоответствия в проектной документации
  • Предложено создание мультиагентного сервиса, включающего несколько языковых моделей, работающих параллельно для повышения точности анализа и минимизации количества ложных результатов
00:58:28
Машинопонятные требования и цифровые информационные модели:
  • 1. Разработан механизм автоматизированной оценки соответствия цифровых информационных моделей нормативным требованиям на основе машино-понимаемых форматов
  • 2. Создано приложение (модуль), позволяющее автоматически разбивать документы на фрагменты и классифицировать их для формирования наполнения модулей требований и стандартов
  • 3. Организована работа по интеграции с различными системами BIM-агрегаторов (например, Calib Model Archive, Tangle Control, NanoCAD) для обеспечения совместной работы и обмена правилами проверок
0: Коллеги, всем добрый день.
1: Скажите, пожалуйста, технические моменты слышно меня или видно, а может и слышно, и видно плюсики в чат огонёчек.
2: Чтобы быть уверенным. Так, огонёчек, вижу, есть огоньки. Замечательно замечательно. Итак, у нас пока ещё не все участники, зарегистрировавшиеся на вебинар, присоединились, поэтому немного потянем время в самом начале и
3: Поговорим про вводную часть. Сегодня я не 1 выступаю со мной. Коллеги из нанософт. Кто, собственно, выделили время подключиться и рассказать о своих наработках в центре.
4: Внимание, у нас сегодня искусственный интеллект. Куда же без него, собственно, поговорим мы про 2 темы, которые касаются как раз процессов проектирования. То есть это автоматизация экспертизы цифровых информацион.
5: Моделей, а также проект проверка проектной документации и рабочей документации на соответствие действующим, а можно и не действующим нормативным требованиям. Тут уже как это задача стоит. Собственно, почему я в вебинаре, потому
6: Что проходим на площадке технониколь. Я сейчас, конечно, коллегам основное слово передам. Зовут меня путовой Сергей. Буду стараться модерировать данные вебинары, отвечать за технические моменты и вопросы в чате.
7: Чтобы основных спикеров меньше отвлекать орг, вопросы, собственно, они у нас из вебинар вебинар не меняются. Также нужно быть активным в чате понятно, что конец рабочей недели и близится завершение ра.
8: Рабочего дня силы потрачены. Давайте их найдём на то, чтобы написать вопросы, а может даже и не вопросы в чате, какие-то свои размышления в части того доклада, который будет сейчас вам, вам про
9: Демонстрирован и поделиться своим мнением. Как показывает практика, в целом вопросы просим задавать вкладку вопросы, но они всегда находятся во вкладке чаты, поэтому жёстко не возбраняется. Где идея пришла, там, собственно, её и
10: Записываем, я все перенесу вопрос и подробно расскажем, покажем. Ну, прокомментируем. Если как бы какие-то моменты будут до конца не раскрыты, в любом случае есть контакты участников, кто вопрос задаёт, мы
11: Связываемся потом и развёрнуто до отвечаем тему, которая может быть не раскрыта. И, собственно, по самому докладу, как мы решили разбить презентацию, мы расска.
12: Наверное, от начала до конца основной блок, чтобы не терять связь, потому что на вопросах можно философски, наверное, уйти в сторону, рассказать ещё 1 вебинар, соответственно, материал расскажем от и до, а потом в конце.
13: Пообсуждаем, собственно ваши вопросы и подискутируем на тему применения. И да, что касается записи коллеги, она у нас уже ведётся всем участникам вебинара по итогу тот же день.
14: Приходит она или же на следующий день после мероприятия на почту ссылка с записью, а также сама презентация презентация в целом вам уже доступна для скачивания в правом верхнем углу у нас есть такая иконка, файлики и презентация в формате pdf.
15: Собственно, будет доступно. Но пока не скачивайте. Давайте смотреть живую демонстрацию на этом. Свою небольшую часть. Собственно, я заканчиваю. Ольга. Коллеги, передаю вам слово огромное. Спасибо, Сергей. Огромное спасибо за
16: Возможность выступить на вашей площадке? Да, меня зовут Кутузова Ольга. Я представляю компанию нанософт, направление, которое называется нр. Specification. Я сегодня с вами буду не 1 со мной. Моя поддержка.
17: Вот Карина Еналиева, Вероника Полянская, которые помогут мне вживую показать инструменты, которые разрабатываются в рамках направления на специфике. Сейчас я хочу переключить презентацию, да.
18: Сейчас, 1 секундочку на свой экран тыдынь. И очень надеюсь, то, что мой экран стал вам виден. Вот это я сделала для того, чтобы мне было комфортнее управлять, управлять действием. Итак, компания на
19: Нанософт всем, наверное, известно по тому, что мы разрабатываем систему автоматизированного проектирования вот платформу нано кат кроме платформы нано кат компания нанософт разрабатывает ещё i beam решений.
20: Я вертикальные решения, которые работают на платформе нанокад. У нас есть программные продукты для создания цифровых информационных моделей. Конструктивная часть, инженерные сети есть часть для
21: Создание гео планов. Вот. И недавно у нас появилось ещё и архитектурное бим приложение. Вот наконец то, но помимо системы автоматизированного проектирования компания нанософт долгое время занималась ещё и
22: И разработкой базы с нормативными документами, нормативными документами, которые должны применяться и при проектировании, строительстве, и для там различных производственных процессов, промышленных в 1 прекрасный момент.
23: Стала очень популярна идея о том, что нормативные документы, они должны не просто лежать стопочкой на столах инженеров, они должны работать и должны автоматизировать работу проектиро.
24: Вот эта вот идея, которая стала популярна не только в России, но и в мире, все это, ну, это мировая практика именно стартанула процесс эволюции стандартов и была впервые
25: Вроде бы в 2016 году опубликована схема эволюции стандартов, согласно которой документы должны были эволюционировать сперва в машиночитаемый вид, потом в машино понимаемый вид. На самом деле в первоначальной схеме фигурировал термин.
26: Машино интерпретируемости, но не суть важно, я так думаю, среди подключившихся участников многие из вас слышали вот подобные термины машиночитаемость, машино понимаемость. И у многих, ну, возникает иногда непонимание о том,
27: Зачем это нужно? Почему оно нужно? Вот у нас, у компании нанософт, которые занимались разработкой базы с нормативными документами, тоже сперва было непонимание того, зачем это нужно и как стандарты сделать работающими. А потом мы решили себя
28: Пробовать в этой области и занялись мы цифровизацией стандартов. Мы для себя поставили 2 очень глобальные, очень важные цели. 1 цель это минимизировать
29: Возможности ошибки на этапе проектирования, которые очень часто связаны с тем, что информацию в нормативных документах искать сложно, долго и очень сложно, анализировать нормативные требования, которые подчас противоречат друг другу.
30: Или содержит какие-то неполные данные. А во вторых, мы поставили для себя цель сделать стандарты работающими для того, чтобы можно было автоматизировать и процесс экспертизы итога работы проектировщика, то есть проектную про
31: Функцию и цифровую информационную модель и проектную документацию. И, может быть когда-нибудь у нас ещё получится даже автоматизировать с помощью этих работающих стандартов процесс проектирования. Вот 2 глобальные
32: Цели у нас есть в арсенале, но для этого, повторюсь, нам необходимо перерабатывать нормативные документы. Так вот в чем заключается вообще этот процесс переработки нормативных документов, который был заявлен международной организацией.
33: По стандартизации в своей схеме эволюции стандартов вы видите на схеме, но я, как всегда, буду показывать на пальцах. У нас есть текст стандарта какой-нибудь свод правил, который раньше назывался снип. Вот в этом тексте содержится норматив
34: Тивные положения. И 1, что нужно сделать с этим документом для того, чтобы, ну, информацию из него было легче обрабатывать, его, необходимо разделить на смысловые кусочки отдельных нормативных положений так, чтобы каждое нормативное положение
35: Было самостоятельно по смыслу и отделено друг от друга отдельной единицей так вот, в таком виде документ считается машиночитаемым, то есть машиночитаемый текст это просто структурированная информа.
36: Где каждая отдельный блок, ну, обладает своим единым смыслом. Дальше, если у нас есть несколько документов, которые мы разделили на смысловые кусочки, то можно каждый смысловой кусочек обвязать какой-то систем.
37: Тегов или классификационных кодов. Зачем это нужно затем, чтобы нормативные положения поняли свои связи не только в рамках 1 документа, но и в рамках целой базы. И вот это считается машиночитаемым контентом, то есть ба.
38: Классифицированных нормативных положений. В таком виде нормативные положения уже очень существенно помогут проектировщику быстрее искать информацию, быстрее её анализировать, но для того, чтобы нормативные положения заработали без уче.
39: Участие человека нужно взять отдельные нормативные положения, которые содержат в себе какую-то конкретную информацию по критериям оценки элементов, ну, допустим, требования к высоте, к ширине, к площади, требования к наличию каких-то
40: Объектов и вот эти вот требования переработать, переписать с человеческого языка на язык какого-то программного сценария, который можно загружать в сапор в среду проектирования, можно загружать в бим агрегаторы, ну
41: И проводить автоматическую оценку соответствия требованиям стандартов своей проектной продукции. Вот переведённый в вид программного сценария нормативное требование, оно является машино понимаемым
42: Все перечисленные сейчас мной этапы, по идее, можно делать и вручную, но это не очень эффективно, потому что документов нормативных в области строительства только их крайне много, их больше 1000. И этот information
43: Massive, он регулярно изменяется, постоянно появляются какие-то изменения, обновления, одни документы утрачивают силу, возникают новые. Поэтому, конечно же, нужна автоматизация, причём это автоматизация обработки нормативных документов, которые
44: Подчас, ну, не стандартизируется какими-то, ну, обычными средствами. То есть нам необходимо нечто, какой-то инструмент, который был бы достаточно гибок для обработки разнообразных нормативных требований из разнообразных документов. Мы
45: Мы все-таки занимаемся it сферой, и мы решили использовать технологию искусственный интеллект, создавая инструменты для обработки текстов нормативных документов, причём мы начинали работу ещё 6 лет назад.
46: Когда ii не был, так у всех на слуху это ещё, ну, можно сказать, не было мейнстримом так вот, 1, о чем мне хочется с вами поговорить, точнее, о чем хочется рассказать, это о том, что вообще
47: Чем означает такое вот понятие искусственный интеллект обычно, когда, ну, сейчас люди, там специалисты заговаривают об искусственном интеллекте, они подразумевают, ну, стандартный образ чата gpt или какого-нибудь
48: Китайской, там deep сик квен какой-нибудь большой языковой модели, то есть некий чат, где можно поговорить, задать вопросы и получить ответы. Так вот, искусственный интеллект это на самом деле область, которая намного шире
49: И искусственный интеллект в своей основе, это машинное обучение. Я, конечно же, сразу очень извинюсь за слушателями, перед слушателями, которые, ну, прекрасно знают.
50: О том, что такое машинное обучение, потому что я сейчас хочу рассказать очень упрощённую свою интерпретацию, вот буквально показав на пальцах, но очень надеюсь то, что это будет полезно для тех, кому искусственный интеллект крайне интересен, но совершенно непонятен, что
51: Такое машинное обучение. Допустим, у нас есть задача. У нас есть картинки, на которых изображены кошки и собаки. И есть у нас задача автоматически сортировать, где кошка, а где собака изображена автоматически сортиро.
52: Картинки. План 1 путь 1 это взять, эти картинки отметить, там какие ушки обычно у собак, какие ушки обычно у кошек, какие глазки у собак, какие глазки у кошек, у кого какая форма черепа.
53: Вот после этого написать программу для компьютера. На какие вот метки нужно обращать внимание, классифицируя изображение. Вот это не машинное обучение, машинное обучение. Это когда у нас есть
54: Фотографии кошек и собак. Мы делаем отметки, на что обращать внимание, где, какие уши, где какие глаза. Вот, и у нас есть уже результат. То есть картинки, где подписано, кто кошка, а кто собака.
55: И мы это все загружаем куда-то. И вот это куда-то самостоятельно для себя пишет программу, основываясь на исходных данных. То есть до и после оно знает до и после, а программа пишется самостоятельно. Вот это очень
56: Упрощённом виде машинное обучение с учителем. То есть у нас есть размеченная информация. Мы знаем, какой будет результат. И программа возникает самостоятельно. Существует область крайне важная, которая как бы вытекает из области
57: Машинного обучения она называется глубокое обучение deep learning так вот что из себя представляет глубокое обучение это не 1 программа, это многослойные нейронные сети, они по своему взаимо.
58: Действия очень напоминают работу человеческого мозга, и суть заключается в том, что загружено огромное количество фотографий, кошек и собак. И вот эти многослойные нейронные сети, они самостоятельно анализи
59: Информацию ищут там закономерности и выдают результат, где, кто изображён. Вот для того, чтобы этот процесс глубокого обучения проходил, необходимы совершенно чудовищные мощности по
60: По энергии и по оборудованию. Те чаты gpt, которыми мы с вами все пользуемся, они как бы вытекают из глубокого обучения. Суть Гене.
61: Генеративных моделей, которые, по сути, вот чат gpt это генеративная модель, модель трансформер. Суть её заключается в том, что она самостоятельно умеет создавать фотографии кошек и собак на основе той информации, которой она была обучена на этапе глубокого обуче.
62: Так вот, областей и на самом деле ещё больше существуют методы обработки естественных Языков энэлпи, нейчерал, ленинг, процессен так вот, методы обработки естественных язык.
63: Это вот все тоже самое, что я рассказала про кошек и собак только для текста, который написан на естественном языке. Там тоже нужно искать смысл, искать закономерности и, ну, понимать, что вообще в этом тексте какое значение есть.
64: Из глубокого обучения как бы вытекает компьютерное зрение, которое одновременно является и под отраслью глубокого обучения и машинного обучения. Компьютерное зрение это, ну, тоже самое распознание там, человеческих лиц, эмоций, это все
65: Ну, вытекает из глубокого обучения. Существует ещё, допустим, оптическое распознание символов оцр. Это автоматическое распознание текста и его смысла из картинки, вот это
66: Вот область ii, она включает в себя и элементы компьютерного зрения, и методы обработки естественных Языков областей ии на самом деле ещё больше, чем вот здесь у меня представлено вот, но мне хотелось бы на этом.
67: Моменте остановиться и продолжить. Я уже, ну, начала эту мысль. Такое вот глобальное заблуждение о том, что внедрение искусственного интеллекта, оно будет экономить ресурсы
68: На самом деле, искусственный интеллект это дико затратная по энергии вещь. Огромное количество ресурсов занимает и тратится на обучение моделей. Вот глубокое обучение, особенно вот.
69: Эксплуатация, то есть использование генеративной любой модели, которая создаёт какие-то тексты или изображения, ну, создаёт какие-то объекты на основе полученного обучения. Это тоже высокое энергопотребление, ну естественно высокое энерго.
70: Потребление, оно напрямую зависит от оборудования. То есть это что-то должно потреблять энергию, потребляют энергию, видеокарты. Вот это основная, так сказать, на них лежит нагрузка и видеокарты для работы, ну, любых компо.
71: С искусственным интеллектом нужны очень мощные, очень хорошие. Вот они очень будут дорого стоить. А самая большая беда заключается в том, что эти видеокарты, они вот после такого использования, они очень быстро устареют.
72: И станут, ну, нерабочими. То есть срок службы видеокарты, которую использует, допустим, генеративная модель. Это может быть год 2. Конечно же, все зависит от там количества параметров генеративной модели. Ну, вот, среднее
73: Средние модели это год, 2 видеокарты и все. Ей наступит конец. Я это все к чему? К тому, что мы решаем с помощью технологии. Искусственный интеллект, такие
74: Очень узкоспециализированные инженерные задачи, мы не можем для решения этих задач применять там, ну, напрямую, там чат gpt, он очень хорош для решения бытовых вопросов, но для инженерных задач нам нужна более гибкая настройка. И вот
75: Выбирая какие-то компоненты с искусственным интеллектом и выбирая настройки этих компонентов, мы должны ориентироваться не только на то, насколько компонент нам подходит, но ещё и на то, что мы это просто сможем. Так ска,
76: Обеспечить энергией и оборудованием. И вот глубокое обучение. Повторюсь, самое большое требование генеративные модели поменьше. Так вот, из всего, что я перечислила на данный момент для
77: Задач обработки нормативных требований, которые решает направление Насер специфике н, используются компоненты машинного обучения, используются методы обработки естественных Языков нлпи. И также мы используем все-таки
78: Генеративные модели, модели трансформера. Берём мы опенсорсные модели, которые в большом количестве сейчас новые и новые публикуются на свободных ресурсах. Вот делаем для них обвязки для улучшения точности работы и для более
79: Качественного результата в данный момент не специфике. Это, повторюсь, 2 цели. Мы решаем быстрее искать информацию, её анализировать и цель автоматизации экспертизы и процесса проектиро,
80: 3 области искусственного интеллекта. И сейчас у нас уже разработано 5 отдельных модулей, которые могут и самостоятельно работать, ну и прекрасно взаимодействовать друг с другом.
81: В комплексе первые 3 модуля, модуль разработки документов, модуль семантической разметки документов и модуль требований. Это модули, которые были разработаны нами ещё 3 года назад. Вот.
82: Модуль семантического поиска, модуль семантического анализа. Сегодня в основном будем говорить о них. Это наши новички, которые мы выпустили, показали рынку буквально несколько месяцев назад. 1 октября у них была дата релиза, но
83: Перехожу уже поближе к сути, к тем решениям, которые создаются, какие там есть проблемы и задачи, очень короткий блок, но все-таки стоит рассказать, что как вообще происходит выделение отдельных нормативных
84: Положений в тексте стандартов, которые были опубликованы нашими официальными организациями. У нас есть сейчас инструмент, в котором действуют компоненты с искусственным интеллектом. Ну, фактически это чанкер, которые выделяются
85: Самостоятельные по смыслу нормативные положения, они подсказывают границы нормативных положений в тексте в этом же инструменте он называется модуль семантической разметки действует ещё и bird подобная модель.
86: Которая для каждого нормативного положения предсказывает классификационные коды, классификационные коды по классификатору строительной информации. Вот, да, если кто-то о нём слышал, то, скорее всего, слышал о том, что с класси
87: Катором строительной информации, есть огромное количество. Ну, нехорошо говорить проблем. Есть у него большое количество особенностей применения и вопросов к его применению, но нам деваться некуда. Это все-таки единственное классификатор, который, ну, заявлен
88: Как обязательное к применению в нашем государстве поэтому мы применяем именно xxi так вот, модуль семантической разметки, выделение нормативных положений и классификация нормативных положений для того, чтобы они понимали свои связи друг с друго.
89: Дальше есть ещё 1 инструмент. Вот здесь никакого искусственного интеллекта нет, это просто веб среда, где можно разрабатывать текст стандарта, где можно проводить этап публичного обсуждения и там тоже можно выделять
90: Границы нормативных положений. Таким образом мы получаем 3 решение наше это самое такое главное окно входа проектировщика, оно называется модуль требований, это инструмент, где хранят
91: Кусочки нормативных положений. Так вот в чем фишка вообще подобного решения и зачем это надо? Я хотела бы все-таки показать вам на практике. И надеюсь, все получилось. Мы с вами переме
92: Пустились. Модуль требований. Энсер. Специфике шен. Так вот какое принципиальное отличие поиска информации по сравнению с поиском отдельных документов. Мы, допустим, нас очень интересуют требования к лестницам 3 типа. Вот мы
93: Берём и пишем лестницы. А вот подсказочка есть лестницы 3 типа, да, мы ещё можем установить дату поиска по умолчанию. Дата текущего дня. Каждое нормативное положение знает дату своего действия. Мы
94: Нажимаем искать. И вот поиск осуществился и мы нашли не целые документы, мы нашли отдельные кусочки нормативных положений, которые что-то говорят про лестницы 3 типа у каждого нормативного положения.
95: Есть информация об источнике, с которой можно ознакомиться вот если очень захотелось открыть полный текст, то вот есть ссылки для перехода к системам норм cs или техэксперт, но это делать совершенно не обязательно 2 сценарий.
96: У нас, допустим, есть целый проект проект. Мы сейчас проектируем больницу, и нам нужно подобрать нормативные положения, которые нужно соблюдать при проектировании больниц. Для этого мы используем поиск по
97: Кодам классификатора строительной информации. У каждого нормативного положения есть коды, которые напрямую соответствуют тексту, и коды, которые соответствуют области применения нормативного положения. И вот мы заходим в поиск по
98: Там классификатора строительной информации. Вводим больница, осуще находим код классификационный из xxi для больниц общего профиля нажимаем применить и тадам 230 норм.
99: Нормативных положений, которые нужно соблюдать при проектировании больниц. Допустим, из этого массива нас интересуют только те требования, которые нужно применять для проектирования лестниц в больнице.
100: Мы пишем здесь лестница и повторяем поиск, и в результате у нас остаётся всего 8, но все-таки требования к лестницам, которые нужно соблюдать именно при проектировании.
101: Больниц. Плюс к этому всему. Здесь же можно для себя создавать подборки, подборки нормативных положений, вот, допустим, актуальных при проектировании школы в подборках каждое требование
102: Оно помнит срок своего действия, и если возникают какие-то заменяющие, прошу прощения, редакции, вот можно щёлкнуть заменяющие требования и посмотреть на новую редакцию уже действующего нормативного положения.
103: Вот, собственно говоря, и все просто поисковая система, где удобно искать кусочки нормативных положений. Меня Сергей ещё отдельно попросил показать связь вот этой вот базы нормативных положений с сапор средой на накат. У нас есть цифровая
104: Информационная модель, она небольшая, это инженерная моделька с конструктивной частью. Вот. И здесь есть различные элементы сваи, колонны. Вот нам надо подобрать нормативные положения для этих элементов. Мы прямо в среди
105: Проектирование прямо в нанокаде. Нажимаем кнопку искать все объекты, которые есть в модели, они разбиваются по группам и вот у нас группы объектов формируются. Вот, допустим, колонна, мы выбираем колонны в
106: Этот момент запрос из нано, када уходит в модуль требований. И мы видим, в результате получили мы отклик, нормативные требования к колоннам, которые проектировщику желательно знать, если он занимается проектированием именно этих элем.
107: Вот эта вот штука, она работает на накате уже 4 года. Точно как так вот мы возвращаемся к презентации и 1 секундочку в сухом остатке, что я вам сейчас показала, что
108: Перевод документов в машиночитаемый вид даёт возможность быстрее подбирать требования по ключевым словам, по кодам классификатора можно создавать чек листы и даже можно интегрировать эту систему требова.
109: Со средой проектирования, чтобы, не выходя из своего основного рабочего инструмента, получать подсказки нормативных требований. Но я быстрее хочу этот момент пройти, потому что мы вас пригласили на искусственный интеллект, а здесь
110: Довольно немного, да, мы переходим к искусственному интеллекту. Нужна все-таки автоматизация анализа и применения требований при проектировании, поэтому мы не стали ограничиваться уже разработанными инструментами и
111: Вот выпускаем сейчас нашу новую разработку, которая имеет сложное, страшное название. Модуль семантического поиска. За этим страшным названием кроется привычный на самом деле многим из вас.
112: Чат с искусственным интеллектом. Принцип работы здесь довольно простой. У нас есть вопрос, который потенциально содержится в тексте нормативных положений. Минимальная площадь квартиры, допустим, в момент, когда мы задаём этот
113: Вопрос осуществляется моментальный поиск нормативных положений, которые потенциально содержат ответ на вопрос пользователя, а дальше они группкой отдаются уже генеративной модели ллм большой языковой модели и
114: Языковая модель, она работает по инструкции, она должна ответить на вопрос пользователя, используя только ту информацию, которая есть в найденных нормативных фрагментах и формируется уже итоговый ответ.
115: Продвинутые слушатели должны догадаться, что речь идёт о раг системе рак система это генерация ответа, дополненная поиском вот, но rock система сейчас на самом.
116: Деле есть готовые уже компоненты рак, вот, которые можно скачивать, использовать, но для того, чтобы работать со специфической информацией в нормативных документах необходим продвинутый рак, и мы считаем, что мы
117: Для себя сделали продвинутый рак, попытаюсь вам это доказать. Есть критика, глобальная критика, рак системы, она заключается в том, что работая с отдельными кусочками,
118: Нормативных положений, мы теряем контекст, то есть не понимаем общий смысл документа, из которого извлечён этот кусок. И это действительно так, как мы пытаемся решить эту проблему, мы
119: В нашу рак систему загружаем не просто кусочки нормативных положений, а кусочки нормативных положений, связанные со своими структурными элементами, то есть связь идёт с наименованием подраздела раздела наименованием.
120: Документа, области применения документа. Вот эта вся информация, она тоже учитывается при осуществлении поиска. Таким образом мы пытаемся сохранить контекст. Фактически у нас сейчас работает даже не векторный поиск, то есть не 1.
121: Смысловой вектор по тексту требования мы строим мы строим 4 вектора, 2 вектора на текст требования это смысловой и лексический, полнотекстовый, и 2 вектора на метаинформацию, то есть раздел подраз.
122: Дела, наименование документа, область применения, разное ранжирование есть у этих векторов, то есть они по разному учитываются при выдаче результата, но учитываются в обязательном порядке. Все.
123: Помимо этого, у нас работает ещё и дополнительная сортировка найденных фрагментов. Это режим реранкинг дополнительного ранжирования найденных фрагментов. Он работает благодаря ллм, то есть лм. Боль.
124: Языковая модель, она ещё оценивает найденные нормативные требования, насколько они по смыслу соответствуют вообще. Ну, необходимости ответа. Дальше у нас есть дополни.
125: Настройки генерации ответа мы вывели в пользовательский интерфейс возможность настраивать топ топ к это стандартные параметры настройки больших языковых моделей плюс настройка, температура и, конечно же, са.
126: Скрытые инструкции, вот эти вот шаблоны, которые используются при ответе на вопрос пользователя базовый шаблон, это ответить на вопрос пользователя. Используя информацию в найденных фрагментах, можно усложнять. Можно.
127: Допустим, ну здесь это большой такой область для творчества промт инженера можно там хвалить, там говорить, ты технический помощник, ты точно все можешь. Вот можно ругать, мы, у нас очень хорошо срабаты.
128: Prompt инструкция, где в конце мы обещали 1 000 000 $ за хорошие ответы и наказание за плохие ответы, но отказались мы от этого промта, потому что в 1 прекрасный момент у нас наш.
129: Инструмент. Наш модуль семантического поиска стал требовать денег. Он говорит, ну я же хорошо отвечаю, поэтому вот где мой 1 000 000 $, мы решили то, что пользователей это испугает, поэтому срочно поправили стандартные инструкции, но никто не запрещает пользователям
130: Самостоятельно экспериментировать и свои шаблоны, инструкции создавать и хранить их в модуле семантического поиска. Кроме этого у нас реализован ещё и режим диалога, если пользователь задаёт не очень корректный вопрос.
131: Вопрос общий, очень общий. То модуль семантического поиска может задавать уточняющие вопросы. Ну вот как в данном случае уточняется здание сооружение какое имеется ввиду, какая высота у этого
132: Здания, после чего собирается новый запрос для осуществления подбора нормативных положений и формулируется уже новый хороший ответ.
133: Да, это режим диалога. Ну, не только нормативная база может быть использована при ответе на вопросы пользователей. Вот можно ещё загружать собственные документы и
134: Эти документы, они извлекается из них текст. Этот текст делится на кусочки, эти кусочки векторизуется, поступают в векторную базу, и пользователь может задавать вопросы, получать ответы, форматы. Мы рассматриваем docx pdf.
135: С текстовым слоем пдфы без текстового слоя и даже pdf с текстовым слоем в аннотациях такое часто бывает при выгрузке из сапр, но я думаю, что слайды всех утомили, поэтому хотелось бы попросить.
136: Мне веронику полянскую вживую продемонстрировать. Модуль семантического поиска. Вероника, перехватывай у меня, пожалуйста, экран.
137: Так, перехватила. Добрый день, коллеги, мы сейчас с вами находимся в интерфейсе нашего чата. У нас есть здесь Тёмная тема и светлая.
138: Есть у нас здесь возможность задавать вопросы как по готовой базе, которую мы создавали сами база сп, либо можно задавать вопросы по вашим собственным документам. Также у нас
139: Как Ольга уже говорила, есть настройки генерации ответов и списки шаблонов. Мы сегодня попробуем задать вопрос, как с одними настройками, так и с другими. Вот.
140: 1 вопрос мы задаём. Какой диаметр должен быть у колодцев ещё раз? Это был у нас самый базовый шаблон. Ответить на вопрос, используя русский язык, сошлись на источник с температурой 0 3. Вот.
141: Мы получаем, соответственно, такой ответ. Получив ответ ответ, мы можем сразу перейти в модуль семантического поиска и посмотреть требования, по которому был дан ответ. Здесь можно
142: Сразу посмотреть всю информацию о документе, где содержится требования. Если это будет нужно, можно посмотреть всю информацию о классификаторе строительной информации, который здесь используется теперь.
143: Мы с вами попробуем задать тот же самый вопрос, однако, изменив настройки для начала я предлагаю повысить температуру ответа и изменить какой-нибудь скрытый шаблон. Вот возьмём технический помощник. Так?
144: Стройка у нас 1 и зададим тот же самый вопрос. Ещё раз проверка отправляем. Я вам показываю это для того, чтобы проверить, как у нас меня
145: Что у нас меняется в результате изменённых настроек. Сейчас подумают чуть чуть подольше. Это связано с тем, что мы увеличили температуру. Соответственно, система
146: Будет думать чуть чуть подольше. Вот мы уже получаем совершенно другой ответ. Он более развёрнутый, использовано
147: Достаточно много информации. Если мы вдруг хотим задать вопрос из собственной коллекции, для этого нам нужно её загрузить в систему. Мы добавляем коллекцию, даём ей название.
148: Например, показ ой, пишу на русском.
149: Показ 1. Загружаем файл, по которому хотим задавать вопросы. Сохраняем. Так. Затем мы
150: Можем открыть текст документа, здесь посмотреть, как он здесь отображается, при необходимости здесь можно поправить что-то удалить или подредактировать. После этого наш текст передаётся на фрагментацию.
151: Есть здесь настройка длины фрагментов, а также коэффициента отношения текста к общей длине фрагментов здесь самое важное проверить, насколько корректно был разбит текст, чтобы у нас не рвались фрагменты по середине.
152: Предложение, если нас все устраивает, мы сохраняем файл и отправляем его на синхронизацию. Как раз-таки в этот момент у нас происходит векторизация выделенных частей текста, то есть каждый
153: У нас фрагмент поступает в векторную базу. Затем мы должны выбрать нашу коллекцию, только что созданную. И по ней мы задаём вопрос. Вот, например, я хочу задать вопрос спосо.
154: Хранение типовых проектных решений.
155: Чуть чуть также подождём. Здесь у нас появляется 10 фрагментов самых релевантных
156: Вот мы получили ответ, что, согласно предоставленному контексту из бим стандарта, способ хранения и так далее.
157: Сейчас это все я передаю слово Ольге экран. Спасибо большое. Спасибо большое, Вероника. Мы к тебе ещё вернёмся. Ну.
158: Это такой базовый сценарий работы, когда можно задавать вопросы, получать ответы. И, да, очень интересный вариант, когда вы можете в этот чат загрузить, ну, вообще любую рак систему, если вы у себя там самостоятельно организуете, можно загружать. Собственны.
159: Инструкции, там, бухгалтерскую информацию, да, вообще все что угодно можно сделать там какой-то единый справочник компании, используя технологию, рак, то есть создание базы и одновременную работу поиска и генерацию ответов на
160: Новее найденных фрагментов, это не только наша фишка, это, ну, общая, так сказать, концепция, которую можно реализовывать и самостоятельно. Но есть ещё 1 сценарий, он довольно интересный. Мы же все-таки с вами заявили не только искус,
161: Интеллект. Мы ещё заявили автоматизацию, автоматизацию процесса проектирования и экспертиза, причём сказали о том, что можно что-то попробовать реализовать именно для проектной документации. Так вот, сценарий как раз для автомати.
162: Зации, поиска несоответствий, противоречий в тексте проектной документации. Надеюсь то, что вы успели осознать, что у нас есть база с нормативными требованиями, причём эти нормативные требования, они ещё и векторизованы.
163: Знаем их смысловой вектор и знаем смысловой вектор тех разделов, подразделов, к которым относятся эти нормативные фрагменты. С другой стороны, мы можем загружать в эту векторную базу свои собственные документы, ну, допустим,
164: Документацию какая-нибудь пояснительная записка или a ios там какое-нибудь текстовое описание так вот, можно реализовать сценарий, по которому каждому фрагменту собственного документа будут автоматически подобраны нормативные требо.
165: Похожие по смыслу, а дальше группкой, они будут отдаваться уже генеративной модели, которая будет работать не по инструкции ответа на вопрос, а по инструкции анализа фрагментов с целью.
166: Явление несоответствий и противоречий в итоге вердикт о том, что в пользовательском тексте противоречит требованиям нормативным.
167: Причём этот сценарий можно использовать при сравнении фрагментов 1 Тома проектной документации с другим томом проектной документации иногда бывает, что фрагменты могут противоречить друг другу там 1 проектировщик.
168: Одни данные записал другой другие, и они не бьются друг с другом вот можно сравнивать с базой нормативных требований, можно сравнивать по перечню типовых замечаний, можно проверять, чего нельзя делать, это по абстрактным замечаниям пытаться.
169: Проверить проектную свою документацию под абстрактными замечаниями. Я имею ввиду замечания, вроде описанные технологические решения не обеспечивают требования безопасности. Вот без всякой конкретики. Ну вот с таким пра,
170: Справляться сложно. Вот точнее справиться то можно и большая языковая модель справится. А вот результат будет так себе. Ему совершенно нельзя будет доверять. Здесь вот как раз есть примеры отчётов, которые мы получали рабо.
171: Работая с пользовательской документацией, хочу обратить ваше внимание вот на вот эту вот картинку, мы анализировали соответствие пояснительной записки фрагментов пояснительной записки с фрагментами иос и у нас в отчёте
172: Фигурировал конфликт 2 фрагментов из документов, причём в аннотации генеративная модель сказала, что 1 фрагмент текста указано в 1 фрагменте текста указано, что группа состоит из 4 скважин, ну и номер.
173: Позиции, тогда как в исходном тексте сказано, что группа состоит из 4 скважин. Это противоречие. Мы решили, что это галлюцинация. Вот, но потом особо внимательный, вроде бы это Вероника как раз была особо внимательна.
174: Обратила внимание то, что отличаются номера позиций, то есть в 1 фрагменте 0 5, в другом 0 4. Это действительно была опечатка. И сам клиент подтвердил то, что да, ну вот такой вот опечатка была допущена в исходном тексте даже такого ро,
175: Противоречия и несоответствия можно вылавливать, используя ту тот сценарий, о котором я вам только что рассказала, но самая большая тонкость заключается даже не в том, чтобы поймать реальное несоответствие и противоречие, а в том,
176: Чтобы по минимуму поймать ложные противоречия, ложные несоответствия. И вот для того, чтобы их количество минимизировать, нужно очень тонко подходить к процессу обработки пользовательских документ.
177: То есть нужно очень качественно извлекать текст, а иногда бывает проектная документация, там с переносами, которые в виде картинок существуют, из которой текст корректный. Ну, вычленить сложно, очень корректно, надо делить текст на смысловые кусочки, желательно ещё добавлять.
178: Метаинформацию, чтобы учитывать контекст, необходимо продолжить поиск универсальной хорошей инструкции. Вот у нас сейчас инструкция, там мы дополнили её примерами, она, ну, нам нравится, как она работает. Вот воз.
179: Можно ещё и следует организовать какой-то, устроить мультиагентный сервис, то есть несколько языковых моделей, чтобы они анализировали запрос и, ну, проводили двухступенчатую обработку анализа текстов проектной документа.
180: Допустим, при сравнении с нормативной базой, но вот это очень позитивная такая табличка. Мы ею гордимся, это в 1 из пилотных проектов, мы её смогли сделать, это, ну, клиент нам предоставил свои документы.
181: И мы искали противоречия с помощью искусственного интеллекта. А дальше эти противоречия мы передавали экспертам самой компании, чтобы они, ну, вынесли свой вердикт. Имеет это место, это противоречие.
182: На жизнь или не имеет. Так вот вот особенно было ценно это сравнение Тома проектной документации с базой нормативных документов и сказал, что 41 есть противоречие 38 из них было подтверждено экспертом, причём
183: Там даже были не все противоречия, которые экспертиза находила, вот там были противоречия. Ну, эксперт писал свои комментарии, что вот экспертиза не нашла, но мы потом на стройке испытывали проблемы, вот именно с
184: Данный именно с данной позицией. То есть это вполне реальный сценарий. И, наверное, стоит посмотреть вживую, как он работает. Вот я снова прошу веронику подключиться и показать вам вживую
185: Как проходит процесс анализа?
186: Да, для того, чтобы нам начать процедуру сравнения, нам нужно загрузить, соответственно, файл. Мы загружаем файл в наш чат.
187: I сохраняем наш файл вот таким образом выглядит это абсолютно всем знакомая проектная документация, выполненная по спдс.
188: С рамками, штампами. Сейчас мы посмотрим, как она отображается. Вот отображается она следующим образом. Все наше содержимое, оно превратилось в 1 большую таблицу.
189: Происходит как раз-таки из за наличия рамок. Для этого у нас предусмотрен функционал обрезки этих самых рамок. Мы его применяем и смотрим как у нас наш файл изменился. Вот теперь у нас появился
190: Достаточно адекватный текст, который можно дальше передать на разбиение. Мы его передаём, сохраняем и синхронизируем коллекцию.
191: Так как пока что мы проводим исследование для реализации сценария сравнения документов, у нас разработан метод апи, и сейчас этот функционал доступен именно через апи. Как, каким обра.
192: У нас реализуется поиск противоречий. У нас есть 2 коллекции коллекция праймери и коллекция секондари. Для каждой коллекции праймери ищется-ка, ну, в данном случае 1 наиболее релевантный фрагмент.
193: В коллекции праймери ой, в коллекции секонди, извините, и при помощи языковой модели выясняется, противоречат ли какие-либо из этих фрагментов фрагменту из коллекции праймери или нет в области запроса в коллекцию праймери.
194: Мы должны присвоить название основной коллекции, то есть коллекции, которую мы только что загружали. Однако есть важный момент. То название, которое мы с вами только что давали загружаемому документу. Это пользовательское название, а
195: Оно было сделано для удобства человека, а его реальное название, оно как бы отображается следующим образом. Оно отображается после 1 запуска коллекции и, соответственно, 2 коллекции мы даём название
196: Это у нас наша база сп. Сравнивать мы будем, соответственно, с ней.
197: Н 50 это количество фрагментов основной коллекции, для которых требуется найти противоречие. Также мы можем менять и к тоже ещё мы можем менять параметры самой
198: Model. Однако мы их сейчас трогать с вами не будем. Они настроены на более релевантный ответ экспериментальным путём. Здесь же мы записываем наш промт. В данном случае ты технический помощник, который находит противоречие между
199: Содержимых фрагментов текста, технической документации, ну и так далее. Для после этого мы запускаем наш сервис. Процесс это не очень быстрый. Поэтому я предлагаю вернуться сначала к Ольге.
200: Как только этот процесс будет завершён, я ей буду сигнализировать, и мы посмотрим результат.
201: Спасибо большое ещё раз, Вероника, ты можешь прямо даже голосом врываться в поток моего сознания. Да, уважаемые коллеги, почему мы сейчас прервали эту демонстрацию? Вернёмся к ней через несколько
202: Несколько секунд, потому что процесс анализа, ну и процесс сравнения фрагментов текстов, он довольно ресурсоёмкий и довольно длительный, к сожалению, это, ну,
203: Это наша действительность, он занимает определённое количество времени. И, конечно же, сейчас я хотела бы поговорить вообще о времени, о нагрузке на сервер, об оборудовании, которое требуется для того, чтобы, ну, у себя в своей локальной
204: Сети своей организации. Можно было развернуть систему, подобную нашей или нашу систему. Так вот, самый главный вопрос это вопрос видеокарт, которые будут способны это все выдержать. И выбор видеокарт, он напрямую зависит от Коли.
205: Количество людей, которые одновременно будут задавать вопросы большой языковой модели, это именно она, генеративная модель, большая языковая модель, максимально требовательна к оборудованию. 2 фак.
206: Влияющий это сценарий работы большой языковой модели. То, что мы показывали в начале, вопрос, ответ он, ну, нагрузочный довольно процесс, но не настолько он нагружает вообще.
207: Оборудование как процесс сравнения фрагментов, фактически сравнение фрагментов это потоком задаваемые вопросы большой языковой модели, требующие, ну, её постоянной работы. Вот, и от этого сценария работы тоже зависит.
208: Выбор видеокарт. Кроме этого, зависит ещё очень много от того, какая конкретная большая языковая модель будет выбрана для работы rock системы, сколько у неё будет параметров. Вот мы
209: Сейчас используем мистраль смол нас это удовлетворяет, но мы постоянно экспериментируем, меняем эти модели, вот, пытаясь найти какое-то оптимальное решение по качеству ответа и
210: Её, так сказать, требовательности к тем же самым ресурсам. Вот, возможно, мы сейчас подумываем о том, чтобы в rock систему добавить нашу 2 ллм, 2 большие языковые модели, чтобы 1 занималась сравнением фрагментов, a2
211: Отвечала на вопросы, ну таким образом распределить нагрузку. Так вот, от этого всего зависит гпу и то, что вы сейчас видите. То, что мы вам сейчас показываем, работает на вот таких вот мощностях, это наш небольшой тестовый сервис.
212: В котором работаем исключительно мы и проводим демонстрации. Вообще для нормальной работы пользователей, естественно, необходимо что-то помощнее, особенно если пользователей будет больше 5. Вот, и
213: Мы сейчас уже готовы, ну, уже для себя арендовали тестовую, ну, ну, не тестовую, настоящую продакшн среду это арендованный сервер с хорошими видеокартами.
214: Куда мы в ближайшее время организуем массово тестовый доступ для наших пользователей. Вот там хорошая мощность, которая как раз даст возможность автоматом людям получать лицензии, заходить, задавать вопросы, получать ответы и
215: Радоваться, ну и вообще изучать возможности модуля семантического поиска. Вот. Но это совсем не вот те требования, которые вы видите на экране, это в десятки раз больше вообще по хорошему, если вы там задумаетесь о том, чтобы
216: Организовать нечто подобное в своей локальной сети необходимо, ну, провести сравнение различных языковых моделей на различных видеокартах. Мы такие тоже эксперименты проводим. Мы даже написали сервис, в котором мы проверяем
217: Работу различных опенсорсных больших языковых моделях на различных видеокартах. Оцениваем мы параметры, конечно же, рпс. Вот, но параметры рпс это, конечно, очень важно, но не настолько важно, как качество ответа, а вот
218: Для того чтобы оценить не только скорость, но и качество, необходим бенчмарк, необходим какой-то эталонный набор хороших вопросов и ожидаемых хороших ответов для того, чтобы можно было автоматом оценить.
219: Качество ответов различных опенсорсных больших языковых моделей, которые очень много сейчас новых появляется, и мы сейчас заняты как раз сбором вот подобного бенчмарка. Для того, чтобы оценивать ещё и качество, результатами, обязательно будем делиться.
220: Да, но я сейчас перехожу ко 2 нашему блоку, ко 2 инструменту, к модулю семантического анализа. А у тебя все готово? Да, готов результат. Давай. Угу. Сейчас.
221: Так вот, к данному моменту у нас появился результат, пока что он отображается тестово в виде json файла в структуре json файла мы можем видеть наш промт все соответст.
222: Настройки генерации, а также, если у нас было найдено противоречие, у нас появляется поле true если противоречия нет, значит, false в том случае, если было найдено противо.
223: Речью у нас появляется поле объяснения, противоречия. В чем именно оно было для удобства. Мы можем выгрузить этот отчёт, открыть его. Ну, я его открываю обычно с помощью ворда.
224: Для того, чтобы можно было найти количество
225: Посмотреть количество найденных противоречий. Вот, значит, у нас всего было найдено 9 противоречий, так как первые 3 это у нас содержатся в промт. Мы бы, мы специально указали в этом файле 2
226: Противоречия, он их нашёл, верно? Вот 1 из них, например, здесь мы некорректно указали высоту выключателей от пола. Соответственно, нам подсветили, что противоречие заключается в
227: Высоте установки выключателей необходимо было устанавливать на высоте 1 и 2, а в другом фрагменте они устанавливались на высоте 1 и 8, соответственно, в этом и заключалось противоречии.
228: Есть у нас также и так называемые спорные ложные противоречия, однако, как уже говорила Ольга, для того, чтобы таких противоречий избегать, необходимо разрабатывать мультиагентный сервис. Вот теперь у меня все
229: Да, спасибо большое, Вероника. Я хочу подчеркнуть то, что мы не говорим о том, что задача эта, она является решённой. Ни в коем случае. Мы бы здесь, ну, просто были бы нечестны с вами. Вот мы го,
230: Говорим о том, что свет в конце туннеля виден, но для того, чтобы по настоящему можно было приблизиться к решению задачи автоматического поиска несоответствий, противоречий, необходимо ещё работать, анализировать, донастраивать, обучать, собирать данные.
231: И этот процесс, скорее всего, займёт большое количество времени и потребует помощи от вас, от экспертов предметной области. Если кто-нибудь из вас заинтересовался подобной работой, вы можете к нам обратиться.
232: На абсолютно некоммерческих условиях. Если у вас там есть ваши документы, мы проведём эксперименты, вот покажем вам результаты, попросим вас экспертно оценить качество ответов от большой языковой модели. И эта информация, она очень нужна нам.
233: Для того, чтобы продолжить донастройку инструмента. Но свет в конце туннеля виден, да, а я хочу переключиться на следующий наш блок. Он более такой, с 1 стороны, более непонятный и сложный, а с другой стороны,
234: Мы здесь добились уже очень таких существенных результатов и очень хотим похвастаться. Так вот, этот блок посвящён автоматизации, оценки, соответствия элементов.
235: Правовой информационной модели, требованиям нормативных документов. Почему это очень такой перспективный сценарий? Потому что для того, чтобы можно было принять решение о соответствии либо нарушении нормативных требований нам
236: Необходима комплексная информация о каждом элементе. Нам необходимо знать, и как элемент называется, и кто находится рядом с этим элементом, и какому зданию этот элемент принадлежит, на каком этаже он находится. Нам необхо.
237: Demo знать информационные характеристики, эти элементы этого элемента, с какими другими элементами этот элемент дружит. И вот в комплексе в своём, в своей совокупности эта информация, ну, есть Надежда её увидеть именно в цифро.
238: По информационной модели я не хочу сказать то, что в цифровых информационных моделях сейчас эта информация там присутствует во всех, но там, по крайней мере, её есть, где расположить. Вот. И именно поэтому сейчас большие надежды
239: Они возлагаются на автоматизацию оценки соответствия именно на основе цифровых информационных моделей, чтобы принималось решение, но для этого тексты нормативных требований нужно пере.
240: Работать нечто качественно новое, качественно новое это машино понимаемый формат машино понимаемый формат это очень широкое понятие, это любой язык программирования, это язык запросов к эскуэль базе, язык антологии, язык разметки.
241: Так или иначе, формализованный текст требования является машино понимаемым можно, можно и нам все говорят, можно взять чат gpt, загрузить туда текст требования и сказать переведи на там джаваскрипт.
242: И chat gpt справится, он, конечно же, может галлюционировать, он может давать неполные ответы, он плохо будет справляться с табличными данными, особенно плохо структурированными таблицами из отечественных нормативных документов, но справится
243: S chem chat gpt не справится, он не справится с он ничего не может знать о структуре пользовательских цифровых информационных моделях, а они бывают очень разные у кого-то есть структурная там основа здания у кого-то.
244: Есть привязка вплоть до этажей, у кого-то просто какой-то есть родительский объект здания, а у кого-то нет и этого. Вот кто-то использует структуру данных Аси, а кто-то ну как допустим то что загружается в cuddly из
245: Программных продуктов. Модул студио имеет свою иерархию, свой скелет, плюс все бим агрегаторы, они так или иначе имеют свои функциональные особенности создать java script на
246: На основе текста это ползадачи, а вот для того, чтобы его применить, у бим агрегатора должно быть достаточно рук и возможностей, и нужно на это тоже ориентироваться при создании машино понимаемого стандарта маши.
247: Понимаемого формата требований 3. Но это особенности описания элементов цифровой информационной модели. В разных компаниях используются разные стандарты. Кто-то уже пытается использовать кси классификатор строительной инфор.
248: Информации, кто-то использует отраслевые классификаторы, кто-то использует свой набор параметров, зафиксированный в своём бим стандарте, а иногда и не зафиксированный. Так вот, чат gpt вот про это ничего знать не может. И
249: С классификатором строительной информации он тоже не знаком. Что же делать, как нам быть? Ну, естественно, надо учить. Помните, я вам в самом начале говорила про машинное обучение, вот для того, чтобы можно было обучить
250: Какие-то, ну, инструменты с ii анализировать тексты используется разметка текста вот как с глазками коше, с глазками и ушками кошечек собак только разметка.
251: Text смысла каждого слова и связи слов это так называемая семантическая разметка и как выполнять семантическую разметку? Нам говорит такая область и как область нлпи область обработки
252: Естественных Языков. Что мы сделали? Мы взяли классические методы обработки естественных Языков и написали методику разметки такую, которая будет соответствовать нашей задаче, разме
253: Текстов нормативных требований для автоматической оценки, соответствия разнообразных цифровых информационных моделей, которые могут иметь разнообразные структурные связи, вот в которых нужно ещё оценивать местоположение объектов и
254: Мы ещё учли возможности бим агрегаторов это необходимость отобрать элементы в проверку по их информационным свойствам и принимать решения относительно там структурной подчинённости элементов или их положения относительно.
255: Друг друга. Так вот вот эту семантическую разметку мы уже начали её применение автоматизировать с помощью компонентов ii, что у нас сейчас есть, у нас уже есть Берр.
256: Подобная модель, которая подсказывает очень хорошо подсказывает значение слов, при разметке текста подсказываются кто объект, кто субъект, кто проперти там характеристика, а где diantis ий оператор, где числовые значения.
257: Точность подсказок уже выше 80%. Вот также мы сейчас пока используем генеративную модель, но копим данные для обучения. Берт, это подсказка верхнеуровневых компонентов. Это шаги для проверки. В каком
258: Порядке. Какие шаги нужно выполнить для принятия решений. Дальше у нас есть ещё подсказка кодов классификатора строительной информации, которые могут быть привязаны к понятиям требования для того, чтобы заработали Филь.
259: Проверки в модели. Здесь работает берт. Точность подсказок хорошая, уже выше 70%. Чем больше мы размечаем текстов требований, тем лучше мы обучаем свой инструмент. Но есть ещё
260: Ещё 1 очень тонкий момент. Повторюсь, бим агрегатор любой, он, как он вообще работает при оценке цифровой информационной модели, он
261: Чаще всего, ну, допустим, калип модели архив, там есть стандартный инструмент проверки на коллизии. Этот инструмент создавался для того, чтобы пересечение ловить элементов и проверять на минимальные расстояния. То есть это базовый геометриче.
262: Проверки, геометрические коллизии. Мы сейчас этот инструмент пытаемся использовать для того, чтобы нормативные проверки реализовывать. Фактически он берет объекты с помощью поиска по информационным свойствам.
263: Также может он учитывать структурные привязку объектов там поиск по параметрам родительских объектов, и дальше он принимает решение по соответствию либо несоответствия, оценивая положение объектов относительно друг друга.
264: Это минимальное расстояние. Пересечение. Может он ещё определять наличие объектов, то есть выдавать ошибку, когда нету 1 объекта относительно другого объекта и может ещё рассчитывать информационные параметры по
265: Информационные параметры 1 объекта относительно другого объекта, то есть выполнять проверку ширины рекреации в зависимости от вместимости спортивного зала. Но здесь есть нюанс.
266: У нас, допустим, есть требование, что в аппаратной не должно быть окон. Фактически это должно превратиться в проверку на пересечение, либо минимальное расстояние вот этого объекта относительно этого не должно быть. У нас есть
267: Требование, что у лестницы должны быть ограждения. Из этого мы должны получить проверку на наличие соседних объектов и выдать ошибку. Если этот объект относительно этого отсутствует, таких вариантов может быть очень много, если мы говорим, что
268: Расстояние должно быть не более, это наличие соседних объектов. Если расстояние не менее, это уже минимальное расстояние, пересечение. Вот дальше использоваться могут ещё и формулы в тексте, и формулы.
269: Иногда бывают явные, то есть в явном виде говорится, что ограждение должно быть в полтора раза больше ширины лестницы, а иногда бывают неявные формулы, когда, допустим, говорится, что трубы, детали 1 линии трубопровода должны
270: Иметь, там должны быть выполнены из 1 материала. Вот это неявные формулы, которые нужно. Мы тоже научились с помощью формул размечать. Так вот, для того, чтобы интерпретировать вот эту разметку и созда,
271: Правила проверки мы написали порядка 100 схем интерпретации. Это не выполняется искусственным интеллектом. Это алгоритмы, которые были описаны. Какой субъект, с каким объектом, с учётом каких дианти
272: Операторов, с учётом какой обвязки должен какую проверку создавать. И у нас, ну, уже заработала эта интеграция для калип модели архив из нашей разметки.
273: И мы уже можем выгружать правила проверки, но не калибо моделям, как не Калиб модели архив единым мы также планируем и очень мечтаем, что у нас получится проинтегрироваться с остальным.
274: Бим агрегаторами, которые есть на рынке. Это ларикс менеджер. Мы уже проводили совместные пилотные проекты тангл контрол. У нас недавно был очень интересный пилотный проект вместе с самолётом бими мы сейчас взаимодействуем на базе deb.
275: Департамента градостроительной политики города Москвы. Вот мы со всеми ними тоже очень хотим сейчас сделать связь и выгрузку размеченных требований в правила проверки, которые будут работать. Но здесь самое важное, чтобы чисто функционально
276: Агрегаторы были способны вообще, ну, отбирать объекты в проверку, вот оценивать их положение одновременно там друг с другом ещё, чтобы они умели считать свойства объектов по формулам и желательно ещё, чтоб была
277: Многоэтапная проверка. И чем больше мы требований размечаем, тем больше у нас, к сожалению, требований к бим, агрегаторам, к их возможностям, там умение считать объекты, умение суммировать свойства объектов в группе и так далее и тому,
278: Подобное. Все для того, чтобы можно было превращать текст, написанный человеком для человека в программный сценарий, мы очень много надежд возлагаем на интеграцию с нано кадом разработчики нано када наши род.
279: Они для нас создали панель проверки модели, которая уже работает в 25 версии на накат. И сейчас мы занимаемся тем, что настраиваем ещё и интерпретацию нашей разметки для создания пра.
280: Правил, они вот из джейсона выгружаются. Правил проверки для нанокад. То, что вы сейчас видите на экране, это реальный видеоролик, когда у нас получилось создать 1 правило проверки, выгружая из разметки, которую мы делаем в модуле семантичес.
281: Анализа, да, но нанкат это не бим, агрегатор нанкат это среда проектирования. Поэтому на данный инструмент мы очень надеемся, как на инструмент, который даст возможность создать, ну, реализовать защиту от Нару.
282: Шений в процессе проектирования, то есть инструмент, где прямо в среде проектирования проектировщик будет получать предупреждение, что здесь ширина должна быть такая-то у объекта, а материал должен быть такой-то ну это все возможно. Вот надо просто очень долго и очень
283: И очень мучительно работать пользователям нашим дорогим. Вот, естественно, на вот эту сложную семантическую разметку смотреть не всегда хочется, поэтому мы
284: Сейчас реализовали выгрузку правил проверки, которые будут храниться прямо в модуле требования, о котором я вам рассказывала в самом начале. То есть задача проектировщика это зайти в модуль требований посмотреть на тексты нормативных требований, а дальше на
285: Нажать кнопочку и правила проверки будут загружены в бим агрегатор и будут работать для проверки цифровых информационных моделей. Мы небольшую демо базу сейчас будем выпускать, чтобы вы могли там в тестовом виде воспользоваться ею и проверить.
286: Работоспособность нашей идеи. Ну а сейчас, конечно же, вживую. Я прошу карину еналиеву забрать у меня микрофон и показать, как это все работает. Сейчас я демонстрацию.
287: Включу.
288: Так, все.
289: Сейчас покажу, как работает модуль семантического анализа вживую, а также его связку с модулем требований выбираем требования в модуле требований, которые нас интересуют допустим, это sp 1 система.
290: Пожарной защиты и смотрим требование, которое посвящено ширине эвакуационных выходов. Для того, чтоб его передать на разметку, необходимо нажать кнопочку, которая так и называется, передать на разметку. И вот мы уже попадаем в модуль
291: Тического анализа. Пройдёмся по интерфейсу. Здесь у нас в панели управления можно вводить названия по умолчанию при передаче из модуля требований сюда заносится текст требования при создании требования с нуля мо.
292: Нужно ввести своё название, также можно выбрать, указать категорию выгрузка и загрузка в формате json это как вариант передачи разметки, выгрузка в таблице, эксель для проверки правильности интерпретации и выгрузка в for.
293: Для Коли модели архив также кнопочка возвращение требования в модуль требований и сохранить. Также у нас здесь есть 3 этапа. 1 этап это этап сегментации. Здесь мы созда,
294: Структуру требования классификации это привязка кодов для отбора объектов модели и формулы при их наличии в тексте требования в исходном тексте у нас также записан текст требования, который был вы.
295: И на 1 шаге нам необходимо запросить разбиение текста на токены токены это логические единицы, то есть каждое слово, каждый знак будет выделен в отдельный токен. После того, как все токены предсказали ь мы.
296: Мы запрашиваем искусственный интеллект разбиение на семантические компоненты. Каждому токену присваивается свой семантический компонент для того, чтобы модель дообучалось необходимо либо соглашаться, либо отка.
297: Пользоваться от подсказанного компонента.
298: Смотрим, здесь у нас ширина подсказана как property property, это характеристика, мы отказались от минимального, потому что у нас дальше будет формулировка не менее. Это также указывает на то, что ширина будет минимальная ширина. У нас характеристика эваку
299: Выходы это субъект. Субъект, это то, что будет проверено в модели из помещения, а помещение у нас будет объектом. Объект это то, относительно чего будет проверено. То есть проверка будет строиться на субъекте ао.
300: Это вспомогательный компонент. Логи логика оператор это операторы и или объект здания. Также вспомогательный элемент. Должно быть это
301: Оператор, он всегда заносится в правила для того, чтобы указывать, что должно быть, разрешается, не разрешается. Не отрицание комппера, это менее, это оператор.
302: Сравнение квантити это числовое значение, то есть 1 и 2 метра. Метры у нас подсказываются как юнит. Это тоже верно. Это единица измерения релейшн это
303: Pre рядом около, они указывают на вспомогательные слова, в основном и property. Это также характеристика помещения здания, число эвакуирующихся через вспомогательный элемент. Не все слова мы
304: Используем в разметке, потому что указанные выходы это те же самые выходы, которые у нас были в начале предложения, поэтому можем отказаться от этих компонентов. И снова более 15 человек. Это уже относится к числу эвакуирующихся.
305: То есть более это кооператив сравнении квантити число 15 человек это единица измерения, измеряем в людях.
306: Дальше необходимо установить связи между компонентами, то есть как объекты друг к другу, привязанности. Это для корректной интерпретации. То есть нам нужно обязательно указать, что ширина, характеристика выходов
307: И мы так и не подвязываем, так не менее не показываем, что подвязывается к сравнению, сравниваем с числом 1 и 2, и число у нас измеряется в метрах. Далее мы
308: Тоже самое делаем с другой характеристикой более 15 измеряется 15 число в людях, и это число эвакуирующихся характеристика, число эвакуирующихся принадлежит либо зданию.
309: Либо помещению.
310: Также по схемам интерпретации, которые показывали до этого, мы выявили чтобы указать структурную принадлежность объектов, необходимо подвязать субъект к зданию, то есть мы показываем, что выходы по структуре будут относиться к зда.
311: И дальше мы запрашиваем подсказку верхнеуровневых суждений. Они подсказываются, у нас не всегда точно точность 50, 60%, как было сказано ранее. Сейчас посмотрим, как он тут предсказывает. Он говот.
312: Говорит нам, что эвакуационные выходы
313: Не менее 1 и 2 при числе эвакуирующихся. Так мы его тут поправим. Тут не все верно. Ширина эвакуационных выходов.
314: Должна быть это потому, что правило будет не менее 1 и 2 метров, остальное это будет ограничением.
315: Сейчас подробнее расскажу.
316: То есть правило звучит у нас. Таким образом, у нас существуют правила и ограничения. Ограничения. Это этапы отбора, то есть какие-то фильтры, а правила это то, что будет конкретно проверяться. Условия проверки, ширина эвакуационных выходов.
317: Должна быть не менее 1 и 2.
318: Дальше у нас подсказывается снова правило. Здесь у нас есть структура, правило количественное. Хотела сказать, структура у нас будет это ограничение подсказано.
319: Неверно. Теперь займёмся ограничениями. Эвакуационные выходы должны быть из зданий. Получается ограничения по структуре. Ставим ограничения и структуру, указываем, что будет связь.
320: This. Также у нас есть ограничения, ещё выходы из помещений, так как это 2 объекта, мы будем использовать ограничения, но уже по местоположению, то есть будет у помеще.
321: На каком-то минимальном расстоянии или пересечении искать выходы. Также у нас есть ограничение, что здания должны быть с числом эвакуирующихся более 15
322: Также создаём ограничение, но ограничение будет количественное, то есть число эвакуирующихся это количественная характеристика и такое же ограничение будет у помещений.
323: Итого мы имеем 1 правило количественное ограничение структурное, что эвакуационные выходы у зданий, место, ограничение по местоположению, эвакуационные выходы из помещений и 2 ограничения у здания, у помещения число.
324: Эвакуирующихся. Теперь необходимо создать калькулятор. Калькулятор выполняет своего рода сценарий проверки, где мы по шагам показываем, как будет проходить отбор и проверка. Сама смотрим сначала.
325: Сценарий, когда эвакуационные выходы в помещениях мы показываем, что выходы находятся в помещениях, в помещениях непростых, в помещениях с такой, с таким числом эвакуирующихся, которые требуется и потом уже проходят правила.
326: И создаём ещё 1 калькулятор для зданий. Указываем, что эвакуационные выходы находятся в зданиях, потом в зданиях с числом эвакуирующихся более 15 и потом
327: Уже проходит правила.
328: Так, все вроде все верно размечено. Мы, мы переходим на этап классификации. Тут можно выбрать редакцию классификатора, которая нас интересует. Допустим, выберем.
329: Октябрьскую и подсказываем. Ой, не то нажала. Сейчас будем подсказывать коды классов.
330: Вот классы компонент, компоненты класс. Здесь также у нас есть 3 варианта подсказок и можно выбирать либо либо соглашаться, либо отказываться. Они расставлены по релевантности. Самые подходящие внизу ширина
331: Указывается, что числовое значение мы сохраняем и соглашаемся от остальных отказываемся. Здесь у нас указаны эвакуационные выходы, но модели модели проектируются по разному, поэтому здесь можно указать либо выход.
332: Либо двери. Кто-то указывает выходы у нас в модели дверь, поэтому здесь мы напишем в
333: Code дверь это будет код класса. Также можно указывать свой классификатор и наши параметры.
334: Помещения и здания мы будем отбирать по общему классификатору строительной информации, как класс строительной информации, потому что в таблицах нету какого-то кода для общих зданий помещений нам не
335: Необходимы все помещения, поэтому мы здесь напишем класс строительной информации, там есть таблицы для помещения, отдельные и таблицы для Рзо. Поэтому мы указываем код Рзо, который говорит нам о принадлежности ко всем помещениям.
336: Угу.
337: Это к слову о том, что иногда приходится, ну, с помощью каких-то дополнительных костылей и фантазии адаптировать применение кси для своих задач.
338: Так, число эвакуирующихся у нас число эвакуирующихся. Соглашаемся.
339: Так, ещё выходы эвакуационные, надо указать принадлежность к пути эвакуации.
340: Пути эвакуации и пишем, что да, он принадлежит
341: Сохраняем, сохраняем и так не сгенерировали результаты. Необходимо после создания калькуляторов обязательно указывать по, в которое будет выгружаться и обновлять шаги. Так?
342: Сохраняем и передаём обратно в модуль требований.
343: В модуле требований обычному проектировщику не обязательно вдаваться. Вот, допустим, всю эту разметку он может открыть, открыть правила проверки. У тебя там осталось висеть.
344: Кто? Вот? Да, вижу. Да, да, да, да, да, да, да.
345: Угу. Нет, не сегодня.
346: Сейчас, а ты сохранила результаты? Да? Ну, попробуй отсюда, Коли выгрузить.
347: Ладно, ну да, все, показываем вживую, всякое может произойти. Так я выгружу в кадре отсюда. Да, давай.
348: В общем, выгрузка в калип открываем калип, открываем профиль проверка на коллизии окно здесь мы загружаем xml выгруженный, отмечаем его и смотрим что у нас получается.
349: У нас есть фильтры, эвакуационные выходы, отобранные с характеристиками, принадлежность к пути эвакуации также отобраны помещения с числом людей и
350: И эвакуационные выходы, принадлежащие по структуре к зданию.
351: Здесь у нас.
352: Условия проверки, пересечения помещения и выходы и то не то, да, я так думаю то, что ты не довыставит параметры.
353: Да, да, да. Вживую нашу, эту сложную схему разметки иногда показывать бывает тяжело. Карина, скажи, пожалуйста, может быть, у тебя есть уже готовая разметка этого требования? Готовая, да?
354: А я сейчас поищу у себя. Угу. Или покажи сразу на демо базе. Я, у меня оно, да, у меня есть оно в
355: Модули, да?
356: Вот это тоже самое требование. Карин, покажи, пожалуйста, покажи. Да, вот, да, все тоже самое требование, тоже самое требование. Просто мы могли в процессе разметки на публику допустить ошибки. Вот такое тоже бывает. Карина, покажи, пожалуйста, xml, который выгружает.
357: Отсюда, да. Ну вот прямо здесь нажми. Да, да, да, да. Вот у нас здесь виден отбор и здесь условия проверки. Угу. Мы вот новый выгруженный файл загру.
358: Так, здесь у нас уже вот появляется вот это условие проверки, где мы проверяем его ширину. Угу.
359: И запускаем.
360: Объекты отобраны, эвакуационные выходы, помещения также отобраны и обнаружена 1 коллизия на пересечении.
361: Так, и вот в этом помещении где-то вот она, коллизия, просто обновлённый cuddly немножечко ограничивает меня в просмотре. Угу. Ну в любом случае.
362: Можно открыть параметры объектов, которые были найдены в коллизии, да, вот дверь, и у него ширина 1000. Вот дверь, ширина 1000, а нам 1200 нужна, да?
363: Карина, покажи, пожалуйста, демо базу, которую мы подготовили для модуля требований. Да, конечно.
364: Да, это то, что мы сейчас в ближайшее время хотим выгрузить и дать в общий доступ. У нас подготовлена небольшая демо база. Там вроде бы 78 требований, которые мы разметили и добавили правила проверки в модуль требований у каждого из них.
365: Их мы можем выбрать, каждый из них нажать кнопочку перехода в модуль семантического анализа и посмотреть на страшные линии. Давай сделай это вот и посмотреть на страшные линии разметки. Вот как вообще проходила семантичес.
366: Разметка каждого требования, ну и для каждого требования в модуле требования доступна возможность выгрузки, правила проверки и применения для проверки своей собственной цифровой информационной модели. Единственное условие, там должны быть у вас коды классификатора строительной информации, да.
367: Карина, я у тебя перехвачу дальше инициативу, если ты не возражаешь.
368: Тебе всегда сложнее всего приходится вот эти вот повторения этих вживую для того, чтобы наш инструмент заработал, мы проводили огромное количество пилотных проектов, пилотные проекты.
369: В ходе которых мы уточняли требования к структуре и наполнению цифровых информационных моделей, пилотные проекты, в ходе которых мы свой инструмент настраивали, дорабатывали и формировали требования к функционалу бим агрегаторов нико.
370: Кому так? Просто? Мы не предлагаем ознакомиться с работой нашего инструмента. Мы всем рекомендуем сперва попробовать это все на практике. Мы открыты к сотрудничеству. Если вас интересует возможность применения машино понимаемых требований, обращайтесь.
371: Пожалуйста, к нам вот на некоммерческих условиях мы просто вместе поэкспериментируем, посмотрим на вашу модель. Вместе отберём требования, которые вам интересно преобразовать в машино понимаемый вид. Поможем вам выполнить разметку или выполним её.
372: Самостоятельно и расскажем о возможных нюансах. Сейчас вот эта вот тема машино понимаемости, она стала очень популярна у нас среди министерств и ведомств у нас готовится к выходу реестр.
373: Требований, в котором будут присутствовать машино понимаемые версии. И, насколько я понимаю, планируется, что они будут использованы для автоматизации экспертизы цифровых информационных моделей. Поэтому у вас есть возможность до того, как это все стало.
374: Общей необходимостью просто попробовать попробовать посмотреть, пощупать руками. Мы открыты для вас. Ну и, подводя итоги, мы вам сегодня вас загрузили, наверное, по полной вот нашими техническими подроб.
375: Завершить мне хочется схемой взаимодействия тех решений, о котором мы вас сегодня рассказывали, модуль семантической разметки документов делит документы на кусочки и классифицирует эти кусочки для того, чтобы создавалось наполнение модуля.
376: Требований, модуле разработки документов. Там создаются новые тексты стандартов, которые тоже могут быть разбиты на кусочки. Для наполнения модуля требований. Из модуля требований. Можно передавать требования для семантического анализа, чтобы создавались
377: Правила проверки для цифровых информационных моделей и из модуля требований требования поступают ещё и в модуль семантического поиска, где волшебная большая языковая модель помогает анализировать положения нормативных требований. Вот при
378: Примерно в таком вот виде мы сейчас существуем. Мы закончили рассказывать вам все, что хотели рассказывать мои контакты. Я вам, да, пообещала это сотрудничество и открытость. Вот я подтверждаю своё намерение здесь на sly,
379: Где опубликованы мои контакты, номер телефона, почта и даже есть секретный QR-код на наш блок, в котором мы иногда не забываем публиковать актуальные новости, ну а сейчас вопросы?
380: Надеюсь, что они все-таки у вас возникли здесь. Я, пожалуй, присоединюсь к демонстрации. Да, спасибо, Ольга. Спасибо, коллеги, за то, что показали, как работает нейросеть. И, ну, с применением нейросети на базе.
381: Работа с нормативной документацией, разметкой. То есть нейросеть это у нас не только окно, где мы можем ввести данные, получить ответ, да, или там загрузить какой-то пром, как это работает, можно сказать, под капотом, как это сложная разме.
382: С текстом происходит как вот дальше подгружать информационную модель и далее работать. Вижу тут коллеги в чате тоже не то что в шоке, как вот Софья написала, чувствую себя как 1 раз открыл автокат, но я думаю, что со временем мы все при
383: К новым возможностям, к новым подходам. И также, как вот Софья написала, открыли автокат, когда-то это будет казаться чем-то простым и обыденным. Вопросы есть, я по ходу чата их добавлял во вкладку.
384: Вопросы. То есть, коллеги, если кого чей-то вопрос потерял, не обижайтесь, напомните, ниже в чате повторно его, Ольга, можете перейти прям во вкладку вопросы. И там я от кого и вопрос, да, собственно говоря, какой плюс, да.
385: Не возражаете, я QR-код, который на ваш блок ещё ссылочкой в чат продублирую на случай, если кто-то на правах модератора не возражает согласованной рекламой все, тогда, коллеги, переходим к вопросам, так?
386: Ну, вопрос, насколько качественно ии. Может проверять проектную документацию на соответствие нормативам, в каком формате должен быть проект для того, чтобы ii его проверила pdf дв. Рбт, здесь даже вопрос не в форма.
387: Здесь вопрос в том, что в этом формате изложено, то есть какой вид данных, то, чем занимаемся мы, это тексты. Именно текстовая часть, самая актуальная потребность сейчас отр.
388: Это автоматизация проверки графики чертежей. И вот с этим вот большая, большая, большая проблема не только у нас, а у всех проблема заключается в том, что вот те элементы компьютерного зрения, там-то, что умеет, хорошо распреде.
389: Распознавать лица оно ни разу не умеет, читать чертежи, чертежи умеют читать люди с соответствующим образованием, инженеры вот и для того, чтобы обучить модули ии читать чертежи.
390: Прям по настоящему то, как это делает инженер, а не изображать вид, то что он их читает, необходимо создавать датасет, то есть необходимо огромное количество материалов, где будут подписаны, какой набор линий, каким элементам
391: Соответствуют и как вообще анализировать вот эти вот элементы в их окружении. Это речь идёт о дата сессии не v 1000 там чертежей это десятки тысяч, и в этом самая большая беда. То есть самый большой стопор для
392: Развитие применения ии, ну, при решении инженерных задач он заключается даже не в том, что сами технологии отстают или там оборудования нету. Самая большая проблема это отсутствие размеченных данных и отсутствие там датасета, который можно использовать для обучения. Вот.
393: Мы, в общем, все меняется каждый день, все меняется очень быстро и может быть там завтра появится какое-то решение. Ну вот мы конкретно команда нср, мы занимаемся текстовыми данными, нам
394: Это более или менее понятно. Дальше там вопрос, реально ли, что экспертизу заменит искусственный интеллект? Ну, в зависимости от того, кто отвечает на этот вопрос. Вот, допустим, я читала там очень много выдержек и там публикаций.
395: Новостей, где чиновники говорят, что все уже все заменило и уже, уже люди не нужны. Мой ответ нет, нереально ни в коем случае. Вот искусственный интеллект это инструмент, который вот на данном этапе своего развития может
396: Стать помощником человеку. Вот и очень хорошо бы, если бы он стал помощником человеку, но для этого человек должен ещё долгое время ему обучать, помогать и сопровождать его работу. Вот, может быть, когда-нибудь он прям сможет по настоящему
397: Чему помогать, но речь о замене я бы сейчас пока ещё не ввела ну по крайней мере на сегодняшний день может быть завтра уже все изменится очень быстро все происходит кто создаст нормативную базу для ii ведь изменения в сп.
398: Ежегодно вносится, ой, смотрите, то, что сейчас содержится в модуле требований, поддерживаем лично команда нср specification. То есть у нас есть 10 специалистов, которые занимаются отслеживанием актуальности. Треб,
399: Anna, которые мы размещаем у себя, мы обработали не так много документов 140 и база наших требований это 40000 требований. Ну это, это совсем не тот объём, который применяется на практике сейчас.
400: У нас уже заработал в России ресурс, он называется реестр требований в рамках ресурса стройкомплекс рф, более того, уже в град кодекс внесены изменения, согласно которым исключительно положения, содержащие содержащиеся
401: В этом вот реестре требований должны применяться при проектировании вот у этого реестра требований там тоже были нормативные документы разделены на кусочки, он улучшается день ото дня, и у него есть открытый api.
402: Вот, а разработкой этого реестра требований занимается фао фцсс, федеральный центр нормирования в строительстве это подвед минстроя, мы с ними давно уже заключили соглашение о технологическом партнёрстве. Вот у нас есть доступ к api, вот мы очень надеемся то
403: Что сейчас p заработает и то, что мы сможем, ну централизованно, из официального источника выгружать обновляемую базу нормативных требований в свою систему и дальше использовать, ну наши возмо.
404: Ности наших сервисов по обработке этой информации. Так, вопрос сколько потребуется времени ii для экспертизы проектной документации ну вот если речь идёт о том сценарии, который вот мы сейчас вам показывали, это сравнение.
405: Text сравнение текста и нормативной базы все, конечно, зависит от того, сколько вообще документов и сколько в этом документе текста и сколько в этом тексте фрагментов, но, ну примерно по времени там средний объём, какой-нибудь пояснитель.
406: Записки в там, я не знаю, 100 страниц занимает его обработка, ну, от получаса до часа, в зависимости от загруженности. Ну, то есть, если документов больше, то есть смысл, ночь, чтобы этот процесс проходил.
407: Так, sp y, остальные нормативы постоянно обновляется, как и будет это генерировать ну, повторюсь, что связь с базой уже разделённых на отдельные смысловые единицы.
408: Нормативных документов, которые размещаются в рамках реестра требований на сайте стройкомплекса рф, потенциально может разрешить эту проблему вот лишь бы заработало апи, лишь бы качество контента там соответствовало нашим.
409: Высоким требованиям. Так только в программе нанкат будет действовать такая функция или это будет и в ревёт, и в нанокад с ревитом у нас на данный момент нету возможности связываться. Это не наша прихоть, но
410: Лицензий нету, и мы сейчас ориентированы на отечественное программное обеспечение. Если сейчас что-то изменится и там с разработчиками ревёт, удастся связаться и будут получены там лицензии на совместную разработку, то
411: Мы, мы открыты вообще для всех. Вот мы бы сделали какую-нибудь интеграцию с ребетом. Да, Константин спрашивает а вы этот бот сами обучали или он работает на основе уже существующих чат gpt?
412: Laxcity джемини так у нас сейчас, повторюсь используется лм. Мистраль смол неделю назад ещё использовали гемму тоже нам нравилось. Вот сейчас думаем заменить на queen тоже такой.
413: Средний по параметрам. Вот. В общем наш чат бот это не ллм, который опенсорсную мы берём из там хаген фейс скачиваем, а наш модуль семантического поиска это
414: Рак система, которая улучшает работу ллм. Вот. И вот эту rock систему, мы её реализовывали и писали самостоятельно, потому что готовые решения нам не подошли. Ну, я уже говорила то, что обработка норма.
415: Тивных требований несёт за собой, влечёт за собой необходимость учитывать огромное количество разных нюансов. Так, глядя на название сайта, вопрос связка идёт с нормой сиэс или это просто
416: Похожее название с тех экспертом, есть ли взаимосвязь мы начинали с нормы сиэс. То есть вот я лично, я была продактом нормы сиэс. Вот в 1 прекрасный момент компания нанософт решила, что, ну, норма сиэс это прекрасно, но
417: Хочется делать с нормативными документами что-то такое более интересное и более автоматизирующее работу проектировщиков. В этот момент нормы сиэс мы передали на разра, ну, другим разработ.
418: Другим правовладельцем вот а сами занялись направлением нср specification изначально называлось мы называлось у нас все нср нормы си специфике, модуль требований имеет связь и с тех экспертом, и с нормой.
419: Это просто ссылочки на полные тексты документов, которыми каждый может воспользоваться, так как загружать файлы с чертежами автокада или ревит для проверки чертежи. Повторюсь, к сожалению, пока никак, потому
420: Компьютерное зрение не в состоянии адекватно оценивать. Ну, такие вот графические данные. Вот надеюсь, что в скором времени все изменится, и мы сможем вам говорить, да, это сделать. Так-то, так-то.
421: Работающей команде. У вас имеются опытные проектировщики. У нас имеются опытные проектировщики. У нас имеются инженеры, стандартизаторы строительной отрасли. У нас есть бим, менеджеры, вот есть специи.
422: Специалисты в области искусственного интеллекта. Вот программисты, программисты, программисты. Ну а я наводящая хаос, продакт, менеджер. Вот я не имею строительного образования, да.
423: Могут ли произойти сбои в программе перегрузка? Может быть. Ну, конечно же, может вот, поэтому мы, ну, самое такое-то, что может быть сильно очень нагружено, это модуль семантического поиска, потому что там
424: Работает ллм большая языковая модель. Вот. И мы сейчас, ну, когда вот мы сейчас уже почти готовы начать массовое тестирование, мы в 1 очередь пару месяцев будем только там тест.
425: Доступ давать ни в коем случае никому ничего не продавать. По 1 простой причине. Нам надо оценить реальную нагрузку, сколько количество человек, какую реальную нагрузку создадут на сервере. Вот после этого можно будет дать ответ.
426: Вот на ваш вопрос, может ли быть перегрузка и при каких условиях она может быть.
427: Да, это, наверное, был последний вопрос. Так, коллеги, если что-то мы потеряли, пока есть ещё время задать его повторно в чате или во вкладке. Вопросы. Ну а я, наверное, хочу со своей стороны поблагодарить команду. Не specification, Ольга.
428: Карина, Вероника, спасибо, что нашли время рассказать нам о том, чем занимаетесь, было довольно познавательно. И думаю, что ещё как компания технониколь мы обратимся как раз
429: С задачами проверки нормативной документации. Возможно, что-то им ещё попробуем. Так и участники вебинара обратятся с пилотными проектами для дальнейшего сотрудничества и развития вашей системы.
430: Мы будем очень рады. Огромное вам спасибо. Спасибо, коллеги. Тогда мы завершаем вебинар.
431: Да, Михаилу казанцеву успею сказать то, что мы уже почти настоящее. Вот будущее будет ещё интересней. Спасибо вам, спасибо.