Как НИКОГДА не упираться в лимиты | Claude и Codex

Вставьте ссылку на видео из Youtube, Rutube, VK видео

Задайте вопрос по видео

Что вас интересует?

00:00:44

Экономия токенов при работе с нейросетями:

1. Один английский знак препинания эквивалентен примерно ⅓ части английского слова (около 100 слов = 130 токенов), русский текст обходится дороже — одно русское слово приблизительно равняется двум-трём токенам
2. Размер контекстного окна современных нейронок составляет около миллиона токенов, однако каждый новый входящий запрос заставляет нейронную сеть заново обрабатывать весь предыдущий диалог
3. В длинных чатах большая часть токенов расходуется на повторную обработку предыдущих сообщений, лишь малая доля используется непосредственно для формирования новых ответов

00:03:18

Лайфхаки для оптимизации расхода токенов:

1. Для оптимизации расхода токенов рекомендовано использовать короткие и чёткие формулировки запросов
2. Рекомендуется регулярно создавать новые чаты для каждой крупной задачи, чтобы избежать путаницы и ухудшения качества обработки запроса нейронкой
3. Использование субагентов позволяет разгрузить основное контекстное окно и сократить нагрузку на токены, сохраняя лишь итоговый результат в основном чате

00:14:30

Оптимизация загрузки контекстного окна:

Контекстное окно нейронки увеличено до 1 миллиона токенов после обновления
Рекомендуется не превышать расход токенов свыше 120 тысяч во избежание проблем с работой нейронки
Разработан инструмент для анализа диалога, суммирования важных моментов и отправки их в следующий чат для сохранения контекста общения

00:16:47

Использование маркдаун файлов и агентов:

1. Рекомендуется конвертировать материалы из PDF и Word файлов в markdown-файлы перед загрузкой в нейронную сеть, поскольку нейросети эффективнее обрабатывают чистый текст без метаданных и дополнительного формата
2. Для улучшения работы нейронной сети предлагается использовать короткие (до 200 строк) файлы `clouded.md` и `agents.md`, содержащие только самую важную информацию по проекту, а дополнительные данные хранить отдельно в markdown-файлах
3. В файлах `clouded.md` и `agents.md` допускается ссылка на отдельные markdown-документы, содержащие дополнительную информацию, необходимую для выполнения конкретных задач

00:20:21

Работа с дополнительными функциями и моделями:

1. Для оптимизации расходов токенов предлагается отключение неиспользуемых функций и модулей (например, плейрайт эмсипи)
2. Рекомендуется выбирать легкие модели нейросетей для простых задач, чтобы сократить расход токенов
3. Обновления дизайна системы и функционала кодекса происходят регулярно, улучшая качество работы и экономию ресурсов

00:22:53

Режим планирования и использование суперспособов:

1. В режиме планирования нейронка создает итоговый план проекта на основе файлов с инструкциями и кодом, позволяя пользователю утвердить или скорректировать план перед началом выполнения задачи
2. Режим планирования снижает вероятность появления значительных ошибок и уменьшает расход токенов за счет четкого понимания задачи нейронкой
3. Плагин Super Powers улучшает процесс планирования и разработки проектов, задавая правильные вопросы, проводя мозговой штурм и обеспечивая качественное выполнение задач

00:24:56

Управление пятичасовыми лимитами в KLOD:

Установлено, что пятичасовое рабочее окно пользователей начинается с момента отправки первого сообщения и длится пять часов (например, начав работу в 9 утра, окно будет с 9 до 14:00)
Предложено решение продлить пятичасовое окно путем ежедневной отправки сообщения в 6 утра, чтобы начать новое пятичасовое окно с 6 до 11 утра
Сообщено, что ранее существовали пиковые часы, в которых лимиты расходовались быстрее, однако сейчас данные ограничения отменены, и подобные временные рамки утратили актуальность

0: Если ты регулярно упираешься в лимиты посреди работы, неважно, в клод код, кодекс курсор и так далее. Это видео для тебя. В этом видеоролике я без лишней воды и теории расскажу о нескольких рабочих способах, как можно экономить токены и

1: Соответственно, не упираться в лимиты. Несколько пунктов будет чисто про клод код, но их меньшинство, если вы работаете с любым и агентом, этот видеоролик будет для вас полезен, поэтому давайте не будем терять время.

2: Поехали, как можете заметить, у меня появился новый микрофон. Я не знаю, насколько он качественно звучит и насколько круто я его настроил. Поэтому если кто-то реально умеет с ним работать и готов мне помочь, то напишите мне в комментарии, я с удовольствием созвонюсь и вместе с вами настрою.

3: Эту штуку. Надеюсь, звук будет нормальный. Для начала давайте разберёмся, что такое токены и зачем нам их экономить. Если коротко, то токен это единица текста, в которой нейронка измеряет все, что ты ей пишешь, и все, что она тебе отвечает. Каждый пробел, каждая буковка.

4: Каждый знак препинания, все это токены на английском языке, 1 токен равен примерно 3 четверти слова, то есть 100 английских слов, где-то 130 токенов, плюс минус с русским языком дела обстоят похуже, 1 русское слово равно примерно.

5: 2 3 токена, то есть тексты на русском обходятся нейронке в 2 3 раза дороже. Теперь быстренько расскажу, что такое контекстное окно. Контекстное окно это память нейронки в рамках 1 чата у современных моделей размер контекстного окна, например, в клоде том же самом

6: 1000000 токенов, что как будто бы очень много. Но тут есть 1 важный моментик. Нейронка не запоминает наш диалог. Каждый раз, когда ты пишешь ей новое сообщение, она читает все, что было до этого, все предыдущие сообщения, все предыдущие ответы от нейронки, короче.

7: Говоря, она заново все обрабатывает. То есть ещё раз отправили 1 сообщение, она на него ответила. Тут как бы все понятно. Отправил 2 сообщение, она перед тем, как ответить на твоё 2 сообщение, читает 1 сообщение, ответ на 1 сообщение. И только

8: Потом 2 сообщение, и чем больше сообщений соответственно, тем больше ей приходится перечитывать перед тем, как тебе ответить. Соответственно, можно понять, что когда вы отправляете, например, 50 сообщение в ваш чат, то она обрабатывает те 49 предыдущих сообщений, которые

9: Были до этого. И эта штука, естественно, очень сильно нагружает вашу нейронку. Соответственно, в длинных чатах подавляющее большинство токенов уходит не на ответ вам, а на обработку предыдущих ответов. Я не помню, в каком конкретно ролике я это видел, но какой-то разработчик решил

10: Замерить на 100 сообщениевам чате не знаю, как это сказать. Короче, чат из 100 сообщений, сколько токенов тратится на ответ его сотового сообщения. И там че то цифры в стиле 98 и 5% токенов тратилось на

11: Обработку предыдущих ответов и только полтора процента тратилось на создание нового ответа. Также важно понимать, что когда вы пишите огромное полотно сообщений, то есть у вас чат, там уже из 100 сообщений, из 50, даже неважно, нейронки все сложнее становятся обрабатывать каждое

12: Сообщение от этого появляется так называемый контекст рот, то есть деградация контекста, нейронка начинает забывать какие-то определённые моменты, где-то начинает тупить. И это является 1 из тех причин, почему где-то на 100 сообщении чата, вы понимаете,

13: Что общаетесь с каким-то имбицилом, а не с клод опусом. Например, давайте перейдём к лайфхакам, которые помогут вам экономить токены и, соответственно, меньше упираться в лимиты и лучше работать с нейронкой. 1 совет не плоди мусорные вопросы. Самое часто

14: Ошибка, которую совершают где-то 99% пользователей. Наверное, это когда вы решаете какую-то задачу, получили, например, неудачный ответ и начинаете писать что-то в стиле ты совсем дурак, надо сделать не так. Попробуй так. Нет, я имел

15: Ввиду другое. Нам надо было сделать то-то, то, то. Короче, таким образом вы заставляете нейронку обрабатывать не только то, что ей будет полезно знать, но и ваши мусорные запросы, которые ни к чему не привели. От этого и токенов тратится больше, если таких запросов много и лимиты сгорают быстрее.

16: И нейронка тупить начинает. Короче говоря, надо это исправлять. Я буду все показывать в клод код, потому что меня благо, ещё не забанили, но для тех, кто пользуется кодексом, курсором и так далее, это тоже будет актуально. Открываю, вижу студио код, открываю клод код и соответствен.

17: Соответственно, давайте приступим. Кстати, те, кто не знают, как работать с клод код кодексом и так далее. Я сделал полные гайды на эти программы. Вот здесь вот можно найти полный гайд на клод код. Вот здесь вот где-то ссылочка будет, а вот здесь вот в том же самом месте полный.

18: На кодекс ссылки на эти видеоролики также будут в описании. Поэтому переходите и ознакамливайтесь с этими программами. Например, с помощью кода я сверстал вот такую вот страницу контактов. И я хочу внести сюда какое-нибудь изменение, например, чтобы вот эти часы работы

19: Штаб горячая линия. Короче, заголовки были другого цвета, например. А можешь заголовки на этих карточках сделать не бирюзовые, а коричневые. Итак, по идее он сделал. Давайте обновим. И, как мы видим, здесь и правда стали коричневые заголовки, допустим, нам не очень

20: Очень понравилось то, что он сделал. То есть весь промт, который он выполнил, это полная лажа. И вместо того, чтобы вот так вот ему накидывать правки, чтобы он полностью с нуля это переделал, можно просто сделать откат. То есть нажимаем вот здесь вот стрелочку назад в целом это

21: Функция работает как в кодексе, так в клоде, так и в курсоре кликаем вот эту стрелку и здесь есть 3 варианта, что мы можем нажать 1 это for conversation from here. Когда мы нажимаем на эту кнопку, у нас откатывается именно диалог rewind код ту хир откатывает соответствен.

22: Файлы с кодом до этого сообщения. То есть история чата останется как была, а вот файлы с кодом у нас откатятся. Ну и, соответственно, фор конверсейшен and rewind код это полный откат. То есть у нас и файлы с кодом возвращаются к состоянию до этого сообщения.

23: И чат форкается с этой точки. Это так называемый самый полный откат. Давайте нажмём на него. Вот он нам тут пишет new work, конверсейшен Вил бы крейте, автор ревиндикации, не знаю, опять же, как правильно кликаем континью все, у нас создался новый чат.

24: Вот как можно заметить, и мы откатились назад, удалили вот этот запрос. И давайте сразу напишем, например, я хочу цвет заголовков на карточках в контактах сделать зелёненьким кликаем enter. И таким образом, без лишней траты вашего контекста, ваших токенов, он просто

25: Несёт эти изменения, все перезагружаем. И теперь у нас зелёные заголовки данный подход не всегда имеет смысл. То есть, например, вы делали какую-то большую задачу, там, например, делали сайт полноценный, и он в целом получился хороший, но есть какие-то

26: Мелкие недочёты, которые надо исправить, естественно, полностью откатываться и делать этот проект заново. Это глупо, потому что нейронка потратила уже большое количество токенов в целом, сделала 90% задачи. Правильно? В этом случае реально есть смысл просто внести ему то

27: Правки, но если нейронка прям жёстко напортачила, сделала полную фигню, тогда уже имеет смысл прям взять и откатиться. Это, конечно, база, но многие про это забывают. Помимо этого, чтобы не расширять лишним образом ваш диалог, вы можете, например,

28: Редактировать сообщения в том же чате. Давайте че-нибудь сюда напишем, например, какая погода в Туле в следующие 10 дней. Дай прогноз. Всем привет из Тулы чего 54 градуса. И что он показал вообще? Че то он странную тему.

29: Выдал какую-то, ну короче, не суть, допустим, он это сделал правильно. И тут я понимаю, что я хотел не в Туле посмотреть прогноз погоды, а где-нибудь в Иркутске, например, всем привет из Иркутска, вместо того, чтобы писать вот сюда, блин, я неправильно тебе город назвал. Давай.

30: Иркутске. Посмотрим, вместо такого нажимаем вот здесь вот значок карандашика и меняем здесь слово Тула на Иркутск. Все кликаем сейф, и он самостоятельно убирает тот свой ответ, который давал и напишет вам новый. Давайте посмотрим. О, нифига себе. В Иркутске 72.

31: Градуса жарковато. Короче говоря, таким образом мы избавляем нейронку от перечитывания лишнего мусора. То есть она получила 1 конкретный запрос, получила 1 конкретный ответ. История чата практически чистая там, где это уместно. Очень советую этим пользоваться. Также, чтобы

32: Не растягивать историю чата. Можно задавать несколько вопросов сразу. Ну, если это не какие-то очень крупные вопросы с помощью данного подхода нейронка будет меньше прогонять историю туда сюда и, соответственно, будет меньше хавать ваши токены. Кстати, если вы, например, работаете в терминале,

33: Давайте я вот здесь вот открою терминал и напишу здесь клод кликаем энтер. Давайте я дам какой-нибудь запрос сюда, ***, а сделай мне какую-нибудь страницу проекта. Неважно, что кликаем энтер, и клод начал работать. Короче, допустим, он начал выполнять

34: Эту задачу и мы хотим задать какой-нибудь уточняющий вопрос, но при этом не прерывать его работу. Что нам можно сделать? Кликаем слэш здесь, вбиваем 3 буквы б т дабл ю. И теперь вы можете задать сейчас. Ну-ка вот тут написано, задайте вопрос.

35: Без, так сказать, нагрузки на основную ветку. И, например, спрашиваем, слушай, а что у нас на главной странице вообще за заголовок и что происходит? Он, не прерывая основную сессию, ответил на наш вопрос. То есть ещё раз мы

36: Ему слэш битти дабл ю задаём свой вопрос он на него отвечает и когда мы нажимаем escape после этого то и ответ нейронки и твой вопрос исчезают из чата это помогает узнать ответы на какие-то вопросы при этом не нагружая основной чат также помогает

37: Экономить токены. Ещё 1 лайфхак, который поможет вам оптимизировать расход токенов. Это просить нейронку отвечать коротко и по делу без лишней воды и каких-то обширных формулировок. Почему это важно? Входные токены стоят в 5 раз дешевле, чем

38: Выходные, то есть ещё раз, если сравнивать одинаковые объёмы того, что вы ему ввели, и тому, что он ответил, то-то, что он ответил, весит в 5 раз больше. Почему это так работает. Когда нейронка читает наш запрос, она схватывает весь текст 1 разом, целиком. А вот

39: Когда она пишет свой ответ, то все работает совсем по другому. Когда нейронка пишет ответ, она пишет по слову за раз, и перед каждым следующим словом она прогоняет через себя свой огромный мозг и все, что уже написала до этого, то есть, например, чтобы написать какой-нибудь

40: 1 запрос может потребоваться несколько сотен таких циклов. Это, само собой, будет сильно нагружать ваши токены и что в итоге отсюда вытекает. Соответственно, длинные ответы от нейронки стоят гораздо больше, чем длинные вопросы от вас. Как мы можем на это?

41: Влиять. Просто можете 1 раз в настройках прописать. Если это клод, то это глобальный клод мд. Если это кодекс, то это глобальный agents мд, или, например, и туда, и туда можно написать в personal preferences. Ну или кастомные настройки. 1 раз это настроил.

42: И все, клод будет отвечать вам, короче, по делу и таким образом меньше тратить свои токены. Также, помимо этого, рекомендуется создавать периодически новые чаты, то есть не весь цикл задач, решать в 1 чате, а разделять их на отдельные. Это, конечно, звучит.

43: Банально, но практически 90% юзеров этим грешат. То есть, например, вы в 1 чате сначала обсуждали то, как будет выглядеть ваш дизайн сайта, например, потом в этом же чате будете настраивать какие-то интеграции, потом бэкэнд и так далее. Все это приведёт.

44: К тому, что нейронка будет жёстко тупорылить и выполнять задачи не так, как вы её просите. Поэтому как тут лучше действовать? Берете какую-нибудь задачу, доводите её до конца. И если контекст этой задачи не нужен для выполнения следующих задач, например, вы разрабатывали дизайн систему.

45: До разработали. Сделали там какой-нибудь markdown. Файл, к которому можно отсылаться. Все закрыли. Чат переходим в новый и начинаем верстать уже в нём. Создали, например, в следующем чате страничку закрыли его. Переходим в новый чат и там делаем какие-нибудь интегра.

46: Короче говоря, в идеале реально придерживаться принципа. 1 крупная задача. 1 чат. Ну, если задачи небольшие, то, наверное, нет особого смысла прям уходить в новые чаты. Если вам вдруг важен какой-то контекст, можете сделать маркдаун файлы с инструкциями и к ним.

47: Ссылаться. Если че, следующий лайфхак для экономии ваших токенов, это использовать субагентов как это работает допустим вы работаете в нейронке и хотите сделать какой-нибудь seo аудит чтобы это сделать, нейронке придётся обработать кучу файлов. Все это правильно.

48: Проанализировать и выдать вам длинным списком. Этот отчёт, это само собой нагрузит ваши токены, ну и при этом ещё и засорит чат. То есть ещё раз все, что он там будет делать, все, что он будет читать, все, что он будет обрабатывать, все это будет нагружать ваше контекстное окно для

49: Каких задач придумали субагентов? Если мы делегируем большую крупную задачу субагенту, то он будет работать в отдельном контекстном окне, сам выполнит цикл работ, сам все проанализирует в отдельном контекстном окне, а в основной чат попадёт только его.

50: По резюме, то есть его ответ, то есть десятки тысяч строк кода, которые эти агенты перелопатили, они остались в его контекстном окне и исчезли вместе с ним. У тебя в чате остаётся только полезная выжимка, и это, конечно же, экономит ваши токены в да.

51: В дальнейшем, то есть, когда мы будем работать над следующим запросом, вот эти все размышления субагента никак не нагрузят нашу нейронку, соответственно, сэкономят наши токены. Если что, субагенты есть как в клоде, так и в кодексе. Короче, везде. По сути, это просто инструкции.

52: Там прописывается, какой моделью пользуется агент, какую задачу выполняет агент, какими инструментами он может пользоваться и так далее. Опять же, если хотите подробнее изучить эту тему, посмотрите, мой полный гайд. Также не стоит забывать, что есть ещё такая штука, которая называется скиллы. Этот

53: Также маркдаун инструкции, и они также помогают экономить контекст. То есть, например, вы делали какую-нибудь задачу, которую постоянно сложно делать. Нейронка постоянно ошибалась, но в конечном итоге вы пришли к готовому решению, возьмите и запишите, как правильно делать эту задачу, и

54: И в дальнейшем, когда вы будете выполнять эту задачу, нейронке не надо очень много думать, как её выполнить, она сразу возьмёт и сделает то, что ей надо сделать. Тоже очень важная, полезная штука, которую надо использовать. В чем ещё плюс Скилов и агентов, так это в том, что они подгружаются только

55: Когда вам это надо, что у агента, что у скила есть свой заголовок и есть своё описание и нейронка подгружает нашего агента или скилла, только когда нам это надо. То есть, например, у нас есть скилл для более качественной вёрстки, например, и при запросе, когда нам надо что-то сверстать, нейронка.

56: Сама понимает, что вот исходя из описания, надо подгрузить этот скилл и подгружает его, а до тех пор контекст нейронки нагружают только заголовок и описание наших Скилов или агентов, то есть почти не нагружает следующий лайфхак это не превышать примерно 120000.

57: Токенов в вашем контекстном окне. Сейчас объясню, почему это важно. Опять же, информация немножко дублируется, но просто зафиксируйте это как факт в коде. Относительно недавно вышло обновление, что контекстное окно вместо 200000 токенов стало 1000000 токенов и все, наверное,

58: Подумали, что теперь мы можем гораздо больше нагружать наше контекстное окно, и нейронка будет умной и не будет тупить как бы не так. То есть нейронке все равно приходится обрабатывать кучу старых ваших запросов, чтобы ответить на ваш новый запрос. Это все равно также сбивает.

59: Нейронку, то есть она че то забывает, че то не так интерпретирует и так далее. Эта проблема сохранилась все равно. То есть я бы сказал, что нейронка прям круто, классно, качественно работает на первых 100000 токенов. Дальше уже начинаются стандартные проблемы, когда нейронка начи

60: Тупить так называемый контекст рот, ну а если вы будете вообще жёстко нагружать, например, на 500000 токенов, то нейронка уже совсем будет crazy shit. I совсем будет жёстко тупить, поэтому тут рекомендуется не превышать расход токенов примерно до 120.

61: Тысяч, где-то старайтесь при необходимости использовать splash, компакт, например, команду откаты делать или создавать новые чаты, то есть не перегружайте ваш чат, либо вы можете сделать скил, который будет анализировать весь ваш диалог, суммаризировать его, выделять.

62: Какие-то важные моменты, которые будут нужны в следующем чате. И вы просто возьмёте, скопируете это и вставите в следующий чат. И у следующего чата будет нормальный контекст того, что вы делали до этого. У меня есть такой скилл, который позволяет классно суммаризировать диалог и отправлять выжимку в следующий чат.

63: И думаю, что я его оставлю в своём telegram канале. Туда. Помимо этого, скилла, я ещё закину все свои советы, которые помогают экономить токены плюс мало ли. Я че то забыл. Может, я ещё и дополню этот список. Кстати, подписывайтесь на мой telegram канал там, помимо этого будет куча полезной информации, связанной.

64: Свайп кодингом от разработки админ панели до юридических моментов, которые помогут вам избежать огромных штрафов на вашем сайте. Кучу полезной информации. Я гружу именно туда. Кстати, помимо этого, там каждые 3 дня плюс минус выходит подкаст

65: С новинками в мире искусственного интеллекта. То есть вам больше не придётся ресерчить несколько источников, все самые горячие новинки будут в моём ттг, все в бесплатном доступе, поэтому буду благодарен за подписку и поддержку моего telegram канала. Давайте двигаться дальше. Следующий лайф.

66: Хак, который уже не так очевиден, как были очевидны, возможно предыдущие. Это все записываете в маркдаун файлы. Объясняю, в чем суть, когда у вас в Папке проекта, или вы просто в context ему кидаете, например, pdf, файл, вордовский документ, html, ты, наверное,

67: Думаешь, что даёшь ей только текст. Но по факту нифига помимо текста ты также даёшь нейронке кучу мусора, который ей не нужен, например, в pdf помимо текста зашиты ещё метаданные о шрифтах, координаты каждого символа на странице информация.

68: Об отступах разметки колонок, встроенных картинок, цветовых профилях и так далее. Половина из этого нечитаемы для человека, но для нейронки это все лишние токены. То есть она вынуждена прогонять через себя весь этот лишний шум, поэтому рекомендуется весь текст.

69: Материал, который находится в таких форматах, там ворд pdf, конвертировать это в markdown файл. Что это такое? Если вы хоть чуть чуть работали с нейронками, то вы знаете, что это тот текстовый формат данных, с которыми как раз-таки и работает нейросеть. То есть agents

70: Д для кодекса клод мд, для клода все это маркдаун файлы это обычные текстовые файлы с минимальным форматированием, то есть никаких метаданных, никакой разметки, никакого лишнего шума. В итоге вы кидаете ему одинаковое содержимое как в pdf, так и.

71: Markdown файле. И вот 1 файл нагрузит нейронку на 15000 токенов, например, a2, который в markdown формате на 8000 токенов. И такая оптимизация произошла чисто из за того, что мы поменяли формат данных. Плюс ко всему маркдаун нейронка понимает лучше, чем все.

72: Все остальные форматы, то есть это её родной язык. Соответственно, ей будет проще воспринимать информацию. Теперь давайте поговорим про клод мд и про agents мд опять же в полных гайдах. Про это есть информация, но если коротко, то клод мд и agents мд для

73: Кодекса это файлы, которые подгружаются в начале каждой сессии. Туда можно положить информацию о вашем стеке. На каком стеке вам нравится работать какие-то визуальные предпочтения? Возможно правила оформления кода, как устроена структура и так далее. Помимо

74: Глобального клод мд и agents and который подгружается реально в начале каждой сессии, в начале каждого проекта вы можете под отдельный проект сделать свой клод мд, который будет подгружаться в начале каждой сессии, когда вы работаете именно с этим проектом. И вот тут надо понимать, как я уже говорил,

75: Клод эд эйжен мд подгружаются в начале каждой сессии, и если этот файл будет какой-нибудь невероятно огромный, то есть содержать 1000 строк с инструкциями, то пока нейронка обработает это в начале сессии, она, во первых, потратит огромное количество токенов. Во вторых, может, че

76: Забыть, потому что ей надо обработать очень много информации. И по итогу у вас сразу будет забитое контекстное окно, сразу тупящий клод или кодекс, и вы сразу будете плохо работать. Поэтому тут есть простое правило. Держите клод мд или agents мд до

77: До 200 строк. Записывайте туда только то, что реально важно знать в каждой задаче всю остальную информацию, дизайн, систему, то как у вас там работает структура или ещё какие-нибудь крупные информационные блоки, закидывайте в отдельный маркдаун файлы, вы можете

78: Кстати, в вашем клодд или agent and ссылаться на эти маркдаун файлы, например вы сделали какую-нибудь дизайн систему, оформили её в markdown файл дизайн, точка мд и в клод энд или в эйджен. Вы можете просто написать 1 маленькую строчку дизайн система?

79: Лежит вот в этом файле. Обращайся к ней, когда тебе надо будет что-нибудь сверстать, что-нибудь вот такое и все. Таким образом у вас как бы не будет в самом начале нагружаться контекстное окно на кучу токенов. И при этом, если вы захотите поработать над дизайном, то нейронка будет

80: Понимать, из какого маркдаун файла ей брать информацию о вашей дизайн системе. Очень удобная тема, которая помогает экономить ваши токены. Ай токин ту ми. Следующий лайфхак, это отключать ненужное. Каждая дополнительная функция, которая работает в клоде или в кодексе.

81: Она жрёт какое-то определённое количество токенов, то есть она тебе по факту не нужна, но при этом она хавает токены просто фактом своего существования. Это, например, различные эмсипи, extending финкинг, то есть расширенное мышление, всякие коннекторы, работа в бра.

82: И так далее. Очень много токенов, например, хавает плейрайт эмсипи, который делает скриншоты. То есть, если вам не надо сейчас сверять юай, проверять, как это выглядит, то можете отключить плейрайт эмсипи или прям попросить в чате не использовать его во время. Вы

83: Выполнение этой задачи. Во первых, он жрёт ваши токены, во вторых, он очень сильно увеличивает время выполнения задачи, поэтому, если он вам не нужен, его либо рекомендуется отключить, либо рекомендуется прописать, чтобы не использовал плейрайт эмсипи. Опять же, как это можно сделать кликаем здесь.

84: Slash. Здесь вбиваем эмсипи, например. И вот здесь вот находится список всех эмсипи, которые у нас есть здесь. Например, выбираем плейрайт эмсипи, кликаем энтер. И здесь есть кнопочка дизейбл. Все. Теперь наш плейрайт эмсипи дизейбл и

85: И он никак не будет использоваться в наших запросах. Все чётко. Таким образом вы можете отключать необходимые эмсипи, которые вам нагружают контекст и тратят ваши токены. Давайте двигаться дальше. Следующий лайфхак это выбирайте лёгкие модели для Лёгких задач. Тут опять

86: Опять же, очевидный лайфхак. То есть если я здесь выберу слэш нажму модел, то здесь есть у нас дефолтный опус 4 точка 7 Санет 4 точка 6 и haiku 4 точка 5. Чем мощнее модель, тем она соответственно больше думает и больше тратит

87: Ваши токены, соответственно, для каких-нибудь рутинных задач, например, поменять цвет кнопки, можно использовать хайку, то есть она с этим справится. Санет в целом может выполнять тот же объём задач, что и opus, просто у него выше риск ошибки, ну и

88: 4 точка 7. Это самая мощная модель, которой можно доверить все что угодно. Тот же принцип у нас в кодексе. Кстати, вот видите, здесь кнопочка обновить. У нас появилась опять очередное обновление. Дропнули, кодекс че то вообще жёстко разошёлся. Вот в том видеоролике я разобрал

89: Последние обновления, которые выходили за последний месяц, там их реально много. Кодекс обновился на 7 версий за 1 апрель. Следующий лайфхак, который может вам помочь выполнять ваши задачи более качественно и, соответственно, тратить меньше токена на их исправление, это включать в начал.

90: Каждой сессии режим планирования, что в кодексе, что в клоде есть режим планирования. Вот, например, в кодексе я нажимаю сочетание шифт тап, и у меня включается режим плана. Вот здесь вот, можете заметить, тоже самое работает и в клоде. То есть вот shift апп нажимаю, и у меня

91: Появляется вот здесь вот видите, в правом нижнем углу меняется формат работы. Вот он у меня план мот это режим, в котором нейронка не вносит никакие изменения в ваш код. Она сначала составляет план. То есть ты говоришь, ей надо проработать план по созданию.

92: Такого-то приложения или такого-то сайта. Вот у меня есть такие-то файлы с информацией, такие-то файлы с тз давай составим план для реализации данной задачи. Она читает все ваши файлы с тз, все ваши инструкции, какие-то файлы с кодом, если они есть и создаёт вам

93: Итоговый план, который вы можете либо апрувнуть, то есть сказать lets go, либо внести какие-то корректировки, чтобы он переделал ваш план только после того, как вы утвердите план, она начнёт выполнять работу. Это, соответственно, также помогает нейронке.

94: Сразу понять задачу, то есть она сразу будет понимать, че ей надо делать. Это, в свою очередь, экономит токены, потому что, скорее всего, она где-нибудь косякнет, вы че-нибудь будете исправлять, и потом опять этот чат будет наполняться и, соответственно, токены будут тратиться, а благодаря режиму

95: Планированию вы уменьшите риск возникновения больших ошибок для процесса планирования. Также классно подходит плагин, который называется super powers. Про него я делал вот здесь вот обзор. Это очень крутой плагин для клод кода и для кодекса, кстати, тоже он там тоже есть. Короче, это

96: Плагин, в который встроена куча Скилов, который помогает вашей нейронке сначала правильно задать вам нужные вопросы. То есть он работает в формате брейншторминга, сначала обсуждает с вами задачу, потом занимается её планированием, потом занимается её реализацией, потом занимается её тестированием.

97: И в конечном итоге у вас получается сразу более менее готовый качественный продукт без внесения огромного количества правок. Этот плагин, естественно, необходим только для таких крупных задач, которые вы хотите изначально продумать, перед тем, как сделать для каких-нибудь самых базовых

98: Простых задач этот плагин будет лишним. Очень советую посмотреть мой видеоролик по этой теме. Следующий блок будет посвящён именно клоду, а именно как растянуть его пятичасовые лимиты. У нас есть пятичасовое окно, в течение которого мы можем потратить наши днев.

99: Лимиты. Начало этого пятичасового окна отчитывается от вашего 1 сообщения, которое вы ему отправите. Например, вы начали работать в 9 утра и ваше пятичасовое окно с 9 до 14:00. Или если вы начали работать в 10, то ваше окно

100: Соответственно, с 10 до 15 пятичасовое. То есть, если вы, например, начали в 10 и в 12 уже упёрлись в лимиты, потратили большое количество токенов, то они у вас возобновятся только после 15:00. Что мы с этим всем можем сделать?

101: Чтобы улучшить нашу работу. Допустим, вы знаете, что вы уходите в лимиты примерно за 2 часа, где-то в клоде есть такая штука, которая называется клод routines. Опять же, я про это рассказывал вот в этом видеоролике. Давайте я это открою. Вот у нас есть вкладка клод код.

102: И вот здесь у нас есть рутин, что мы можем сделать? Мы можем создать новую рутину, которая будет отправлять каждый день в 6 утра. Например, какое-нибудь сообщение маленькое это сообщение будет запускать наше пятичасовое окно. То есть, если мы, например,

103: Отправляем ему сообщение в 6 утра, то, соответственно, наше окно начинается с 6 и заканчивается в 11. Таким образом, если вы приступите к работе в 9 утра, то с 9 до 11 вы всадите все ваши лимиты, и они автоматически с 11 часов.

104: Продлеваются. Надеюсь, вы поняли меня. То есть с 9 до 11 вы всадили весь свой лимит, и с 11 он начинается заново. Таким образом, вы без большой паузы можете продолжить вашу работу. Вау, я когда сценарий составлял, у меня самый финальный тейк был про пиковый.

105: Часы работы клода то, что в пиковые часы лимиты сгорают быстрее, но данная тема устарела пару дней назад буквально, что произошло 6.05.2026 антропия заколлабимся со space x.

106: Центру колоссус 1 в Мемфисе это огромное количество мегаватт мощности в связи с этим антропилорического работы в клод код, а именно в pro max тим и энтерпрайз теперь в лимиты уйти стало гораздо сложнее.

107: И помимо этого, они убрали вот эти ограничения по пиковым часам. То есть раньше в клоде были определённые временные промежутки, в которые гораздо быстрее ты мог улететь в лимиты. Сейчас это уже неактуально. Ну и также по аппе они подняли raid лимитс для.

108: Opus моделей тоже круто. В общем какой-то вот такой видеоролик у меня получился. Возможно я что-то недорассказал, я это обязательно в тг канале дополню, если че то забыл, также можете писать свои лайфхаки по экономии токенов тоже буду рад почитать всем спасибо за просмотр.

109: Надеюсь, этот видеоролик был для вас полезен?