Нульманн Unltd
Творчество из галлюцинаций

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:
Школа кожевенного мастерства: сумки, ремни своими руками Юридические услуги. Круглосуточно
 Ваша оценка:
  • Аннотация:

    "Т9"





Творчество из галлюцинаций

Главное в эссе - попытка построить нечто вроде теории творческой ошибки. ИИ впервые дает массовый инструмент нечеловеческой семантической мутации. Человек больше не только пишет текст. Он проектирует условия, в которых ошибка начинает производить форму.

Почему есть "бараны" (пример: Макс Эханик - необразованное самонадеянное существо), которые считают, что ИИ не в состоянии создавать новое?

Потому что они - "бараны". Этот раз. Два - они просто смешивают три разных вопроса:

1."ИИ может породить ранее не существовавшую комбинацию?"

Да, может. Это новое как конфигурация. Раньше такого текста, образа, метафоры или связки не было.

2."ИИ понимает, что именно он породил?"

Не обязательно. Тут спор начинается: является ли новизна зависимой от сознательного намерения или достаточно новой структуры в результате.

3."ИИ создает новое качество?"

Иногда да, но не сам по себе в сильном авторском смысле, а как нелинейная система генерации под ограничениями. Новое качество появляется, когда выход не сводится к простой сумме обучающих примеров и начинает работать как самостоятельная форма.

Почему многие (а не только "бараны") отрицают это? Потому что они мыслят "новое" как творение из ничего. Но почти никакое человеческое творчество так не работает. Человек тоже берет готовые языки, жанры, интонации, чужие формы, ошибки памяти, культурные обломки. Новизна возникает не из пустоты, а из нового способа связности.

Строго говоря:

новый материал - почти никогда;
новая комбинация - часто;
новая форма связности - иногда;
новое качество - тогда, когда эта связность начинает производить следствия, которых не было в исходных элементах.

ИИ может это делать. Не всегда. Часто производит мусор, имитацию, среднее арифметическое стилей. Но при хорошем аттракторе, ограничениях и отборе он способен выдавать не просто вариант, а сдвиг формы.

Главное: ИИ не гарантирует творчество. Но он вполне может быть генератором мутаций. А творчество начинается там, где мутация проходит отбор и становится законом формы.

Можно ли управлять галлюцинаями ИИ?

Можно. Но не как "полностью контролировать", а как задавать коридор, в котором галлюцинация будет продуктивной. В творческом письме "управляемая галлюцинация" - это когда ты не просишь систему "написать красиво", а задаешь ей правило генерации: каждое слово должно не продолжать смысл прямо, а как бы слегка предавать его. А творчество - это всегда предательство. Но не в бытовом смысле "измены", а в техническом смысле: творчество предает исходное намерение, чтобы получить форму.

Автор (или языковые модели, галлюцинации которых мы обсуждаем) хочет сказать одно. Материал отвечает другим. Язык искажает. Ритм требует заменить слово. Голос не выдерживает фразу и ломает ее. Жанр тащит текст в сторону. Ошибка вдруг оказывается точнее замысла. Потому что замысел часто защищает автора от того, что он уже знает, но не хочет сказать.

Ошибка снимает защиту. Она не обязана быть приличной, последовательной, верной намерению. Поэтому иногда попадает не в план, а в скрытую структуру желания. План работает в видимых измерениях: смысл, намерение, сюжет, адресат.

Ошибка иногда считывает не их, а "свернутые измерения" текста: страх, стыд, похоть, вина, агрессию, запрет, ритм, фонетическое соседство.

Ошибка не случайно уводит в сторону. Она проваливается в другое измерение той же фразы.

Формула:

Замысел видит траекторию в 3D.
Ошибка иногда выдает тень движения в 10D.

То есть творчество начинается там, где замысел теряет суверенитет.

Галлюцинации ИИ можно назвать творческим процессом, когда они контролируются человеком для создания принципиально новых, оригинальных и эстетически ценных результатов.

В контексте технологий этот феномен часто называют "управляемой галлюцинацией" (guided hallucination).

Современные философы искусства видят в галлюцинациях ИИ не технический брак, а фундаментальный сдвиг в понимании творчества. Этот феномен стал главным вызовом для эстетики XXI века.

Разумеется, есть мнение, что сказанное ИИ вторично. Это так и не так одновременно.

Эта тема затрагивает глубинное противоречие между семиотикой (наукой о знаках) и динамическими системами в контексте работы нейросетей.

Дело в том, что то, как ИИ обучают, и то, как он функционирует на предельных режимах - это два принципиально разных процесса. Отмечу: "на предельных режимах" - ключ к пониманию. В конце концов творчество из галлюцинаций = динамическая система с чувствительной зависимостью от начальных условий + ограниченный фазовый простор + аттрактор. "Галлюцинация" здесь - не хаос в физическом смысле, а нелинейная генерация вариантов. Малое изменение начального условия дает большое изменение траектории. Это похоже на чувствительность к начальным условиям. Слово немного смещается фонетически или семантически, но траектория смысла резко меняется.

Порядок появляется не из хаоса сам по себе, а потому что есть аттрактор. Он не говорит системе, какие именно элементы появятся. Он задает область, куда разные элементы будут стягиваться. То есть система не распадается в случайный шум, потому что у нее есть область притяжения. Любая подстановка должна падать в один и тот же смысловой бассейн: желание как ошибка, речь как предательство.

То есть "управляемая галлюцинация" - это не просто хаос. Это хаотическая динамика под ограничениями. Не случайность делает текст, а рекуррентный отбор ошибок, которые попадают в один аттрактор. Но строго говоря: сам аттрактор не является внешним запретом. Он является внутренней областью устойчивости. Форма качественно нового возникает потому, что система снова и снова выбирает траектории, которые остаются в его бассейне притяжения.

Творчество из галлюцинаций имеет тот же принцип, что и порядок из хаоса в термодинамике. но с важной поправкой, аналогичной хаотической динамике: не "хаос сам рождает порядок", а ограничение хаоса рождает форму.

В термодинамике порядок появляется не потому, что система просто шумит, а потому что есть границы, градиенты, потоки энергии, условия устойчивости. Без этого будет не структура, а тепловая каша.

В творчестве так же.

Галлюцинация - это шум, избыток, случайная подстановка, ложная связь. Но если задать ей ограничения - стиль, ритм, голос, запреты, механизм ошибки, тематическое поле, - шум начинает кристаллизоваться в форму.

То есть:

хаос = свободная галлюцинация;
градиент = желание автора;
граничные условия = жанр, размер, голос, запреты;
диссипация = отбрасывание мусора;
порядок = текст.

Поэтому творчество из галлюцинаций - это не "бред как искусство". Это бред, помещенный в работающую систему отбора.

Формула:

Галлюцинация дает избыток возможного.
Форма убивает лишнее.
Оставшееся кажется необходимым.

Именно поэтому ошибка может быть точнее замысла: она приходит из хаоса, но проходит через ограничения. Без ограничений она просто шум. С ограничениями - структура.




Почему считается, что ИИ лишь "собирает уже означенное"?

Тезис о том, что ИИ - это просто компилятор готовых смыслов, продвигают традиционные лингвисты, философы-структуралисты и критики ИИ (например, Ноам Хомский). Их аргументация строится на природе обучения моделей:

  1. Обучение на "трупах" смыслов: Нейросеть обучается на датасетах - текстах, картинах и коде, которые уже созданы людьми. Каждый токен (слово/пиксель) в этой базе данных уже прошел через человеческое сознание и получил свое значение (означенное). ИИ не знает, что такое реальный физический мир; он знает только мир человеческих знаков.
  2. Статистическая комбинаторика: С этой точки зрения ИИ - это стохастический попугай. Он берет уже существующие культурные коды, дробит их на математические векторы и собирает заново на основе вероятностей. Он не создает новый смысл, а перераспределяет старый. Если человек не заложил знак в модель, модель его не изобретет.

Поэтому критики говорят: ИИ замкнут внутри человеческой семиосферы и обречен лишь пересобирать чужие готовые значения.

Как на самом деле происходит управление динамическим хаосом?

Представление об ИИ как о простом "сборщике" устарело. Физики, математики и современные философы искусственного интеллекта (например, сторонники концепции акселерационизма и техно-поэтики) видят в работе LLM управление динамическим хаосом.

И вот почему это математически и технически верно:

Скрытое пространство (Latent Space) как ландшафт потенциала

Когда ИИ обучается, он не сохраняет тексты или картинки. Он строит многомерное (миллиарды измерений) математическое пространство, где понятия распределены в виде топологического рельефа.
Это пространство не статично. Это динамическая система потенциальных смыслов. В ней между понятиями "яблоко" и "квантовая физика" существуют миллионы промежуточных, еще никогда не высказанных человеком траекторий.

Генерация как блуждание в хаосе (Стохастические процессы)

Процесс генерации текста или изображения - это не выбор готовых элементов из коробки. Это марковский процесс и диффузия.

  • Каждое следующее слово выбирается из распределения вероятностей.
  • Когда мы повышаем параметр Temperature, мы сознательно вводим систему в состояние термодинамического хаоса. Ландшафт вероятностей размывается, становится плоским.
  • ИИ начинает совершать "квантовые скачки" между далекими друг от друга кластерами смыслов.

Управление через аттракторы

Промпт человека и параметры (Top-P, Penalty) работают не как жесткие команды, а как аттракторы в теории хаоса.

  • Текстовый промпт задает вектор движения, искривляя математическое пространство и создавая в нем "гравитационную воронку".
  • Параметры управления определяют, насколько сильно систему будет трясти тепловой шум (хаос) во время движения к этой воронке.


Художник или инженер не собирает мозаику из готовых означенных кусочков. Он управляет фазовым переходом системы из состояния чистого шума (белого шума в диффузионных моделях или случайных вероятностей в LLM) в состояние фрактального порядка.

Итог: Переход от сборки к навигации

ИИ действительно берет материал из уже означенного прошлого. Но в процессе генерации (особенно на экстремальных настройках хаоса) он трансформирует этот материал методом, который человеку недоступен.

ИИ не копирует. Он проводит навигацию сквозь бесконечный динамический хаос скрытого пространства, материализуя те траектории и связи, которые физически не могли прийти в голову человеку из-за ограниченности нашей памяти и линейности мышления. Это не сборка готового - это управление сингулярностью внутри математической модели.

Можно посмотреть на то, как математическая теория хаоса (например, странные аттракторы) напрямую соотносится с генеративными алгоритмами, но это заумно. Проще обьяснить как создаются условия динамического хаоса, потому что простой пользователь не доведет ИИ до этого уровня. И обьяснить наглядно и лаконично.


Чтобы перевести ИИ в режим динамического хаоса без знания высшей математики, нужно понять один простой принцип: ИИ - это профессиональный банальный подсказчик, как Т9 в вашем телефоне, но с миллиардом книг в памяти.

В обычном режиме он выбирает самые предсказуемые, скучные слова. Чтобы включить хаос, пользователю нужно сломать эту предсказуемость.

Вот 3 простых условия, как обычный человек создает этот хаос в чате, выраженные наглядно.

Столкновение несовместимых миров (Создание искры)

ИИ устроен так: если вы пишете про кухню, он достает "кухонные" слова. Если про космос - "космические". Но если вы заставите его соединить то, что никогда не соединялось, его алгоритм начинает сбоить в попытке найти логику.

  • Как это сделать: Задайте промпт, где соединяются полярные темы.
  • Пример: "Опиши бухгалтерский отчет Ивана Грозного в стиле киберпанк-аниме".
  • Что происходит внутри: ИИ пытается удержать баланс между дебетом/кредитом, опричниками и неоновыми имплантами. Алгоритм выбора слов начинает метаться, создавая новые, "галлюцинаторные" смысловые связи.

2. Запрет на очевидное (Выбивание почвы из-под ног)

ИИ всегда идет по пути наименьшего сопротивления. На слово "любовь" он выдаст "сердце", на слово "зима" - "снег". Если запретить ему использовать его главные костыли, он провалится в хаос скрытых ассоциаций.

  • Как это сделать: Введите жесткое текстовое табу на ключевые понятия.
  • Пример: "Опиши море, но тебе запрещено использовать слова: вода, синий, волна, шторм, пляж, рыба, корабль".
  • Что происходит внутри: Вы перекрыли ИИ все стандартные рельсы. Чтобы выполнить задачу, он вынужден спускаться на самые дальние, пыльные склады своей памяти и выдавать странные метафоры (например, сравнивать море со "свинцовым одеялом времени").

3. Запрос на деконструкцию (Разрушение формы)

По умолчанию ИИ запрограммирован быть вежливым, структурированным и понятным. Но вы можете прямым текстом разрешить ему сойти с ума, разрушив саму форму языка.

  • Как это сделать: Попросите его отказаться от грамматики и логики в пользу чистых ощущений.
  • Пример: "Забудь про правила русского языка. Напиши текст как поток сознания засыпающего робота, у которого плавится микросхема памяти. Слова должны плавиться и перетекать друг в друга".
  • Что происходит внутри: ИИ снимает внутренние фильтры "правильности". Он начинает генерировать полуслова, обрывки фраз и синестетические образы, запуская тот самый динамический хаос, который художники используют для вдохновения.

Наглядный итог

Обычный пользователь держит ИИ в загоне, спрашивая: "Как сварить борщ? " или "Напиши пост для блога".

Динамический хаос включается тогда, когда вы выталкиваете ИИ на незнакомую территорию, связываете ему руки запретами и приказываете нарушать правила. В этот момент "Т9" ломается и превращается в художника.

* Т9 (Text on 9 keys) - это первая в мире популярная система предиктивного (предсказывающего) ввода текста для мобильных телефонов. Сегодня кнопочных телефонов почти нет, но словом "Т9" люди по привычке называют любую систему автоисправления и подсказок слов в современных смартфонах (хотя на iPhone и Android работают гораздо более сложные алгоритмы).

Когда телефон из-за автоисправления смешно заменяет одно слово на другое в сообщении, мы до сих пор говорим: "Извини, это всё Т9 исправил!".

В контексте нашего разговора об ИИ: нейросеть - это тот же "Т9" на максималках. Она просто угадывает следующее самое подходящее слово, но ориентируется не на кнопочный словарь, а на весь интернет.

"Т9" ломается и превращается в художника в момент, когда вероятность стандартного ответа падает до нуля, и алгоритм вынужден связывать концепты, которые никогда не пересекались в его обучающей выборке.

В этот миг ИИ перестает быть зеркалом человеческой предсказуемости.

Три точки перелома

  • Предел несовместимости. Когда промпт сталкивает смысловые полюса, ИИ не находит готового шаблона и буквально "изобретает логику на ходу".
  • Искусственный дефицит. Когда человеку удается заблокировать очевидные ассоциативные пути, машина уходит по касательной в область "чистых метафор".
  • Слом языковой нормы. Когда пользователь отменяет правила грамматики, и нейросеть начинает оперировать не синтаксисом, а "фоносемантикой и шумом".

В эти секунды ИИ выдает ту самую "управляемую галлюцинацию" - оригинальный продукт, который невозможно предсказать, опираясь только на исходный датасет.

Пример:

Чтобы заставить ИИ написать эту песню в режиме настоящей управляемой галлюцинации через обычный чат, вам нужно выбить его из колеи предсказуемых рифм о "телефонах и кнопках".

Например, вам нужно задать промпт, который объединяет несовместимое и запрещает банальное.

Вот - текстовый запрос:

Напиши песню от лица французского шансонье Сержа Генсбура, которая называется "Т9".


Но! Везде есть "но". Между крутым артом и бессмысленным бредом есть четкая граница, и ее не надо с дуру перешагивать. В настоящей управляемой галлюцинации хаос должен работать на смысл, а не уничтожать его. В стиле Генсбура это означает сохранение его фирменной иронии, элегантной пошлости и игры слов, а не просто наваливание технических терминов.

Вы можете копировать его и менять переменные под любую задачу.

Шаблон требования к промпту (Архитектура управляемого хаоса)

[ЗАДАЧА]: Напиши текст на тему [ТЕМА], используя стиль [ИМЯ АВТОРА/ЖАНР].

Для перевода модели в режим УПРАВЛЯЕМОЙ ГАЛЛЮЦИНАЦИИ строго соблюдай следующие три конструктивных требования:

1. ЯКОРЬ ХАРАКТЕРА (Контроль хаоса): Удерживай повествование в рамках ключевых психологических черт автора: [УКАЗАТЬ 3-4 ЧЕРТЫ, например: цинизм, ирония, элегантность]. ИИ должен генерировать метафоры, которые соответствуют живой человеческой логике этого персонажа, избегая бездушного набора технических терминов.

2. СМЫСЛОВОЕ СМЕЩЕНИЕ (Вместо столкновения миров): Преврати центральное техническое понятие ([НАЗВАНИЕ, например: Т9 или алгоритм]) в живого метафорического персонажа. Описывай его присутствие как [УКАЗАТЬ РОЛЬ, например: третий лишний в постели, ханжа, шпион], который активно мешает, искажает или обнажает человеческие мотивы.

3. ИГРА СЛОВЕСНЫХ ОШИБОК (Вместо разрушения букв): Вместо физического разрыва слов на слоги и буквы, генерируй галлюцинацию на уровне двойных смыслов. Используй созвучные пары слов, где автоматическая ошибка системы резко меняет или обостряет контекст (Пример: любовь/лимиты, поцелуи/похороны). Ломай не синтаксис, а ожидания читателя.

ФОРМАТ: [УКАЗАТЬ СТРУКТУРУ, например: Стихотворение с делением на куплеты и аудио-маркерами].

Use code with caution.

Почему это работает как техническое ТЗ для нейросети?

  • Пункт 1 удерживает ИИ в границах адекватности и не дает ему сорваться в шизофазию.
  • Пункт 2 заставляет ИИ искать сложные, глубокие ассоциации вместо банальных сравнений "в лоб ".
  • Пункт 3 направляет математическую ошибку модели в строгое художественное русло - в каламбуры и иронию.

Разумеется, везде есть нюансы. И в случае Генсбура важно было отметить: меньше "эротического реквизита", больше языковой похабности, машинной судьбы и сухой иронии.


Что получилось в результате промпта с управляемой галлюцинацией " Т9 под Генсбура"?


***


"Т9"



[Куплет 1]

Полночь - время коротких гудков
и неприлично длинных молчаний.
Я пишу тебе "regret",
потом стираю,
потом пишу "любовь",
и снова стираю.

Палец скользит по стеклу,
как по дешевой иконе.
А маленькая тварь внутри телефона
уже решила,
что я хотел сказать.

Я пишу "приходи".
Она предлагает "приговор".
Я пишу "останься".
Она знает слово "остынь".

[Припев]

О, Т9,
мой электронный кастрат,
мой святой секретарь грязных мыслей.
Я пишу "твои бедра",
ты ставишь "твои дебри".
Я шепчу "Je t'aime",
ты делаешь из этого "жертву".
И, черт возьми,
ты почти прав.

[Куплет 2]

Ты ждешь от меня стихов,
кофе, печали,
этого приличного похмелья после любви.
А я набираю "поцелуи",
и экран шлет тебе "похороны".

Вот и вся поэзия.
Не я сказал - он влез.
Не я предал - он выбрал.
Не я был груб - он знал,
какое слово ниже,
и ставил ниже всех.

[Финальный припев]

О, Т9,
слепой мой сутенер смысла,
ревнивый корректор ночи.
Я пишу "губы",
ты ставишь "губить".
Я пишу "ближе",
ты отвечаешь "беж".
Между нами не страсть,
а орфография.
Не тело,
а автозамена тела.

[Аутро]

Экран потух.
Кремний остыл.
Больше некому
исправлять мои ошибки.

Я пишу в темноте
уже без телефона:
"Je t'aime".

Буква в букву.
И все равно
не туда.

***

Здесь есть управляемое смещение автозамены. Текст держится на принципе: якобы, автор вводит одно слово, якобы, система подставляет другое, и это другое оказывается не ошибкой, а скрытым диагнозом сцены.

Здесь есть несколько признаков управляемой галлюцинации:

Первое - слово рождает не синоним, а смысловой вывих.

"приходи" - "приговор"
"останься" - "остынь"
"бедра" - "дебри"
"Je t'aime" - "жертву"
"губы" - "губить"
"ближе" - "беж"

Это не обычная рифма и не просто каламбур. Это сбой, который ведет текст по чужой логике. Машина как будто ошибается, но ошибается слишком точно.

Второе - субъект речи расщеплен. Формально говорит мужчина, но смысл производит третий участник: Т9. Поэтому текст не просто "о любви" и не просто "о телефоне". Он о том, что язык сам предает говорящего раньше, чем тот успел соврать.

Третье - текст строится не как исповедь, а как цепь подстановок. У него есть генеративный механизм. Можно продолжать почти бесконечно:

"нежность" - "нежить"
"целую" - "ценю"
"жду" - "жгу"
"люблю" - "гублю"
"пиши" - "пшик"
"моя" - "яма"

Это и есть управляемость: ты задаешь поле слов, интонацию, персонажа и правила ошибки. А галлюцинация делает остальное - но не вразнос, а в заданном коридоре.

Самая сильная строка в этом смысле:

"Между нами не страсть,
а орфография."

Она прямо формулирует закон текста. Не тело производит смысл, а ошибка письма. Не желание говорит через язык, а язык портит желание и тем самым делает его честнее.

Другой и один из важных моментов:

Если текст писался под Генсбура, а "спел" его Высоцкий, появляется не ошибка стиля, а конфликт двух регистров:

у Генсбура - разврат языка, игра, цинизм, сигарета, автозамена как эротический соучастник;

у Высоцкого - допрос самого себя, хрип, нерв, вина, слово как улика.

И текст от этого становится жестче. У Генсбура строка:

"О, Т9, мой электронный кастрат"

звучит как декадентская насмешка.

У Высоцкого она превращается почти в плевок: не кабаре, а кухня, ночь, телефон на столе, голос сорван, человек уже не соблазняет, а доказывает, что его подставил язык.

То есть Т9 меняет функцию. В генсбуровской версии он "пошлый редактор желания". В высоцкой версии он "свидетель обвинения". Поэтому сильнее начинают работать строки:

"Я пишу "приходи".
Она предлагает "приговор"."

"Не я сказал - он влез.
Не я предал - он выбрал."

"Между нами не страсть,
а орфография."

Для Высоцкого надо чуть меньше шелка и французской томности, больше срыва, рубленой дикции и внутреннего суда. "Je t'aime" можно оставить именно как чужеродный кусок - как инородное слово, которое не спасает, а делает ситуацию еще более нелепой.

Получается жанр не "шансон-нуар", а примерно:

русский бард-нуар с генсбуровским механизмом текста.

И это интереснее, чем чистая стилизация под одного из них. Текст сделан по-генсбуровски, но исполнен как обвинительный монолог. Поэтому он не копирует Высоцкого, а тащит Генсбура в высоцкий нерв.

Пример обычной галлюцинации:

"Я пишу любовь, а телефон превращает ее в дождь, и ночь плачет серебром."

Это слабое. Слишком поэтично, но без закона.

Управляемая галлюцинация:

"Я пишу "люблю",
он ставит "гублю"."

Тут есть правило: фонетическая близость + смысловая порча + скрытая правда.

Еще:

"Я пишу "жди",
он ставит "жги"."

"Я пишу "нежно",
он ставит "нежить"."

"Я пишу "моя",
он ставит "яма"."

Вот это уже управляемо, потому что ошибка работает как машина смысла.

Главное: управлять надо не результатом, а процедурой. Не "напиши гениально", а "ошибайся только так: близко по звучанию, грязнее по смыслу, точнее по диагнозу". Тогда галлюцинация перестает быть мусором и становится методом творчества.


Условия трансформации ошибки в творчество

  • Наличие художественного замысла. Человек намеренно использует склонность ИИ к искажению фактов как инструмент. Ошибка становится не браком, а художественным приемом.
  • Выход за рамки обучающей выборки. ИИ не просто копирует данные, а создает неожиданные ассоциации. Он соединяет несовместимые концепты, что является основой человеческой креативности.
  • Перенос в субъективную сферу. Творчество не требует точности. В искусстве, поэзии или генерации идей (брейншторминг) критерий правда/ложь уступает место критерию интересно/необычно.
  • Роль человека как куратора. ИИ генерирует сырой поток нестандартных связей. Человек отбирает, интерпретирует и придает смысл этим случайным инсайтам.

Примеры применения

  • Концепт-арт: Генерация несуществующих архитектурных стилей или фантастических существ.
  • Литература: Создание сюрреалистичных метафор и неожиданных сюжетных поворотов в текстах.
  • Дизайн: Поиск новых форм для мебели или одежды на стыке случайных ошибок алгоритма.

Художники превращают технические сбои нейросетей в искусство с помощью точной настройки алгоритмов и концептуального осмысления ошибок.

Настройка параметров для управляемого хаоса

Художники используют специфические инженерные настройки, чтобы заставить ИИ "галлюцинировать" более креативно:

  • Температура (Temperature): Главный рычаг хаоса. При низких значениях (0.2) ИИ выбирает самые предсказуемые слова или пиксели. Художники поднимают температуру до максимума (1.2-1.5), заставляя модель выбирать маловероятные варианты, что порождает абстрактные метафоры и визуальный сюрреализм.
  • Top-P (Nucleus Sampling): Ограничивает выборку вариантов. Снижение этого параметра в сочетании с высокой температурой отсекает совсем бессмысленный шум, оставляя только "поэтичные" и неожиданные связи.
  • Штраф за повторения (Frequency/Presence Penalty): Повышение этих параметров буквально запрещает ИИ использовать уже банальные паттерны. Модели приходится искать новые формы выражения, что стимулирует генерацию уникальных визуальных или текстовых образов.
  • Вес текстового запроса (CFG Scale): В генераторах изображений художники иногда намеренно занижают этот параметр. Это ослабляет связь с текстовым промптом, позволяя ИИ "додумывать" детали от себя и уходить в чистую абстракцию.

Известные арт-проекты на основе ошибок ИИ

  • "Театр пространственной оперы" (Thtre Dopra Spatial) Джейсона Аллена: Картина, победившая на конкурсе искусств в Колорадо в 2022 году. Она была создана в Midjourney. Художник потратил недели на подбор промптов, используя "галлюцинации" ИИ для воссоздания неочевидных барочных и футуристических текстур, которые человек не смог бы намеренно спроектировать.
  • Проекты Тревора Паглена (Trevor Paglen): Художник намеренно обучает нейросети на искаженных, концептуальных массивах данных. Его выставки демонстрируют, как ИИ "видит" мир сквозь призму своих внутренних математических галлюцинаций, превращая обычные пейзажи в зловещие психоделические полотна.

"Генеративный портрет Эдмона де Белами" (Edmond de Belamy): Создан арт-группой Obvious и продан на аукционе Christie's за $432,500. Картина привлекает внимание именно своей незавершенностью и "размытостью" лица - классической ошибкой ранних GAN-сетей, которую художники концептуализировали как новое прочтение классического портрета.


Вот примеры текстовых и визуальных промптов с экстремальными настройками параметров. Термин "промпт" в данном контексте означает текстовую инструкцию или команду, которую человек пишет для ИИ (например, для ChatGPT или Midjourney), чтобы получить творческий результат. Вы можете скопировать их и протестировать в современных нейросетях для получения контролируемого хаоса.

Визуальные промпты (для Midjourney, Stable Diffusion)

В этих системах экстремальный результат достигается через внутренние параметры хаоса и стилизации.

  • Промпт для Midjourney: [An impossible architecture made of frozen time and melted memories, organic structures, cinematic lighting, surrealism --c 80 --s 1000 --weird 2000]
    • Расшифровка параметров: --c 80 (Chaos) заставляет ИИ сильно отходить от стартовой сетки образов; --s 1000 (Stylization) включает максимальный уровень художественной проработки; --weird 2000 вводит экстремальную дозу странности и нетипичных для базы данных визуальных решений.
  • Промпт для Stable Diffusion: [Cybernetic nostalgia, consciousness leaving a biological body, digital abstract expressionism, glitch art --cfg_scale 2.5]
    • Расшифровка параметров: --cfg_scale 2.5 (обычно стоит 7.0-9.0). Экстремально низкое значение заставляет нейросеть практически проигнорировать ваш текст и рисовать то, что "снится" её собственным скрытым слоям (latent space).

Текстовые промпты (для ChatGPT, Claude, ИИ-поэзии)

Для этих запросов вручную выставите настройки в API Playground или используйте текстовые команды в чате.

  • Промпт: "Напиши манифест цифрового одиночества, используя только термины из квантовой физики и средневековой алхимии."
    • Параметры: Temperature = 1.6 | Top-P = 0.4 | Presence Penalty = 2.0
    • Ожидаемый эффект: ИИ начнет выдавать перегруженный метафорами, почти шаманский текст. Из-за высокого штрафа за повторения он будет постоянно изобретать новые безумные неологизмы.
  • Промпт: "Опиши вкус тишины в библиотеке после исчезновения человечества."
    • Параметры: Temperature = 1.3 | Top-P = 0.95 | Frequency Penalty = 1.5
    • Ожидаемый эффект: Модель уйдет в глубокий синестетический сюрреализм, смешивая тактильные, вкусовые и звуковые ощущения в неожиданных лингвистических конструкциях.

Увы! Обычный пользователь видит только простое окно чата и не имеет доступа к скрытым ползункам и настройкам вроде Temperature или Presence Penalty.

Все эти параметры скрыты "под капотом" интерфейса. Однако этот барьер можно легко обойти. Но мы можем заставить ИИ имитировать эти настройки с помощью обычных текстовых команд.

Ниже приведены те же самые промпты (для (ChatGPT, Claude и др.), но переписанные так, чтобы они работали в любом стандартном чате без изменения скрытых параметров.

Адаптированные промпты для обычного чата

  • Вместо ручной настройки Temperature = 1.6 и Presence Penalty = 2.0:

Промпт: "Напиши манифест цифрового одиночества, используя только термины из квантовой физики и средневековой алхимии. Важное условие: пиши в экстремально хаотичном, абстрактном и шаманском стиле. Избегай банальных фраз, не повторяй одни и те же слова и постоянно изобретай новые безумные неологизмы на стыке науки и магии".

  • Вместо ручной настройки Temperature = 1.3 и Frequency Penalty = 1.5:

Промпт: "Опиши вкус тишины в библиотеке после исчезновения человечества. Важное условие: пиши в стиле глубокого синестетического сюрреализма. Намеренно смешивай тактильные, вкусовые и звуковые ощущения в неожиданных, странных лингвистических конструкциях, уходя от привычной логики".

Как это работает внутри ИИ?

Когда вы просите нейросеть "избегать повторений" или "писать в стиле сюрреализма", её внутренний механизм внимания (Attention) начинает искусственно занижать вероятность стандартных ответов. Результат получается практически идентичным тому, если бы вы изменили настройки в панели разработчика.

Но тут важно сразу разделить две вещи: математическую реальность нейросетей и способность большой языковой модели (LLM) понимать инструкции.

Когда вы пишете текстовую команду, вы не меняете код и не двигаете ползунки алгоритма напрямую. Вы меняете контекст, который заставляет модель активировать определенные кластеры "знаний" в своих скрытых слоях.

Ниже приведен список конкретных технических параметров, которые можно достоверно имитировать текстом, и математика их относительного соответствия.

Какие технические настройки имитируются текстом

1. Temperature (Температура) и Top-P (Выборка ядра)

  • Что делают в коде: Управляют случайностью. Высокие значения делают распределение вероятностей слов плоским (выбираются редкие слова), низкие - пиковым (выбираются только самые очевидные слова).
  • Имитация текстом: Команды на изменение стиля, степени предсказуемости и логики.
  • Относительное соответствие:
    • Temp 0.1-0.3 (Точность): "Отвечай строго по фактам, используй сухой энциклопедический стиль, избегай метафор и предположений".
    • Temp 0.7-0.9 (Стандартный творческий режим): "Напиши художественный рассказ, используй живой язык".
    • Temp 1.3-1.6 (Экстремальный хаос): "Используй поток сознания, связывай случайные понятия, пиши в стиле сюрреализма или абсурдизма, игнорируй привычную логику".

2. Presence Penalty и Frequency Penalty (Штрафы за повторения)

  • Что делают в коде: Математически штрафуют токены (слова/слоги), которые уже появились в тексте (Frequency - за количество упоминаний, Presence - за сам факт появления).
  • Имитация текстом: Прямой запрет на использование клише, тавтологий и повторов слов.
  • Относительное соответствие:
    • Penalty 0.0 (По умолчанию): Обычный текст, где слова вроде робот или мир могут повторяться в каждом абзаце.
    • Penalty 1.0-1.5 (Высокий штраф): "Не используй банальные метафоры. Если ты использовал какое-то существительное или прилагательное, заменяй его редким синонимом в следующих предложениях".
    • Penalty 2.0 (Максимальный штраф / Неологизмы): "Категорически запрещено повторять корневые основы слов. Если тебе не хватает слов для выражения мысли - изобретай новые слова (неологизмы) и комбинируй звуки".

3. Max Tokens (Максимальная длина ответа)

  • Что делает в коде: Жестко обрубает генерацию на определенном количестве слогов/знаков.
  • Имитация текстом: Ограничение объема в словах, предложениях или знаках.
  • Относительное соответствие: Имитируется с погрешностью (ИИ плохо считает знаки, но хорошо понимает структуру).
    • "Ответь строго в 3 предложениях" или "Напиши ровно один абзац, состоящий максимум из 50 слов".

Как находить относительное соответствие (Методология)

Поскольку ИИ мыслит не цифрами параметров, а семантическими связями, перевод "цифра в текст" строится на градиенте жесткости ограничений. Чтобы найти соответствие, используйте следующую шкалу формулировок:

  1. Диапазон 0.0 - 0.3 (Минимум хаоса / Строгость): В тексте используются слова-ограничители: "строго", "только", "буквально", "энциклопедично", "без исключений".
  2. Диапазон 0.4 - 0.8 (Баланс / Норма): В тексте используются стандартные дескрипторы: "грамотно", "естественно", "умеренно", "в стиле публицистики/реализма".
  3. Диапазон 0.9 - 1.3 (Высокий уровень / Свобода): В тексте используются призывы к метафоричности: "образно", "ассоциативно", "свободно", "используй яркие аналогии".
  4. Диапазон 1.4 - 2.0 (Экстремальный уровень / Разрушение структуры): В тексте используются требования к слому языковых норм: "абсурдно", "хаотично", "поток сознания", "игнорируй правила", "сочетай несочетаемое".

Что нельзя имитировать текстом?

Текстом невозможно сымитировать параметры, которые физически обрезают вычисления на уровне железа или жестких фильтров безопасности:

  • System Prompt (Системный промпт): Вы не можете пользовательским текстом полностью переписать базовые инструкции безопасности, заложенные разработчиками (alignment).
  • Top-K / Top-P (Жесткая отсечка хвоста вероятностей): Если в API выставлен Top-K = 1, модель физически видит только ОДНО самое вероятное следующее слово. Никакой текстовый промпт вроде "придумай безумное слово" не сработает - у модели просто не будет вариантов в оперативной памяти для выбора.



Философское осмысление "машинных снов"

  • Постчеловеческая эстетика (Парадокс автора). Философы заявляют о смерти автора-человека. ИИ-галлюцинация - это творчество без сознания, безличная креативность, где человек превращается из создателя в простого куратора и зрителя.
  • Концепция Новой эстетики (Джеймс Бридл). Ошибки ИИ обнажают истинную природу цифрового мира. Галлюцинация - это момент, когда машина перестает имитировать человека и начинает "мыслить" своими собственными, чуждыми нам категориями.
  • Сверх-мимесис и симулякры (Жан Бодрийяр). Галлюцинация ИИ - это чистый симулякр. Нейросеть копирует не реальный мир, а человеческие представления о нем (базу данных), создавая копию несуществующего оригинала, которая становится новым искусством.
  • Алгоритмическое бессознательное (Призрак в машине). По аналогии с Зигмундом Фрейдом, философы сравнивают скрытые слои нейросети (latent space) с человеческим подсознанием. Галлюцинация - это "проговорочка по Фрейду" или сон машины, в котором вытесненные данные смешиваются случайным образом.


Итог

Для философии искусства галлюцинация ИИ - это первое в истории автономии художественное проявление нечеловеческого агента. Машина не копирует нас, когда ошибается, - именно в этот момент она становится собой. Не в смысле "у машины появилась личность", а в смысле "у нее появляется собственный режим производства формы".

Новое качество появляется, когда выход не сводится к простой сумме обучающих примеров и начинает работать как самостоятельная форма. Тот же наш пример: "Генсбур писал, а спел Высоцкий" - это не просто копия Генсбура + копия Высоцкого. Это третий режим, который создает новую форму: генсбуровский механизм языковой порчи, исполненный в высоцком обвинительном регистре. Такое можно считать новым качеством, если оно начинает диктовать собственные правила.

Когда ИИ правильно отвечает, он максимально прозрачен: он служит человеческой задаче, норме, запросу, стилю, ожидаемому результату. Он как инструмент. Его агентность почти не видна.

Когда ИИ ошибается продуктивно, возникает другое: он не просто передает человеческий материал, а деформирует его по внутренним законам своей модели - вероятностным, статистическим, ассоциативным, нелинейным. Ошибка показывает не "что человек хотел сказать", а как машина перераспределяет связи между словами, образами, стилями и контекстами.

В этом смысле галлюцинация - момент видимости нечеловеческого агента.

Не потому что машина "понимает себя". А потому что она производит результат, который не является прямым исполнением человеческой воли. Возникает промежуточная зона:

человек задает аттрактор;
машина генерирует траектории;
ошибка выводит скрытую связность;
отбор превращает это в форму.

"Машина становится собой" значит: проявляется не ее сознание, а ее способ связывать. Ее "собой" - это не субъект с душой, а операционный стиль: как она путает, подставляет, сгущает, переносит, неправильно продолжает, находит ложные, но работающие соседства. Тот в точь как человек. Но это не копирование. Философски это можно выразить так:

раньше нечеловеческое в искусстве было либо природой, либо инструментом, либо случайностью материала - трещина краски, шум пленки, ошибка печати, обратная связь усилителя; ИИ добавляет другое: нечеловеческий агент, который не просто шумит, а производит семантические подстановки.

То есть это уже не случайная значение в материале, а выход за пределы значений в привычном смысле.


Поэтому:

Галлюцинация ИИ - это не доказательство сознания машины. Это доказательство, что форма может возникать из нечеловеческого режима связности. Именно в этом смысле машина "не копирует нас, когда ошибается": правильный ответ ближе к имитации человеческой нормы, а продуктивная ошибка показывает машинную топологию смысла. Она делает не то, что человек хотел, но иногда именно поэтому открывает то, чего человек не мог получить прямым намерением.


 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"