Alek�ei Matiu�hkin

сделано с умом



Дилемма заключённого — это развод

Wednesday, 20 May 2026 Tags: 2026tech

Дилемма заключённого — один из самых упоминаемых мысленных экспериментов теории игр и, осмелюсь заметить, одна из наиболее интеллектуально нечистоплотных конструкций в истории социальных наук. Не потому, что математика неверна — математика непробиваема, как она и бывает всегда, когда вы сами выбираете аксиомы. Мошенничество — в предпосылках.

Для тех, кто был счастливо с этим незнаком: двух преступников арестовывают. Каждый может промолчать (сотрудничать с партнёром) или дать показания против него (предать). Если оба молчат — каждый получает год. Если один предаёт, а другой молчит — предатель выходит на свободу, а верный дурак сидит три года. Если оба предают — оба получают по два. «Дилемма» в том, что рациональный эгоизм диктует предательство, хотя взаимное молчание даёт лучший исход для обоих. Равновесие по Нэшу — взаимная измена. Два рациональных агента, действуя рационально, приходят к иррациональному результату. Шах и мат, человечество.

Эта история породила две тысячи научных статей, несколько десятков научпоп-книг и, по меньшей мере, один документальный фильм, озвученный тем самым приглушённым голосом, который обычно приберегают для тектонических катаклизмов. Проблема в том, что история эта имеет примерно такое же отношение к реальным человеческим решениям, какое сферическая корова в вакууме — к молочному животноводству.

Внешний мир, или: стукачей бьют

Стандартная формулировка содержит оговорку настолько наглую, что диву даёшься, как она вообще пережила рецензирование. Позволю себе процитировать: «Предполагается, что у обоих заключённых нет лояльности друг к другу, и у них не будет возможности для мести или вознаграждения за пределами игры».

Прочитайте снова. Медленно.

«Нет возможности для мести или вознаграждения за пределами игры». Это не упрощающее допущение. Это уничтожение всей экосистемы, в которой только и возможно принять решение. Это равнозначно статье по аэродинамике, начинающейся со слов «предположим, воздуха нет». Под таким условием, конечно, можно вывести результаты — но у вас должно хватить приличия не называть их результатами о полёте.

Преступники — настоящие преступники, те самые, которых арестовывают парами и водят к прокурорам с фаустовскими предложениями — существуют в социальных сетях плотнее нейтронной звезды. Причина не сентиментальна: она экономическая. Преступный бизнес — это в своей основе повторяющаяся игра на сотрудничество с запредельно высокими ставками, и выживают именно те сети, которые выработали механизмы, делающие предательство самоубийством. Сицилийская мафия придумала omerta не из-за того, что сицилийцам как-то особенно нравится молчать. Её придумали потому, что организации, члены которых сдают друг друга при первом прокурорском подмигивании, живут не дольше поденки. Естественный отбор применяется к институтам столь же безжалостно, как к организмам, — а институт «стучи свободно, без последствий» вымер, не успев оставить ископаемых.

У японских якудза есть юбицумэ — ритуальное отрезание фаланги пальца в качестве искупления нелояльности. Русские воры в законе поддерживали внутри тюремной системы целый параллельный правовой кодекс, где сотрудничество с властями каралось смертью. Это не колоритные культурные сноски. Это механизмы поддержания равновесия, выработанные за столетия теми, чьё выживание зависело от решения именно той проблемы, которую дилемма заключённого объявляет нерешаемой. Модель теоретика игр — мир, из которого эти механизмы хирургически удалены, а вывод «смотрите, сотрудничество разрушилось!» — преподносится как откровение, а не как тавтология.

Даже без организованной преступности аргумент работает. Даже у камней есть память. В тюрьмах — существуют и процветают иерархии. Тот, кто вышел сегодня на свободу, дав показания, завтра пойдёт по тем же улицам, и улицы будут знать. В камере своя информационная сеть, и она эффективнее большинства корпоративных интранетов. Представление о том, что «игра» заканчивается, когда открываются тюремные ворота, — фантазия, доступная только тому, чьё ближайшее столкновение с уголовной юстицией — штраф за парковку.

Итерационная версия дилеммы частично учитывает это возражение. При введении повторений сотрудничество возникает: знаменитый турнир Роберта Аксельрода показал, что стратегия «зуб за зуб» — сотрудничать первым, потом зеркалить предыдущий ход противника — превосходит стратегии чистого предательства. Нэш сам, наблюдая за первоначальным стосессионным экспериментом Флада и Дрешера, заметил: Алчиан и Уильямс сотрудничали куда чаще, чем предсказывала однократная теория. Но вот в чём дело: одноразовых игр в реальной жизни не существует. Каждое человеческое взаимодействие вплетено в сеть отношений, ожиданий и последствий, простирающуюся далеко за пределы сиюминутной сделки. Одноразовая дилемма заключённого — не упрощение реальности. Это другая планета.

Убрать репутацию, будущие взаимодействия, социальные сети и угрозу расплаты — а затем изумляться краху сотрудничества — примерно так же глубокомысленно, как снести стены здания и удивляться, что крыша рухнула. Стены держали нагрузку. Теоретик игр снёс их — и обвинил гравитацию.

Гордость в вакууме

Хорошо. Давайте, ради аргумента, примем вакуум. Один раз. Без будущего. Без расплаты. Без социальных связей. Двое незнакомцев в отдельных комнатах, которые больше никогда не встретятся — ни друг с другом, ни с кем-либо, кто знал другого. Решение, кристально чистое в своей изолированности, не затронутое никаким соображением за пределами четырёх стен и тикающих часов.

Даже здесь — особенно здесь — дилемма заключённого опирается на скрытое допущение настолько фундаментальное, что большинство работ даже не удосуживается его сформулировать: матрица выплат полна.

Она не полна.

Матрица показывает тюремные сроки. Она присваивает числа годам за решёткой. Но она не показывает — не может показать, намеренно опускает — тяжесть решения для того, кто его принимает. Отражение в зеркале на следующее утро. То, что знаешь о себе, о чём никогда не спросит комиссия по условно-досрочному освобождению и чего не сотрёт никакое смягчение приговора.

Для определённого типа людей — тех, кого теоретики игр называют «рациональными», а остальные могут охарактеризовать менее лестно — матрица действительно полна. Важно только количество лет. Свобода хороша, заключение плохо, совесть — погрешность округления. Для таких людей предательство — доминирующая стратегия, равновесие по Нэшу — взаимная измена, математики правы, а мир мрачнее, чем мог бы быть.

Но люди не однородны в этом отношении. Притворяться, будто мир устроен иначе — второе великое мошенничество.

Некоторые предпочтут отсидеть три года с чистой совестью, чем выйти на свободу, зная, что упрятали за решётку человека, сохранившего слово. Это не иррациональность. Это не «ограниченная рациональность» и не «когнитивное искажение» — эвфемизмы, за которые экономисты хватаются, когда люди отказываются вести себя согласно их моделям. Это другая функция полезности. Ошибка теоретика игр — не в алгебре; она в онтологии. Он предположил, что матрица выплат — аккуратная сетка тюремных сроков — описывает всё пространство последствий. Не описывает. В матрице нет одной строки. Строка называется самоуважение.

Назовём эту скрытую переменную гордостью. Не в тщеславном смысле — не павлиний хвост, не очередное селфи, — а гордостью как самоотношением: внутренняя цена осознания того, что ты совершил нечто, что сам считаешь постыдным. Для одних эта цена равна нулю. Для других она превышает любой срок, который способно назначить государство. Между этими крайностями — весь спектр человеческого характера, любезно вычеркнутый допущением о том, что все игроки суть «рациональные агенты, озабоченные исключительно минимизацией тюремных сроков».

Интересующая нас величина — соотношение гордости к рациональному своекорыстию, коэффициент гордости. Назовём его ρ (ро). Человек с ρ = 0 — идеальный рациональный агент теоретика игр: электронная таблица на ножках. Человек с бесконечным ρ — святой или дурак, в зависимости от вашего вероисповедания. Остальные из нас живут где-то посередине, и точное местоположение имеет последствия, которые стандартная дилемма заключённого отказывается вычислять.

Вычислим.

Сбалансированная игра

Условия задачи

В стандартной формулировке выплаты для игрока A (выраженные как отрицательные тюремные сроки — чем больше, тем лучше) выглядят так:

B молчитB даёт показания
A молчит -1 -3
A даёт показания 0 -2

Предательство доминирует: что бы ни делал B, A выгоднее давать показания. Против молчащего B показания дают свободу (0) вместо одного года (-1). Против дающего показания B — два года (-2) вместо трёх (-3). Логика безупречна. Предпосылки покалечены.

Теперь введём гордость. Когда игрок предаёт, он несёт психологическую цену, пропорциональную ρ. Но — и это принципиальная тонкость — величина этой цены зависит от того, что сделал противник.

Предать кого-то, кто доверился тебе и промолчал, — для большинства людей более тяжкое бремя, чем взаимное предательство. Если оба предали, можно хотя бы сказать себе: он сделал бы то же самое. Если ты предал, а партнёр держал слово, — такого убежища нет. Эту асимметрию мы фиксируем вторым параметром γ (гамма), от 0 до 1:

  • Предательство сотрудничавшего обходится в полный стыд ρ. Ты изменил доверию.
  • Предательство предателя обходится в γρ стыда. Со скидкой на знание, что доверие с самого начала на кону не стояло.

Модифицированная матрица выплат для игрока A:

B молчитB даёт показания
A молчит -1 -3
A даёт показания -(2 + γρ)

При ρ = 0 это сворачивается до стандартной дилеммы. При большом ρ доминирует сотрудничество. Где-то между крайностями игра балансирует.

Вывод формулы

Предположим, B сотрудничает с вероятностью q. Игрок A безразличен к стратегиям, когда ожидаемые выплаты равны:

  E[молчать]             = q(-1) + (1 - q)(-3)      = 2q - 3
  E[давать показания]    = q(-ρ) + (1 - q)(-2 - γρ) = q(2 + γρ - ρ) - 2 - γρ

Приравниваем:

   2q - 3 = q(2 + γρ - ρ) - 2 - γρ
   2q - 3 = 2q + q(γ - 1)ρ - 2 - γρ
  -1 + γρ = q(γ - 1)ρ

Решаем относительно q:

  q = (γρ - 1) / ((γ - 1)ρ)

Чтобы игра была сбалансированной — каждый игрок сотрудничает ровно с вероятностью 1/2 — кладём q = 1/2 и решаем:

  2(γρ - 1) = (γ - 1)ρ
  2γρ - 2 = γρ - ρ
  γρ + ρ = 2
  ρ(1 + γ) = 2

Что даёт границу:

ρ = 2 / (1 + γ)

Что это означает

Формула говорит: критический коэффициент гордости зависит от того, насколько вы обесцениваете стыд взаимного предательства по сравнению с предательством сотрудничавшего.

γ = 0 — «Предать предателя мне ничего не стоит». Закалённый реалист. Полный стыд за донос на верного партнёра, ноль — за взаимное предательство. Здесь ρ = 2. Перевод: если ваше самоуважение стоит меньше двух лет тюрьмы — вы предаёте. Больше — молчите. Ровно два года — орёл или решка.

γ = 1/2 — «Взаимное предательство жалит, но вполовину слабее». Правдоподобный стандарт для большинства. Здесь ρ = 4/3 ≈ 1,33. Вашему самоуважению нужно стоить примерно шестнадцать месяцев свободы, чтобы вы оказались в точке безразличия.

γ = 1 — «Любое предательство одинаково постыдно». Человек, для которого сам акт предательства, вне зависимости от контекста, несёт одинаковый моральный вес. Здесь ρ = 1. Один год самоуважения против одного года тюрьмы. Обменный курс — один к одному.

Полная таблица:

  γ       ρ = 2/(1+γ)   Смысл
  ─────────────────────────────────────────────────────────────────
  0,00    2,00          Стыд — только за предательство доверия
  0,25    1,60          Взаимное предательство стоит четверть
  0,50    1,33          Взаимное предательство стоит половину
  0,75    1,14          Почти одинаково стыдно в любом случае
  1,00    1,00          Любое предательство одинаково постыдно

Три режима

Полная картина имеет три режима, определяемых ρ и γ:

ρ < 1 — Доминирует предательство. Классическая территория дилеммы заключённого. Стыд от предательства, даже при полном весе, меньше разницы в один год между сотрудничеством и изменой. Разум правит. Гордость — сноска. Теоретики игр правы — для этого конкретного подвида человека.

ρ > 1/γ — Доминирует сотрудничество. Стыд от предательства, даже взаимного, перевешивает материальную выгоду. «Дилемма» перестаёт существовать; молчать строго предпочтительнее, что бы ни делал B. (Заметим: при γ = 0 этот порог бесконечен — одним стыдом не заставишь молчать против предателя, если взаимное предательство ничего не стоит.)

1 < ρ < 1/γ — Смешанная стратегия. Ни одна стратегия не доминирует. Игрок молчит против тех, кто молчит (стыд предательства превышает выигрыш в один год), но предаёт тех, кто предаёт (обесцененный стыд меньше экономии в год). В этом режиме равновесие — вероятностная смесь, а точка баланса — ровно 50/50 — находится при ρ = 2/(1 + γ).

Переменная, которую забыли

Дилемма заключённого не ошибочна. Это теорема, а теоремы не ошибаются; они либо корректно, либо некорректно выведены из своих аксиом. Вывод корректен. Аксиомы — вот проблема.

Первая аксиома — никакого внешнего мира — уничтожает весь эволюционный аппарат, делающий сотрудничество нормой, а не исключением в человеческих делах. Это аксиома, которую все критикуют, и поделом. Вторая аксиома — матрица выплат полна — предполагает, что тюремные сроки суть единственное значимое последствие; это равносильно предположению, что у людей нет внутренней жизни, самоуважения и совести. Это аксиома, которую почти никто не ставит под сомнение — потому что она не сформулирована как аксиома вообще. Её контрабандой протаскивают в двумерной таблице и принимают без досмотра.

Приведённая выше арифметика показывает, что упущение это — не просто философское. Оно исчислимо. Для любой заданной асимметрии стыда γ существует точный коэффициент гордости ρ = 2/(1 + γ), при котором дилемма растворяется в совершенном безразличии. Ниже этого значения игра ведёт себя так, как заявлено. Выше — сотрудничество — не альтруизм. Это своекорыстие, корректно учтённое.

Вопрос, который дилемма заключённого задаёт на самом деле, — не «будут ли рациональные агенты сотрудничать?». Это нечто куда более личное и куда более интересное: сколько стоит ваше самоуважение, измеренное в тюремных годах?

Ответ у каждого свой.

Вот, пожалуй, настоящая дилемма.


⇦  ¦