Как отличить интеллект от имитации? Предлагаю серию глубоких тестов для проверки LLM на прочность. Здесь нет простых вопросов — только логические ловушки, проверка визуального контекста, стресс-тесты на кодинг и задачи на литературный подтекст. Узнайте, способна ли модель удерживать сложные ограничения и замечать аномалии или она лишь мастерски имитирует уверенность, спотыкаясь на первой же скрытой детали.