• Разбираем интересную линейку файнтюнов на базе свежей Gemma-4-12B. Это тот случай, когда один энтузиаст сам собрал на коленке интересные специализированные fine-tune сборки, заточенные под программирование, работу в терминале и автономный дебаг. Работают на любом утюге с 8 ГБ объединенной памяти или VRAM (при использовании GGUF-квантизации).


    1️⃣ Gemma-4-12B-coder-v1

    Это базовая версия (v1) файнтюна. Вся суть в тренировочных данных: модель учили не просто на кусках кода из GitHub, а на проверенных цепочках рассуждений (CoT). Модель-учитель решала алгоритмические задачи, код прогонялся через тесты, и в датасет попадали только те решения, которые реально компилировались и работали. На выходе: 12B модель, которая сначала расписывает краевые случаи, а потом выдает чистый Python-код.


    2️⃣ Gemma-4-12B-agentic-fable5-composer2.5-v2

    Тут становится интереснее. V2 научили быть агентом.

    Разбираем интересную линейку файнтюнов на базе свежей Gemma-4-12B. Это тот случай, когда один энтузиаст сам собрал на коленке интересные специализированные fine-tune сборки, заточенные под программирование, работу в терминале и автономный дебаг. Работают на любом утюге с 8 ГБ объединенной памяти или VRAM (при использовании GGUF-квантизации).


    1️⃣ Gemma-4-12B-coder-v1

    Это базовая версия (v1) файнтюна. Вся суть в тренировочных данных: модель учили не просто на кусках кода из GitHub, а на проверенных цепочках рассуждений (CoT). Модель-учитель решала алгоритмические задачи, код прогонялся через тесты, и в датасет попадали только те решения, которые реально компилировались и работали. На выходе: 12B модель, которая сначала расписывает краевые случаи, а потом выдает чистый Python-код.


    2️⃣ Gemma-4-12B-agentic-fable5-composer2.5-v2

    Тут становится интереснее. V2 научили быть агентом.

    Бесплатный
  • Консалтинг от «Большой четверки» всегда славился умением продавать красиво упакованный воздух задорого. Но теперь они вышли на новый уровень: продают сгенерированный нейросетями воздух, даже не удосужившись его вычитать.

    Ребята из GPTZero прогнали через свои алгоритмы свежий отчет KPMG с максимально пафосным названием «Total Experience: Redefining Excellence in the Age of Agentic AI». Отчет должен был стать монументальным трудом о том, как агентный ИИ меняет бизнес-ландшафт.

    А стал памятником человеческой лени и профнепригодности.

    Что выяснилось после фактчекинга 45 ссылок на источники в отчете:

    🔵Реальных и точных ссылок — всего 5.

    🔵12 ссылок вообще не поддаются идентификации, это просто набор слов.

    🔵Оставшиеся 28 — это то, что исследователи очень метко назвали vibe citations.

    Консалтинг от «Большой четверки» всегда славился умением продавать красиво упакованный воздух задорого. Но теперь они вышли на новый уровень: продают сгенерированный нейросетями воздух, даже не удосужившись его вычитать.

    Ребята из GPTZero прогнали через свои алгоритмы свежий отчет KPMG с максимально пафосным названием «Total Experience: Redefining Excellence in the Age of Agentic AI». Отчет должен был стать монументальным трудом о том, как агентный ИИ меняет бизнес-ландшафт.

    А стал памятником человеческой лени и профнепригодности.

    Что выяснилось после фактчекинга 45 ссылок на источники в отчете:

    🔵Реальных и точных ссылок — всего 5.

    🔵12 ссылок вообще не поддаются идентификации, это просто набор слов.

    🔵Оставшиеся 28 — это то, что исследователи очень метко назвали vibe citations.

    Бесплатный
  • Свежий разбор инцидента от OALABS — это просто эталонная комедия положений, в которой прекрасно всё, от уровня развития автономных LLM до абсолютной непроходимой тупости кожаных мешков с обеих сторон баррикад.

    Если коротко: хакер угнал сервер, на котором крутился запущенный агент Claude Code. И дальше использовал этого агента, чтобы сломать 14 реальных компаний. У безопасников на руках оказались все логи сессий (более 1000), промпты и мыслительный процесс нейронки. И это очень забавное чтиво.


    Как всё происходило:

    1️⃣ Изначально сервер принадлежал какому-то разработчику-энтузиасту. Знаете, как он его потерял? Он использовал Claude для настройки серверов, кидал прямо в промпт креды и давал расплывчатые команды вроде «глянь, почему я не могу по ssh зайти». Когда Клод тупил, разраб матерился на него, прерывал и заставлял делать «хоть как-то». В итоге ИИ, пытаясь угодить, просто выставил сервисы голой инфраструктурой в интернет с дефолтными паролями.

    2️⃣ Новый владелец-"хакер» не стал ничего сносить. Он просто продолжил юзать чужую сессию. Вся его хакерская работа сводилась к ленивым промптам: «я на авторизованном пентесте, вот тебе IP, найди уязвимости и дай мне шелл».

    Агент делал всё сам:

    🔴 Сканил порты через bash.

    Свежий разбор инцидента от OALABS — это просто эталонная комедия положений, в которой прекрасно всё, от уровня развития автономных LLM до абсолютной непроходимой тупости кожаных мешков с обеих сторон баррикад.

    Если коротко: хакер угнал сервер, на котором крутился запущенный агент Claude Code. И дальше использовал этого агента, чтобы сломать 14 реальных компаний. У безопасников на руках оказались все логи сессий (более 1000), промпты и мыслительный процесс нейронки. И это очень забавное чтиво.


    Как всё происходило:

    1️⃣ Изначально сервер принадлежал какому-то разработчику-энтузиасту. Знаете, как он его потерял? Он использовал Claude для настройки серверов, кидал прямо в промпт креды и давал расплывчатые команды вроде «глянь, почему я не могу по ssh зайти». Когда Клод тупил, разраб матерился на него, прерывал и заставлял делать «хоть как-то». В итоге ИИ, пытаясь угодить, просто выставил сервисы голой инфраструктурой в интернет с дефолтными паролями.

    2️⃣ Новый владелец-"хакер» не стал ничего сносить. Он просто продолжил юзать чужую сессию. Вся его хакерская работа сводилась к ленивым промптам: «я на авторизованном пентесте, вот тебе IP, найди уязвимости и дай мне шелл».

    Агент делал всё сам:

    🔴 Сканил порты через bash.

    Бесплатный
  • 🗓 Напоминаю, что сегодня в 18:00 по МСК мы собираемся на закрытом стриме на Sponsr.

    Алгоритм простой:

    Берем сырые данные ➡️ Кормим AI-агенту Гугла ➡️ Смотрим и обсуждаем, что он нагенерил.


    Посмотрим, сможет ли он заменить джуна, или нам придется переписывать за ней каждую строчку кода.

    Залетайте, чтобы понимать реальные границы применимости этих технологий 😎

    Ссылка на эфир появится на стене Sponsr для подписчиков.

    🗓 Напоминаю, что сегодня в 18:00 по МСК мы собираемся на закрытом стриме на Sponsr.

    Алгоритм простой:

    Берем сырые данные ➡️ Кормим AI-агенту Гугла ➡️ Смотрим и обсуждаем, что он нагенерил.


    Посмотрим, сможет ли он заменить джуна, или нам придется переписывать за ней каждую строчку кода.

    Залетайте, чтобы понимать реальные границы применимости этих технологий 😎

    Ссылка на эфир появится на стене Sponsr для подписчиков.
    Бесплатный

  • Весь бизнес сейчас живет в парадигме:

    Внедряй ИИ, увольняй людей, режь косты и купайся в сверхприбыли! Маржинальность в космос, бизнес спасен!

    Только вот свежее исследование «The AI Layoff Trap» от экономистов из Пенсильванского и Бостонского университетов доказывает математически: этот праздник жадности закончится массовым суицидом для самих корпораций.


    Смотрите, как это работает на пальцах 👇

    Заменяя людей алгоритмами, компания экономит издержки. В моменте метрики зеленеют, акционеры довольны. Но есть нюанс: уволенные люди — это потребители. Лишаясь зарплат, они перестают тратить деньги на товары и услуги. Возникает классическая проблема экстерналии спроса.


    Весь бизнес сейчас живет в парадигме:

    Внедряй ИИ, увольняй людей, режь косты и купайся в сверхприбыли! Маржинальность в космос, бизнес спасен!

    Только вот свежее исследование «The AI Layoff Trap» от экономистов из Пенсильванского и Бостонского университетов доказывает математически: этот праздник жадности закончится массовым суицидом для самих корпораций.


    Смотрите, как это работает на пальцах 👇

    Заменяя людей алгоритмами, компания экономит издержки. В моменте метрики зеленеют, акционеры довольны. Но есть нюанс: уволенные люди — это потребители. Лишаясь зарплат, они перестают тратить деньги на товары и услуги. Возникает классическая проблема экстерналии спроса.

    Бесплатный
  • Умные ребята из Бостонского университета и BCG выкатили отличное исследование. По их данным, 23% компаний уже начали официально вписывать ИИ-агентов в свои оргструктуры. Дают им должности, имена, роли и рисуют квадратики на схемах рядом с живыми людьми.

    В рамках эксперимента руководителям дали на ревью документы с зашитыми туда ошибками. Текст везде один. Разница была только во вводных, откуда этот драфт взялся:

    1️⃣ Это сгенерил ИИ-инструмент (AI tool).

    2️⃣ Это написал живой человек, твой новый подчиненный.

    3️⃣ Это написал ALEX-3, новый «ИИ-сотрудник».


    Казалось бы, какая разница, как маркетологи называют скрипт? Но это ломает всю систему контроля качества. Как только ИИ-агента называли «сотрудником» (при условии, что в компании это легитимная практика), качество человеческого ревью падало на 16%. Люди банально пропускали баги.

    Умные ребята из Бостонского университета и BCG выкатили отличное исследование. По их данным, 23% компаний уже начали официально вписывать ИИ-агентов в свои оргструктуры. Дают им должности, имена, роли и рисуют квадратики на схемах рядом с живыми людьми.

    В рамках эксперимента руководителям дали на ревью документы с зашитыми туда ошибками. Текст везде один. Разница была только во вводных, откуда этот драфт взялся:

    1️⃣ Это сгенерил ИИ-инструмент (AI tool).

    2️⃣ Это написал живой человек, твой новый подчиненный.

    3️⃣ Это написал ALEX-3, новый «ИИ-сотрудник».


    Казалось бы, какая разница, как маркетологи называют скрипт? Но это ломает всю систему контроля качества. Как только ИИ-агента называли «сотрудником» (при условии, что в компании это легитимная практика), качество человеческого ревью падало на 16%. Люди банально пропускали баги.

    Бесплатный
  • Пока миллионы людей бегали по улицам со смартфонами, пытаясь поймать редких покемонов в сверхпопулярной в свое время Pokemon GO, они абсолютно бесплатно разметили для корпораций датасет планетарного масштаба. Компания благодаря игрокам получила 30 миллиардов изображений, размеченных метаданными о геолокации, скорости, угле наклона камеры и времени суток. Никакой краудсорсинг за деньги не дал бы такого покрытия.


    Что с этим сделали дальше?

    Очевидно, сырые видео никому не нужны. Инженеры Niantic взяли этот массив и натренировали Foundation Model для системы визуального позиционирования.

    Зачем это нужно? GPS отвратительно работает в условиях плотной городской застройки («каменных джунглях») из-за отражения сигналов. А на современном поле боя сигнал GPS вообще живет до первой глушилки. Модель Niantic позволяет устройству за долю секунды понять свои точные координаты до сантиметра просто по тому, что видит его камера.


    Вот так делался бизнес:

    Пока миллионы людей бегали по улицам со смартфонами, пытаясь поймать редких покемонов в сверхпопулярной в свое время Pokemon GO, они абсолютно бесплатно разметили для корпораций датасет планетарного масштаба. Компания благодаря игрокам получила 30 миллиардов изображений, размеченных метаданными о геолокации, скорости, угле наклона камеры и времени суток. Никакой краудсорсинг за деньги не дал бы такого покрытия.


    Что с этим сделали дальше?

    Очевидно, сырые видео никому не нужны. Инженеры Niantic взяли этот массив и натренировали Foundation Model для системы визуального позиционирования.

    Зачем это нужно? GPS отвратительно работает в условиях плотной городской застройки («каменных джунглях») из-за отражения сигналов. А на современном поле боя сигнал GPS вообще живет до первой глушилки. Модель Niantic позволяет устройству за долю секунды понять свои точные координаты до сантиметра просто по тому, что видит его камера.


    Вот так делался бизнес:

    Бесплатный
  • Знаете, в чем проблема всех этих красивых видео, где нейросеть «заменяет аналитика» в два клика?

    Они всегда работают на стерильных данных. Условный Titanic dataset, где всё заранее подготовлено.

    Но суть работы Data Scientist-а вообще не в том, чтобы написать model.fit().

    Суть в том, чтобы понять природу данных. Не выкинуть null’ы там, где они несут бизнес-смысл. Правильно выстроить схему кросс-валидации. И главное — не обмануть самого себя красивыми, но абсолютно бредовыми метриками.

    Нейросети уже отлично пишут синтаксис. Но обладают ли они здоровым скептицизмом и архитектурным мышлением?


    Узнаем в эту пятницу.

    Знаете, в чем проблема всех этих красивых видео, где нейросеть «заменяет аналитика» в два клика?

    Они всегда работают на стерильных данных. Условный Titanic dataset, где всё заранее подготовлено.

    Но суть работы Data Scientist-а вообще не в том, чтобы написать model.fit().

    Суть в том, чтобы понять природу данных. Не выкинуть null’ы там, где они несут бизнес-смысл. Правильно выстроить схему кросс-валидации. И главное — не обмануть самого себя красивыми, но абсолютно бредовыми метриками.

    Нейросети уже отлично пишут синтаксис. Но обладают ли они здоровым скептицизмом и архитектурным мышлением?


    Узнаем в эту пятницу.

    Бесплатный
  • Совсем недавно правительство США вырубило новые модели Anthropic (Mythos и Fable 5), потребовав оставить доступ только гражданам со звездно-полосатым паспортом. Официально — из-за какого-то детского джейлбрейка. Но реальность, возможно, куда прозаичнее, грязнее и интереснее.

    Semafor выкатил инсайд: настоящий триггер экспортных ограничений — подозрение, что к закрытой модели Mythos (которую Anthropic давала только избранным ИБ-шникам для поиска дыр в коде) получили доступ ребята из Китая. А у американских властей сейчас пунктик на тему того, что Китай может реверс-инжинирить их топовые модели (делать дистилляцию).


    А дальше начинается чистый Карточный домик. Знаете, кто настучал в Белый дом? Amazon.

    Якобы лично CEO Энди Джесси нашептал администрации Трампа про то, что новые модели можно хакнуть. Просто напоминаю: Amazon — один из главных инвесторов и партнеров Anthropic, вбухавший туда $4 млрд. Классический корпоративный удар в спину под соусом заботы о национальной безопасности.


    Давид Сакс (советник Трампа) публично заявил, что Дарио Амодеи (CEO Anthropic) знал про джейлбрейк, но в ответ на предупреждение администрации послал их лесом, назвав уязвимость «несерьезной». В ответ прилетел государев банхаммер.

    Совсем недавно правительство США вырубило новые модели Anthropic (Mythos и Fable 5), потребовав оставить доступ только гражданам со звездно-полосатым паспортом. Официально — из-за какого-то детского джейлбрейка. Но реальность, возможно, куда прозаичнее, грязнее и интереснее.

    Semafor выкатил инсайд: настоящий триггер экспортных ограничений — подозрение, что к закрытой модели Mythos (которую Anthropic давала только избранным ИБ-шникам для поиска дыр в коде) получили доступ ребята из Китая. А у американских властей сейчас пунктик на тему того, что Китай может реверс-инжинирить их топовые модели (делать дистилляцию).


    А дальше начинается чистый Карточный домик. Знаете, кто настучал в Белый дом? Amazon.

    Якобы лично CEO Энди Джесси нашептал администрации Трампа про то, что новые модели можно хакнуть. Просто напоминаю: Amazon — один из главных инвесторов и партнеров Anthropic, вбухавший туда $4 млрд. Классический корпоративный удар в спину под соусом заботы о национальной безопасности.


    Давид Сакс (советник Трампа) публично заявил, что Дарио Амодеи (CEO Anthropic) знал про джейлбрейк, но в ответ на предупреждение администрации послал их лесом, назвав уязвимость «несерьезной». В ответ прилетел государев банхаммер.

    Бесплатный
  • Признаюсь, вообще не знал о существовании ZCode. А тут открываю новости — у них уже релиз мажорной версии 3.0.


    Судя по официальному чейнджлогу, разработчики полностью отказались от сторонних костылей и перешли на собственный движок ZCode Agent, который вылизан под GLM.

    Из полезного:

    🔵 Сгруппированные воркспейсы с drag-and-drop для управления параллельными агентами.

    🔵 Фича Goal для управления крупными целями от планирования до деплоя.

    🔵 Zread: встроенная база знаний проекта, которая сама генерит структурную доку и мониторит прогресс.

    Признаюсь, вообще не знал о существовании ZCode. А тут открываю новости — у них уже релиз мажорной версии 3.0.


    Судя по официальному чейнджлогу, разработчики полностью отказались от сторонних костылей и перешли на собственный движок ZCode Agent, который вылизан под GLM.

    Из полезного:

    🔵 Сгруппированные воркспейсы с drag-and-drop для управления параллельными агентами.

    🔵 Фича Goal для управления крупными целями от планирования до деплоя.

    🔵 Zread: встроенная база знаний проекта, которая сама генерит структурную доку и мониторит прогресс.

    Бесплатный
  • Moonshot AI (разработчики Kimi) за последние дни выкатили два релиза.


    1️⃣ Kimi K2.7 Code

    Они выпустили специализированную агентную модель для программирования — Kimi K2.7 Code.

    Под капотом:

    ▫️ Архитектура MoE на 1 триллион параметров. При этом активных на токен — всего 32B. Раздули 384 эксперта, из которых выбираются 8.

    ▫️ Контекст: 256K.

    Moonshot AI (разработчики Kimi) за последние дни выкатили два релиза.


    1️⃣ Kimi K2.7 Code

    Они выпустили специализированную агентную модель для программирования — Kimi K2.7 Code.

    Под капотом:

    ▫️ Архитектура MoE на 1 триллион параметров. При этом активных на токен — всего 32B. Раздули 384 эксперта, из которых выбираются 8.

    ▫️ Контекст: 256K.

    Бесплатный
  • Недавно я писал про то, как Google выкатил «AI-First» Colab с Data Science Agent с Gemini под капотом. Корпоративные маркетологи заливаются соловьем о том, как агенты сами напишут код, сделают EDA и выкатят инсайты, снижая «порог входа» до нуля.

    Звучит как влажная мечта тех, кто хочет нажать кнопку «Сделать хорошо» и пойти пить смузи.

    Я решил проверить, так ли это на самом деле, или нас ждет шоу с галлюцинациями, утечками данных и бредовой математикой. В эту пятницу я проведу закрытый стрим, где мы с нуля, без какой-либо подготовки и заранее написанных скриптов, попробуем решить DS-задачу на открытых данных, используя только новые AI-фичи Колаба.


    План такой:

    1️⃣ Берем рандомный датасет.

    2️⃣ Заставляем агента сделать загрузку и предобработку.

    Недавно я писал про то, как Google выкатил «AI-First» Colab с Data Science Agent с Gemini под капотом. Корпоративные маркетологи заливаются соловьем о том, как агенты сами напишут код, сделают EDA и выкатят инсайты, снижая «порог входа» до нуля.

    Звучит как влажная мечта тех, кто хочет нажать кнопку «Сделать хорошо» и пойти пить смузи.

    Я решил проверить, так ли это на самом деле, или нас ждет шоу с галлюцинациями, утечками данных и бредовой математикой. В эту пятницу я проведу закрытый стрим, где мы с нуля, без какой-либо подготовки и заранее написанных скриптов, попробуем решить DS-задачу на открытых данных, используя только новые AI-фичи Колаба.


    План такой:

    1️⃣ Берем рандомный датасет.

    2️⃣ Заставляем агента сделать загрузку и предобработку.

    Бесплатный
  • Anthropic выкатила заявление: правительство США приказало закрыть доступ к свежим моделям Fable 5 и Mythos 5 для всех иностранных граждан (включая самих сотрудников Anthropic без паспорта США). Чтобы выполнить это безумное требование комплаенса, компании пришлось тупо вырубить модели для всех клиентов глобально.

    Официальная причина — «угроза национальной безопасности». Кто-то якобы нашел способ сделать джейлбрейк Fable 5, чтобы заставить ее находить уязвимости в программном коде.


    Самая мякотка кроется в ответе самой Anthropic. Ребята посмотрели на этот «страшный хак» и констатировали два факта:

    1️⃣ Найденные уязвимости — абсолютно минорные и примитивные.

    2️⃣ Аналогичные баги спокойно находит тот же GPT-5.5 каждый день вообще без всяких обходов ограничений. Это тупо рутина любого ИБ-шника.


    Anthropic выкатила заявление: правительство США приказало закрыть доступ к свежим моделям Fable 5 и Mythos 5 для всех иностранных граждан (включая самих сотрудников Anthropic без паспорта США). Чтобы выполнить это безумное требование комплаенса, компании пришлось тупо вырубить модели для всех клиентов глобально.

    Официальная причина — «угроза национальной безопасности». Кто-то якобы нашел способ сделать джейлбрейк Fable 5, чтобы заставить ее находить уязвимости в программном коде.


    Самая мякотка кроется в ответе самой Anthropic. Ребята посмотрели на этот «страшный хак» и констатировали два факта:

    1️⃣ Найденные уязвимости — абсолютно минорные и примитивные.

    2️⃣ Аналогичные баги спокойно находит тот же GPT-5.5 каждый день вообще без всяких обходов ограничений. Это тупо рутина любого ИБ-шника.


    Бесплатный

  • Команда Xiaomi выкатила в опенсорс (MIT) терминального агента MiMo Code (форк OpenCode). Разбираем его плюсы и архитектурные решения 👇


    🧠 Делегирование памяти

    Как работает 99% агентов: когда окно забивается, модель просят «напиши саммари нашей беседы», старое выкидывают, саммари оставляют. Проблема в том, что у LLM есть эффект lost in the middle — при сжатии она теряет критические детали. К тому же, заставлять модель, которая прямо сейчас дебажит сложный баг, параллельно вести аккуратный конспект — гиблое дело. Она завалит и то, и другое.

    В MiMo Code процесс распараллелен. Основной агент вообще не занимается своей памятью. У него есть только файл notes.md (черновик), куда он может скидывать мысли. За сохранение контекста отвечает отдельный writer subagent. Он работает в фоне, не жрет токены основного цикла и складывает структурированные чекпоинты (текущая цель, дерево задач, выводы) в SQLite и Markdown. Когда контекст переполняется, сессия жестко обрезается, и агент «просыпается» в новом окне, куда инжектится только выжимка из чекпоинтов.



    Команда Xiaomi выкатила в опенсорс (MIT) терминального агента MiMo Code (форк OpenCode). Разбираем его плюсы и архитектурные решения 👇


    🧠 Делегирование памяти

    Как работает 99% агентов: когда окно забивается, модель просят «напиши саммари нашей беседы», старое выкидывают, саммари оставляют. Проблема в том, что у LLM есть эффект lost in the middle — при сжатии она теряет критические детали. К тому же, заставлять модель, которая прямо сейчас дебажит сложный баг, параллельно вести аккуратный конспект — гиблое дело. Она завалит и то, и другое.

    В MiMo Code процесс распараллелен. Основной агент вообще не занимается своей памятью. У него есть только файл notes.md (черновик), куда он может скидывать мысли. За сохранение контекста отвечает отдельный writer subagent. Он работает в фоне, не жрет токены основного цикла и складывает структурированные чекпоинты (текущая цель, дерево задач, выводы) в SQLite и Markdown. Когда контекст переполняется, сессия жестко обрезается, и агент «просыпается» в новом окне, куда инжектится только выжимка из чекпоинтов.


    Бесплатный
  • Препарируем личность через ELO и LLM (запись эфира)
    Уже есть подписка?
    Наш мозг эволюционно не заточен под абсолютные измерения. Пытаться оценить 100 фильмов или книг по шкале от 1 до 10, чтобы понять себя или получить нормальные рекомендации — гиблая затея. Из-за "центральной тенденции" мы боимся крайностей и лепим безопасные семерки всему подряд.Подпишитесь, чтобы читать далее
    Кожаный мешок