Минутка: краткий статус

Таки локальная, но победа! Qwen3.5-27B на полной точности в кластерном режиме с тензорным параллелизмом на 2х Ryzen AI Max+ 395 с vLLM и Ray. Гайды в сети гайдами, но покопаться пришлось несколько недель.<div class="post-image show" data-index="0" contenteditable="false"><img src="https://media.sponsr.ru/project/8417/post/145192/image/398161/imagesprojects41784173u8bdp396bb6fc35.webp?1774820285075" data-src="/project/8417/post/145192/image/398162/imagesprojects41784173u8bdp396bb6fc35_original.webp?1774820285075" alt /></div>Следующий этап — запуск MoE версий Qwen’a. 122B-A10B в две ноды будет категорически классным командным решением.Идеально было бы запустить на 4-х, но тут нужен или коммутатор Mellanox за 500к рублей, или еще 3 карты на 4 порта Intel E810, что тоже не бюджетно. Пока поэкспериментируем с тем, что взлетело.Детальнее будет в большой статье по кластерам на Strix Halo позже.

таки локальная, но победа! qwen3.5-27b на полной точности в кластерном режиме с тензорным параллелизмом на 2х ryzen ai max+ 395 с vllm и ray. гайды в сети гайдами, но покопаться пришлось несколько недель.         следующий этап — запуск moe версий qwen’a. 122b-a10b в две ноды будет категорически классным командным решением.  идеально было бы запустить на 4-х, но тут нужен или коммутатор mellanox за 500к рублей, или еще 3 карты на 4 порта intel e810, что тоже не бюджетно. пока поэкспериментируем с тем, что взлетело.  детальнее будет в большой статье по кластерам на strix halo позже.

минутка: кластер vllm все же запущен!

Минутка: Кластер vLLM все же запущен!

Заметки о Qwen3.5 и бенчмарках

Всем привет! Меня зовут Андрей Зорин и не исключено, что если вы работаете в банковском ИТ и финтехе в целом, то вы про меня слышали, были на выступлениях или учились вместе со мной.Проект - дневник личного погружения автора в тему ИИ и перестроения корпоративной разработки на абсолютно новые рельсы.ИИ как технология не способен поменять что-то сам по себе. Как и любая другая технология он должен быть встроен в производство, выдавать предсказуемый и управляемый результат, быть измеримым. Долгое время эти задачи не решались и не было понятно, как вообще можно подойти к этому вопросу на практике крупных отечественных компаний, с учетом требований защиты информации и надежности.В январе 2026 года автор смог сформулировать для себя гипотезы, как это встраивание возможно. И приступил к предметному изучению тематики.В пятницу, 13 февраля 2026 года автор прочитал про SSD (spec driven development), посмотрел материалы и осознал, что среди лошадей в потоке появился автомобиль. Революция произошла. Фарш не провернуть обратно. Весь ИТ находится в состоянии полного дисрапта и уничтожения рабочих мест.Процесс нельзя остановить. Его нужно возглавить.Автор 20 лет зарабатывает деньги в ИТ, умеет строить системы и команды. Слова: "Требования ФСТЭК, ЗОКИИ, ГОСТ по безопасной разработке" - часть ежедневного лексикона.Рассказ пойдет от лица бывалого ИТ-руководителя, для начала на примере pet-проекта, потом обогатится практикой переноса в корпоративную среду. По пути будут размышления об ИТ-архитектуре, технологиях и прочих смежных областях.Присоединяйтесь и поехали!P.S. При написании статей на проекте не пострадал, не страдает и не пострадает ни один ИИ. Только ручной контент.

ИИ меняет всё. Автор 20 лет зарабатывал деньги в ИТ, писал код, строил команды в сотни людей, делал системы из сотен микросервисов с десятками релизов в день, но революция уже здесь. Программисты будут вымирать, разработка меняется. Погружаемся.

ии меняет всё. автор 20 лет зарабатывал деньги в ит, писал код, строил команды в сотни людей, делал системы из сотен микросервисов с десятками релизов в день, но революция уже здесь. программисты будут вымирать, разработка меняется. погружаемся.

Вселенское зло об ИИ, технологиях и людях

Стандартная подписка без возможности комментировать и задавать вопросы

Кроме чтения материалов, доступна возможность задавать вопросы автору, на которые автор будет стараться отвечать в личных сообщениях или выносить в формате статьи ответов на вопросы читателей

Для личных собеседников автора, строго по блату, без публичного доступа.

Дает возможность раз в месяц встречаться с автором в центре Москвы для разговора как по тематике проекта, так и на прочие взаимно интересные темы.