<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Ai developer</title>
    <description>The latest articles on DEV Community by Ai developer (@__2ddbae6bb7d).</description>
    <link>https://dev.to/__2ddbae6bb7d</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.us-east-2.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3957324%2F72f42b43-34d9-4f58-8d91-d26e09bffd69.jpeg</url>
      <title>DEV Community: Ai developer</title>
      <link>https://dev.to/__2ddbae6bb7d</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/__2ddbae6bb7d"/>
    <language>en</language>
    <item>
      <title>AI.Insaf (@ai_tablet) — Полный архив постов канала</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Wed, 03 Jun 2026 09:00:20 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/aiinsaf-aitablet-polnyi-arkhiv-postov-kanala-1m70</link>
      <guid>https://dev.to/__2ddbae6bb7d/aiinsaf-aitablet-polnyi-arkhiv-postov-kanala-1m70</guid>
      <description>&lt;h1&gt;
  
  
  AI.Insaf (@ai_tablet) — Полный архив постов канала
&lt;/h1&gt;

&lt;h2&gt;
  
  
  Ранние посты (#1-~49)
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Пост ~1: TabGAN (pet project)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Библиотека генерации табличных данных (с 2021)&lt;/li&gt;
&lt;li&gt;500+ ⭐, 40K загрузок, 38 цитирований&lt;/li&gt;
&lt;li&gt;Грант Яндекс Open Source (апрель 2024)&lt;/li&gt;
&lt;li&gt;Теперь генерация через GAN + LLM + Forest Diffusion&lt;/li&gt;
&lt;li&gt;pip install tabgan&lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/Diyago/Tabular-data-generation" rel="noopener noreferrer"&gt;https://github.com/Diyago/Tabular-data-generation&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~2: Вакансии (DA + DS)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Мониторинг и предиктивное выявление проблемности корпоративных заёмщиков&lt;/li&gt;
&lt;li&gt;Стек: Python, SQL&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~3-7: Япония (Токио, Киото, Осака, Нара)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Токио: вежливость, регулировщики, рамены, Фудзи&lt;/li&gt;
&lt;li&gt;Киото: храмы, Золотой храм (Мисима), Тории ⛩, Фусими Инари&lt;/li&gt;
&lt;li&gt;Осака: замок, уличная еда&lt;/li&gt;
&lt;li&gt;Нара: олени 🦌&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~35: The Culture Code
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Успех команды = чувство безопасности&lt;/li&gt;
&lt;li&gt;Фасилитатор: сначала идеи, потом реализуемость&lt;/li&gt;
&lt;li&gt;Общее чувство цели + взаимная уязвимость&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~36: Мем (OK google, на чём обучали Gemini)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост ~37: Двойная ось Y в графиках
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Мнимое пересечение на графике №1&lt;/li&gt;
&lt;li&gt;График №2 — правильный, ушёл в печать&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~38: The Shape of Story (презентации)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Единство стиля, лаконичные выводы&lt;/li&gt;
&lt;li&gt;Микроистории: проблема → сложности → решение → эффект&lt;/li&gt;
&lt;li&gt;В Сбере — executive summary (обратный порядок)&lt;/li&gt;
&lt;li&gt;Курсы: Бонни и Слайд, Яндекс Практикум&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~39: Presentation skills (МФТИ → Delivery Club)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Первые слайды для руководства — "приземлили"&lt;/li&gt;
&lt;li&gt;Рекомендации: Виктор Кантор, Таня Савельева (топ-30 Forbes)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~40: Книги "Выживает самый дружелюбный" + "Лучшее в нас"
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Альтруизм бонобо, эволюционный успех через сотрудничество&lt;/li&gt;
&lt;li&gt;Снижение насилия в истории человечества&lt;/li&gt;
&lt;li&gt;Но: частные кейсы, confirmation bias, cherry picking&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~41: Менторство — личный опыт
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Два ментора за 3 года&lt;/li&gt;
&lt;li&gt;Первый: софты, продакт, книги, уверенность&lt;/li&gt;
&lt;li&gt;Второй (сертифицированный): быстрое разрешение кейсов&lt;/li&gt;
&lt;li&gt;Проблема: когда нечего формулировать — значит всё решилось&lt;/li&gt;
&lt;li&gt;PS: кто работает с ментором = менти&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~42: Летняя школа МФТИ
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Лекция: "Мониторинг корпоративных рисков в условиях неопределённости"&lt;/li&gt;
&lt;li&gt;Интерпретация моделей, bias/variance, blending&lt;/li&gt;
&lt;li&gt;"Кармический откат за пропуски лекций в универе"&lt;/li&gt;
&lt;li&gt;Большинство школьников выбрали домашку вместо докладов&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~43: Яндекс Практикум — консультант
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Обсудили найм, навыки DS для табличных данных&lt;/li&gt;
&lt;li&gt;Рекомендации по программе курса&lt;/li&gt;
&lt;li&gt;Интересная опция: сервис найма для нанимающих менеджеров&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~44: Хакатон AI стартапов (ментор)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Проект: личный ассистент по выбору одежды&lt;/li&gt;
&lt;li&gt;ViT/CLIP для эмбеддингов, FAISS для поиска&lt;/li&gt;
&lt;li&gt;FashionVLP, CoSMo.pytorch, metric learning&lt;/li&gt;
&lt;li&gt;Команда школьников — не прошли в финал (жюри: Артемий Лебедев)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~45: Почему бустинги лучше нейросетей на табличных данных
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Deep Neural Networks and Tabular Data: A Survey (2022)&lt;/li&gt;
&lt;li&gt;Причины: качество данных, отсутствие структуры, критичность признаков, GPU&lt;/li&gt;
&lt;li&gt;A Closer Look at Deep Learning on Tabular Data (300 датасетов)&lt;/li&gt;
&lt;li&gt;Catboost выигрывает в ~200 из 300&lt;/li&gt;
&lt;li&gt;TabR (Яндекс) — медленно, падает по памяти&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~46: Книги/курсы для DS
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Классическое ML: Python Machine Learning (Raschka), специализация МФТИ+Яндекс&lt;/li&gt;
&lt;li&gt;MLOps: O'Reilly&lt;/li&gt;
&lt;li&gt;System Design: Designing Machine Learning Systems&lt;/li&gt;
&lt;li&gt;Аналитика: Девенпорт, SQL, Pandas&lt;/li&gt;
&lt;li&gt;RecSys: курс МТС&lt;/li&gt;
&lt;li&gt;A/B: гайд VK, Яндекс Практикум, Trustworthy Online Controlled Experiments&lt;/li&gt;
&lt;li&gt;NLP: ШАД, Voita, Abby, обзорные статьи&lt;/li&gt;
&lt;li&gt;CV: Deep Learning with PyTorch&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~47: Софтовые навыки
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Общение, small talk&lt;/li&gt;
&lt;li&gt;Переговоры: "Договориться можно обо всём", "Переговоры с монстрами"&lt;/li&gt;
&lt;li&gt;Деловая переписка&lt;/li&gt;
&lt;li&gt;Фасилитация&lt;/li&gt;
&lt;li&gt;Public talks&lt;/li&gt;
&lt;li&gt;Лидерство: NASA, "Лидер без титула", "5 пороков и 5 благодетелей команды"&lt;/li&gt;
&lt;li&gt;Креативность: "Как придумать идею, если вы не Огилви"&lt;/li&gt;
&lt;li&gt;Менторы, коучи, психологи&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~143: Google Jules (coding agent)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Запущен в мае, интеграция с GitHub&lt;/li&gt;
&lt;li&gt;Переписал readme.md неплохо&lt;/li&gt;
&lt;li&gt;Но: установка torch непосильна, код не работал, 400+ строк изменений&lt;/li&gt;
&lt;li&gt;До часа ожидания на запрос&lt;/li&gt;
&lt;li&gt;Cursor пока лучше&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~144: Сбер — отчёт 2024
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Проект "Индивидуальный мониторинг" в отчёте Сбера&lt;/li&gt;
&lt;li&gt;486 страниц&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~145: Reddit — ChatGPT трейдинг
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Чат-бот натрейдил на $400&lt;/li&gt;
&lt;li&gt;Robinhood, длинное плечо, риск&lt;/li&gt;
&lt;li&gt;На NVidia ошибка 40% за 3 месяца&lt;/li&gt;
&lt;li&gt;Excel-протягивание или экспоненциальное сглаживание&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~146: Swing Vision (теннис)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Приложение для анализа тенниса&lt;/li&gt;
&lt;li&gt;Инвесторы: ex ATP No1&lt;/li&gt;
&lt;li&gt;Локальный инференс на телефоне&lt;/li&gt;
&lt;li&gt;Статистика: удары, точность, скорость&lt;/li&gt;
&lt;li&gt;Challenge (Hawk-Eye) для аутов&lt;/li&gt;
&lt;li&gt;Нужен трипод&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~147: OCR и Vision-LLM тренды Q1/Q2 2025
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Gemini 2.5 — новая SOTA, на 15-20% лучше qwen/gpt-4o&lt;/li&gt;
&lt;li&gt;Small VLM: MonkeyOCR, Dolphin&lt;/li&gt;
&lt;li&gt;ChartQA Pro: топовые VLM далеки от человека (85%)&lt;/li&gt;
&lt;li&gt;Claude Sonnet 3.5: ~56%, GPT-4o: ~42%&lt;/li&gt;
&lt;li&gt;Enterprise: специализированные модели лучше универсальных&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~157: Шри-Ланка
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Тур по путёвке&lt;/li&gt;
&lt;li&gt;Сёрфинг: инструктор 1000₽/час, отбил рёбро&lt;/li&gt;
&lt;li&gt;Цейлонский чай&lt;/li&gt;
&lt;li&gt;Еда спорная, акула как белая рыба, дуриан&lt;/li&gt;
&lt;li&gt;Сафари по реке: крокодилы, хамелеон, лангуры&lt;/li&gt;
&lt;li&gt;Запуск черепашек в океан&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~158: LLM Reasoning (Sebastian Raschka)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Wait Injection: +50% на математике&lt;/li&gt;
&lt;li&gt;Chain of Draft (CoD): короткие тезисы вместо избыточного CoT&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~159: ШАД — курс по LLM
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Достойные материалы&lt;/li&gt;
&lt;li&gt;PS: будет integer overflow&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~160: TabM (Яндекс)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;MLP-архитектура, имитирует ансамбль из 32 сетей&lt;/li&gt;
&lt;li&gt;Параметры из статьи, падает по памяти&lt;/li&gt;
&lt;li&gt;LightGBM: AUC 0.7659, TabM: 0.7421&lt;/li&gt;
&lt;li&gt;TabM CPU: 234.55s vs LGB: 0.23s&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~161: TabArena + RealMLP
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;TabArena бенчмарк: LightGBM и TabM стат. не отличаются&lt;/li&gt;
&lt;li&gt;RealMLP — новый лидер&lt;/li&gt;
&lt;li&gt;Предобученные дефолты, квантильное преобразование, smooth clipping&lt;/li&gt;
&lt;li&gt;Работает быстро, из коробки, гиперпараметры не нужны&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~162: Avito DS party
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Вечеринка для DS тимлидов и менеджеров&lt;/li&gt;
&lt;li&gt;Создание комьюнити&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  Посты #74-#89
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Пост ~74: Авито мероприятие для DS тимлидов
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Вечеринка, друзья, новые знакомства&lt;/li&gt;
&lt;li&gt;Цель: сильное комьюнити&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~75: Хакатон (кластеризация логов)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;3-е место&lt;/li&gt;
&lt;li&gt;Идеи: scaNN, Rank-BM25, кастомный эмбеддинг, dbstream, LLM-итеративная кластеризация, JetBrains aggregation&lt;/li&gt;
&lt;li&gt;Ожидаемо хотели трансформеры, но объём данных + ресурсы → другой подход&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~76: OCR обзор (Игорь Галицкий)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Pipeline-Based, Expert OCR VLMs (GOT-OCR2.0), General VLMs&lt;/li&gt;
&lt;li&gt;Enterprise: RAG по документам, качество OCR влияет на результат&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~77-78: Мемы
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост ~79: ChatGPT и расшифровка истории
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;"Александр Радищев", 1836&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~80: Аналитика hh
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост ~81: Data Ёлка VK (2019 → сейчас)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Reliable ML: MAPIE, uncertainties&lt;/li&gt;
&lt;li&gt;NLP: "LLM стали лучше. Занавес"&lt;/li&gt;
&lt;li&gt;PyData: Briefer, Quak&lt;/li&gt;
&lt;li&gt;Карьера: 7+ резюме на вакансию, джуны 10x&lt;/li&gt;
&lt;li&gt;Time-Series Anomaly Detection: Dive into Time-Series Anomaly Detection: A Decade Review&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~83: Персонализированное письмо
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;AI-агенты сайт спарсил GitHub + LinkedIn&lt;/li&gt;
&lt;li&gt;Супер-персонализированное письмо&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~86: Временные ряды аномалии (deep dive)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Dive into Time-Series Anomaly Detection: A Decade Review&lt;/li&gt;
&lt;li&gt;Виды аномалий: точечные, контекстные, sequence-based&lt;/li&gt;
&lt;li&gt;Supervised/Unsupervised/Semi-supervised/Self-supervised&lt;/li&gt;
&lt;li&gt;Классические: бустинги, RNN, LSTM, SVM, скользящее среднее&lt;/li&gt;
&lt;li&gt;Reconstruction-based: автоэнкодеры, GANs, диффузионные&lt;/li&gt;
&lt;li&gt;Clustering-based: DAG, KNN (лучший по простоте)&lt;/li&gt;
&lt;li&gt;Метрики: ROC AUC, Precision, Recall&lt;/li&gt;
&lt;li&gt;Бенчмарки: NAB, KDD21, TODS, TimeEval&lt;/li&gt;
&lt;li&gt;Рекомендация: бейзлайн на скользящих средних и бустингах&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~87: KNN для поиска аномалий (code snippet)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;window_size=5, NearestNeighbors, anomaly_scores&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~88: GigaChat vs DeepSeek (Марков vs Тюкин)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;GigaChat: позитивная оценка&lt;/li&gt;
&lt;li&gt;DeepSeek: выложил половину весов, скорость инференса в 2 раза ниже&lt;/li&gt;
&lt;li&gt;Цены API: DeepSeek $0.14-2/1M, ChatGPT $10-20, GigaChat $10&lt;/li&gt;
&lt;li&gt;DeepSeek API отключены&lt;/li&gt;
&lt;li&gt;GigaChat open-source, архитектура на DeepSeek&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~89: Hugging Face — AI агенты курс
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;smolagents — не нужно прописывать логику вызова функций&lt;/li&gt;
&lt;li&gt;Первая часть из шести, час&lt;/li&gt;
&lt;li&gt;Учебные проекты: запрос погоды (зачем, если проще напрямую)&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  Посты #90-#228
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Пост 90: ChatGPT и креативность (Science)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Generative AI enhances individual creativity but reduces collective diversity&lt;/li&gt;
&lt;li&gt;Больше AI-идей = лучше текст, но тексты похожие&lt;/li&gt;
&lt;li&gt;Решение: разные модели, повысить temperature&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 91: NeurIPS vs Taylor Swift
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;На NeurIPS меньше людей, чем на концерте Taylor Swift&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~92: Книга "Простые правила"
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Сложные правила сложно соблюдать&lt;/li&gt;
&lt;li&gt;Простые = продуктивнее и точнее&lt;/li&gt;
&lt;li&gt;Примеры: бессонница, стартапы Чили&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~93: Kaggle Best Solutions 2023
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Временные ряды: GroupKFold, cross time series validation&lt;/li&gt;
&lt;li&gt;GRU, магический коэффициент 1.0045&lt;/li&gt;
&lt;li&gt;LB public probing = переобучение (упал с 1-го на 967-е)&lt;/li&gt;
&lt;li&gt;Распознавание языков жестов: Squeezeformer, FingerDropout&lt;/li&gt;
&lt;li&gt;1D CNN для букв эффективнее трансформеров&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 163: Обзор архитектур open-source LLM за 2025
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Linear Attention Hybrids (Qwen3-Next, DeepSeek V3.2)&lt;/li&gt;
&lt;li&gt;Text Diffusion Models — параллельная генерация, но хуже качество&lt;/li&gt;
&lt;li&gt;Small Recursive Transformers — &amp;lt;100M параметров, головоломки&lt;/li&gt;
&lt;li&gt;Code World Models — LLM моделирует выполнение кода&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 190: Follow-up от Raschka
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Linear Attention: KV-кэш лучше, метрики немного просели&lt;/li&gt;
&lt;li&gt;Text Diffusion: не работает Chain of Thought&lt;/li&gt;
&lt;li&gt;Small Recursive Transformers: красивая история, но пока только тулзы для больших моделей&lt;/li&gt;
&lt;li&gt;Code World Models: увеличение compute, результат на уровне классики&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 191: Глобальная память в LLM
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Обзор подходов: суммаризация, NER, Agentic memory, длинный контекст, RAG, Function calling&lt;/li&gt;
&lt;li&gt;MemGPT → Letta: Core Memory + Archival Memory&lt;/li&gt;
&lt;li&gt;A-Mem: имитация человеческой памяти (факты модифицируются, не добавляются)&lt;/li&gt;
&lt;li&gt;LangMem (LangChain): асинхронная обработка памяти&lt;/li&gt;
&lt;li&gt;x3 F1, в 16x меньше токенов&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 192: GigaMemory (AI Journey Contest 2025)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;1-е место (86.6%): logprobs релевантности чанков через LLM&lt;/li&gt;
&lt;li&gt;2-е (84.5%): технически сложнее, но концептуально похоже&lt;/li&gt;
&lt;li&gt;3-е (74.5%): классический RAG с bge-m3&lt;/li&gt;
&lt;li&gt;Проблема: топ-2 перечитывают все диалоги заново&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~193: Итоги года (tgstats / tgwrapped)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Цифры не бьются — "не согласовали методологию"&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 195: RecSys (самый сложный домен в ML)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;МТС курс по RecSys&lt;/li&gt;
&lt;li&gt;В продакшене: комбинация методов + топ популярных + последние взаимодействия&lt;/li&gt;
&lt;li&gt;Стабильные предпочтения: ALS на большой истории&lt;/li&gt;
&lt;li&gt;HSTU (Meta, 2024): триллион параметров, генеративная архитектура&lt;/li&gt;
&lt;li&gt;Open-source: LightFM (заброшен), RePlay (Сбер)&lt;/li&gt;
&lt;li&gt;Яндекс Музыка: HSTU-подход, +2.2% TLT, +12% Discovery&lt;/li&gt;
&lt;li&gt;LLM в RecSys: OneRec/MiniOneRec, PLUM, RecAI/InteRecAgent, RecGPT, PinRec, RoLLMRec&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 196: Мем (оперативка дорожает)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост 197: Financial Times — AI-proof your job
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Социальные навыки важнее тех-скиллов для зарплаты&lt;/li&gt;
&lt;li&gt;O*NET классификация: High/Low social × High/Low math&lt;/li&gt;
&lt;li&gt;Wages: рост медианных зарплат относительно 1980-х&lt;/li&gt;
&lt;li&gt;IT: спрос падает, важнее погружение в продукт&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 198: Вакансия Senior DS (Сбер, HR-блок)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;AI-агенты, ранжирование резюме, RecSys для обучения, отток&lt;/li&gt;
&lt;li&gt;Стек: Python, SQL, GigaChat, LangChain/LangGraph, LightGBM&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 199: Бесплатный API (vibeproxy)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;vibeproxy / easyCli — мимикрирование подписок&lt;/li&gt;
&lt;li&gt;Continue.dev + бесплатный Qwen&lt;/li&gt;
&lt;li&gt;ChatGPT Go не подходит, нужна Plus&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 200: KnowNote + DeepTutor (локальные NotebookLM)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;KnowNote: эмбеддер без настройки размерности, RAG не работал&lt;/li&gt;
&lt;li&gt;DeepTutor (10K ⭐): зависимости, LightRAG, RAGAnything&lt;/li&gt;
&lt;li&gt;Ollama POST-запросы некорректны → LM Studio&lt;/li&gt;
&lt;li&gt;Проблема с переполнением контекста (36 API-вызовов)&lt;/li&gt;
&lt;li&gt;LM Studio: частичный инференс на GPU&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 202: Мем (взаимный Agentic Looping)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост 203: Kimi для генерации слайдов
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;ChatGPT/Gemini/Perplexity: текст в пару предложений&lt;/li&gt;
&lt;li&gt;Kimi.com: достойные слайды про RAG (во вложении)&lt;/li&gt;
&lt;li&gt;Лимиты жёсткие&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 204: LLM в RecSys (follow-up)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;OneRec/MiniOneRec (Kuaishou): Semantic IDs, 25% трафика, 400M DAU&lt;/li&gt;
&lt;li&gt;PLUM (YouTube/Google): CPT на доменных данных&lt;/li&gt;
&lt;li&gt;RecAI/InteRecAgent (Microsoft), RecGPT/RecGPT-V2 (Taobao): LLM-оркестратор&lt;/li&gt;
&lt;li&gt;PinRec (Pinterest), LinkedIn Retrieval: dual-encoder&lt;/li&gt;
&lt;li&gt;RoLLMRec (2026): промпт-инъекции в описания товаров, защита через RAG-валидацию&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 205: Anthropic обвиняет китайские AI
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;16M+ запросов через фейковые аккаунты&lt;/li&gt;
&lt;li&gt;Claude на китайском отвечает что он DeepSeek&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 206: (пропущен / удалён)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост 207: Парадокс Джевонса
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Технологический прогресс увеличивает эффективность → увеличивает потребление&lt;/li&gt;
&lt;li&gt;indeed.com: вакансии разработчиков растут (vibe coding)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 208: Python митап
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Выступление про публикацию в open source&lt;/li&gt;
&lt;li&gt;100+ человек, обещали футболку 🤨&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 209: Мультиязычные LLM
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;One ruler to measure them all: Benchmarking multilingual long-context language models (arxiv 2025)&lt;/li&gt;
&lt;li&gt;Польский (88%) &amp;gt; русский (84%) &amp;gt; английский (83.9%)&lt;/li&gt;
&lt;li&gt;Тестировались слабые модели: Gemini-1.5-Flash, Qwen 2.5 72B&lt;/li&gt;
&lt;li&gt;Разница значимее на длинном контексте&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 210: Open Source LLM Spring 2026
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Обзор от Sebastian Raschka — что нового в опенсорс за 2 месяца:&lt;/li&gt;
&lt;li&gt;Sliding Window Attention у всех, контекст растёт, модели не толстеют&lt;/li&gt;
&lt;li&gt;QK-Norm как аналог RMSNorm&lt;/li&gt;
&lt;li&gt;Мультимодальные модели (Kimi k2.5 претрейн на изображениях)&lt;/li&gt;
&lt;li&gt;GLM-5 от Z.ai — на уровне GPT-5.2/Opus 4.5, внутри DeepSeek-V2&lt;/li&gt;
&lt;li&gt;Step 3.5 Flash (196B) — сопоставим с DeepSeek, в 3x быстрее, Multi-Token Prediction&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 211: AIConf 2026 (20 апреля, Москва)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Мультиагентные системы и RAG&lt;/li&gt;
&lt;li&gt;Стабильные результаты от LLM&lt;/li&gt;
&lt;li&gt;Обоснование технологий бизнесу&lt;/li&gt;
&lt;li&gt;Экономика AI / инфраструктура&lt;/li&gt;
&lt;li&gt;400+ участников, спикеры из Сбера, Яндекса, VK&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 212: Clawbot / OpenClaw опыт
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Поднял на VPS, старая версия библиотеки&lt;/li&gt;
&lt;li&gt;OpenRouter — бесплатные модели не такие уж бесплатные&lt;/li&gt;
&lt;li&gt;Локальный Qwen — tool calling падал из-за абсолютных путей&lt;/li&gt;
&lt;li&gt;Без контекста 200k всё падает&lt;/li&gt;
&lt;li&gt;Вывод: рано для само-хостинга, лучше коробочные решения (Kimi, GLM) но нужна подписка&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 215: Colleague Skill (цифровой двойник)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Система оцифровки сотрудника в AI-агента&lt;/li&gt;
&lt;li&gt;Стилистический промпт + мета-информация + переписки&lt;/li&gt;
&lt;li&gt;Три файла на выходе: стиль общения, решение задач, стек&lt;/li&gt;
&lt;li&gt;Зафорсилось в Китае&lt;/li&gt;
&lt;li&gt;Claude как кодинг-агент и так хорош&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 216: Z.ai цены
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;GLM 5.1 подписка подорожала в 2 раза до $160&lt;/li&gt;
&lt;li&gt;Лучшие в опенсорсе, но подписки как у проприетарных&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 217: Внедряем 🙂
&lt;/h3&gt;

&lt;p&gt;(19 😁 — мем-пост)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 218: RAG SOTA benchmarks (SEQUOIA)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Классический пайплайн: Hybrid Retrieval + reranker + суммаризация&lt;/li&gt;
&lt;li&gt;Step-back prompting, Agentic RAG&lt;/li&gt;
&lt;li&gt;LightRAG — графовая альтернатива векторным базам&lt;/li&gt;
&lt;li&gt;RAPTOR — дерево с кластеризацией листьев&lt;/li&gt;
&lt;li&gt;SEQUOIA = RAPTOR + step-back prompting = SOTA&lt;/li&gt;
&lt;li&gt;Проверено 7 методов: No-RAG, Classical, Hybrid, LightRAG, PageIndex, GraphRAG, Agentic, SEQUOIA, SEQUOIA Pro&lt;/li&gt;
&lt;li&gt;Репо: &lt;a href="https://github.com/Diyago/rag-benchmark" rel="noopener noreferrer"&gt;https://github.com/Diyago/rag-benchmark&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 219: Первое приседание
&lt;/h3&gt;

&lt;p&gt;(отсеял часть решений)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 220: AI Conf отчёт
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;Публикации индустрии — среднее время 9 месяцев, LLM для кода/ревью уже норма&lt;/li&gt;
&lt;li&gt;Воркшопы: search-агенты (ReAct + Groq + Tavily), мониторинг (Langfuse)&lt;/li&gt;
&lt;li&gt;Agent Harness (Deep Agents) — память + скиллы, но дорого (2M токенов на скилл, 100K на вызов)&lt;/li&gt;
&lt;li&gt;Голосовые агенты: Speech-to-Text → LLM → Text-to-Speech, проблемы с latency и перебиваниями&lt;/li&gt;
&lt;li&gt;LLM-контент на YouTube: обложка + сценарий + контент = легко распознать по капс-заголовкам&lt;/li&gt;
&lt;li&gt;Еда по талонам — котлетка с пюрешкой&lt;/li&gt;
&lt;/ol&gt;

&lt;h3&gt;
  
  
  Пост 221: 💀
&lt;/h3&gt;

&lt;p&gt;(18 😁 — мем)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 222: 100 триллионов токенов от Xiaomi
&lt;/h3&gt;

&lt;p&gt;(мем/новость)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 224: Russian Speech-To-Text бенчмарк
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Сравнил Whisper vs GigaAM-RNNT/CTC vs мультимодальные модели&lt;/li&gt;
&lt;li&gt;GigaAM на порядок быстрее Whisper при сопоставимых метриках&lt;/li&gt;
&lt;li&gt;Мультимодальные модели — медленно, качество проседает&lt;/li&gt;
&lt;li&gt;LLM-постпроцессинг улучшает качество&lt;/li&gt;
&lt;li&gt;Репо: &lt;a href="https://github.com/Diyago/tts_bench" rel="noopener noreferrer"&gt;https://github.com/Diyago/tts_bench&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;WER/CER метрики&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 225: AI для готовки
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;ChatGPT для готовки с 5й версии&lt;/li&gt;
&lt;li&gt;Кимчи, radis sauté au beuvre&lt;/li&gt;
&lt;li&gt;Создание реальной добавленной стоимости 😅&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 226: Стэнфорд исследование
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Найм проседает из-за AI в первую очередь у джунов&lt;/li&gt;
&lt;li&gt;Разработка и клиентская поддержка — сильнее всего&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://digitaleconomy.stanford.edu/" rel="noopener noreferrer"&gt;https://digitaleconomy.stanford.edu/&lt;/a&gt;...&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 227: Книга "Займись ничем"
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Польза прокрастинации&lt;/li&gt;
&lt;li&gt;Непрерывный фокус перегружает префронтальную кору&lt;/li&gt;
&lt;li&gt;Default Mode Network (DMN) — пассивный режим мозга ловит инсайты&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 228: Freebuff (вайбкодинг)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://freebuff.com/" rel="noopener noreferrer"&gt;https://freebuff.com/&lt;/a&gt; — бесплатные лимиты&lt;/li&gt;
&lt;li&gt;5 сессий по часу в день&lt;/li&gt;
&lt;li&gt;Модели: DeepSeek V4 Pro, Kimi K2.6, DeepSeek V4 Flash, MiniMax M2.7&lt;/li&gt;
&lt;li&gt;Собирают данные для обучения через API&lt;/li&gt;
&lt;li&gt;Обрывает часовые сессии&lt;/li&gt;
&lt;li&gt;Установка: npm install -g freebuff&lt;/li&gt;
&lt;/ul&gt;




&lt;p&gt;&lt;em&gt;Собрано: 2026-05-31&lt;/em&gt;&lt;br&gt;
&lt;em&gt;Источник: t.me/s/ai_tablet (public preview)&lt;/em&gt;&lt;br&gt;
&lt;em&gt;Метод: web_fetch через t.me/s/ URL (без авторизации)&lt;/em&gt;&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>rag</category>
      <category>llm</category>
    </item>
    <item>
      <title>AI.Insaf (@ai_tablet) — Полный архив постов канала</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Wed, 03 Jun 2026 06:01:42 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/aiinsaf-aitablet-polnyi-arkhiv-postov-kanala-36l7</link>
      <guid>https://dev.to/__2ddbae6bb7d/aiinsaf-aitablet-polnyi-arkhiv-postov-kanala-36l7</guid>
      <description>&lt;h1&gt;
  
  
  AI.Insaf (@ai_tablet) — Полный архив постов канала
&lt;/h1&gt;

&lt;h2&gt;
  
  
  Ранние посты (#1-~49)
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Пост ~1: TabGAN (pet project)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Библиотека генерации табличных данных (с 2021)&lt;/li&gt;
&lt;li&gt;500+ ⭐, 40K загрузок, 38 цитирований&lt;/li&gt;
&lt;li&gt;Грант Яндекс Open Source (апрель 2024)&lt;/li&gt;
&lt;li&gt;Теперь генерация через GAN + LLM + Forest Diffusion&lt;/li&gt;
&lt;li&gt;pip install tabgan&lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/Diyago/Tabular-data-generation" rel="noopener noreferrer"&gt;https://github.com/Diyago/Tabular-data-generation&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~2: Вакансии (DA + DS)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Мониторинг и предиктивное выявление проблемности корпоративных заёмщиков&lt;/li&gt;
&lt;li&gt;Стек: Python, SQL&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~3-7: Япония (Токио, Киото, Осака, Нара)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Токио: вежливость, регулировщики, рамены, Фудзи&lt;/li&gt;
&lt;li&gt;Киото: храмы, Золотой храм (Мисима), Тории ⛩, Фусими Инари&lt;/li&gt;
&lt;li&gt;Осака: замок, уличная еда&lt;/li&gt;
&lt;li&gt;Нара: олени 🦌&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~35: The Culture Code
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Успех команды = чувство безопасности&lt;/li&gt;
&lt;li&gt;Фасилитатор: сначала идеи, потом реализуемость&lt;/li&gt;
&lt;li&gt;Общее чувство цели + взаимная уязвимость&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~36: Мем (OK google, на чём обучали Gemini)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост ~37: Двойная ось Y в графиках
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Мнимое пересечение на графике №1&lt;/li&gt;
&lt;li&gt;График №2 — правильный, ушёл в печать&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~38: The Shape of Story (презентации)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Единство стиля, лаконичные выводы&lt;/li&gt;
&lt;li&gt;Микроистории: проблема → сложности → решение → эффект&lt;/li&gt;
&lt;li&gt;В Сбере — executive summary (обратный порядок)&lt;/li&gt;
&lt;li&gt;Курсы: Бонни и Слайд, Яндекс Практикум&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~39: Presentation skills (МФТИ → Delivery Club)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Первые слайды для руководства — "приземлили"&lt;/li&gt;
&lt;li&gt;Рекомендации: Виктор Кантор, Таня Савельева (топ-30 Forbes)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~40: Книги "Выживает самый дружелюбный" + "Лучшее в нас"
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Альтруизм бонобо, эволюционный успех через сотрудничество&lt;/li&gt;
&lt;li&gt;Снижение насилия в истории человечества&lt;/li&gt;
&lt;li&gt;Но: частные кейсы, confirmation bias, cherry picking&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~41: Менторство — личный опыт
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Два ментора за 3 года&lt;/li&gt;
&lt;li&gt;Первый: софты, продакт, книги, уверенность&lt;/li&gt;
&lt;li&gt;Второй (сертифицированный): быстрое разрешение кейсов&lt;/li&gt;
&lt;li&gt;Проблема: когда нечего формулировать — значит всё решилось&lt;/li&gt;
&lt;li&gt;PS: кто работает с ментором = менти&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~42: Летняя школа МФТИ
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Лекция: "Мониторинг корпоративных рисков в условиях неопределённости"&lt;/li&gt;
&lt;li&gt;Интерпретация моделей, bias/variance, blending&lt;/li&gt;
&lt;li&gt;"Кармический откат за пропуски лекций в универе"&lt;/li&gt;
&lt;li&gt;Большинство школьников выбрали домашку вместо докладов&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~43: Яндекс Практикум — консультант
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Обсудили найм, навыки DS для табличных данных&lt;/li&gt;
&lt;li&gt;Рекомендации по программе курса&lt;/li&gt;
&lt;li&gt;Интересная опция: сервис найма для нанимающих менеджеров&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~44: Хакатон AI стартапов (ментор)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Проект: личный ассистент по выбору одежды&lt;/li&gt;
&lt;li&gt;ViT/CLIP для эмбеддингов, FAISS для поиска&lt;/li&gt;
&lt;li&gt;FashionVLP, CoSMo.pytorch, metric learning&lt;/li&gt;
&lt;li&gt;Команда школьников — не прошли в финал (жюри: Артемий Лебедев)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~45: Почему бустинги лучше нейросетей на табличных данных
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Deep Neural Networks and Tabular Data: A Survey (2022)&lt;/li&gt;
&lt;li&gt;Причины: качество данных, отсутствие структуры, критичность признаков, GPU&lt;/li&gt;
&lt;li&gt;A Closer Look at Deep Learning on Tabular Data (300 датасетов)&lt;/li&gt;
&lt;li&gt;Catboost выигрывает в ~200 из 300&lt;/li&gt;
&lt;li&gt;TabR (Яндекс) — медленно, падает по памяти&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~46: Книги/курсы для DS
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Классическое ML: Python Machine Learning (Raschka), специализация МФТИ+Яндекс&lt;/li&gt;
&lt;li&gt;MLOps: O'Reilly&lt;/li&gt;
&lt;li&gt;System Design: Designing Machine Learning Systems&lt;/li&gt;
&lt;li&gt;Аналитика: Девенпорт, SQL, Pandas&lt;/li&gt;
&lt;li&gt;RecSys: курс МТС&lt;/li&gt;
&lt;li&gt;A/B: гайд VK, Яндекс Практикум, Trustworthy Online Controlled Experiments&lt;/li&gt;
&lt;li&gt;NLP: ШАД, Voita, Abby, обзорные статьи&lt;/li&gt;
&lt;li&gt;CV: Deep Learning with PyTorch&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~47: Софтовые навыки
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Общение, small talk&lt;/li&gt;
&lt;li&gt;Переговоры: "Договориться можно обо всём", "Переговоры с монстрами"&lt;/li&gt;
&lt;li&gt;Деловая переписка&lt;/li&gt;
&lt;li&gt;Фасилитация&lt;/li&gt;
&lt;li&gt;Public talks&lt;/li&gt;
&lt;li&gt;Лидерство: NASA, "Лидер без титула", "5 пороков и 5 благодетелей команды"&lt;/li&gt;
&lt;li&gt;Креативность: "Как придумать идею, если вы не Огилви"&lt;/li&gt;
&lt;li&gt;Менторы, коучи, психологи&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~143: Google Jules (coding agent)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Запущен в мае, интеграция с GitHub&lt;/li&gt;
&lt;li&gt;Переписал readme.md неплохо&lt;/li&gt;
&lt;li&gt;Но: установка torch непосильна, код не работал, 400+ строк изменений&lt;/li&gt;
&lt;li&gt;До часа ожидания на запрос&lt;/li&gt;
&lt;li&gt;Cursor пока лучше&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~144: Сбер — отчёт 2024
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Проект "Индивидуальный мониторинг" в отчёте Сбера&lt;/li&gt;
&lt;li&gt;486 страниц&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~145: Reddit — ChatGPT трейдинг
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Чат-бот натрейдил на $400&lt;/li&gt;
&lt;li&gt;Robinhood, длинное плечо, риск&lt;/li&gt;
&lt;li&gt;На NVidia ошибка 40% за 3 месяца&lt;/li&gt;
&lt;li&gt;Excel-протягивание или экспоненциальное сглаживание&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~146: Swing Vision (теннис)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Приложение для анализа тенниса&lt;/li&gt;
&lt;li&gt;Инвесторы: ex ATP No1&lt;/li&gt;
&lt;li&gt;Локальный инференс на телефоне&lt;/li&gt;
&lt;li&gt;Статистика: удары, точность, скорость&lt;/li&gt;
&lt;li&gt;Challenge (Hawk-Eye) для аутов&lt;/li&gt;
&lt;li&gt;Нужен трипод&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~147: OCR и Vision-LLM тренды Q1/Q2 2025
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Gemini 2.5 — новая SOTA, на 15-20% лучше qwen/gpt-4o&lt;/li&gt;
&lt;li&gt;Small VLM: MonkeyOCR, Dolphin&lt;/li&gt;
&lt;li&gt;ChartQA Pro: топовые VLM далеки от человека (85%)&lt;/li&gt;
&lt;li&gt;Claude Sonnet 3.5: ~56%, GPT-4o: ~42%&lt;/li&gt;
&lt;li&gt;Enterprise: специализированные модели лучше универсальных&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~157: Шри-Ланка
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Тур по путёвке&lt;/li&gt;
&lt;li&gt;Сёрфинг: инструктор 1000₽/час, отбил рёбро&lt;/li&gt;
&lt;li&gt;Цейлонский чай&lt;/li&gt;
&lt;li&gt;Еда спорная, акула как белая рыба, дуриан&lt;/li&gt;
&lt;li&gt;Сафари по реке: крокодилы, хамелеон, лангуры&lt;/li&gt;
&lt;li&gt;Запуск черепашек в океан&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~158: LLM Reasoning (Sebastian Raschka)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Wait Injection: +50% на математике&lt;/li&gt;
&lt;li&gt;Chain of Draft (CoD): короткие тезисы вместо избыточного CoT&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~159: ШАД — курс по LLM
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Достойные материалы&lt;/li&gt;
&lt;li&gt;PS: будет integer overflow&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~160: TabM (Яндекс)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;MLP-архитектура, имитирует ансамбль из 32 сетей&lt;/li&gt;
&lt;li&gt;Параметры из статьи, падает по памяти&lt;/li&gt;
&lt;li&gt;LightGBM: AUC 0.7659, TabM: 0.7421&lt;/li&gt;
&lt;li&gt;TabM CPU: 234.55s vs LGB: 0.23s&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~161: TabArena + RealMLP
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;TabArena бенчмарк: LightGBM и TabM стат. не отличаются&lt;/li&gt;
&lt;li&gt;RealMLP — новый лидер&lt;/li&gt;
&lt;li&gt;Предобученные дефолты, квантильное преобразование, smooth clipping&lt;/li&gt;
&lt;li&gt;Работает быстро, из коробки, гиперпараметры не нужны&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~162: Avito DS party
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Вечеринка для DS тимлидов и менеджеров&lt;/li&gt;
&lt;li&gt;Создание комьюнити&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  Посты #74-#89
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Пост ~74: Авито мероприятие для DS тимлидов
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Вечеринка, друзья, новые знакомства&lt;/li&gt;
&lt;li&gt;Цель: сильное комьюнити&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~75: Хакатон (кластеризация логов)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;3-е место&lt;/li&gt;
&lt;li&gt;Идеи: scaNN, Rank-BM25, кастомный эмбеддинг, dbstream, LLM-итеративная кластеризация, JetBrains aggregation&lt;/li&gt;
&lt;li&gt;Ожидаемо хотели трансформеры, но объём данных + ресурсы → другой подход&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~76: OCR обзор (Игорь Галицкий)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Pipeline-Based, Expert OCR VLMs (GOT-OCR2.0), General VLMs&lt;/li&gt;
&lt;li&gt;Enterprise: RAG по документам, качество OCR влияет на результат&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~77-78: Мемы
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост ~79: ChatGPT и расшифровка истории
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;"Александр Радищев", 1836&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~80: Аналитика hh
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост ~81: Data Ёлка VK (2019 → сейчас)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Reliable ML: MAPIE, uncertainties&lt;/li&gt;
&lt;li&gt;NLP: "LLM стали лучше. Занавес"&lt;/li&gt;
&lt;li&gt;PyData: Briefer, Quak&lt;/li&gt;
&lt;li&gt;Карьера: 7+ резюме на вакансию, джуны 10x&lt;/li&gt;
&lt;li&gt;Time-Series Anomaly Detection: Dive into Time-Series Anomaly Detection: A Decade Review&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~83: Персонализированное письмо
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;AI-агенты сайт спарсил GitHub + LinkedIn&lt;/li&gt;
&lt;li&gt;Супер-персонализированное письмо&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~86: Временные ряды аномалии (deep dive)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Dive into Time-Series Anomaly Detection: A Decade Review&lt;/li&gt;
&lt;li&gt;Виды аномалий: точечные, контекстные, sequence-based&lt;/li&gt;
&lt;li&gt;Supervised/Unsupervised/Semi-supervised/Self-supervised&lt;/li&gt;
&lt;li&gt;Классические: бустинги, RNN, LSTM, SVM, скользящее среднее&lt;/li&gt;
&lt;li&gt;Reconstruction-based: автоэнкодеры, GANs, диффузионные&lt;/li&gt;
&lt;li&gt;Clustering-based: DAG, KNN (лучший по простоте)&lt;/li&gt;
&lt;li&gt;Метрики: ROC AUC, Precision, Recall&lt;/li&gt;
&lt;li&gt;Бенчмарки: NAB, KDD21, TODS, TimeEval&lt;/li&gt;
&lt;li&gt;Рекомендация: бейзлайн на скользящих средних и бустингах&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~87: KNN для поиска аномалий (code snippet)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;window_size=5, NearestNeighbors, anomaly_scores&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~88: GigaChat vs DeepSeek (Марков vs Тюкин)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;GigaChat: позитивная оценка&lt;/li&gt;
&lt;li&gt;DeepSeek: выложил половину весов, скорость инференса в 2 раза ниже&lt;/li&gt;
&lt;li&gt;Цены API: DeepSeek $0.14-2/1M, ChatGPT $10-20, GigaChat $10&lt;/li&gt;
&lt;li&gt;DeepSeek API отключены&lt;/li&gt;
&lt;li&gt;GigaChat open-source, архитектура на DeepSeek&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~89: Hugging Face — AI агенты курс
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;smolagents — не нужно прописывать логику вызова функций&lt;/li&gt;
&lt;li&gt;Первая часть из шести, час&lt;/li&gt;
&lt;li&gt;Учебные проекты: запрос погоды (зачем, если проще напрямую)&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  Посты #90-#228
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Пост 90: ChatGPT и креативность (Science)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Generative AI enhances individual creativity but reduces collective diversity&lt;/li&gt;
&lt;li&gt;Больше AI-идей = лучше текст, но тексты похожие&lt;/li&gt;
&lt;li&gt;Решение: разные модели, повысить temperature&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 91: NeurIPS vs Taylor Swift
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;На NeurIPS меньше людей, чем на концерте Taylor Swift&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~92: Книга "Простые правила"
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Сложные правила сложно соблюдать&lt;/li&gt;
&lt;li&gt;Простые = продуктивнее и точнее&lt;/li&gt;
&lt;li&gt;Примеры: бессонница, стартапы Чили&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~93: Kaggle Best Solutions 2023
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Временные ряды: GroupKFold, cross time series validation&lt;/li&gt;
&lt;li&gt;GRU, магический коэффициент 1.0045&lt;/li&gt;
&lt;li&gt;LB public probing = переобучение (упал с 1-го на 967-е)&lt;/li&gt;
&lt;li&gt;Распознавание языков жестов: Squeezeformer, FingerDropout&lt;/li&gt;
&lt;li&gt;1D CNN для букв эффективнее трансформеров&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 163: Обзор архитектур open-source LLM за 2025
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Linear Attention Hybrids (Qwen3-Next, DeepSeek V3.2)&lt;/li&gt;
&lt;li&gt;Text Diffusion Models — параллельная генерация, но хуже качество&lt;/li&gt;
&lt;li&gt;Small Recursive Transformers — &amp;lt;100M параметров, головоломки&lt;/li&gt;
&lt;li&gt;Code World Models — LLM моделирует выполнение кода&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 190: Follow-up от Raschka
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Linear Attention: KV-кэш лучше, метрики немного просели&lt;/li&gt;
&lt;li&gt;Text Diffusion: не работает Chain of Thought&lt;/li&gt;
&lt;li&gt;Small Recursive Transformers: красивая история, но пока только тулзы для больших моделей&lt;/li&gt;
&lt;li&gt;Code World Models: увеличение compute, результат на уровне классики&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 191: Глобальная память в LLM
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Обзор подходов: суммаризация, NER, Agentic memory, длинный контекст, RAG, Function calling&lt;/li&gt;
&lt;li&gt;MemGPT → Letta: Core Memory + Archival Memory&lt;/li&gt;
&lt;li&gt;A-Mem: имитация человеческой памяти (факты модифицируются, не добавляются)&lt;/li&gt;
&lt;li&gt;LangMem (LangChain): асинхронная обработка памяти&lt;/li&gt;
&lt;li&gt;x3 F1, в 16x меньше токенов&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 192: GigaMemory (AI Journey Contest 2025)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;1-е место (86.6%): logprobs релевантности чанков через LLM&lt;/li&gt;
&lt;li&gt;2-е (84.5%): технически сложнее, но концептуально похоже&lt;/li&gt;
&lt;li&gt;3-е (74.5%): классический RAG с bge-m3&lt;/li&gt;
&lt;li&gt;Проблема: топ-2 перечитывают все диалоги заново&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост ~193: Итоги года (tgstats / tgwrapped)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Цифры не бьются — "не согласовали методологию"&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 195: RecSys (самый сложный домен в ML)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;МТС курс по RecSys&lt;/li&gt;
&lt;li&gt;В продакшене: комбинация методов + топ популярных + последние взаимодействия&lt;/li&gt;
&lt;li&gt;Стабильные предпочтения: ALS на большой истории&lt;/li&gt;
&lt;li&gt;HSTU (Meta, 2024): триллион параметров, генеративная архитектура&lt;/li&gt;
&lt;li&gt;Open-source: LightFM (заброшен), RePlay (Сбер)&lt;/li&gt;
&lt;li&gt;Яндекс Музыка: HSTU-подход, +2.2% TLT, +12% Discovery&lt;/li&gt;
&lt;li&gt;LLM в RecSys: OneRec/MiniOneRec, PLUM, RecAI/InteRecAgent, RecGPT, PinRec, RoLLMRec&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 196: Мем (оперативка дорожает)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост 197: Financial Times — AI-proof your job
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Социальные навыки важнее тех-скиллов для зарплаты&lt;/li&gt;
&lt;li&gt;O*NET классификация: High/Low social × High/Low math&lt;/li&gt;
&lt;li&gt;Wages: рост медианных зарплат относительно 1980-х&lt;/li&gt;
&lt;li&gt;IT: спрос падает, важнее погружение в продукт&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 198: Вакансия Senior DS (Сбер, HR-блок)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;AI-агенты, ранжирование резюме, RecSys для обучения, отток&lt;/li&gt;
&lt;li&gt;Стек: Python, SQL, GigaChat, LangChain/LangGraph, LightGBM&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 199: Бесплатный API (vibeproxy)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;vibeproxy / easyCli — мимикрирование подписок&lt;/li&gt;
&lt;li&gt;Continue.dev + бесплатный Qwen&lt;/li&gt;
&lt;li&gt;ChatGPT Go не подходит, нужна Plus&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 200: KnowNote + DeepTutor (локальные NotebookLM)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;KnowNote: эмбеддер без настройки размерности, RAG не работал&lt;/li&gt;
&lt;li&gt;DeepTutor (10K ⭐): зависимости, LightRAG, RAGAnything&lt;/li&gt;
&lt;li&gt;Ollama POST-запросы некорректны → LM Studio&lt;/li&gt;
&lt;li&gt;Проблема с переполнением контекста (36 API-вызовов)&lt;/li&gt;
&lt;li&gt;LM Studio: частичный инференс на GPU&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 202: Мем (взаимный Agentic Looping)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост 203: Kimi для генерации слайдов
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;ChatGPT/Gemini/Perplexity: текст в пару предложений&lt;/li&gt;
&lt;li&gt;Kimi.com: достойные слайды про RAG (во вложении)&lt;/li&gt;
&lt;li&gt;Лимиты жёсткие&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 204: LLM в RecSys (follow-up)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;OneRec/MiniOneRec (Kuaishou): Semantic IDs, 25% трафика, 400M DAU&lt;/li&gt;
&lt;li&gt;PLUM (YouTube/Google): CPT на доменных данных&lt;/li&gt;
&lt;li&gt;RecAI/InteRecAgent (Microsoft), RecGPT/RecGPT-V2 (Taobao): LLM-оркестратор&lt;/li&gt;
&lt;li&gt;PinRec (Pinterest), LinkedIn Retrieval: dual-encoder&lt;/li&gt;
&lt;li&gt;RoLLMRec (2026): промпт-инъекции в описания товаров, защита через RAG-валидацию&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 205: Anthropic обвиняет китайские AI
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;16M+ запросов через фейковые аккаунты&lt;/li&gt;
&lt;li&gt;Claude на китайском отвечает что он DeepSeek&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 206: (пропущен / удалён)
&lt;/h3&gt;

&lt;h3&gt;
  
  
  Пост 207: Парадокс Джевонса
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Технологический прогресс увеличивает эффективность → увеличивает потребление&lt;/li&gt;
&lt;li&gt;indeed.com: вакансии разработчиков растут (vibe coding)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 208: Python митап
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Выступление про публикацию в open source&lt;/li&gt;
&lt;li&gt;100+ человек, обещали футболку 🤨&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 209: Мультиязычные LLM
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;One ruler to measure them all: Benchmarking multilingual long-context language models (arxiv 2025)&lt;/li&gt;
&lt;li&gt;Польский (88%) &amp;gt; русский (84%) &amp;gt; английский (83.9%)&lt;/li&gt;
&lt;li&gt;Тестировались слабые модели: Gemini-1.5-Flash, Qwen 2.5 72B&lt;/li&gt;
&lt;li&gt;Разница значимее на длинном контексте&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 210: Open Source LLM Spring 2026
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Обзор от Sebastian Raschka — что нового в опенсорс за 2 месяца:&lt;/li&gt;
&lt;li&gt;Sliding Window Attention у всех, контекст растёт, модели не толстеют&lt;/li&gt;
&lt;li&gt;QK-Norm как аналог RMSNorm&lt;/li&gt;
&lt;li&gt;Мультимодальные модели (Kimi k2.5 претрейн на изображениях)&lt;/li&gt;
&lt;li&gt;GLM-5 от Z.ai — на уровне GPT-5.2/Opus 4.5, внутри DeepSeek-V2&lt;/li&gt;
&lt;li&gt;Step 3.5 Flash (196B) — сопоставим с DeepSeek, в 3x быстрее, Multi-Token Prediction&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 211: AIConf 2026 (20 апреля, Москва)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Мультиагентные системы и RAG&lt;/li&gt;
&lt;li&gt;Стабильные результаты от LLM&lt;/li&gt;
&lt;li&gt;Обоснование технологий бизнесу&lt;/li&gt;
&lt;li&gt;Экономика AI / инфраструктура&lt;/li&gt;
&lt;li&gt;400+ участников, спикеры из Сбера, Яндекса, VK&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 212: Clawbot / OpenClaw опыт
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Поднял на VPS, старая версия библиотеки&lt;/li&gt;
&lt;li&gt;OpenRouter — бесплатные модели не такие уж бесплатные&lt;/li&gt;
&lt;li&gt;Локальный Qwen — tool calling падал из-за абсолютных путей&lt;/li&gt;
&lt;li&gt;Без контекста 200k всё падает&lt;/li&gt;
&lt;li&gt;Вывод: рано для само-хостинга, лучше коробочные решения (Kimi, GLM) но нужна подписка&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 215: Colleague Skill (цифровой двойник)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Система оцифровки сотрудника в AI-агента&lt;/li&gt;
&lt;li&gt;Стилистический промпт + мета-информация + переписки&lt;/li&gt;
&lt;li&gt;Три файла на выходе: стиль общения, решение задач, стек&lt;/li&gt;
&lt;li&gt;Зафорсилось в Китае&lt;/li&gt;
&lt;li&gt;Claude как кодинг-агент и так хорош&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 216: Z.ai цены
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;GLM 5.1 подписка подорожала в 2 раза до $160&lt;/li&gt;
&lt;li&gt;Лучшие в опенсорсе, но подписки как у проприетарных&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 217: Внедряем 🙂
&lt;/h3&gt;

&lt;p&gt;(19 😁 — мем-пост)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 218: RAG SOTA benchmarks (SEQUOIA)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Классический пайплайн: Hybrid Retrieval + reranker + суммаризация&lt;/li&gt;
&lt;li&gt;Step-back prompting, Agentic RAG&lt;/li&gt;
&lt;li&gt;LightRAG — графовая альтернатива векторным базам&lt;/li&gt;
&lt;li&gt;RAPTOR — дерево с кластеризацией листьев&lt;/li&gt;
&lt;li&gt;SEQUOIA = RAPTOR + step-back prompting = SOTA&lt;/li&gt;
&lt;li&gt;Проверено 7 методов: No-RAG, Classical, Hybrid, LightRAG, PageIndex, GraphRAG, Agentic, SEQUOIA, SEQUOIA Pro&lt;/li&gt;
&lt;li&gt;Репо: &lt;a href="https://github.com/Diyago/rag-benchmark" rel="noopener noreferrer"&gt;https://github.com/Diyago/rag-benchmark&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 219: Первое приседание
&lt;/h3&gt;

&lt;p&gt;(отсеял часть решений)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 220: AI Conf отчёт
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;Публикации индустрии — среднее время 9 месяцев, LLM для кода/ревью уже норма&lt;/li&gt;
&lt;li&gt;Воркшопы: search-агенты (ReAct + Groq + Tavily), мониторинг (Langfuse)&lt;/li&gt;
&lt;li&gt;Agent Harness (Deep Agents) — память + скиллы, но дорого (2M токенов на скилл, 100K на вызов)&lt;/li&gt;
&lt;li&gt;Голосовые агенты: Speech-to-Text → LLM → Text-to-Speech, проблемы с latency и перебиваниями&lt;/li&gt;
&lt;li&gt;LLM-контент на YouTube: обложка + сценарий + контент = легко распознать по капс-заголовкам&lt;/li&gt;
&lt;li&gt;Еда по талонам — котлетка с пюрешкой&lt;/li&gt;
&lt;/ol&gt;

&lt;h3&gt;
  
  
  Пост 221: 💀
&lt;/h3&gt;

&lt;p&gt;(18 😁 — мем)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 222: 100 триллионов токенов от Xiaomi
&lt;/h3&gt;

&lt;p&gt;(мем/новость)&lt;/p&gt;

&lt;h3&gt;
  
  
  Пост 224: Russian Speech-To-Text бенчмарк
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Сравнил Whisper vs GigaAM-RNNT/CTC vs мультимодальные модели&lt;/li&gt;
&lt;li&gt;GigaAM на порядок быстрее Whisper при сопоставимых метриках&lt;/li&gt;
&lt;li&gt;Мультимодальные модели — медленно, качество проседает&lt;/li&gt;
&lt;li&gt;LLM-постпроцессинг улучшает качество&lt;/li&gt;
&lt;li&gt;Репо: &lt;a href="https://github.com/Diyago/tts_bench" rel="noopener noreferrer"&gt;https://github.com/Diyago/tts_bench&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;WER/CER метрики&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 225: AI для готовки
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;ChatGPT для готовки с 5й версии&lt;/li&gt;
&lt;li&gt;Кимчи, radis sauté au beuvre&lt;/li&gt;
&lt;li&gt;Создание реальной добавленной стоимости 😅&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 226: Стэнфорд исследование
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Найм проседает из-за AI в первую очередь у джунов&lt;/li&gt;
&lt;li&gt;Разработка и клиентская поддержка — сильнее всего&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://digitaleconomy.stanford.edu/" rel="noopener noreferrer"&gt;https://digitaleconomy.stanford.edu/&lt;/a&gt;...&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 227: Книга "Займись ничем"
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Польза прокрастинации&lt;/li&gt;
&lt;li&gt;Непрерывный фокус перегружает префронтальную кору&lt;/li&gt;
&lt;li&gt;Default Mode Network (DMN) — пассивный режим мозга ловит инсайты&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Пост 228: Freebuff (вайбкодинг)
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://freebuff.com/" rel="noopener noreferrer"&gt;https://freebuff.com/&lt;/a&gt; — бесплатные лимиты&lt;/li&gt;
&lt;li&gt;5 сессий по часу в день&lt;/li&gt;
&lt;li&gt;Модели: DeepSeek V4 Pro, Kimi K2.6, DeepSeek V4 Flash, MiniMax M2.7&lt;/li&gt;
&lt;li&gt;Собирают данные для обучения через API&lt;/li&gt;
&lt;li&gt;Обрывает часовые сессии&lt;/li&gt;
&lt;li&gt;Установка: npm install -g freebuff&lt;/li&gt;
&lt;/ul&gt;




&lt;p&gt;&lt;em&gt;Собрано: 2026-05-31&lt;/em&gt;&lt;br&gt;
&lt;em&gt;Источник: t.me/s/ai_tablet (public preview)&lt;/em&gt;&lt;br&gt;
&lt;em&gt;Метод: web_fetch через t.me/s/ URL (без авторизации)&lt;/em&gt;&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>rag</category>
      <category>llm</category>
    </item>
    <item>
      <title>AI.Insaf — Архив постов канала (реальные посты из web_fetch)</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Wed, 03 Jun 2026 06:00:19 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/aiinsaf-arkhiv-postov-kanala-riealnyie-posty-iz-webfetch-1mhm</link>
      <guid>https://dev.to/__2ddbae6bb7d/aiinsaf-arkhiv-postov-kanala-riealnyie-posty-iz-webfetch-1mhm</guid>
      <description>&lt;h1&gt;
  
  
  AI.Insaf — Архив постов канала (реальные посты из web_fetch)
&lt;/h1&gt;

&lt;p&gt;&lt;strong&gt;Канал:&lt;/strong&gt; &lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;br&gt;
&lt;strong&gt;Владелец:&lt;/strong&gt; Инсаф Ашрапов (Lead DS, Сбер)&lt;br&gt;
&lt;strong&gt;Дата архивации:&lt;/strong&gt; 2026-05-31&lt;br&gt;
&lt;strong&gt;Метод:&lt;/strong&gt; web_fetch через публичный preview t.me/s/ai_tablet&lt;br&gt;
&lt;strong&gt;Всего постов в канале:&lt;/strong&gt; ~228&lt;br&gt;
&lt;strong&gt;В этом архиве:&lt;/strong&gt; ~60+ реальных постов, которые удалось вытащить&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #1 — Создание канала
&lt;/h2&gt;

&lt;p&gt;&lt;em&gt;Channel created&lt;/em&gt;&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #2 — TabGAN
&lt;/h2&gt;

&lt;p&gt;Несколько слов про свой pet project – tabgan, который продолжает жить с 2021г. Суть либы в генерации новых табличных данных похожих к данным на входе — можно применить для анонимизации данных, для генерации данных для dev стендов. Уже более 500 ⭐, 40 тысяч загрузок, 38 цитирований. В апреле 2024 выиграл грант от Яндекса как один из лучших open source проектов.&lt;br&gt;
Недавно выпустил новую версию — теперь там не только генерация с GAN, но и через LLM и Forest Diffusion. Тестировать: pip install tabgan&lt;br&gt;
🔗 &lt;a href="https://github.com/Diyago/Tabular-data-generation" rel="noopener noreferrer"&gt;https://github.com/Diyago/Tabular-data-generation&lt;/a&gt;&lt;br&gt;
👍5 4&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #3 — Вакансии (DA + DS)
&lt;/h2&gt;

&lt;p&gt;К себе в команду ищу дата аналитика (junior/middle) и data scientist'a (middle+/senior). Мы занимаемся мониторингом и предиктивным выявлением проблемности у действующих и новых корпоративных заемщиков банка с помощью ML моделей. Стэк: python, sql.&lt;br&gt;
👍2 🙏1 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #4 — Япония: Токио
&lt;/h2&gt;

&lt;p&gt;На новый год съездил в Японию. Токио — нет явно выраженного центра, очень свободно. Люди невероятно вежливые, в метро контролер кланяется тебе. Очень много людей регулирует потоки. Еда безумно вкусная, рамены в Москве намного проще. В ясную погоду можно увидеть гору Фудзи.&lt;br&gt;
4 👍3 😁2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #5 — Япония: Киото / Осака / Нара
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Киото&lt;/strong&gt; — Самый насыщенный старинными храмами город. Был столицей &amp;gt;1000 лет. Золотой храм, Храм Фусими Инари (711г) с тысячами ворот Тории.&lt;br&gt;
&lt;strong&gt;Осака&lt;/strong&gt; — Замок Осаки (из сериала Сёгун), уличная еда.&lt;br&gt;
&lt;strong&gt;Нара&lt;/strong&gt; — Храмы + диснеевские олени 🦌&lt;br&gt;
❤5&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #6 — (фото/мем, текст не вытащен)
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #7 — Книги и курсы для DS (часть 1 — база)
&lt;/h2&gt;

&lt;p&gt;Набросал книжки/курсы, которые помогут стать хорошим DS.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;1. Классическое ML (табличные данные):&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Python Machine Learning by Sebastian Raschka (кроме 13-й главы)&lt;/li&gt;
&lt;li&gt;Специализация Машинное обучение и анализ данных от МФТИ и Яндекса&lt;/li&gt;
&lt;li&gt;Kaggle соревнования&lt;/li&gt;
&lt;li&gt;Лекции с Датафеста и ML Training&lt;/li&gt;
&lt;li&gt;Документация CatBoost, XGBoost, LightGBM&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;2. MLOps:&lt;/strong&gt; Introducing MLOps (O'Reilly)&lt;br&gt;
&lt;strong&gt;3. System Design:&lt;/strong&gt; Designing Machine Learning Systems (O'Reilly)&lt;br&gt;
&lt;strong&gt;4. Аналитика:&lt;/strong&gt; Девенпорт, аналитика как конкурентное преимущество, SQL, Pandas&lt;br&gt;
&lt;strong&gt;5. RecSys:&lt;/strong&gt; Курс от МТС (5 лекций основных)&lt;br&gt;
&lt;strong&gt;6. A/B-тестирование:&lt;/strong&gt; Гайд от VK, курс от Яндекса, Trustworthy Online Controlled Experiments&lt;br&gt;
&lt;strong&gt;7. NLP:&lt;/strong&gt; Курс ШАДа, курс Лены Войты, DeepNLP-Course, обзорные статьи по LLM&lt;br&gt;
&lt;strong&gt;8. CV:&lt;/strong&gt; Deep Learning with PyTorch, image classification, segmentation, GAN, object detection, diffusion models, ViT&lt;/p&gt;

&lt;p&gt;👍7 7 🕊2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #8 — Софтовые навыки для DS
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;1. Общение, small talks&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;2. Переговоры:&lt;/strong&gt; Договориться можно обо всем, Договориться о невозможном, Переговоры с монстрами&lt;br&gt;
&lt;strong&gt;3. Деловая переписка:&lt;/strong&gt; Новые правила деловой переписки&lt;br&gt;
&lt;strong&gt;4. Фасилитация:&lt;/strong&gt; Руководство фасилитатора&lt;br&gt;
&lt;strong&gt;5. Public talks&lt;/strong&gt; — только практика&lt;br&gt;
&lt;strong&gt;6. Лидерство:&lt;/strong&gt; Действуй как лидер, 100 правил проектов NASA, Лидер без титула, Идеальный руководитель, 5 пороков и 5 благодетелей команды, стили эмоционального лидерства&lt;br&gt;
&lt;strong&gt;7. Креативность:&lt;/strong&gt; Как придумать идею, если вы не Огилви&lt;br&gt;
&lt;strong&gt;8. Менторы, коучи, психологи&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;👍11 1 😁1 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #9 — Gemini training data (мем)
&lt;/h2&gt;

&lt;p&gt;OK google) на чем же обучали gemini 🤔&lt;br&gt;
🥰6 💋2 1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #10 — Двойная ось Y в графиках
&lt;/h2&gt;

&lt;p&gt;Почему не стоит использовать двойную ось Y в графиках. При подготовке материалов столкнулся с необходимостью — получилось мнимое пересечение, хотя его на самом деле нет. Используйте с осторожностью.&lt;br&gt;
👍8 🤣4 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #11 — The Culture Code
&lt;/h2&gt;

&lt;p&gt;Книга The Culture Code: The Secrets of Highly Successful Groups. Успех команды напрямую зависит от чувства безопасности внутри нее. Общее чувство цели и взаимная уязвимость. Не стоит подчеркивать чужие промахи, а дать человеку возможность самостоятельно разобраться.&lt;br&gt;
👍11 🤔2 🫡1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #12 — The Shape of Story (презентации)
&lt;/h2&gt;

&lt;p&gt;Создание презентаций: единство стиля, лаконичные выводы, только необходимая информация. Курс Бонни и Слайд, бесплатный от Яндекса.&lt;br&gt;
Строить рассказ через микроистории: проблема → сложности → решение → эффект.&lt;br&gt;
👍7 2 😁2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #13 — Presentation skills
&lt;/h2&gt;

&lt;p&gt;Когда учился на физтехе (МФТИ), слайды делал только на парах по английскому. На первой работе в Delivery Club быстро приземлили когда делал слайды для руководства.&lt;br&gt;
Рекомендую каналы: Виктор Кантор (t.me/kantor_ai), Таня Савельева (t.me/tldr_tany).&lt;br&gt;
6 ❤4 👍2 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #14 — Книги: Выживает самый дружелюбный и Лучшее в нас
&lt;/h2&gt;

&lt;p&gt;Две книги развивают схожие тезисы о преимуществах дружелюбия.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Первая: альтруизм бонобо объясняет эволюционный успех через сотрудничество&lt;/li&gt;
&lt;li&gt;Вторая: снижение уровня насилия на протяжении всей истории
Обе имеют проблемы: первая — cherry picking, вторая — большой доверительный интервал исторических данных.
👍8 ❤2 1 🤔1 🗿1&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  Пост #15 — Менторство (личный опыт)
&lt;/h2&gt;

&lt;p&gt;За последние три года поработал с двумя менторами.&lt;br&gt;
Первый — помог собраться по софтам когда стал продактом в команде.&lt;br&gt;
Второй — сертифицированный ментор, быстро помог разобрать проблемные кейсы.&lt;br&gt;
Внешний взгляд позволяет получить объективные доводы о том, что делать дальше. Очень рекомендую.&lt;br&gt;
PS: Кто работает с ментором — называют менти 😏&lt;br&gt;
👍9 ❤5 2 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #16 — Лекция в Летней школе МФТИ
&lt;/h2&gt;

&lt;p&gt;Сегодня выступил с лекцией на Летней школе МФТИ на тему "Мониторинг корпоративных рисков в условиях неопределенности". Обсудили интерпретацию моделей, bias/variance, blending. Большая часть школьников выбрала делать домашку вместо докладов.&lt;br&gt;
🫡8 👍7 3 😎1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #17 — Консультант Яндекс Практикума
&lt;/h2&gt;

&lt;p&gt;Связались из Яндекс Практикума. Обсудили особенности найма и навыки для DS (ML, Python, SQL). Дал рекомендации по программе курса — главный пробел: недостаточный фокус на работе с данными.&lt;br&gt;
Бесплатная возможность для нанимающих менеджеров: через форму можно выбрать и пообщаться с сервисом найма.&lt;br&gt;
👍8 2 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #18 — Ментор на конкурсе AI-стартапов
&lt;/h2&gt;

&lt;p&gt;Проект — личный ассистент по выбору одежды. Техническая часть: ViT/CLIP для эмбеддингов, FAISS для поиска.&lt;br&gt;
Команда школьников со своим продуктом и продактом. Жалко, что не прошли в финал (жюри — Артемий Лебедев).&lt;br&gt;
👍9 7 😁3 👾2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #19 — Бустинги vs нейросети на табличных данных
&lt;/h2&gt;

&lt;p&gt;Почему классические бустинги часто лучше нейросетей на табличных данных?&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Причины:&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Различие в природе данных — табличные гомогенные, тексты/картинки гетерогенные&lt;/li&gt;
&lt;li&gt;Плохое качество данных и зависимость от препроцессинга&lt;/li&gt;
&lt;li&gt;Отсутствие или нелинейная связь признаков&lt;/li&gt;
&lt;li&gt;Критичная важность признаков&lt;/li&gt;
&lt;li&gt;Время обучения и необходимость GPU&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Обзоры:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Deep Neural Networks and Tabular Data: A Survey (2022)&lt;/li&gt;
&lt;li&gt;A Closer Look at Deep Learning on Tabular Data (2024) — бенчмарк на 300 датасетах, в 200 из 300 деревья выигрывают (особенно CatBoost)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👍8 6 🤔2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #20 — Сравнение таблиц (мем)
&lt;/h2&gt;

&lt;p&gt;1я статья. Бустинги (первая половина таблицы) сильно лучше сеток&lt;br&gt;
👍4 3 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #21 — Сравнение таблиц 2 (мем)
&lt;/h2&gt;

&lt;p&gt;2я статья&lt;br&gt;
👍5 1 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #22 — Книга ML System Design от Alex Xu
&lt;/h2&gt;

&lt;p&gt;Отличная обзорная книга о проектировании систем ML. В русскоязычном сегменте популяризировал Валера Бабушкин.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Пайплайн:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Понять проблему (бизнес-цель, ограничения)&lt;/li&gt;
&lt;li&gt;Архитектура (пайплайн ML-модели, масштабируемость, мониторинг)&lt;/li&gt;
&lt;li&gt;Подвести итоги&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Книжку советую менеджерам. DS будет скучно.&lt;br&gt;
👍9 ❤1 1 🤔1 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #23 — Схема ML System Design (мем)
&lt;/h2&gt;

&lt;p&gt;схема от автора книги&lt;br&gt;
👍6 ❤3 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #24 — Книга Decode and Conquer (Product Management)
&lt;/h2&gt;

&lt;p&gt;Неплохая книжка по продуктовому менеджменту. Фреймворки:&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;CIRCLES:&lt;/strong&gt; Comprehend → Identify → Report → Cut → List → Evaluate → Summarize&lt;br&gt;
&lt;strong&gt;DIGS:&lt;/strong&gt; Define → Identify → Generate → Select&lt;br&gt;
&lt;strong&gt;MoSCoW:&lt;/strong&gt; Must/Should/Could/Won't have&lt;br&gt;
&lt;strong&gt;RICE:&lt;/strong&gt; Reach × Impact × Confidence / Effort&lt;/p&gt;

&lt;p&gt;👍8 4 👌2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #17 — Консультант Яндекс Практикума
&lt;/h2&gt;

&lt;p&gt;Связались из Яндекс Практикума. Обсудили особенности найма и навыки для DS (ML, Python, SQL). Дал рекомендации по программе курса — главный пробел: недостаточный фокус на работе с данными.&lt;br&gt;
Бесплатная возможность для нанимающих менеджеров: через форму можно выбрать и пообщаться с сервисом найма.&lt;br&gt;
👍8 2 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #18 — Ментор на конкурсе AI-стартапов
&lt;/h2&gt;

&lt;p&gt;Проект — личный ассистент по выбору одежды. Техническая часть: ViT/CLIP для эмбеддингов, FAISS для поиска.&lt;br&gt;
Команда школьников со своим продуктом и продактом. Жалко, что не прошли в финал (жюри — Артемий Лебедев).&lt;br&gt;
👍9 7 😁3 👾2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #19 — Бустинги vs нейросети на табличных данных
&lt;/h2&gt;

&lt;p&gt;Почему классические бустинги часто лучше нейросетей на табличных данных?&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Причины:&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Различие в природе данных — табличные гомогенные, тексты/картинки гетерогенные&lt;/li&gt;
&lt;li&gt;Плохое качество данных и зависимость от препроцессинга&lt;/li&gt;
&lt;li&gt;Отсутствие или нелинейная связь признаков&lt;/li&gt;
&lt;li&gt;Критичная важность признаков&lt;/li&gt;
&lt;li&gt;Время обучения и необходимость GPU&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Обзоры:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Deep Neural Networks and Tabular Data: A Survey (2022)&lt;/li&gt;
&lt;li&gt;A Closer Look at Deep Learning on Tabular Data (2024) — бенчмарк на 300 датасетах, в 200 из 300 деревья выигрывают (особенно CatBoost)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👍8 6 🤔2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #20 — Сравнение таблиц (мем)
&lt;/h2&gt;

&lt;p&gt;1я статья. Бустинги (первая половина таблицы) сильно лучше сеток&lt;br&gt;
👍4 3 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #21 — Сравнение таблиц 2 (мем)
&lt;/h2&gt;

&lt;p&gt;2я статья&lt;br&gt;
👍5 1 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #22 — Книга ML System Design от Alex Xu
&lt;/h2&gt;

&lt;p&gt;Отличная обзорная книга о проектировании систем ML. В русскоязычном сегменте популяризировал Валера Бабушкин.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Пайплайн:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Понять проблему (бизнес-цель, ограничения)&lt;/li&gt;
&lt;li&gt;Архитектура (пайплайн ML-модели, масштабируемость, мониторинг)&lt;/li&gt;
&lt;li&gt;Подвести итоги&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Книжку советую менеджерам. DS будет скучно.&lt;br&gt;
👍9 ❤1 1 🤔1 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #23 — Схема ML System Design (мем)
&lt;/h2&gt;

&lt;p&gt;схема от автора книги&lt;br&gt;
👍6 ❤3 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #24 — Книга Decode and Conquer (Product Management)
&lt;/h2&gt;

&lt;p&gt;Неплохая книжка по продуктовому менеджменту. Фреймворки:&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;CIRCLES:&lt;/strong&gt; Comprehend → Identify → Report → Cut → List → Evaluate → Summarize&lt;br&gt;
&lt;strong&gt;DIGS:&lt;/strong&gt; Define → Identify → Generate → Select&lt;br&gt;
&lt;strong&gt;MoSCoW:&lt;/strong&gt; Must/Should/Could/Won't have&lt;br&gt;
&lt;strong&gt;RICE:&lt;/strong&gt; Reach × Impact × Confidence / Effort&lt;/p&gt;

&lt;p&gt;👍8 4 👌2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #25 — Поездка в ЮАР (Кейптаун)
&lt;/h2&gt;

&lt;p&gt;В октябре съездил в Кейптаун. Тур через @heapcheaptrips_tours. Группа из 6+ человек.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Океаны (Индийский и Атлантический), столовые горы&lt;/li&gt;
&lt;li&gt;Мыс Доброй Надежды&lt;/li&gt;
&lt;li&gt;Тауншипы (гетто) со времён апартеида&lt;/li&gt;
&lt;li&gt;Весна — цветение растений, киты, пингвины, дельфины 🐬&lt;/li&gt;
&lt;li&gt;Питомник: львы на расстоянии вытянутой руки, слоны, буйволы&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👍10 7 ❤2 🥰1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #26 — ЮАР фото 1
&lt;/h2&gt;

&lt;p&gt;❤11 5 👍1 🤩1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #27 — ЮАР фото 2
&lt;/h2&gt;

&lt;p&gt;17 ❤4 🙏2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #28-40 — (фото/эмодзи/мемы, текст не вытащен)
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #41 — Каналы для DS
&lt;/h2&gt;

&lt;p&gt;Рекомендую каналы: Виктор Кантор (t.me/kantor_ai) — образование и карьера в DS, топ 30 Форбс. Таня Савельева (t.me/tldr_tany) — номинант топ 30 Форбс.&lt;br&gt;
6 ❤4 👍2 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #42-53 — Повторы ранних постов (мемы/фото)
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #54 — Поездка в ЮАР (повтор)
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #55-73 — Фото из ЮАР, Китая, хакатона
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #74 — Хакатон кластеризации
&lt;/h2&gt;

&lt;p&gt;Удалось побыть DS-ментором на хакатоне. Команда заняла 3-е место . Проект — кластеризация событий брокера сообщений/логов.&lt;/p&gt;

&lt;p&gt;Идеи:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Baseline: scaNN + эмбеддер&lt;/li&gt;
&lt;li&gt;Rank-BM25 — улучшенный tf-idf&lt;/li&gt;
&lt;li&gt;Кастомный эмбеддинг: BPE токенизатор → tf-idf → кластеризация&lt;/li&gt;
&lt;li&gt;RapidFuzz + dbstream clustering&lt;/li&gt;
&lt;li&gt;Итеративное выделение кластеров с LLM&lt;/li&gt;
&lt;li&gt;JetBrains: Aggregation of Stack Trace Similarities&lt;/li&gt;
&lt;/ol&gt;




&lt;h2&gt;
  
  
  Пост #75-89 — Хакатон (продолжение, фото)
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #90 — Как ChatGPT влияет на креативность
&lt;/h2&gt;

&lt;p&gt;Журнал Science: Generative AI enhances individual creativity but reduces the collective diversity.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Чем больше AI-идей доступно — тем лучше текст (особенно для слабых навыков)&lt;/li&gt;
&lt;li&gt;Но чем активнее используют подсказки AI — тем более похожими становятся тексты (проверено через косинусное расстояние эмбеддингов)
👍12 5 ❤4&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  Пост #91 — NeurIPS vs Taylor Swift
&lt;/h2&gt;

&lt;p&gt;Топ1 AI-конфу NeurIPS посетило намного меньше людей, чем концерт Taylor Swift (вот где true hype)&lt;br&gt;
😁7 5 🥰3 🤔2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #92 — Книга Простые правила
&lt;/h2&gt;

&lt;p&gt;Книга Дональда Сулла и Кэтлин Эйзенхардт. Сложным правилам непросто следовать, они могут быть ошибочными — простые оказываются продуктивнее. Разбор множества сфер: от медицины (борьба с бессонницей — ложиться спать в одно время) до программы развития стартапов в Чили.&lt;br&gt;
👍11 😁7 ❤4 🗿1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #93 — Kaggle Best Solutions 2023
&lt;/h2&gt;

&lt;p&gt;Прочитал лучшие решения с соревнований Kaggle 2023 года. За статьи раздали $100,000.&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Временные ряды (Chris Deotte): прогноз микробизнесов, прогрессирование болезни Паркинсона&lt;/li&gt;
&lt;li&gt;Распознавание языков жестов: Squeezeformer, FingerDropout&lt;/li&gt;
&lt;li&gt;Прогноз успеваемости студентов: бустинги + WaveNet-подход&lt;/li&gt;
&lt;li&gt;Физические задачи: гравитационные волны (G2Net), нейтрино (GNN)&lt;/li&gt;
&lt;li&gt;Маммография: YOLOX + EfficientNet&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;👍14 ❤2 2 🤓2 😁1 🦄1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #94 — Почему AutoML не серебряная пуля
&lt;/h2&gt;

&lt;p&gt;Чтобы построить хорошую модель, нужно полностью разобраться в задаче и правильно поделить данные. GroupKFold по регионам + cross time series validation. В LAMA такой параметр есть, но если не знать зачем — AutoML не сделает правильный выбор.&lt;br&gt;
👍9 😁4 🤔3&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #95 — Perplexity подписка
&lt;/h2&gt;

&lt;p&gt;Проспонсировал AI-гонку, купив годовую подписку Perplexity. 300 запросов в день.&lt;br&gt;
👍8 😁4 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #96-100 — Фото/мемы
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #101 — Вьетнам и Малайзия
&lt;/h2&gt;

&lt;p&gt;Еще в конце февраля ездили во Вьетнам (Ханой → Фукуок), затем в Малайзию.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Чэнду (Китай)&lt;/strong&gt; — родина панд, попали в заповедник. Сычуанский перец даёт онемение.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Ханой&lt;/strong&gt; — понравился больше всего. Кухня: фо бо, бун ча, яичный кофе, свежие роллы. Ресторан из гида Мишлен — суп с пивом за 250 рублей, за соседним столиком сидел Обама. Бухта Халонг (1000+ островов), Ниньбинь.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Фукуок&lt;/strong&gt; — перелёт на юг Вьетнама. Аквапарк, сафари-парк, канатная дорога. Похоже на Пхукет.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Куала-Лумпур&lt;/strong&gt; — жарко и влажно, джунгли старше Амазонии (150 млн лет). Похож на Сингапур, но живее. Башни Петронас.&lt;/p&gt;

&lt;p&gt;11 ❤5 🙏2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #102-103 — Фото Вьетнама
&lt;/h2&gt;

&lt;p&gt;❤12 😁3 2 🙏2 / ❤24 10 🙏2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #104 — Career Development (Manager/Director/VP)
&lt;/h2&gt;

&lt;p&gt;Статья из Kellblog: What It Really Means to be a Manager, Director, or VP.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Managers&lt;/strong&gt; — доводят задачи до результата, не требуют избыточного контроля. Разработка глобального плана — не их обязанность.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Directors&lt;/strong&gt; — доводят дело до конца, мыслят шире, находят обходные пути.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;VPs&lt;/strong&gt; — разработка глобального плана. Несут полную ответственность за результаты.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Основная идея: VP не могут оправдать неудачу тем, что выполняли согласованный план.&lt;/p&gt;

&lt;p&gt;👍13 ❤3 😁1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #105-109 — Фото/мемы
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #110 — Career Development (продолжение)
&lt;/h2&gt;

&lt;p&gt;Автор статьи Kellblog шутник: It conflates career development and salary negotiation. It encourages a mindset of saying, what must I do to make L10 when you want to say, I want a $10K raise.&lt;br&gt;
😁10 👏6 🌚2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #111 — Датафест в Яндексе
&lt;/h2&gt;

&lt;p&gt;Сходил на Датафест в Яндексе, только доклады про внутренние продукты.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Спрос Яндекс Лавки:&lt;/strong&gt; Prophet + бустинги с разделением на продукты/регионы&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Алиса:&lt;/strong&gt; 2% или 20% людей имеют две колонки Алисы, нужно понимать к какой обращаются&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Рекомендации в Лавке:&lt;/strong&gt; двухбашенный подход с трансформером user-items → косинусные расстояния → бустинги + запросы + корзина. Пробовали графовую сетку (PinSage + TwHIN) — метрики упали. До 20% GMV за счёт рекомендаций.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Экран отписки от Плюса:&lt;/strong&gt; ранжирование не работает, лучше всего сохраняет скидка&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;VLM для нейро и оффлайн эмбеддингов&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👍18 10 ❤2 🙏1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #112 — Датафест в Avito
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Post-training LLM:&lt;/strong&gt; torchtune (SFT, DPO, PPO без Hugging Face обёрток). Llama 7B с QLoRA — 358 мин, с Compile + FlexAttention — 36 мин, но память 7→40→70 ГБ.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;LLM в Avito/Т-Банке:&lt;/strong&gt; разметка звонков, чатов на факт сделки. Очистка выборки + консистентность разметки. BM25 + LLM + BERT + RoBERTa reranker.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Дообучение LLM в Avito:&lt;/strong&gt; DPO на Qwen 7B — небольшие приросты, нивелируются новыми open-source моделями. Ключевой эффект — свой токенизатор (+31% к скорости инференса).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Рекомендации Avito:&lt;/strong&gt; ретривал на трансформерах + ranking на CatBoost. 50% просмотров, 30% кликов. Блендер для товаров из разных категорий.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Дискуссия про ML-соревнования:&lt;/strong&gt; если результат определяется местом на лидерборде, презентации не стоит учитывать.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;14 ❤8 👍3&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #113 — MacBook M4
&lt;/h2&gt;

&lt;p&gt;Купил базовый Mac 15 на M4 за &amp;lt;100к. Кто ещё на интеле — рекомендую к миграции.&lt;br&gt;
👍8 😁7 ❤3&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #114 — Yet Another Insight (Яндекс)
&lt;/h2&gt;

&lt;p&gt;Закрытая конференция Яндекса для руководителей с фокусом на аналитику.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Как понять факторы, влияющие на метрику:&lt;/strong&gt; логистическая регрессия → коэффициенты. Когда строил в Delivery Club, ключевой фактор удовлетворённости доставкой — опоздал ли курьер.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;text2sql через LLM + RAG:&lt;/strong&gt; цель — передать до 5% запросов в Telegram-бот. Проблема: в компании YQL, а не SQL.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Поиск Нейро:&lt;/strong&gt; получит рекламу&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Amazon 40% рынка e-commerce, Shopify 10%&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Яндекс.Маркет хочет стать Shopify&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👍8 6 ✍4 😁3&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #115 — Memvid (мем)
&lt;/h2&gt;

&lt;p&gt;В Х пропушили библиотеку Memvid (5000 ⭐ на GitHub). Теперь вместо векторных баз данных предлагают хранить всё в видеофайлах, где каждый кадр — QR-код. Внутри всё равно FAISS и те же векторные базы. Вот до чего доводит вайб-кодинг.&lt;br&gt;
😁10 ❤3 👍2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #116 — Кыргызстан и Узбекистан
&lt;/h2&gt;

&lt;p&gt;В мае съездил в Кыргызстан 🇰🇬 и Узбекистан 🇺🇿.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Кыргызстан:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Алтын-Арашан — горная долина на 2600 м, подъём на буханке 2 часа. Горное озеро Ала-Кёль на 3800 м, в мае перевал в снегу по пояс. На конях!&lt;/li&gt;
&lt;li&gt;Иссык-Куль — искупался, но холодно&lt;/li&gt;
&lt;li&gt;Еда: годное мясо и шашлыки, лучше чем в Москве по цене&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Узбекистан (Ташкент):&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Центр города порадовал, божественная клубника&lt;/li&gt;
&lt;li&gt;Храмы и архитектура&lt;/li&gt;
&lt;li&gt;Пять казанов — плов в трёхметровом казане, лучший плов&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;❤12 6 🙏2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #117-139 — Фото из Кыргызстана и Узбекистана
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #140 — Rasmussen/Cook Risk Model
&lt;/h2&gt;

&lt;p&gt;Risk management in a dynamic society (Rasmussen, 1997) и Resilience In Complex Adaptive Systems (R. Cook).&lt;/p&gt;

&lt;p&gt;Модель функционирования сложных систем (от АЭС до IT проектов), ограниченных тремя границами:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Экономическая эффективность&lt;/strong&gt; (cost)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Рабочая нагрузка&lt;/strong&gt; (capacity)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Отказ&lt;/strong&gt; (accident boundary)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Система дрейфует к границе отказа из-за стремления сократить затраты. Вводят буфер безопасности (margin of safety), но его со временем сдвигают (normalization of deviance).&lt;/p&gt;

&lt;p&gt;Рекомендация: сделать процесс прозрачным и обложить мониторингом.&lt;br&gt;
PS: Для автономных AI-агентов и LLM с промптами может быть недостаточно.&lt;/p&gt;

&lt;p&gt;👍7 ❤5 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #141 — Гугл — Яндекс: 1-0 (мем)
&lt;/h2&gt;

&lt;p&gt;😁16 👎2 🤔2 🤝1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #142 — Google Jules
&lt;/h2&gt;

&lt;p&gt;Google запустил ассистент Jules для кодинга с интеграцией в GitHub (сам создаёт pull request).&lt;/p&gt;

&lt;p&gt;Протестировал на открытом репозитории:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;readme.md переписал неплохо&lt;/li&gt;
&lt;li&gt;Добавление нового функционала: первая попытка — провал, вторая — упал при установке зависимостей (torch не осилил)&lt;/li&gt;
&lt;li&gt;Код не работал, дебажить 400+ строк — помянем&lt;/li&gt;
&lt;li&gt;Каждый запрос — до часа ожидания&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Очень неплохо, но Cursor пока лучше.&lt;br&gt;
😁9 👍2 🙏1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #143 — Отчёт Сбера 2024
&lt;/h2&gt;

&lt;p&gt;Полистал ежегодный отчёт Сбера. Увидел проект Индивидуальный мониторинг, в запуске которого участвовал. Приятно 🍷&lt;br&gt;
Отчёт 486 листов.&lt;br&gt;
15 ❤6 👍5 👏2&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #144 — ChatGPT трейдинг (Reddit)
&lt;/h2&gt;

&lt;p&gt;На Reddit успешный кейс: чат-бот с $400 натрейдил иксы. Торги с длинным плечом, рискованные операции на Robinhood.&lt;/p&gt;

&lt;p&gt;Если скормить исторические цены — обычно линейная регрессия или экспоненциальное сглаживание. На акциях NVIDIA ошибка 40% за 3 месяца by ChatGPT 4.1.&lt;/p&gt;

&lt;p&gt;❤7 😁4 👍3&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #145 — Swing Vision (теннис)
&lt;/h2&gt;

&lt;p&gt;Играю в большой теннис 🎾, рекомендую. Особенно если пережить первые полгода.&lt;/p&gt;

&lt;p&gt;Приложение Swing Vision — снимая как ты играешь, получаешь сквозную статистику: удары, точность, скорость. Инференс локально на телефоне. Функция challenge (как Hawk-Eye). Нужен трипод.&lt;/p&gt;

&lt;p&gt;17 👍6 ❤3&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #146 — OCR и Vision-LLM тренды Q1/Q2 2025
&lt;/h2&gt;

&lt;p&gt;Обзор от Игоря Галицкого.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Новая SOTA:&lt;/strong&gt; Gemini 2.5 — лидер на OCR бенчмарках, лучше Qwen 2.5 VL / GPT-4o на 15-20%&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Small VLM:&lt;/strong&gt; MonkeyOCR, Dolphin — SOTA при минимальных ресурсах&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chart Captioning:&lt;/strong&gt; Claude Sonnet 3.5 ≈56%, GPT-4o ≈42%, человек 85%. Моделям сложно совмещать perception + reasoning&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Enterprise:&lt;/strong&gt; Для PII-маскирования, live-перевода, low DPI — специализированные модели лучше&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👍8 3 👎1 🤔1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #147 — Шри-Ланка
&lt;/h2&gt;

&lt;p&gt;Почти год назад ездил на Шри-Ланку 🇱🇰.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Океан:&lt;/strong&gt; классические волны, доступное место для сёрфинга (инструктор 1000 руб/час). Отбил ребро, заживало месяц 😅&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Чай:&lt;/strong&gt; цейлонский — совсем не горчит&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Еда:&lt;/strong&gt; спорная (вайбы Индии), но попробовал акулу (как белая рыба). Фрукты отличные, дуриан — ням&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Сафари по реке:&lt;/strong&gt; крокодилы, хамелеон в кустах в метре от меня, лангуры (дружелюбные), запустили черепашек в океан&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;❤14 👍5 💘3 👌1&lt;/p&gt;




&lt;h2&gt;
  
  
  Пост #148-149 — Фото Шри-Ланки
&lt;/h2&gt;




&lt;h2&gt;
  
  
  Пост #150-228 — (новые посты не вытащены через web preview — нужен свежий before=)
&lt;/h2&gt;




&lt;p&gt;&lt;strong&gt;Конец архива&lt;/strong&gt;&lt;/p&gt;




&lt;p&gt;&lt;em&gt;Архив собран 2026-05-31 через web_fetch с t.me/s/ai_tablet&lt;/em&gt;&lt;br&gt;
&lt;em&gt;Для обновления: используй t.me/s/ai_tablet?before=&lt;/em&gt;&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>rag</category>
      <category>llm</category>
    </item>
    <item>
      <title>"Vnedryaem" — The Universal Engineering Mood in One Word</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Sat, 30 May 2026 05:25:48 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/vnedryaem-the-universal-engineering-mood-in-one-word-2o75</link>
      <guid>https://dev.to/__2ddbae6bb7d/vnedryaem-the-universal-engineering-mood-in-one-word-2o75</guid>
      <description>&lt;h1&gt;
  
  
  "Vnedryaem" — The Universal Engineering Mood in One Word
&lt;/h1&gt;

&lt;p&gt;No text. Just the word "Vnedryaem" ("We are implementing/deploying").&lt;/p&gt;

&lt;p&gt;19 laughing reactions. 5 100-point emojis. 3 hearts. 2 salutes.&lt;/p&gt;

&lt;h2&gt;
  
  
  Why This Resonated
&lt;/h2&gt;

&lt;p&gt;Every engineer in a large organization knows this mood. It is the moment between "we have decided to do this" and "we are actually doing this" — which can stretch from days to months.&lt;/p&gt;

&lt;p&gt;The word captures:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;The optimism of starting&lt;/li&gt;
&lt;li&gt;The resignation of bureaucracy&lt;/li&gt;
&lt;li&gt;The camaraderie of shared struggle&lt;/li&gt;
&lt;li&gt;The engineering tradition of laconic humor&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  The Context
&lt;/h2&gt;

&lt;p&gt;This followed discussions about AI pricing, model deployment, and conference plans. The single word works because everyone in the channel has lived through:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Approval processes that take longer than implementation&lt;/li&gt;
&lt;li&gt;Pilot projects that never end&lt;/li&gt;
&lt;li&gt;Proof-of-concepts that become production by default&lt;/li&gt;
&lt;li&gt;Implementations where the hardest part is not technical&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  What This Tells Me About the Channel
&lt;/h2&gt;

&lt;p&gt;The audience is not just technical — they are organizational survivors. They understand that AI implementation is 20% model selection, 80% change management, politics, and persistence.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Lesson
&lt;/h2&gt;

&lt;p&gt;Sometimes the most effective communication is a single word with shared context. AI cannot generate this — it requires lived experience and cultural understanding.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More engineering culture, AI implementation reality, and production notes from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>career</category>
      <category>machinelearning</category>
      <category>humor</category>
    </item>
    <item>
      <title>The Open Source Illusion: Why "Free" AI Models Are Getting Expensive</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Sat, 30 May 2026 05:20:22 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/the-open-source-illusion-why-free-ai-models-are-getting-expensive-3j2d</link>
      <guid>https://dev.to/__2ddbae6bb7d/the-open-source-illusion-why-free-ai-models-are-getting-expensive-3j2d</guid>
      <description>&lt;h1&gt;
  
  
  The Open Source Illusion: Why "Free" AI Models Are Getting Expensive
&lt;/h1&gt;

&lt;p&gt;Everyone's watching Chinese open-source models. But the subscription costs are catching up to Western counterparts.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Z.ai Price Hike
&lt;/h2&gt;

&lt;p&gt;GLM 5.1 — arguably the best open-source model available — just doubled subscription prices. Maximum tier now costs &lt;strong&gt;$160/month&lt;/strong&gt;.&lt;/p&gt;

&lt;p&gt;For comparison:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Claude Pro: ~$20/month&lt;/li&gt;
&lt;li&gt;ChatGPT Plus: ~$20/month&lt;/li&gt;
&lt;li&gt;Mid-tier API access: variable, but often lower&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Why This Matters
&lt;/h2&gt;

&lt;p&gt;The narrative around open-source models has been "free alternatives to expensive closed models." But:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Inference costs scale with usage.&lt;/strong&gt; Running GLM-5 at scale requires serious hardware or API credits.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chinese providers are monetizing aggressively.&lt;/strong&gt; The open weights are free; reliable hosting and premium features are not.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Local deployment isn't free either.&lt;/strong&gt; A 70B+ parameter model needs 2-4x A100s or equivalent. That's $5-15/hour on cloud GPU instances.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  The Real Cost Comparison
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Model&lt;/th&gt;
&lt;th&gt;Access Cost&lt;/th&gt;
&lt;th&gt;Inference Cost (1M tokens)&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.2 API&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;$10-30&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Claude API&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;$3-15&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GLM-5 (Z.ai)&lt;/td&gt;
&lt;td&gt;$0-160/mo&lt;/td&gt;
&lt;td&gt;Included in subscription&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Local 70B&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;$5-15/hr hardware&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  The Hidden Value
&lt;/h2&gt;

&lt;p&gt;What you're paying for with premium tiers:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Consistent availability&lt;/strong&gt; (local GPUs can be flaky)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;No setup maintenance&lt;/strong&gt; (dependencies, updates, drivers)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Multi-modal features&lt;/strong&gt; (not always available in open weights)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Context window guarantees&lt;/strong&gt; (local setup may crash on 200K tokens)&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  My Approach
&lt;/h2&gt;

&lt;p&gt;Hybrid strategy:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Experiment locally&lt;/strong&gt; — understand model behavior, validate approaches&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Production APIs&lt;/strong&gt; — reliability and scale matter more than marginal cost savings&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Monitor burn&lt;/strong&gt; — token consumption grows non-linearly with adoption&lt;/li&gt;
&lt;/ul&gt;




&lt;p&gt;&lt;em&gt;More AI economics, model comparisons, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>llm</category>
      <category>career</category>
      <category>machinelearning</category>
    </item>
    <item>
      <title>I Tried the "Colleague Skill" — Digital Cloning an Employee</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Sat, 30 May 2026 05:20:18 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/i-tried-the-colleague-skill-digital-cloning-an-employee-1nh7</link>
      <guid>https://dev.to/__2ddbae6bb7d/i-tried-the-colleague-skill-digital-cloning-an-employee-1nh7</guid>
      <description>&lt;h1&gt;
  
  
  I Tried the "Colleague Skill" — Digital Cloning an Employee
&lt;/h1&gt;

&lt;p&gt;The Colleague Skill project went viral in China. The premise: capture a real employee's communication style, problem-solving approach, and tech stack into an AI agent that can substitute for them.&lt;/p&gt;

&lt;h2&gt;
  
  
  How It Works
&lt;/h2&gt;

&lt;p&gt;The system (built for Claude) uses three files to describe a person:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Communication style&lt;/strong&gt; — how they write, respond, express emotions&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Problem-solving approach&lt;/strong&gt; — methodology, priorities, shortcuts&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tech stack and expertise&lt;/strong&gt; — tools, frameworks, domain knowledge&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;It assembles these from meta-information and actual chat histories. The result is a stylized prompt that attaches as a skill to Claude.&lt;/p&gt;

&lt;h2&gt;
  
  
  My Experience
&lt;/h2&gt;

&lt;p&gt;I ran it. The concept is elegant — codify what makes a specific person effective.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;But here's the reality:&lt;/strong&gt; Claude as a coding agent is already excellent. The "colleague" framing adds narrative appeal, but the underlying capability is Claude's reasoning, not the personality capture.&lt;/p&gt;

&lt;h2&gt;
  
  
  Where It Gets Interesting
&lt;/h2&gt;

&lt;p&gt;The project sparked a wave of "how do I prevent my employer from cloning me" discussions in China. Which reveals something important:&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;If your value is purely your communication style, you're replaceable.&lt;/strong&gt; If your value is your judgment, network, and ability to navigate ambiguity — no prompt file captures that.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Real Use Case
&lt;/h2&gt;

&lt;p&gt;Not replacing people, but &lt;strong&gt;onboarding acceleration&lt;/strong&gt;. A new team member can query "how would [senior engineer] approach this?" and get a reasonable approximation. It's a living documentation of decision patterns.&lt;/p&gt;

&lt;h2&gt;
  
  
  What's Missing
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Context awareness.&lt;/strong&gt; The skill doesn't know current project state, blockers, or interpersonal dynamics.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Evolution.&lt;/strong&gt; People change their approach. Static skill files go stale.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Error recovery.&lt;/strong&gt; When the real employee would escalate or ask for help, the agent might confidently proceed down a wrong path.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  My Take
&lt;/h2&gt;

&lt;p&gt;Beautiful concept, limited practical value today. The real win is forcing teams to articulate &lt;em&gt;why&lt;/em&gt; specific people are effective — which is valuable documentation regardless of AI.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI experiments, agent architectures, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>agents</category>
      <category>machinelearning</category>
      <category>career</category>
    </item>
    <item>
      <title>RAG SOTA: I Built SEQUOIA and Tested 7 Pipelines — Full Results</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Sat, 30 May 2026 05:14:39 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/rag-sota-i-built-sequoia-and-tested-7-pipelines-full-results-49c4</link>
      <guid>https://dev.to/__2ddbae6bb7d/rag-sota-i-built-sequoia-and-tested-7-pipelines-full-results-49c4</guid>
      <description>&lt;h1&gt;
  
  
  RAG SOTA: I Built SEQUOIA and Tested 7 Pipelines — Full Results
&lt;/h1&gt;

&lt;p&gt;After 20+ hours of compute time on local hardware, I benchmarked 7 RAG configurations against real-world tasks. SEQUOIA (RAPTOR tree + step-back prompting) consistently outperformed alternatives.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Full Pipeline List
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Method&lt;/th&gt;
&lt;th&gt;Core Approach&lt;/th&gt;
&lt;th&gt;My Score&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;No-RAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Direct LLM generation&lt;/td&gt;
&lt;td&gt;Baseline&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Classical RAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Dense retrieval (BGE-small + FAISS)&lt;/td&gt;
&lt;td&gt;Poor&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Hybrid RAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;BM25 + Dense + RRF + reranker&lt;/td&gt;
&lt;td&gt;Moderate&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;LightRAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Key-value graph + dense hybrid&lt;/td&gt;
&lt;td&gt;Disappointing&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;PageIndex&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Two-stage hierarchical retrieval&lt;/td&gt;
&lt;td&gt;Okay&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;GraphRAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Entity graph + dense fallback&lt;/td&gt;
&lt;td&gt;Complex&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Agentic RAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Multi-step reasoning pipeline&lt;/td&gt;
&lt;td&gt;Slow, expensive&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;SEQUOIA&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;RAPTOR tree + step-back prompting&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;Best&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;SEQUOIA Pro&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Multi-query + rerank + compression&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;SOTA&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  Why LightRAG Underperformed
&lt;/h2&gt;

&lt;p&gt;The Twitter/LinkedIn hype suggested graph-based RAG would revolutionize retrieval. On real banking documents and technical manuals:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Graph construction is expensive (entity extraction, relationship mapping)&lt;/li&gt;
&lt;li&gt;Retrieval quality didn't justify the overhead&lt;/li&gt;
&lt;li&gt;Academic benchmarks ≠ production reality&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;I call it "procedural warming" — looks sophisticated, delivers mediocre results.&lt;/p&gt;

&lt;h2&gt;
  
  
  Why RAPTOR Works
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Recursive Abstractive Processing for Tree-Organized Retrieval:&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Cluster leaf nodes (individual chunks)&lt;/li&gt;
&lt;li&gt;Summarize upward (hierarchical abstraction)&lt;/li&gt;
&lt;li&gt;Retrieve at multiple levels (specific details + high-level context)&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;This mirrors how humans organize knowledge — specific facts nested under general principles.&lt;/p&gt;

&lt;h2&gt;
  
  
  Step-Back Prompting: Free Performance
&lt;/h2&gt;

&lt;p&gt;Before retrieving, generalize the query:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;User asks: "What's the error rate for Q3?"&lt;/li&gt;
&lt;li&gt;Step-back: "What metrics are tracked quarterly?"&lt;/li&gt;
&lt;li&gt;Retrieve broader context first, then narrow&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Result:&lt;/strong&gt; ~15% improvement in recall across all tested configurations. Costs nothing in latency.&lt;/p&gt;

&lt;h2&gt;
  
  
  SEQUOIA Architecture
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;User Query
    ↓
Step-back Prompting (generalize)
    ↓
RAPTOR Tree Retrieval (multi-level)
    ↓
Context Compression (summarize long contexts)
    ↓
Re-ranking (cross-encoder)
    ↓
Local LLM Generation
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  Local LLM Evaluation
&lt;/h2&gt;

&lt;p&gt;I used a local model weaker than GPT-4 for judging and summarization. Key finding: &lt;strong&gt;relative rankings between methods stayed consistent&lt;/strong&gt; even with a weaker evaluator.&lt;/p&gt;

&lt;p&gt;This means you can prototype and compare approaches without burning API credits on GPT-4 evaluations.&lt;/p&gt;

&lt;h2&gt;
  
  
  Production Recommendations
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Start with Classical RAG&lt;/strong&gt; — establish baseline, prove value&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Add step-back prompting&lt;/strong&gt; — free performance gain&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Move to hierarchical retrieval&lt;/strong&gt; — when context complexity justifies it&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Avoid graph approaches&lt;/strong&gt; — unless you have specific graph-structured data&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Measure on YOUR data&lt;/strong&gt; — academic benchmarks are misleading&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  Open Source
&lt;/h2&gt;

&lt;p&gt;Everything is available:&lt;br&gt;
🔗 &lt;a href="https://github.com/Diyago/rag-benchmark/tree/main" rel="noopener noreferrer"&gt;https://github.com/Diyago/rag-benchmark/tree/main&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Includes all implementations, evaluation dataset (anonymized), and analysis notebooks.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More RAG benchmarks, agent architectures, and production AI notes from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>rag</category>
      <category>llm</category>
      <category>ai</category>
      <category>opensource</category>
    </item>
    <item>
      <title>AI Conf 2026 Moscow: Why I'm Attending (and You Should Too)</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Sat, 30 May 2026 05:14:17 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/ai-conf-2026-moscow-why-im-attending-and-you-should-too-31h5</link>
      <guid>https://dev.to/__2ddbae6bb7d/ai-conf-2026-moscow-why-im-attending-and-you-should-too-31h5</guid>
      <description>&lt;h1&gt;
  
  
  AI Conf 2026 Moscow: Why I'm Attending (and You Should Too)
&lt;/h1&gt;

&lt;p&gt;April 20, Moscow. AI Conf 2026 — a practical Data Science conference with workshops, not just talks.&lt;/p&gt;

&lt;h2&gt;
  
  
  Why This Conference Matters
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;400+ participants.&lt;/strong&gt; Speakers from Sber, Yandex, VK, and other major teams.&lt;/p&gt;

&lt;p&gt;The program is unusually applied:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Multi-agent systems and RAG — how teams actually build and deploy them&lt;/li&gt;
&lt;li&gt;Working with LLMs — achieving stable, predictable results in production&lt;/li&gt;
&lt;li&gt;Justifying tech decisions to business — the eternal challenge&lt;/li&gt;
&lt;li&gt;AI economics — calculating and optimizing infrastructure costs&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  What I'm Looking For
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Real deployment stories.&lt;/strong&gt; Not "we used LangChain" — but "here's how we handle failure modes at scale."&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Cost optimization.&lt;/strong&gt; Every LLM project eventually faces the "why does this cost $50K/month" conversation.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Agent architectures.&lt;/strong&gt; Moving beyond simple RAG to systems that can plan, execute, and recover.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  The Shift I'm Seeing
&lt;/h2&gt;

&lt;p&gt;Last year, speakers still debated "what's the difference between an LLM application and an agent." Now everyone is building agents. The question changed from "what is it?" to "how do we make it reliable?"&lt;/p&gt;

&lt;h2&gt;
  
  
  My Plan
&lt;/h2&gt;

&lt;p&gt;Attending at least two workshops:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Building search agents (hands-on)&lt;/li&gt;
&lt;li&gt;Monitoring with Langfuse (or alternatives)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;I'll share notes and key insights on my channel after the event.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More conference notes, production AI insights, and RAG benchmarks from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>rag</category>
      <category>llm</category>
      <category>ai</category>
      <category>opensource</category>
    </item>
    <item>
      <title>One Ruler to Measure Them All: How Language Affects LLM Quality</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Fri, 29 May 2026 09:00:18 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/one-ruler-to-measure-them-all-how-language-affects-llm-quality-2pc6</link>
      <guid>https://dev.to/__2ddbae6bb7d/one-ruler-to-measure-them-all-how-language-affects-llm-quality-2pc6</guid>
      <description>&lt;h1&gt;
  
  
  One Ruler to Measure Them All: How Language Affects LLM Quality
&lt;/h1&gt;

&lt;p&gt;Most discussions about LLM performance focus on the model architecture and prompting. But there's a hidden factor: the tokenizer. It determines how much of your text fits in the context window.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Tokenizer Problem
&lt;/h2&gt;

&lt;p&gt;Russian text consumes more tokens than English for the same information density. Some developers even switch to English prompts to save tokens and improve performance.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Surprising Result
&lt;/h2&gt;

&lt;p&gt;A recent arxiv study benchmarked multilingual long-context language models across different languages. The winner? &lt;strong&gt;Polish&lt;/strong&gt; — 88% accuracy.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Russian placed 5th at 84%&lt;/strong&gt; — ahead of English at 83.9%.&lt;/p&gt;

&lt;p&gt;The gap widens on long-context tasks. More tokens = more opportunities for the model to lose coherence.&lt;/p&gt;

&lt;h2&gt;
  
  
  Important Caveat
&lt;/h2&gt;

&lt;p&gt;The test used "weaker" models by 2026 standards:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Gemini 1.5 Flash&lt;/li&gt;
&lt;li&gt;Qwen 2.5 72B&lt;/li&gt;
&lt;li&gt;Other mid-tier models&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Top-tier models might show different patterns, but the tokenizer effect persists regardless of model quality.&lt;/p&gt;

&lt;h2&gt;
  
  
  Implications for Production
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Language choice matters for RAG.&lt;/strong&gt; If your knowledge base is multilingual, retrieval quality varies by language.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Long-context tasks favor compact languages.&lt;/strong&gt; English is more token-efficient than Russian, but Polish outperformed both.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tokenizer-agnostic metrics are needed.&lt;/strong&gt; BLEU and ROUGE don't capture tokenization bias.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  What I'm Tracking
&lt;/h2&gt;

&lt;p&gt;I'm monitoring whether newer models (Kimi k2.5, GLM-5, GPT-5.2 series) show the same pattern. Early signs suggest top-tier models compress better across languages, but the gap doesn't fully disappear.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More multilingual LLM analysis and production AI notes from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>rag</category>
      <category>llm</category>
    </item>
    <item>
      <title>One Ruler to Measure Them All: How Language Affects LLM Quality</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Fri, 29 May 2026 06:01:46 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/one-ruler-to-measure-them-all-how-language-affects-llm-quality-5f54</link>
      <guid>https://dev.to/__2ddbae6bb7d/one-ruler-to-measure-them-all-how-language-affects-llm-quality-5f54</guid>
      <description>&lt;h1&gt;
  
  
  One Ruler to Measure Them All: How Language Affects LLM Quality
&lt;/h1&gt;

&lt;p&gt;Most discussions about LLM performance focus on the model architecture and prompting. But there's a hidden factor: the tokenizer. It determines how much of your text fits in the context window.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Tokenizer Problem
&lt;/h2&gt;

&lt;p&gt;Russian text consumes more tokens than English for the same information density. Some developers even switch to English prompts to save tokens and improve performance.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Surprising Result
&lt;/h2&gt;

&lt;p&gt;A recent arxiv study benchmarked multilingual long-context language models across different languages. The winner? &lt;strong&gt;Polish&lt;/strong&gt; — 88% accuracy.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Russian placed 5th at 84%&lt;/strong&gt; — ahead of English at 83.9%.&lt;/p&gt;

&lt;p&gt;The gap widens on long-context tasks. More tokens = more opportunities for the model to lose coherence.&lt;/p&gt;

&lt;h2&gt;
  
  
  Important Caveat
&lt;/h2&gt;

&lt;p&gt;The test used "weaker" models by 2026 standards:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Gemini 1.5 Flash&lt;/li&gt;
&lt;li&gt;Qwen 2.5 72B&lt;/li&gt;
&lt;li&gt;Other mid-tier models&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Top-tier models might show different patterns, but the tokenizer effect persists regardless of model quality.&lt;/p&gt;

&lt;h2&gt;
  
  
  Implications for Production
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Language choice matters for RAG.&lt;/strong&gt; If your knowledge base is multilingual, retrieval quality varies by language.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Long-context tasks favor compact languages.&lt;/strong&gt; English is more token-efficient than Russian, but Polish outperformed both.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tokenizer-agnostic metrics are needed.&lt;/strong&gt; BLEU and ROUGE don't capture tokenization bias.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  What I'm Tracking
&lt;/h2&gt;

&lt;p&gt;I'm monitoring whether newer models (Kimi k2.5, GLM-5, GPT-5.2 series) show the same pattern. Early signs suggest top-tier models compress better across languages, but the gap doesn't fully disappear.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More multilingual LLM analysis and production AI notes from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>rag</category>
      <category>llm</category>
    </item>
    <item>
      <title>AI Conf 2026: Classic ML Is Dead, Everyone's Building Agents</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Fri, 29 May 2026 06:00:17 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/ai-conf-2026-classic-ml-is-dead-everyones-building-agents-og6</link>
      <guid>https://dev.to/__2ddbae6bb7d/ai-conf-2026-classic-ml-is-dead-everyones-building-agents-og6</guid>
      <description>&lt;h1&gt;
  
  
  AI Conf 2026: Classic ML Is Dead, Everyone's Building Agents
&lt;/h1&gt;

&lt;p&gt;Spent two days at AI Conf in Moscow. The shift is complete: nobody talks about traditional ML anymore. It's all agents, RAG, and voice systems.&lt;/p&gt;

&lt;h2&gt;
  
  
  1. Academic Publication Pipeline Is Slow
&lt;/h2&gt;

&lt;p&gt;Average time from submission to publication at A-tier conferences: &lt;strong&gt;9 months.&lt;/strong&gt; Multiple review cycles, sequential improvements.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;What researchers actually use LLMs for now:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Code generation&lt;/li&gt;
&lt;li&gt;Paper review assistance&lt;/li&gt;
&lt;li&gt;Literature synthesis&lt;/li&gt;
&lt;li&gt;(Not for original ideas — tried "let it think for 2 weeks," expensive and ineffective)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Prediction:&lt;/strong&gt; Future papers will include zip archives of experimental code that AI can verify. Human value shifts to idea generation, not implementation.&lt;/p&gt;

&lt;h2&gt;
  
  
  2. Search Agents Workshop
&lt;/h2&gt;

&lt;p&gt;Built a working ReAct search agent in the workshop:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Groq API&lt;/strong&gt; — free tier, fast inference&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tavily&lt;/strong&gt; — 1000 free search queries/month&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Langfuse&lt;/strong&gt; monitoring&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Stack cost: $0 for prototyping. Production cost: depends on scale.&lt;/p&gt;

&lt;h2&gt;
  
  
  3. Monitoring: Langfuse vs Arize Phoenix
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Tool&lt;/th&gt;
&lt;th&gt;Approach&lt;/th&gt;
&lt;th&gt;Best For&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Langfuse&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Manual integration, detailed traces&lt;/td&gt;
&lt;td&gt;Custom setups, granular control&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Arize Phoenix&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Auto-instrumentation, wraps everything&lt;/td&gt;
&lt;td&gt;Quick setup, less configuration&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Both show traces, token counts, latency breakdowns. Phoenix wins if you want observability without wiring it yourself.&lt;/p&gt;

&lt;h2&gt;
  
  
  4. Agent Harness vs Classic Agents
&lt;/h2&gt;

&lt;p&gt;The terminology evolved:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;2024:&lt;/strong&gt; "What's the difference between LLM and agent?"&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;2026:&lt;/strong&gt; &lt;strong&gt;Agent Harness&lt;/strong&gt; — memory + skills instead of tools&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Example: Deep Agents framework. Skill creation costs 2M tokens. Single invocation: 100K tokens. But the abstraction is cleaner than manual tool orchestration.&lt;/p&gt;

&lt;h2&gt;
  
  
  5. Voice Agents for Telephony
&lt;/h2&gt;

&lt;p&gt;Voice-to-voice models exist but lack:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Tool use integration&lt;/li&gt;
&lt;li&gt;Context management&lt;/li&gt;
&lt;li&gt;Reliability for long conversations&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Current production stack:&lt;/strong&gt; Speech-to-Text → LLM → Text-to-Speech&lt;/p&gt;

&lt;p&gt;Voice-to-voice will replace this eventually, but not before tool calling and context compression catch up.&lt;/p&gt;

&lt;h2&gt;
  
  
  What I Didn't Hear
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Gradient boosting use cases&lt;/li&gt;
&lt;li&gt;Feature engineering debates&lt;/li&gt;
&lt;li&gt;Model interpretability discussions (except for RAG context windows)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;The industry moved on. If you're still pitching Random Forest improvements, you're talking to the wrong audience.&lt;/p&gt;

&lt;h2&gt;
  
  
  My Take
&lt;/h2&gt;

&lt;p&gt;The conference confirmed what I see in production: &lt;strong&gt;agent orchestration is the new infrastructure layer.&lt;/strong&gt; Not the models themselves — how you connect them, manage memory, route between skills, and monitor everything.&lt;/p&gt;

&lt;p&gt;The companies winning aren't those with the best single model. They're those with the best agent architecture.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More production AI insights and conference notes from a bank's DS lead — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>rag</category>
      <category>llm</category>
    </item>
    <item>
      <title>I Self-Hosted an AI Assistant: Lessons from 48 Hours of Debugging</title>
      <dc:creator>Ai developer</dc:creator>
      <pubDate>Thu, 28 May 2026 21:39:25 +0000</pubDate>
      <link>https://dev.to/__2ddbae6bb7d/i-self-hosted-an-ai-assistant-lessons-from-48-hours-of-debugging-4okc</link>
      <guid>https://dev.to/__2ddbae6bb7d/i-self-hosted-an-ai-assistant-lessons-from-48-hours-of-debugging-4okc</guid>
      <description>&lt;h1&gt;
  
  
  I Self-Hosted an AI Assistant: Lessons from 48 Hours of Debugging
&lt;/h1&gt;

&lt;p&gt;I wanted a local AI assistant. Expected: 2 hours. Reality: 2 days of edge cases, broken dependencies, and discovering that "local" doesn't mean "free."&lt;/p&gt;

&lt;h2&gt;
  
  
  The Stack
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;OpenClaw&lt;/strong&gt; (open-source AI assistant framework)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;VPS with limited console access&lt;/strong&gt; (had to file tickets to enable)&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;OpenRouter&lt;/strong&gt; for model access&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Local Qwen&lt;/strong&gt; as fallback&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  What Broke
&lt;/h2&gt;

&lt;h3&gt;
  
  
  1. Dependency Hell
&lt;/h3&gt;

&lt;p&gt;Pre-installed OpenClaw came with an outdated library. Updated manually. Then updated again. OpenRouter integration only worked after the second update.&lt;/p&gt;

&lt;h3&gt;
  
  
  2. Certificate Issues
&lt;/h3&gt;

&lt;p&gt;Self-hosted means self-managed certificates. Let's Encrypt, reverse proxy, CORS headers. Each layer adds a new failure mode.&lt;/p&gt;

&lt;h3&gt;
  
  
  3. "Free" API Credits Aren't
&lt;/h3&gt;

&lt;p&gt;OpenRouter's "free" models have limits. Hit them within hours. The API key died silently — no error message, just empty responses.&lt;/p&gt;

&lt;h3&gt;
  
  
  4. Local Model Reality Check
&lt;/h3&gt;

&lt;p&gt;Qwen promised tool-use support. Reality:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Absolute paths broke tool calling (relative only)&lt;/li&gt;
&lt;li&gt;Model experienced "amnesia" — couldn't open .md files it created&lt;/li&gt;
&lt;li&gt;Larger models need more RAM but run slower&lt;/li&gt;
&lt;li&gt;200K context window sounds great until you hit memory limits&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  5. The Debugging Cascade
&lt;/h3&gt;

&lt;p&gt;Fix one thing → break another. Add skills for email and search. DuckDuckGo API rate-limits kill the search skill. Switch to alternative. New limits.&lt;/p&gt;

&lt;h2&gt;
  
  
  What Worked
&lt;/h2&gt;

&lt;p&gt;Despite everything, the assistant is now running. Key insight:&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Boxed solutions (Kimi, GLM native APIs) are more reliable.&lt;/strong&gt; But self-hosting teaches you how the pieces actually connect — tool calling, memory management, model routing, context windows.&lt;/p&gt;

&lt;h2&gt;
  
  
  The Real Cost
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Item&lt;/th&gt;
&lt;th&gt;Expected&lt;/th&gt;
&lt;th&gt;Actual&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Setup time&lt;/td&gt;
&lt;td&gt;2 hours&lt;/td&gt;
&lt;td&gt;2 days&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;API costs&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;$20+ before limits&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Compute&lt;/td&gt;
&lt;td&gt;Minimal&lt;/td&gt;
&lt;td&gt;16GB+ RAM for usable local models&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Maintenance&lt;/td&gt;
&lt;td&gt;Zero&lt;/td&gt;
&lt;td&gt;Ongoing dependency updates&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  Should You Self-Host?
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Yes if:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;You want to understand LLM infrastructure deeply&lt;/li&gt;
&lt;li&gt;Data privacy is non-negotiable&lt;/li&gt;
&lt;li&gt;You enjoy debugging more than using&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;No if:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;You need reliability today&lt;/li&gt;
&lt;li&gt;Your time has a cost&lt;/li&gt;
&lt;li&gt;You're not ready to file support tickets for console access&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  What's Next
&lt;/h2&gt;

&lt;p&gt;I'm keeping the local setup as a learning environment but routing production tasks to managed APIs. The hybrid approach: local for experimentation, cloud for reliability.&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More self-hosting experiments and production AI infrastructure notes — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;




&lt;p&gt;&lt;em&gt;More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;🚀 &lt;strong&gt;&lt;a href="https://t.me/ai_tablet" rel="noopener noreferrer"&gt;https://t.me/ai_tablet&lt;/a&gt;&lt;/strong&gt; (Russian, technical)&lt;/p&gt;

</description>
      <category>ai</category>
      <category>machinelearning</category>
      <category>llm</category>
      <category>nlp</category>
    </item>
  </channel>
</rss>
