AI.Insaf (@ai_tablet) — Полный архив постов канала
Ранние посты (#1-~49)
Пост ~1: TabGAN (pet project)
- Библиотека генерации табличных данных (с 2021)
- 500+ ⭐, 40K загрузок, 38 цитирований
- Грант Яндекс Open Source (апрель 2024)
- Теперь генерация через GAN + LLM + Forest Diffusion
- pip install tabgan
- https://github.com/Diyago/Tabular-data-generation
Пост ~2: Вакансии (DA + DS)
- Мониторинг и предиктивное выявление проблемности корпоративных заёмщиков
- Стек: Python, SQL
Пост ~3-7: Япония (Токио, Киото, Осака, Нара)
- Токио: вежливость, регулировщики, рамены, Фудзи
- Киото: храмы, Золотой храм (Мисима), Тории ⛩, Фусими Инари
- Осака: замок, уличная еда
- Нара: олени 🦌
Пост ~35: The Culture Code
- Успех команды = чувство безопасности
- Фасилитатор: сначала идеи, потом реализуемость
- Общее чувство цели + взаимная уязвимость
Пост ~36: Мем (OK google, на чём обучали Gemini)
Пост ~37: Двойная ось Y в графиках
- Мнимое пересечение на графике №1
- График №2 — правильный, ушёл в печать
Пост ~38: The Shape of Story (презентации)
- Единство стиля, лаконичные выводы
- Микроистории: проблема → сложности → решение → эффект
- В Сбере — executive summary (обратный порядок)
- Курсы: Бонни и Слайд, Яндекс Практикум
Пост ~39: Presentation skills (МФТИ → Delivery Club)
- Первые слайды для руководства — "приземлили"
- Рекомендации: Виктор Кантор, Таня Савельева (топ-30 Forbes)
Пост ~40: Книги "Выживает самый дружелюбный" + "Лучшее в нас"
- Альтруизм бонобо, эволюционный успех через сотрудничество
- Снижение насилия в истории человечества
- Но: частные кейсы, confirmation bias, cherry picking
Пост ~41: Менторство — личный опыт
- Два ментора за 3 года
- Первый: софты, продакт, книги, уверенность
- Второй (сертифицированный): быстрое разрешение кейсов
- Проблема: когда нечего формулировать — значит всё решилось
- PS: кто работает с ментором = менти
Пост ~42: Летняя школа МФТИ
- Лекция: "Мониторинг корпоративных рисков в условиях неопределённости"
- Интерпретация моделей, bias/variance, blending
- "Кармический откат за пропуски лекций в универе"
- Большинство школьников выбрали домашку вместо докладов
Пост ~43: Яндекс Практикум — консультант
- Обсудили найм, навыки DS для табличных данных
- Рекомендации по программе курса
- Интересная опция: сервис найма для нанимающих менеджеров
Пост ~44: Хакатон AI стартапов (ментор)
- Проект: личный ассистент по выбору одежды
- ViT/CLIP для эмбеддингов, FAISS для поиска
- FashionVLP, CoSMo.pytorch, metric learning
- Команда школьников — не прошли в финал (жюри: Артемий Лебедев)
Пост ~45: Почему бустинги лучше нейросетей на табличных данных
- Deep Neural Networks and Tabular Data: A Survey (2022)
- Причины: качество данных, отсутствие структуры, критичность признаков, GPU
- A Closer Look at Deep Learning on Tabular Data (300 датасетов)
- Catboost выигрывает в ~200 из 300
- TabR (Яндекс) — медленно, падает по памяти
Пост ~46: Книги/курсы для DS
- Классическое ML: Python Machine Learning (Raschka), специализация МФТИ+Яндекс
- MLOps: O'Reilly
- System Design: Designing Machine Learning Systems
- Аналитика: Девенпорт, SQL, Pandas
- RecSys: курс МТС
- A/B: гайд VK, Яндекс Практикум, Trustworthy Online Controlled Experiments
- NLP: ШАД, Voita, Abby, обзорные статьи
- CV: Deep Learning with PyTorch
Пост ~47: Софтовые навыки
- Общение, small talk
- Переговоры: "Договориться можно обо всём", "Переговоры с монстрами"
- Деловая переписка
- Фасилитация
- Public talks
- Лидерство: NASA, "Лидер без титула", "5 пороков и 5 благодетелей команды"
- Креативность: "Как придумать идею, если вы не Огилви"
- Менторы, коучи, психологи
Пост ~143: Google Jules (coding agent)
- Запущен в мае, интеграция с GitHub
- Переписал readme.md неплохо
- Но: установка torch непосильна, код не работал, 400+ строк изменений
- До часа ожидания на запрос
- Cursor пока лучше
Пост ~144: Сбер — отчёт 2024
- Проект "Индивидуальный мониторинг" в отчёте Сбера
- 486 страниц
Пост ~145: Reddit — ChatGPT трейдинг
- Чат-бот натрейдил на $400
- Robinhood, длинное плечо, риск
- На NVidia ошибка 40% за 3 месяца
- Excel-протягивание или экспоненциальное сглаживание
Пост ~146: Swing Vision (теннис)
- Приложение для анализа тенниса
- Инвесторы: ex ATP No1
- Локальный инференс на телефоне
- Статистика: удары, точность, скорость
- Challenge (Hawk-Eye) для аутов
- Нужен трипод
Пост ~147: OCR и Vision-LLM тренды Q1/Q2 2025
- Gemini 2.5 — новая SOTA, на 15-20% лучше qwen/gpt-4o
- Small VLM: MonkeyOCR, Dolphin
- ChartQA Pro: топовые VLM далеки от человека (85%)
- Claude Sonnet 3.5: ~56%, GPT-4o: ~42%
- Enterprise: специализированные модели лучше универсальных
Пост ~157: Шри-Ланка
- Тур по путёвке
- Сёрфинг: инструктор 1000₽/час, отбил рёбро
- Цейлонский чай
- Еда спорная, акула как белая рыба, дуриан
- Сафари по реке: крокодилы, хамелеон, лангуры
- Запуск черепашек в океан
Пост ~158: LLM Reasoning (Sebastian Raschka)
- Wait Injection: +50% на математике
- Chain of Draft (CoD): короткие тезисы вместо избыточного CoT
Пост ~159: ШАД — курс по LLM
- Достойные материалы
- PS: будет integer overflow
Пост ~160: TabM (Яндекс)
- MLP-архитектура, имитирует ансамбль из 32 сетей
- Параметры из статьи, падает по памяти
- LightGBM: AUC 0.7659, TabM: 0.7421
- TabM CPU: 234.55s vs LGB: 0.23s
Пост ~161: TabArena + RealMLP
- TabArena бенчмарк: LightGBM и TabM стат. не отличаются
- RealMLP — новый лидер
- Предобученные дефолты, квантильное преобразование, smooth clipping
- Работает быстро, из коробки, гиперпараметры не нужны
Пост ~162: Avito DS party
- Вечеринка для DS тимлидов и менеджеров
- Создание комьюнити
Посты #74-#89
Пост ~74: Авито мероприятие для DS тимлидов
- Вечеринка, друзья, новые знакомства
- Цель: сильное комьюнити
Пост ~75: Хакатон (кластеризация логов)
- 3-е место
- Идеи: scaNN, Rank-BM25, кастомный эмбеддинг, dbstream, LLM-итеративная кластеризация, JetBrains aggregation
- Ожидаемо хотели трансформеры, но объём данных + ресурсы → другой подход
Пост ~76: OCR обзор (Игорь Галицкий)
- Pipeline-Based, Expert OCR VLMs (GOT-OCR2.0), General VLMs
- Enterprise: RAG по документам, качество OCR влияет на результат
Пост ~77-78: Мемы
Пост ~79: ChatGPT и расшифровка истории
- "Александр Радищев", 1836
Пост ~80: Аналитика hh
Пост ~81: Data Ёлка VK (2019 → сейчас)
- Reliable ML: MAPIE, uncertainties
- NLP: "LLM стали лучше. Занавес"
- PyData: Briefer, Quak
- Карьера: 7+ резюме на вакансию, джуны 10x
- Time-Series Anomaly Detection: Dive into Time-Series Anomaly Detection: A Decade Review
Пост ~83: Персонализированное письмо
- AI-агенты сайт спарсил GitHub + LinkedIn
- Супер-персонализированное письмо
Пост ~86: Временные ряды аномалии (deep dive)
- Dive into Time-Series Anomaly Detection: A Decade Review
- Виды аномалий: точечные, контекстные, sequence-based
- Supervised/Unsupervised/Semi-supervised/Self-supervised
- Классические: бустинги, RNN, LSTM, SVM, скользящее среднее
- Reconstruction-based: автоэнкодеры, GANs, диффузионные
- Clustering-based: DAG, KNN (лучший по простоте)
- Метрики: ROC AUC, Precision, Recall
- Бенчмарки: NAB, KDD21, TODS, TimeEval
- Рекомендация: бейзлайн на скользящих средних и бустингах
Пост ~87: KNN для поиска аномалий (code snippet)
- window_size=5, NearestNeighbors, anomaly_scores
Пост ~88: GigaChat vs DeepSeek (Марков vs Тюкин)
- GigaChat: позитивная оценка
- DeepSeek: выложил половину весов, скорость инференса в 2 раза ниже
- Цены API: DeepSeek $0.14-2/1M, ChatGPT $10-20, GigaChat $10
- DeepSeek API отключены
- GigaChat open-source, архитектура на DeepSeek
Пост ~89: Hugging Face — AI агенты курс
- smolagents — не нужно прописывать логику вызова функций
- Первая часть из шести, час
- Учебные проекты: запрос погоды (зачем, если проще напрямую)
Посты #90-#228
Пост 90: ChatGPT и креативность (Science)
- Generative AI enhances individual creativity but reduces collective diversity
- Больше AI-идей = лучше текст, но тексты похожие
- Решение: разные модели, повысить temperature
Пост 91: NeurIPS vs Taylor Swift
- На NeurIPS меньше людей, чем на концерте Taylor Swift
Пост ~92: Книга "Простые правила"
- Сложные правила сложно соблюдать
- Простые = продуктивнее и точнее
- Примеры: бессонница, стартапы Чили
Пост ~93: Kaggle Best Solutions 2023
- Временные ряды: GroupKFold, cross time series validation
- GRU, магический коэффициент 1.0045
- LB public probing = переобучение (упал с 1-го на 967-е)
- Распознавание языков жестов: Squeezeformer, FingerDropout
- 1D CNN для букв эффективнее трансформеров
Пост 163: Обзор архитектур open-source LLM за 2025
- Linear Attention Hybrids (Qwen3-Next, DeepSeek V3.2)
- Text Diffusion Models — параллельная генерация, но хуже качество
- Small Recursive Transformers — <100M параметров, головоломки
- Code World Models — LLM моделирует выполнение кода
Пост 190: Follow-up от Raschka
- Linear Attention: KV-кэш лучше, метрики немного просели
- Text Diffusion: не работает Chain of Thought
- Small Recursive Transformers: красивая история, но пока только тулзы для больших моделей
- Code World Models: увеличение compute, результат на уровне классики
Пост 191: Глобальная память в LLM
- Обзор подходов: суммаризация, NER, Agentic memory, длинный контекст, RAG, Function calling
- MemGPT → Letta: Core Memory + Archival Memory
- A-Mem: имитация человеческой памяти (факты модифицируются, не добавляются)
- LangMem (LangChain): асинхронная обработка памяти
- x3 F1, в 16x меньше токенов
Пост 192: GigaMemory (AI Journey Contest 2025)
- 1-е место (86.6%): logprobs релевантности чанков через LLM
- 2-е (84.5%): технически сложнее, но концептуально похоже
- 3-е (74.5%): классический RAG с bge-m3
- Проблема: топ-2 перечитывают все диалоги заново
Пост ~193: Итоги года (tgstats / tgwrapped)
- Цифры не бьются — "не согласовали методологию"
Пост 195: RecSys (самый сложный домен в ML)
- МТС курс по RecSys
- В продакшене: комбинация методов + топ популярных + последние взаимодействия
- Стабильные предпочтения: ALS на большой истории
- HSTU (Meta, 2024): триллион параметров, генеративная архитектура
- Open-source: LightFM (заброшен), RePlay (Сбер)
- Яндекс Музыка: HSTU-подход, +2.2% TLT, +12% Discovery
- LLM в RecSys: OneRec/MiniOneRec, PLUM, RecAI/InteRecAgent, RecGPT, PinRec, RoLLMRec
Пост 196: Мем (оперативка дорожает)
Пост 197: Financial Times — AI-proof your job
- Социальные навыки важнее тех-скиллов для зарплаты
- O*NET классификация: High/Low social × High/Low math
- Wages: рост медианных зарплат относительно 1980-х
- IT: спрос падает, важнее погружение в продукт
Пост 198: Вакансия Senior DS (Сбер, HR-блок)
- AI-агенты, ранжирование резюме, RecSys для обучения, отток
- Стек: Python, SQL, GigaChat, LangChain/LangGraph, LightGBM
Пост 199: Бесплатный API (vibeproxy)
- vibeproxy / easyCli — мимикрирование подписок
- Continue.dev + бесплатный Qwen
- ChatGPT Go не подходит, нужна Plus
Пост 200: KnowNote + DeepTutor (локальные NotebookLM)
- KnowNote: эмбеддер без настройки размерности, RAG не работал
- DeepTutor (10K ⭐): зависимости, LightRAG, RAGAnything
- Ollama POST-запросы некорректны → LM Studio
- Проблема с переполнением контекста (36 API-вызовов)
- LM Studio: частичный инференс на GPU
Пост 202: Мем (взаимный Agentic Looping)
Пост 203: Kimi для генерации слайдов
- ChatGPT/Gemini/Perplexity: текст в пару предложений
- Kimi.com: достойные слайды про RAG (во вложении)
- Лимиты жёсткие
Пост 204: LLM в RecSys (follow-up)
- OneRec/MiniOneRec (Kuaishou): Semantic IDs, 25% трафика, 400M DAU
- PLUM (YouTube/Google): CPT на доменных данных
- RecAI/InteRecAgent (Microsoft), RecGPT/RecGPT-V2 (Taobao): LLM-оркестратор
- PinRec (Pinterest), LinkedIn Retrieval: dual-encoder
- RoLLMRec (2026): промпт-инъекции в описания товаров, защита через RAG-валидацию
Пост 205: Anthropic обвиняет китайские AI
- 16M+ запросов через фейковые аккаунты
- Claude на китайском отвечает что он DeepSeek
Пост 206: (пропущен / удалён)
Пост 207: Парадокс Джевонса
- Технологический прогресс увеличивает эффективность → увеличивает потребление
- indeed.com: вакансии разработчиков растут (vibe coding)
Пост 208: Python митап
- Выступление про публикацию в open source
- 100+ человек, обещали футболку 🤨
Пост 209: Мультиязычные LLM
- One ruler to measure them all: Benchmarking multilingual long-context language models (arxiv 2025)
- Польский (88%) > русский (84%) > английский (83.9%)
- Тестировались слабые модели: Gemini-1.5-Flash, Qwen 2.5 72B
- Разница значимее на длинном контексте
Пост 210: Open Source LLM Spring 2026
- Обзор от Sebastian Raschka — что нового в опенсорс за 2 месяца:
- Sliding Window Attention у всех, контекст растёт, модели не толстеют
- QK-Norm как аналог RMSNorm
- Мультимодальные модели (Kimi k2.5 претрейн на изображениях)
- GLM-5 от Z.ai — на уровне GPT-5.2/Opus 4.5, внутри DeepSeek-V2
- Step 3.5 Flash (196B) — сопоставим с DeepSeek, в 3x быстрее, Multi-Token Prediction
Пост 211: AIConf 2026 (20 апреля, Москва)
- Мультиагентные системы и RAG
- Стабильные результаты от LLM
- Обоснование технологий бизнесу
- Экономика AI / инфраструктура
- 400+ участников, спикеры из Сбера, Яндекса, VK
Пост 212: Clawbot / OpenClaw опыт
- Поднял на VPS, старая версия библиотеки
- OpenRouter — бесплатные модели не такие уж бесплатные
- Локальный Qwen — tool calling падал из-за абсолютных путей
- Без контекста 200k всё падает
- Вывод: рано для само-хостинга, лучше коробочные решения (Kimi, GLM) но нужна подписка
Пост 215: Colleague Skill (цифровой двойник)
- Система оцифровки сотрудника в AI-агента
- Стилистический промпт + мета-информация + переписки
- Три файла на выходе: стиль общения, решение задач, стек
- Зафорсилось в Китае
- Claude как кодинг-агент и так хорош
Пост 216: Z.ai цены
- GLM 5.1 подписка подорожала в 2 раза до $160
- Лучшие в опенсорсе, но подписки как у проприетарных
Пост 217: Внедряем 🙂
(19 😁 — мем-пост)
Пост 218: RAG SOTA benchmarks (SEQUOIA)
- Классический пайплайн: Hybrid Retrieval + reranker + суммаризация
- Step-back prompting, Agentic RAG
- LightRAG — графовая альтернатива векторным базам
- RAPTOR — дерево с кластеризацией листьев
- SEQUOIA = RAPTOR + step-back prompting = SOTA
- Проверено 7 методов: No-RAG, Classical, Hybrid, LightRAG, PageIndex, GraphRAG, Agentic, SEQUOIA, SEQUOIA Pro
- Репо: https://github.com/Diyago/rag-benchmark
Пост 219: Первое приседание
(отсеял часть решений)
Пост 220: AI Conf отчёт
- Публикации индустрии — среднее время 9 месяцев, LLM для кода/ревью уже норма
- Воркшопы: search-агенты (ReAct + Groq + Tavily), мониторинг (Langfuse)
- Agent Harness (Deep Agents) — память + скиллы, но дорого (2M токенов на скилл, 100K на вызов)
- Голосовые агенты: Speech-to-Text → LLM → Text-to-Speech, проблемы с latency и перебиваниями
- LLM-контент на YouTube: обложка + сценарий + контент = легко распознать по капс-заголовкам
- Еда по талонам — котлетка с пюрешкой
Пост 221: 💀
(18 😁 — мем)
Пост 222: 100 триллионов токенов от Xiaomi
(мем/новость)
Пост 224: Russian Speech-To-Text бенчмарк
- Сравнил Whisper vs GigaAM-RNNT/CTC vs мультимодальные модели
- GigaAM на порядок быстрее Whisper при сопоставимых метриках
- Мультимодальные модели — медленно, качество проседает
- LLM-постпроцессинг улучшает качество
- Репо: https://github.com/Diyago/tts_bench
- WER/CER метрики
Пост 225: AI для готовки
- ChatGPT для готовки с 5й версии
- Кимчи, radis sauté au beuvre
- Создание реальной добавленной стоимости 😅
Пост 226: Стэнфорд исследование
- Найм проседает из-за AI в первую очередь у джунов
- Разработка и клиентская поддержка — сильнее всего
- https://digitaleconomy.stanford.edu/...
Пост 227: Книга "Займись ничем"
- Польза прокрастинации
- Непрерывный фокус перегружает префронтальную кору
- Default Mode Network (DMN) — пассивный режим мозга ловит инсайты
Пост 228: Freebuff (вайбкодинг)
- https://freebuff.com/ — бесплатные лимиты
- 5 сессий по часу в день
- Модели: DeepSeek V4 Pro, Kimi K2.6, DeepSeek V4 Flash, MiniMax M2.7
- Собирают данные для обучения через API
- Обрывает часовые сессии
- Установка: npm install -g freebuff
Собрано: 2026-05-31
Источник: t.me/s/ai_tablet (public preview)
Метод: web_fetch через t.me/s/ URL (без авторизации)
More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:
🚀 https://t.me/ai_tablet (Russian, technical)
Top comments (0)