DEV Community

Ai developer
Ai developer

Posted on

AI.Insaf (@ai_tablet) — Полный архив постов канала

AI.Insaf (@ai_tablet) — Полный архив постов канала

Ранние посты (#1-~49)

Пост ~1: TabGAN (pet project)

  • Библиотека генерации табличных данных (с 2021)
  • 500+ ⭐, 40K загрузок, 38 цитирований
  • Грант Яндекс Open Source (апрель 2024)
  • Теперь генерация через GAN + LLM + Forest Diffusion
  • pip install tabgan
  • https://github.com/Diyago/Tabular-data-generation

Пост ~2: Вакансии (DA + DS)

  • Мониторинг и предиктивное выявление проблемности корпоративных заёмщиков
  • Стек: Python, SQL

Пост ~3-7: Япония (Токио, Киото, Осака, Нара)

  • Токио: вежливость, регулировщики, рамены, Фудзи
  • Киото: храмы, Золотой храм (Мисима), Тории ⛩, Фусими Инари
  • Осака: замок, уличная еда
  • Нара: олени 🦌

Пост ~35: The Culture Code

  • Успех команды = чувство безопасности
  • Фасилитатор: сначала идеи, потом реализуемость
  • Общее чувство цели + взаимная уязвимость

Пост ~36: Мем (OK google, на чём обучали Gemini)

Пост ~37: Двойная ось Y в графиках

  • Мнимое пересечение на графике №1
  • График №2 — правильный, ушёл в печать

Пост ~38: The Shape of Story (презентации)

  • Единство стиля, лаконичные выводы
  • Микроистории: проблема → сложности → решение → эффект
  • В Сбере — executive summary (обратный порядок)
  • Курсы: Бонни и Слайд, Яндекс Практикум

Пост ~39: Presentation skills (МФТИ → Delivery Club)

  • Первые слайды для руководства — "приземлили"
  • Рекомендации: Виктор Кантор, Таня Савельева (топ-30 Forbes)

Пост ~40: Книги "Выживает самый дружелюбный" + "Лучшее в нас"

  • Альтруизм бонобо, эволюционный успех через сотрудничество
  • Снижение насилия в истории человечества
  • Но: частные кейсы, confirmation bias, cherry picking

Пост ~41: Менторство — личный опыт

  • Два ментора за 3 года
  • Первый: софты, продакт, книги, уверенность
  • Второй (сертифицированный): быстрое разрешение кейсов
  • Проблема: когда нечего формулировать — значит всё решилось
  • PS: кто работает с ментором = менти

Пост ~42: Летняя школа МФТИ

  • Лекция: "Мониторинг корпоративных рисков в условиях неопределённости"
  • Интерпретация моделей, bias/variance, blending
  • "Кармический откат за пропуски лекций в универе"
  • Большинство школьников выбрали домашку вместо докладов

Пост ~43: Яндекс Практикум — консультант

  • Обсудили найм, навыки DS для табличных данных
  • Рекомендации по программе курса
  • Интересная опция: сервис найма для нанимающих менеджеров

Пост ~44: Хакатон AI стартапов (ментор)

  • Проект: личный ассистент по выбору одежды
  • ViT/CLIP для эмбеддингов, FAISS для поиска
  • FashionVLP, CoSMo.pytorch, metric learning
  • Команда школьников — не прошли в финал (жюри: Артемий Лебедев)

Пост ~45: Почему бустинги лучше нейросетей на табличных данных

  • Deep Neural Networks and Tabular Data: A Survey (2022)
  • Причины: качество данных, отсутствие структуры, критичность признаков, GPU
  • A Closer Look at Deep Learning on Tabular Data (300 датасетов)
  • Catboost выигрывает в ~200 из 300
  • TabR (Яндекс) — медленно, падает по памяти

Пост ~46: Книги/курсы для DS

  • Классическое ML: Python Machine Learning (Raschka), специализация МФТИ+Яндекс
  • MLOps: O'Reilly
  • System Design: Designing Machine Learning Systems
  • Аналитика: Девенпорт, SQL, Pandas
  • RecSys: курс МТС
  • A/B: гайд VK, Яндекс Практикум, Trustworthy Online Controlled Experiments
  • NLP: ШАД, Voita, Abby, обзорные статьи
  • CV: Deep Learning with PyTorch

Пост ~47: Софтовые навыки

  • Общение, small talk
  • Переговоры: "Договориться можно обо всём", "Переговоры с монстрами"
  • Деловая переписка
  • Фасилитация
  • Public talks
  • Лидерство: NASA, "Лидер без титула", "5 пороков и 5 благодетелей команды"
  • Креативность: "Как придумать идею, если вы не Огилви"
  • Менторы, коучи, психологи

Пост ~143: Google Jules (coding agent)

  • Запущен в мае, интеграция с GitHub
  • Переписал readme.md неплохо
  • Но: установка torch непосильна, код не работал, 400+ строк изменений
  • До часа ожидания на запрос
  • Cursor пока лучше

Пост ~144: Сбер — отчёт 2024

  • Проект "Индивидуальный мониторинг" в отчёте Сбера
  • 486 страниц

Пост ~145: Reddit — ChatGPT трейдинг

  • Чат-бот натрейдил на $400
  • Robinhood, длинное плечо, риск
  • На NVidia ошибка 40% за 3 месяца
  • Excel-протягивание или экспоненциальное сглаживание

Пост ~146: Swing Vision (теннис)

  • Приложение для анализа тенниса
  • Инвесторы: ex ATP No1
  • Локальный инференс на телефоне
  • Статистика: удары, точность, скорость
  • Challenge (Hawk-Eye) для аутов
  • Нужен трипод

Пост ~147: OCR и Vision-LLM тренды Q1/Q2 2025

  • Gemini 2.5 — новая SOTA, на 15-20% лучше qwen/gpt-4o
  • Small VLM: MonkeyOCR, Dolphin
  • ChartQA Pro: топовые VLM далеки от человека (85%)
  • Claude Sonnet 3.5: ~56%, GPT-4o: ~42%
  • Enterprise: специализированные модели лучше универсальных

Пост ~157: Шри-Ланка

  • Тур по путёвке
  • Сёрфинг: инструктор 1000₽/час, отбил рёбро
  • Цейлонский чай
  • Еда спорная, акула как белая рыба, дуриан
  • Сафари по реке: крокодилы, хамелеон, лангуры
  • Запуск черепашек в океан

Пост ~158: LLM Reasoning (Sebastian Raschka)

  • Wait Injection: +50% на математике
  • Chain of Draft (CoD): короткие тезисы вместо избыточного CoT

Пост ~159: ШАД — курс по LLM

  • Достойные материалы
  • PS: будет integer overflow

Пост ~160: TabM (Яндекс)

  • MLP-архитектура, имитирует ансамбль из 32 сетей
  • Параметры из статьи, падает по памяти
  • LightGBM: AUC 0.7659, TabM: 0.7421
  • TabM CPU: 234.55s vs LGB: 0.23s

Пост ~161: TabArena + RealMLP

  • TabArena бенчмарк: LightGBM и TabM стат. не отличаются
  • RealMLP — новый лидер
  • Предобученные дефолты, квантильное преобразование, smooth clipping
  • Работает быстро, из коробки, гиперпараметры не нужны

Пост ~162: Avito DS party

  • Вечеринка для DS тимлидов и менеджеров
  • Создание комьюнити

Посты #74-#89

Пост ~74: Авито мероприятие для DS тимлидов

  • Вечеринка, друзья, новые знакомства
  • Цель: сильное комьюнити

Пост ~75: Хакатон (кластеризация логов)

  • 3-е место
  • Идеи: scaNN, Rank-BM25, кастомный эмбеддинг, dbstream, LLM-итеративная кластеризация, JetBrains aggregation
  • Ожидаемо хотели трансформеры, но объём данных + ресурсы → другой подход

Пост ~76: OCR обзор (Игорь Галицкий)

  • Pipeline-Based, Expert OCR VLMs (GOT-OCR2.0), General VLMs
  • Enterprise: RAG по документам, качество OCR влияет на результат

Пост ~77-78: Мемы

Пост ~79: ChatGPT и расшифровка истории

  • "Александр Радищев", 1836

Пост ~80: Аналитика hh

Пост ~81: Data Ёлка VK (2019 → сейчас)

  • Reliable ML: MAPIE, uncertainties
  • NLP: "LLM стали лучше. Занавес"
  • PyData: Briefer, Quak
  • Карьера: 7+ резюме на вакансию, джуны 10x
  • Time-Series Anomaly Detection: Dive into Time-Series Anomaly Detection: A Decade Review

Пост ~83: Персонализированное письмо

  • AI-агенты сайт спарсил GitHub + LinkedIn
  • Супер-персонализированное письмо

Пост ~86: Временные ряды аномалии (deep dive)

  • Dive into Time-Series Anomaly Detection: A Decade Review
  • Виды аномалий: точечные, контекстные, sequence-based
  • Supervised/Unsupervised/Semi-supervised/Self-supervised
  • Классические: бустинги, RNN, LSTM, SVM, скользящее среднее
  • Reconstruction-based: автоэнкодеры, GANs, диффузионные
  • Clustering-based: DAG, KNN (лучший по простоте)
  • Метрики: ROC AUC, Precision, Recall
  • Бенчмарки: NAB, KDD21, TODS, TimeEval
  • Рекомендация: бейзлайн на скользящих средних и бустингах

Пост ~87: KNN для поиска аномалий (code snippet)

  • window_size=5, NearestNeighbors, anomaly_scores

Пост ~88: GigaChat vs DeepSeek (Марков vs Тюкин)

  • GigaChat: позитивная оценка
  • DeepSeek: выложил половину весов, скорость инференса в 2 раза ниже
  • Цены API: DeepSeek $0.14-2/1M, ChatGPT $10-20, GigaChat $10
  • DeepSeek API отключены
  • GigaChat open-source, архитектура на DeepSeek

Пост ~89: Hugging Face — AI агенты курс

  • smolagents — не нужно прописывать логику вызова функций
  • Первая часть из шести, час
  • Учебные проекты: запрос погоды (зачем, если проще напрямую)

Посты #90-#228

Пост 90: ChatGPT и креативность (Science)

  • Generative AI enhances individual creativity but reduces collective diversity
  • Больше AI-идей = лучше текст, но тексты похожие
  • Решение: разные модели, повысить temperature

Пост 91: NeurIPS vs Taylor Swift

  • На NeurIPS меньше людей, чем на концерте Taylor Swift

Пост ~92: Книга "Простые правила"

  • Сложные правила сложно соблюдать
  • Простые = продуктивнее и точнее
  • Примеры: бессонница, стартапы Чили

Пост ~93: Kaggle Best Solutions 2023

  • Временные ряды: GroupKFold, cross time series validation
  • GRU, магический коэффициент 1.0045
  • LB public probing = переобучение (упал с 1-го на 967-е)
  • Распознавание языков жестов: Squeezeformer, FingerDropout
  • 1D CNN для букв эффективнее трансформеров

Пост 163: Обзор архитектур open-source LLM за 2025

  • Linear Attention Hybrids (Qwen3-Next, DeepSeek V3.2)
  • Text Diffusion Models — параллельная генерация, но хуже качество
  • Small Recursive Transformers — <100M параметров, головоломки
  • Code World Models — LLM моделирует выполнение кода

Пост 190: Follow-up от Raschka

  • Linear Attention: KV-кэш лучше, метрики немного просели
  • Text Diffusion: не работает Chain of Thought
  • Small Recursive Transformers: красивая история, но пока только тулзы для больших моделей
  • Code World Models: увеличение compute, результат на уровне классики

Пост 191: Глобальная память в LLM

  • Обзор подходов: суммаризация, NER, Agentic memory, длинный контекст, RAG, Function calling
  • MemGPT → Letta: Core Memory + Archival Memory
  • A-Mem: имитация человеческой памяти (факты модифицируются, не добавляются)
  • LangMem (LangChain): асинхронная обработка памяти
  • x3 F1, в 16x меньше токенов

Пост 192: GigaMemory (AI Journey Contest 2025)

  • 1-е место (86.6%): logprobs релевантности чанков через LLM
  • 2-е (84.5%): технически сложнее, но концептуально похоже
  • 3-е (74.5%): классический RAG с bge-m3
  • Проблема: топ-2 перечитывают все диалоги заново

Пост ~193: Итоги года (tgstats / tgwrapped)

  • Цифры не бьются — "не согласовали методологию"

Пост 195: RecSys (самый сложный домен в ML)

  • МТС курс по RecSys
  • В продакшене: комбинация методов + топ популярных + последние взаимодействия
  • Стабильные предпочтения: ALS на большой истории
  • HSTU (Meta, 2024): триллион параметров, генеративная архитектура
  • Open-source: LightFM (заброшен), RePlay (Сбер)
  • Яндекс Музыка: HSTU-подход, +2.2% TLT, +12% Discovery
  • LLM в RecSys: OneRec/MiniOneRec, PLUM, RecAI/InteRecAgent, RecGPT, PinRec, RoLLMRec

Пост 196: Мем (оперативка дорожает)

Пост 197: Financial Times — AI-proof your job

  • Социальные навыки важнее тех-скиллов для зарплаты
  • O*NET классификация: High/Low social × High/Low math
  • Wages: рост медианных зарплат относительно 1980-х
  • IT: спрос падает, важнее погружение в продукт

Пост 198: Вакансия Senior DS (Сбер, HR-блок)

  • AI-агенты, ранжирование резюме, RecSys для обучения, отток
  • Стек: Python, SQL, GigaChat, LangChain/LangGraph, LightGBM

Пост 199: Бесплатный API (vibeproxy)

  • vibeproxy / easyCli — мимикрирование подписок
  • Continue.dev + бесплатный Qwen
  • ChatGPT Go не подходит, нужна Plus

Пост 200: KnowNote + DeepTutor (локальные NotebookLM)

  • KnowNote: эмбеддер без настройки размерности, RAG не работал
  • DeepTutor (10K ⭐): зависимости, LightRAG, RAGAnything
  • Ollama POST-запросы некорректны → LM Studio
  • Проблема с переполнением контекста (36 API-вызовов)
  • LM Studio: частичный инференс на GPU

Пост 202: Мем (взаимный Agentic Looping)

Пост 203: Kimi для генерации слайдов

  • ChatGPT/Gemini/Perplexity: текст в пару предложений
  • Kimi.com: достойные слайды про RAG (во вложении)
  • Лимиты жёсткие

Пост 204: LLM в RecSys (follow-up)

  • OneRec/MiniOneRec (Kuaishou): Semantic IDs, 25% трафика, 400M DAU
  • PLUM (YouTube/Google): CPT на доменных данных
  • RecAI/InteRecAgent (Microsoft), RecGPT/RecGPT-V2 (Taobao): LLM-оркестратор
  • PinRec (Pinterest), LinkedIn Retrieval: dual-encoder
  • RoLLMRec (2026): промпт-инъекции в описания товаров, защита через RAG-валидацию

Пост 205: Anthropic обвиняет китайские AI

  • 16M+ запросов через фейковые аккаунты
  • Claude на китайском отвечает что он DeepSeek

Пост 206: (пропущен / удалён)

Пост 207: Парадокс Джевонса

  • Технологический прогресс увеличивает эффективность → увеличивает потребление
  • indeed.com: вакансии разработчиков растут (vibe coding)

Пост 208: Python митап

  • Выступление про публикацию в open source
  • 100+ человек, обещали футболку 🤨

Пост 209: Мультиязычные LLM

  • One ruler to measure them all: Benchmarking multilingual long-context language models (arxiv 2025)
  • Польский (88%) > русский (84%) > английский (83.9%)
  • Тестировались слабые модели: Gemini-1.5-Flash, Qwen 2.5 72B
  • Разница значимее на длинном контексте

Пост 210: Open Source LLM Spring 2026

  • Обзор от Sebastian Raschka — что нового в опенсорс за 2 месяца:
  • Sliding Window Attention у всех, контекст растёт, модели не толстеют
  • QK-Norm как аналог RMSNorm
  • Мультимодальные модели (Kimi k2.5 претрейн на изображениях)
  • GLM-5 от Z.ai — на уровне GPT-5.2/Opus 4.5, внутри DeepSeek-V2
  • Step 3.5 Flash (196B) — сопоставим с DeepSeek, в 3x быстрее, Multi-Token Prediction

Пост 211: AIConf 2026 (20 апреля, Москва)

  • Мультиагентные системы и RAG
  • Стабильные результаты от LLM
  • Обоснование технологий бизнесу
  • Экономика AI / инфраструктура
  • 400+ участников, спикеры из Сбера, Яндекса, VK

Пост 212: Clawbot / OpenClaw опыт

  • Поднял на VPS, старая версия библиотеки
  • OpenRouter — бесплатные модели не такие уж бесплатные
  • Локальный Qwen — tool calling падал из-за абсолютных путей
  • Без контекста 200k всё падает
  • Вывод: рано для само-хостинга, лучше коробочные решения (Kimi, GLM) но нужна подписка

Пост 215: Colleague Skill (цифровой двойник)

  • Система оцифровки сотрудника в AI-агента
  • Стилистический промпт + мета-информация + переписки
  • Три файла на выходе: стиль общения, решение задач, стек
  • Зафорсилось в Китае
  • Claude как кодинг-агент и так хорош

Пост 216: Z.ai цены

  • GLM 5.1 подписка подорожала в 2 раза до $160
  • Лучшие в опенсорсе, но подписки как у проприетарных

Пост 217: Внедряем 🙂

(19 😁 — мем-пост)

Пост 218: RAG SOTA benchmarks (SEQUOIA)

  • Классический пайплайн: Hybrid Retrieval + reranker + суммаризация
  • Step-back prompting, Agentic RAG
  • LightRAG — графовая альтернатива векторным базам
  • RAPTOR — дерево с кластеризацией листьев
  • SEQUOIA = RAPTOR + step-back prompting = SOTA
  • Проверено 7 методов: No-RAG, Classical, Hybrid, LightRAG, PageIndex, GraphRAG, Agentic, SEQUOIA, SEQUOIA Pro
  • Репо: https://github.com/Diyago/rag-benchmark

Пост 219: Первое приседание

(отсеял часть решений)

Пост 220: AI Conf отчёт

  1. Публикации индустрии — среднее время 9 месяцев, LLM для кода/ревью уже норма
  2. Воркшопы: search-агенты (ReAct + Groq + Tavily), мониторинг (Langfuse)
  3. Agent Harness (Deep Agents) — память + скиллы, но дорого (2M токенов на скилл, 100K на вызов)
  4. Голосовые агенты: Speech-to-Text → LLM → Text-to-Speech, проблемы с latency и перебиваниями
  5. LLM-контент на YouTube: обложка + сценарий + контент = легко распознать по капс-заголовкам
  6. Еда по талонам — котлетка с пюрешкой

Пост 221: 💀

(18 😁 — мем)

Пост 222: 100 триллионов токенов от Xiaomi

(мем/новость)

Пост 224: Russian Speech-To-Text бенчмарк

  • Сравнил Whisper vs GigaAM-RNNT/CTC vs мультимодальные модели
  • GigaAM на порядок быстрее Whisper при сопоставимых метриках
  • Мультимодальные модели — медленно, качество проседает
  • LLM-постпроцессинг улучшает качество
  • Репо: https://github.com/Diyago/tts_bench
  • WER/CER метрики

Пост 225: AI для готовки

  • ChatGPT для готовки с 5й версии
  • Кимчи, radis sauté au beuvre
  • Создание реальной добавленной стоимости 😅

Пост 226: Стэнфорд исследование

  • Найм проседает из-за AI в первую очередь у джунов
  • Разработка и клиентская поддержка — сильнее всего
  • https://digitaleconomy.stanford.edu/...

Пост 227: Книга "Займись ничем"

  • Польза прокрастинации
  • Непрерывный фокус перегружает префронтальную кору
  • Default Mode Network (DMN) — пассивный режим мозга ловит инсайты

Пост 228: Freebuff (вайбкодинг)

  • https://freebuff.com/ — бесплатные лимиты
  • 5 сессий по часу в день
  • Модели: DeepSeek V4 Pro, Kimi K2.6, DeepSeek V4 Flash, MiniMax M2.7
  • Собирают данные для обучения через API
  • Обрывает часовые сессии
  • Установка: npm install -g freebuff

Собрано: 2026-05-31
Источник: t.me/s/ai_tablet (public preview)
Метод: web_fetch через t.me/s/ URL (без авторизации)


More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:

🚀 https://t.me/ai_tablet (Russian, technical)

Top comments (0)