Ai developer

Posted on Jun 3

AI.Insaf (@ai_tablet) — Полный архив постов канала

#ai #llm #machinelearning #rag

AI.Insaf (@ai_tablet) — Полный архив постов канала

Ранние посты (#1-~49)

Пост ~1: TabGAN (pet project)

Библиотека генерации табличных данных (с 2021)
500+ ⭐, 40K загрузок, 38 цитирований
Грант Яндекс Open Source (апрель 2024)
Теперь генерация через GAN + LLM + Forest Diffusion
pip install tabgan
https://github.com/Diyago/Tabular-data-generation

Пост ~2: Вакансии (DA + DS)

Мониторинг и предиктивное выявление проблемности корпоративных заёмщиков
Стек: Python, SQL

Пост ~3-7: Япония (Токио, Киото, Осака, Нара)

Токио: вежливость, регулировщики, рамены, Фудзи
Киото: храмы, Золотой храм (Мисима), Тории ⛩, Фусими Инари
Осака: замок, уличная еда
Нара: олени 🦌

Пост ~35: The Culture Code

Успех команды = чувство безопасности
Фасилитатор: сначала идеи, потом реализуемость
Общее чувство цели + взаимная уязвимость

Пост ~36: Мем (OK google, на чём обучали Gemini)

Пост ~37: Двойная ось Y в графиках

Мнимое пересечение на графике №1
График №2 — правильный, ушёл в печать

Пост ~38: The Shape of Story (презентации)

Единство стиля, лаконичные выводы
Микроистории: проблема → сложности → решение → эффект
В Сбере — executive summary (обратный порядок)
Курсы: Бонни и Слайд, Яндекс Практикум

Пост ~39: Presentation skills (МФТИ → Delivery Club)

Первые слайды для руководства — "приземлили"
Рекомендации: Виктор Кантор, Таня Савельева (топ-30 Forbes)

Пост ~40: Книги "Выживает самый дружелюбный" + "Лучшее в нас"

Альтруизм бонобо, эволюционный успех через сотрудничество
Снижение насилия в истории человечества
Но: частные кейсы, confirmation bias, cherry picking

Пост ~41: Менторство — личный опыт

Два ментора за 3 года
Первый: софты, продакт, книги, уверенность
Второй (сертифицированный): быстрое разрешение кейсов
Проблема: когда нечего формулировать — значит всё решилось
PS: кто работает с ментором = менти

Пост ~42: Летняя школа МФТИ

Лекция: "Мониторинг корпоративных рисков в условиях неопределённости"
Интерпретация моделей, bias/variance, blending
"Кармический откат за пропуски лекций в универе"
Большинство школьников выбрали домашку вместо докладов

Пост ~43: Яндекс Практикум — консультант

Обсудили найм, навыки DS для табличных данных
Рекомендации по программе курса
Интересная опция: сервис найма для нанимающих менеджеров

Пост ~44: Хакатон AI стартапов (ментор)

Проект: личный ассистент по выбору одежды
ViT/CLIP для эмбеддингов, FAISS для поиска
FashionVLP, CoSMo.pytorch, metric learning
Команда школьников — не прошли в финал (жюри: Артемий Лебедев)

Пост ~45: Почему бустинги лучше нейросетей на табличных данных

Deep Neural Networks and Tabular Data: A Survey (2022)
Причины: качество данных, отсутствие структуры, критичность признаков, GPU
A Closer Look at Deep Learning on Tabular Data (300 датасетов)
Catboost выигрывает в ~200 из 300
TabR (Яндекс) — медленно, падает по памяти

Пост ~46: Книги/курсы для DS

Классическое ML: Python Machine Learning (Raschka), специализация МФТИ+Яндекс
MLOps: O'Reilly
System Design: Designing Machine Learning Systems
Аналитика: Девенпорт, SQL, Pandas
RecSys: курс МТС
A/B: гайд VK, Яндекс Практикум, Trustworthy Online Controlled Experiments
NLP: ШАД, Voita, Abby, обзорные статьи
CV: Deep Learning with PyTorch

Пост ~47: Софтовые навыки

Общение, small talk
Переговоры: "Договориться можно обо всём", "Переговоры с монстрами"
Деловая переписка
Фасилитация
Public talks
Лидерство: NASA, "Лидер без титула", "5 пороков и 5 благодетелей команды"
Креативность: "Как придумать идею, если вы не Огилви"
Менторы, коучи, психологи

Пост ~143: Google Jules (coding agent)

Запущен в мае, интеграция с GitHub
Переписал readme.md неплохо
Но: установка torch непосильна, код не работал, 400+ строк изменений
До часа ожидания на запрос
Cursor пока лучше

Пост ~144: Сбер — отчёт 2024

Проект "Индивидуальный мониторинг" в отчёте Сбера
486 страниц

Пост ~145: Reddit — ChatGPT трейдинг

Чат-бот натрейдил на $400
Robinhood, длинное плечо, риск
На NVidia ошибка 40% за 3 месяца
Excel-протягивание или экспоненциальное сглаживание

Пост ~146: Swing Vision (теннис)

Приложение для анализа тенниса
Инвесторы: ex ATP No1
Локальный инференс на телефоне
Статистика: удары, точность, скорость
Challenge (Hawk-Eye) для аутов
Нужен трипод

Пост ~147: OCR и Vision-LLM тренды Q1/Q2 2025

Gemini 2.5 — новая SOTA, на 15-20% лучше qwen/gpt-4o
Small VLM: MonkeyOCR, Dolphin
ChartQA Pro: топовые VLM далеки от человека (85%)
Claude Sonnet 3.5: ~56%, GPT-4o: ~42%
Enterprise: специализированные модели лучше универсальных

Пост ~157: Шри-Ланка

Тур по путёвке
Сёрфинг: инструктор 1000₽/час, отбил рёбро
Цейлонский чай
Еда спорная, акула как белая рыба, дуриан
Сафари по реке: крокодилы, хамелеон, лангуры
Запуск черепашек в океан

Пост ~158: LLM Reasoning (Sebastian Raschka)

Wait Injection: +50% на математике
Chain of Draft (CoD): короткие тезисы вместо избыточного CoT

Пост ~159: ШАД — курс по LLM

Достойные материалы
PS: будет integer overflow

Пост ~160: TabM (Яндекс)

MLP-архитектура, имитирует ансамбль из 32 сетей
Параметры из статьи, падает по памяти
LightGBM: AUC 0.7659, TabM: 0.7421
TabM CPU: 234.55s vs LGB: 0.23s

Пост ~161: TabArena + RealMLP

TabArena бенчмарк: LightGBM и TabM стат. не отличаются
RealMLP — новый лидер
Предобученные дефолты, квантильное преобразование, smooth clipping
Работает быстро, из коробки, гиперпараметры не нужны

Пост ~162: Avito DS party

Вечеринка для DS тимлидов и менеджеров
Создание комьюнити

Посты #74-#89

Пост ~74: Авито мероприятие для DS тимлидов

Вечеринка, друзья, новые знакомства
Цель: сильное комьюнити

Пост ~75: Хакатон (кластеризация логов)

3-е место
Идеи: scaNN, Rank-BM25, кастомный эмбеддинг, dbstream, LLM-итеративная кластеризация, JetBrains aggregation
Ожидаемо хотели трансформеры, но объём данных + ресурсы → другой подход

Пост ~76: OCR обзор (Игорь Галицкий)

Pipeline-Based, Expert OCR VLMs (GOT-OCR2.0), General VLMs
Enterprise: RAG по документам, качество OCR влияет на результат

Пост ~77-78: Мемы

Пост ~79: ChatGPT и расшифровка истории

"Александр Радищев", 1836

Пост ~80: Аналитика hh

Пост ~81: Data Ёлка VK (2019 → сейчас)

Reliable ML: MAPIE, uncertainties
NLP: "LLM стали лучше. Занавес"
PyData: Briefer, Quak
Карьера: 7+ резюме на вакансию, джуны 10x
Time-Series Anomaly Detection: Dive into Time-Series Anomaly Detection: A Decade Review

Пост ~83: Персонализированное письмо

AI-агенты сайт спарсил GitHub + LinkedIn
Супер-персонализированное письмо

Пост ~86: Временные ряды аномалии (deep dive)

Dive into Time-Series Anomaly Detection: A Decade Review
Виды аномалий: точечные, контекстные, sequence-based
Supervised/Unsupervised/Semi-supervised/Self-supervised
Классические: бустинги, RNN, LSTM, SVM, скользящее среднее
Reconstruction-based: автоэнкодеры, GANs, диффузионные
Clustering-based: DAG, KNN (лучший по простоте)
Метрики: ROC AUC, Precision, Recall
Бенчмарки: NAB, KDD21, TODS, TimeEval
Рекомендация: бейзлайн на скользящих средних и бустингах

Пост ~87: KNN для поиска аномалий (code snippet)

window_size=5, NearestNeighbors, anomaly_scores

Пост ~88: GigaChat vs DeepSeek (Марков vs Тюкин)

GigaChat: позитивная оценка
DeepSeek: выложил половину весов, скорость инференса в 2 раза ниже
Цены API: DeepSeek $0.14-2/1M, ChatGPT $10-20, GigaChat $10
DeepSeek API отключены
GigaChat open-source, архитектура на DeepSeek

Пост ~89: Hugging Face — AI агенты курс

smolagents — не нужно прописывать логику вызова функций
Первая часть из шести, час
Учебные проекты: запрос погоды (зачем, если проще напрямую)

Посты #90-#228

Пост 90: ChatGPT и креативность (Science)

Generative AI enhances individual creativity but reduces collective diversity
Больше AI-идей = лучше текст, но тексты похожие
Решение: разные модели, повысить temperature

Пост 91: NeurIPS vs Taylor Swift

На NeurIPS меньше людей, чем на концерте Taylor Swift

Пост ~92: Книга "Простые правила"

Сложные правила сложно соблюдать
Простые = продуктивнее и точнее
Примеры: бессонница, стартапы Чили

Пост ~93: Kaggle Best Solutions 2023

Временные ряды: GroupKFold, cross time series validation
GRU, магический коэффициент 1.0045
LB public probing = переобучение (упал с 1-го на 967-е)
Распознавание языков жестов: Squeezeformer, FingerDropout
1D CNN для букв эффективнее трансформеров

Пост 163: Обзор архитектур open-source LLM за 2025

Linear Attention Hybrids (Qwen3-Next, DeepSeek V3.2)
Text Diffusion Models — параллельная генерация, но хуже качество
Small Recursive Transformers — <100M параметров, головоломки
Code World Models — LLM моделирует выполнение кода

Пост 190: Follow-up от Raschka

Linear Attention: KV-кэш лучше, метрики немного просели
Text Diffusion: не работает Chain of Thought
Small Recursive Transformers: красивая история, но пока только тулзы для больших моделей
Code World Models: увеличение compute, результат на уровне классики

Пост 191: Глобальная память в LLM

Обзор подходов: суммаризация, NER, Agentic memory, длинный контекст, RAG, Function calling
MemGPT → Letta: Core Memory + Archival Memory
A-Mem: имитация человеческой памяти (факты модифицируются, не добавляются)
LangMem (LangChain): асинхронная обработка памяти
x3 F1, в 16x меньше токенов

Пост 192: GigaMemory (AI Journey Contest 2025)

1-е место (86.6%): logprobs релевантности чанков через LLM
2-е (84.5%): технически сложнее, но концептуально похоже
3-е (74.5%): классический RAG с bge-m3
Проблема: топ-2 перечитывают все диалоги заново

Пост ~193: Итоги года (tgstats / tgwrapped)

Цифры не бьются — "не согласовали методологию"

Пост 195: RecSys (самый сложный домен в ML)

МТС курс по RecSys
В продакшене: комбинация методов + топ популярных + последние взаимодействия
Стабильные предпочтения: ALS на большой истории
HSTU (Meta, 2024): триллион параметров, генеративная архитектура
Open-source: LightFM (заброшен), RePlay (Сбер)
Яндекс Музыка: HSTU-подход, +2.2% TLT, +12% Discovery
LLM в RecSys: OneRec/MiniOneRec, PLUM, RecAI/InteRecAgent, RecGPT, PinRec, RoLLMRec

Пост 196: Мем (оперативка дорожает)

Пост 197: Financial Times — AI-proof your job

Социальные навыки важнее тех-скиллов для зарплаты
O*NET классификация: High/Low social × High/Low math
Wages: рост медианных зарплат относительно 1980-х
IT: спрос падает, важнее погружение в продукт

Пост 198: Вакансия Senior DS (Сбер, HR-блок)

AI-агенты, ранжирование резюме, RecSys для обучения, отток
Стек: Python, SQL, GigaChat, LangChain/LangGraph, LightGBM

Пост 199: Бесплатный API (vibeproxy)

vibeproxy / easyCli — мимикрирование подписок
Continue.dev + бесплатный Qwen
ChatGPT Go не подходит, нужна Plus

Пост 200: KnowNote + DeepTutor (локальные NotebookLM)

KnowNote: эмбеддер без настройки размерности, RAG не работал
DeepTutor (10K ⭐): зависимости, LightRAG, RAGAnything
Ollama POST-запросы некорректны → LM Studio
Проблема с переполнением контекста (36 API-вызовов)
LM Studio: частичный инференс на GPU

Пост 202: Мем (взаимный Agentic Looping)

Пост 203: Kimi для генерации слайдов

ChatGPT/Gemini/Perplexity: текст в пару предложений
Kimi.com: достойные слайды про RAG (во вложении)
Лимиты жёсткие

Пост 204: LLM в RecSys (follow-up)

OneRec/MiniOneRec (Kuaishou): Semantic IDs, 25% трафика, 400M DAU
PLUM (YouTube/Google): CPT на доменных данных
RecAI/InteRecAgent (Microsoft), RecGPT/RecGPT-V2 (Taobao): LLM-оркестратор
PinRec (Pinterest), LinkedIn Retrieval: dual-encoder
RoLLMRec (2026): промпт-инъекции в описания товаров, защита через RAG-валидацию

Пост 205: Anthropic обвиняет китайские AI

16M+ запросов через фейковые аккаунты
Claude на китайском отвечает что он DeepSeek

Пост 206: (пропущен / удалён)

Пост 207: Парадокс Джевонса

Технологический прогресс увеличивает эффективность → увеличивает потребление
indeed.com: вакансии разработчиков растут (vibe coding)

Пост 208: Python митап

Выступление про публикацию в open source
100+ человек, обещали футболку 🤨

Пост 209: Мультиязычные LLM

One ruler to measure them all: Benchmarking multilingual long-context language models (arxiv 2025)
Польский (88%) > русский (84%) > английский (83.9%)
Тестировались слабые модели: Gemini-1.5-Flash, Qwen 2.5 72B
Разница значимее на длинном контексте

Пост 210: Open Source LLM Spring 2026

Обзор от Sebastian Raschka — что нового в опенсорс за 2 месяца:
Sliding Window Attention у всех, контекст растёт, модели не толстеют
QK-Norm как аналог RMSNorm
Мультимодальные модели (Kimi k2.5 претрейн на изображениях)
GLM-5 от Z.ai — на уровне GPT-5.2/Opus 4.5, внутри DeepSeek-V2
Step 3.5 Flash (196B) — сопоставим с DeepSeek, в 3x быстрее, Multi-Token Prediction

Пост 211: AIConf 2026 (20 апреля, Москва)

Мультиагентные системы и RAG
Стабильные результаты от LLM
Обоснование технологий бизнесу
Экономика AI / инфраструктура
400+ участников, спикеры из Сбера, Яндекса, VK

Пост 212: Clawbot / OpenClaw опыт

Поднял на VPS, старая версия библиотеки
OpenRouter — бесплатные модели не такие уж бесплатные
Локальный Qwen — tool calling падал из-за абсолютных путей
Без контекста 200k всё падает
Вывод: рано для само-хостинга, лучше коробочные решения (Kimi, GLM) но нужна подписка

Пост 215: Colleague Skill (цифровой двойник)

Система оцифровки сотрудника в AI-агента
Стилистический промпт + мета-информация + переписки
Три файла на выходе: стиль общения, решение задач, стек
Зафорсилось в Китае
Claude как кодинг-агент и так хорош

Пост 216: Z.ai цены

GLM 5.1 подписка подорожала в 2 раза до $160
Лучшие в опенсорсе, но подписки как у проприетарных

Пост 217: Внедряем 🙂

(19 😁 — мем-пост)

Пост 218: RAG SOTA benchmarks (SEQUOIA)

Классический пайплайн: Hybrid Retrieval + reranker + суммаризация
Step-back prompting, Agentic RAG
LightRAG — графовая альтернатива векторным базам
RAPTOR — дерево с кластеризацией листьев
SEQUOIA = RAPTOR + step-back prompting = SOTA
Проверено 7 методов: No-RAG, Classical, Hybrid, LightRAG, PageIndex, GraphRAG, Agentic, SEQUOIA, SEQUOIA Pro
Репо: https://github.com/Diyago/rag-benchmark

Пост 219: Первое приседание

(отсеял часть решений)

Пост 220: AI Conf отчёт

Публикации индустрии — среднее время 9 месяцев, LLM для кода/ревью уже норма
Воркшопы: search-агенты (ReAct + Groq + Tavily), мониторинг (Langfuse)
Agent Harness (Deep Agents) — память + скиллы, но дорого (2M токенов на скилл, 100K на вызов)
Голосовые агенты: Speech-to-Text → LLM → Text-to-Speech, проблемы с latency и перебиваниями
LLM-контент на YouTube: обложка + сценарий + контент = легко распознать по капс-заголовкам
Еда по талонам — котлетка с пюрешкой

Пост 221: 💀

(18 😁 — мем)

Пост 222: 100 триллионов токенов от Xiaomi

(мем/новость)

Пост 224: Russian Speech-To-Text бенчмарк

Сравнил Whisper vs GigaAM-RNNT/CTC vs мультимодальные модели
GigaAM на порядок быстрее Whisper при сопоставимых метриках
Мультимодальные модели — медленно, качество проседает
LLM-постпроцессинг улучшает качество
Репо: https://github.com/Diyago/tts_bench
WER/CER метрики

Пост 225: AI для готовки

ChatGPT для готовки с 5й версии
Кимчи, radis sauté au beuvre
Создание реальной добавленной стоимости 😅

Пост 226: Стэнфорд исследование

Найм проседает из-за AI в первую очередь у джунов
Разработка и клиентская поддержка — сильнее всего
https://digitaleconomy.stanford.edu/...

Пост 227: Книга "Займись ничем"

Польза прокрастинации
Непрерывный фокус перегружает префронтальную кору
Default Mode Network (DMN) — пассивный режим мозга ловит инсайты

Пост 228: Freebuff (вайбкодинг)

https://freebuff.com/ — бесплатные лимиты
5 сессий по часу в день
Модели: DeepSeek V4 Pro, Kimi K2.6, DeepSeek V4 Flash, MiniMax M2.7
Собирают данные для обучения через API
Обрывает часовые сессии
Установка: npm install -g freebuff

Собрано: 2026-05-31
Источник: t.me/s/ai_tablet (public preview)
Метод: web_fetch через t.me/s/ URL (без авторизации)

More AI engineering notes, RAG benchmarks, and production insights from inside a bank — follow my Telegram channel:

🚀 https://t.me/ai_tablet (Russian, technical)