Inti Masalah (TL;DR)
Agen AI dapat menulis kode, memanggil API, dan menjalankan alur kerja multi-langkah. Namun, hingga kini, mereka belum mampu mengedit video. Alat seperti After Effects dan DaVinci Resolve menggunakan linimasa berlapis dan grafik adegan JSON yang tidak familiar bagi LLM. HeyGen merilis HyperFrames, solusi open source yang memungkinkan agen AI membuat video dengan HTML, CSS, dan JavaScript, lalu merendernya ke MP4, MOV, atau WebM. Instalasi sebagai skill Claude Code hanya butuh satu perintah—dan kini agen Anda bisa mengedit video.
Pendahuluan
Video adalah format komunikasi paling menarik di web, namun rantai alat untuk video masih rumit bagi agen AI. Model generatif seperti Sora, Veo, atau Runway hanya menghasilkan satu video monolitik per prompt—tidak bisa dikomposisikan, diulang, atau diubah per adegan.
HeyGen merilis HyperFrames pada 17 April 2026 untuk mengatasi masalah ini. Alih-alih memaksa agen mempelajari perangkat lunak video tradisional, mereka memanfaatkan format yang sudah dikuasai: HTML. Panduan ini membahas cara kerja HyperFrames, alasan teknis di balik pendekatan ini, serta langkah implementasi agar agen Anda mampu mengedit video.
Jika Anda membangun workflow agen berbasis API yang menghasilkan video, pengujian orkestrasi jadi krusial—bagian ini akan dibahas di akhir bersama Apidog.
Mengapa Agen AI Tidak Bisa Mengedit Video Sebelumnya
Alat pengeditan video tradisional dibuat untuk manusia, bukan agen. Tiga hambatan utama:
- UI linimasa tidak cocok untuk kode. After Effects, Premiere, dan DaVinci Resolve menyimpan proyek dalam format biner atau JSON yang sangat berlapis—nyaris tidak ada data pelatihan untuk LLM.
- Animasi visual sulit dikuasai tanpa pratinjau. Keyframe, easing, dan komposit layer biasanya dilakukan secara visual, bukan berbasis teks.
- Alat berasumsi operator manusia. Pipeline rendering, plugin, dan codec dikontrol lewat UI, bukan API. Otomatisasi via skrip sangat terbatas.
Akhirnya, agen hanya bisa memanggil ffmpeg untuk tugas sederhana. Hal lebih kompleks tetap butuh manusia.
Wawasan HTML-untuk-video
Tim HeyGen sadar bahwa LLM telah dilatih pada milyaran halaman HTML, CSS, dan JavaScript—termasuk ribuan animasi GSAP, SVG, Canvas, dan file Lottie.
Ketika diminta membuat animasi visual, model dengan mudah menulis HTML dan CSS. Agen tahu cara:
- Memosisikan elemen dengan CSS
- Menganimasikan dengan GSAP atau CSS keyframe
- Merender SVG
- Menyusun layer dengan
z-indexdanopacity - Melakukan tween antar state
Semua primitif visual ini sudah tersedia di browser. Yang kurang hanya satu: cara mengubah linimasa HTML menjadi video yang dirender.
Itulah fungsi HyperFrames: HTML menjadi frame video.
Cara Kerja HyperFrames
HyperFrames menambahkan beberapa atribut data- pada HTML untuk mendefinisikan linimasa video. Selebihnya adalah kode web biasa.
| Atribut | Tujuan |
|---|---|
data-composition-id |
ID unik untuk komposisi video |
data-width / data-height
|
Resolusi output dalam piksel |
data-start |
Waktu mulai adegan dalam detik |
data-duration |
Durasi adegan dalam detik |
data-track-index |
Urutan layer untuk adegan tumpang tindih |
Agen menulis HTML seperti biasa. HyperFrames membaca atribut ini, menjalankan HTML di headless browser, menangkap frame pada framerate target, dan meng-encode hasilnya dengan FFmpeg.
Tidak ada DSL baru, tidak ada editor keyframe, tidak ada grafik adegan. Animasi hidup dalam GSAP timeline atau CSS animation.
Contoh Minimal
Komposisi video 5 detik, dua adegan, kurang dari 70 baris HTML:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<script src="https://cdn.jsdelivr.net/npm/gsap@3.14.2/dist/gsap.min.js"></script>
<style>
body { margin:0; width:1920px; height:1080px; overflow:hidden; background:#0D1B2A; }
.scene { position:absolute; inset:0; width:1920px; height:1080px; overflow:hidden; background:#0D1B2A; }
#scene2 { z-index:2; opacity:0; }
.s1 { display:flex; flex-direction:column; justify-content:center; padding:120px 160px; gap:20px; }
.s2 { display:flex; flex-direction:column; justify-content:center; align-items:center; padding:100px 160px; gap:32px; }
</style>
</head>
<body>
<div id="root" data-composition-id="hyperframes-intro"
data-width="1920" data-height="1080" data-start="0" data-duration="5">
<div id="scene1" class="scene">
<div class="s1">
<div class="s1-title">HTML is Video</div>
<div class="s1-sub">Compose. Animate. Render.</div>
</div>
</div>
<div id="scene2" class="scene">
<div class="s2-title">Start composing.</div>
</div>
</div>
<script>
window.__timelines = window.__timelines || {};
const tl = gsap.timeline({ paused: true });
// Scene 1: title entrance
tl.from(".s1-title", { x:-40, opacity:0, duration:0.5, ease:"power3.out" }, 0.25);
tl.from(".s1-sub", { y:15, opacity:0, duration:0.4, ease:"power2.out" }, 0.5);
// Blur crossfade transition
const T = 2.2;
tl.to("#scene1", { filter:"blur(8px)", scale:1.03, opacity:0, duration:0.35, ease:"power2.inOut" }, T);
tl.fromTo("#scene2",
{ filter:"blur(8px)", scale:0.97, opacity:0 },
{ filter:"blur(0px)", scale:1, opacity:1, duration:0.35, ease:"power2.inOut" }, T + 0.08);
window.__timelines["hyperframes-intro"] = tl;
</script>
</body>
</html>
Catatan:
- Logika animasi sepenuhnya GSAP; LLM yang dilatih GSAP bisa menulis linimasa seperti ini.
-
Overhead HyperFrames hanya atribut
data-pada elemen root.
Render file ini: hasilnya MP4 1920x1080 dari animasi di atas. Ubah teks, warna, font, atau logo—semua tinggal edit HTML.
Apa Saja Teknologi Web yang Didukung Agen
Karena pipeline render berbasis browser, semua stack web bisa digunakan:
- Animasi & transisi CSS untuk gerakan sederhana
- GSAP timeline untuk koreografi kompleks
- SVG untuk logo, shape, dan animasi path
- Canvas untuk efek partikel/generatif
- Three.js untuk adegan 3D
- D3.js untuk data visualization
- Lottie untuk animasi After Effects
- Font web (Google Fonts atau custom)
-
Video/image background dengan
<video>dan<img>
Tanpa wrapper atau framework tambahan. Agen langsung pakai apa yang sudah mereka tahu.
Cara Memberi Agen Kemampuan Editing Video dalam Satu Perintah
HyperFrames tersedia sebagai skill Claude Code. Instalasi:
npx skills add heygen-com/hyperframes
Perintah ini akan mengambil skill dari GitHub HeyGen, menginstal toolchain, dan menambahkan fungsi editing video ke Claude Code.
Setelah terpasang, Anda bisa memberi perintah alami ke agen:
Buat saya video penjelas produk 10 detik untuk API baru.
Mulai dengan latar belakang gradien gelap, animasikan nama produk
meluncur dari bawah dengan fade, lalu potong ke tiga
poin-poin dengan ikon, akhiri dengan kartu panggilan-untuk-bertindak.
Agen menulis HTML, pratinjau lokal, dan render MP4—langsung di mesin Anda, tanpa API eksternal.
Pengaturan Tanpa Claude Code
HyperFrames framework-agnostik—bisa dipakai di agen apa saja yang mendukung shell dan file.
- Kloning repo:
git clone https://github.com/heygen-com/hyperframes
cd hyperframes
npm install
- Render file komposisi:
npx hyperframes render my-video.html --output my-video.mp4
- Pratinjau lokal:
npx hyperframes preview my-video.html
Perintah preview akan membuka browser untuk memeriksa linimasa sebelum render penuh.
Apa yang Dibuka untuk Pengembang
Kasus penggunaan praktis:
- Otomasi pemasaran produk: Agen menarik release notes, buat HTML adegan, lalu render & unggah ke CDN.
- Video personalisasi: API webhook memicu agen untuk merender video per event user (welcome, kwitansi, milestone, dsb).
- Data storytelling: Agen merangkum metrik ke visualisasi D3 dalam scene HyperFrames, output narasi dashboard otomatis.
- B-roll dinamis untuk podcast/konten panjang: Agen membaca transkrip, menghasilkan motion graphic per poin, layer ke audio.
- Video dokumentasi API: Parsing OpenAPI, buat panduan endpoint dengan diagram animasi, ekspor jadi klip siap pakai.
Menguji Orkestrasi Agen dengan Apidog
HyperFrames mengurus rendering video, tapi orchestrasi hulu (loop agen, panggilan alat, permintaan API LLM) sering jadi sumber kegagalan.
Apidog menyediakan lingkungan pengujian untuk semua aspek selain render:
- Mock endpoint LLM: Buat endpoint tiruan Claude/OpenAI di Apidog dengan skema sesuai kebutuhan agen, uji respons error/timeout sebelum memakai API berbayar.
- Validasi payload alat: Endpoint API eksternal (pengambilan aset, brand kit, dsb) bisa diuji skema dan strukturnya dengan Apidog.
- Tracking konsumsi token: Claude Opus 4.7 menghasilkan token lebih banyak—pantau penggunaan prompt di Apidog agar tidak terjadi pemborosan biaya.
- Debug alur multi-turn: Video sering butuh 5-10 giliran LLM (draft, revisi, timing, animasi, dsb). Apidog memungkinkan replay percakapan untuk menemukan bug orkestrasi.
Argumen Filosofis
Tim HeyGen percaya HTML bukan hanya format nyaman untuk video agen—tapi format yang tepat untuk masa depan video.
Alasannya jelas: video tradisional dikunci vendor, HTML terbuka, standar, versionable, searchable, dan bisa diedit di mana saja.
Jika standar video masa depan berbasis HTML:
- Dapat dibandingkan di git: Lihat perubahan antar revisi.
- Dapat dikomponenkan: Kartu judul = React component; motion graph = modul import.
- Responsif: Satu komposisi bisa di-render ke 1080p, 4K, atau vertikal tanpa rebuild.
- Aksesibel: Screen reader langsung membaca source.
- Dapat dicari: Teks dalam video adalah teks asli, bukan hasil OCR.
Semua sudah tersedia di browser. HyperFrames hanya menjembatani ke format video.
Batasan yang Perlu Diketahui
HyperFrames masih versi 1. Beberapa batasan:
- Kecepatan render tergantung kompleksitas: Scene Three.js/Canvas lebih berat dari GSAP text.
-
Input video live terbatas:
<video>didukung, tapi kamera/streaming real-time butuh kode tambahan. - Audio masih dasar: Trek audio bisa ditambahkan, mixing canggih tetap via FFmpeg pasca-render.
- Kreativitas agen tergantung model: Opus 4.7 paling stabil untuk workflow ini.
Perhatikan batasan ini jika membangun pipeline produksi.
Daftar Periksa Memulai
Ingin langsung coba HyperFrames?
- [ ] Instal Claude Code (atau agen pilihan)
- [ ] Jalankan
npx skills add heygen-com/hyperframes - [ ] Perintah agen membuat video sederhana 5 detik
- [ ] Render output & cek hasil MP4
- [ ] Iterasi: ubah gaya, timing, jumlah scene
- [ ] Untuk workflow API, siapkan endpoint LLM & tools di Apidog
- [ ] Buat satu video nyata (teaser produk, data story, ringkasan rilis)
- [ ] Beri bintang ke github.com/heygen-com/hyperframes
Kesimpulan
Agen AI sudah lama bisa membuat kode, tapi editing video masih jadi domain kreatif yang membutuhkan manusia. HyperFrames menghilangkan batasan ini—agen cukup menulis HTML, CSS, dan JavaScript seperti biasa.
Pendekatan ini sederhana, fleksibel, dan mampu menghasilkan motion graphic berkualitas tinggi. Jika workflow Anda butuh output video (otomasi pemasaran, konten personalisasi, data storytelling, dokumentasi API), HyperFrames wajib ada di stack Anda.
Untuk lapisan API & orkestrasi, selalu uji skenario agen, tools, dan permintaan LLM Anda di Apidog sebelum scale-up. Permintaan API gagal = video tidak pernah ter-render.

Top comments (0)