DEV Community

Cover image for Holo3: En İyi Bilgisayar Kullanım Modeli Mi?
Tobias Hoffmann
Tobias Hoffmann

Posted on • Originally published at apidog.com

Holo3: En İyi Bilgisayar Kullanım Modeli Mi?

TL;DR

H Şirketi, 31 Mart 2026'da OSWorld-Verified karşılaştırma testinde %78,85 puan alan ve GPT-5.4 ile Opus 4.6'yı düşük maliyetle geride bırakan Holo3 adlı bilgisayar kullanım modeli ailesini tanıttı. API an itibariyle yayında, 35B varyantı ise Apache 2.0 ile HuggingFace’te açık ağırlıklı olarak yer alıyor.

Apidog'u bugün deneyin

Çoğu geliştiricinin çözemediği bilgisayar kullanım boşluğu

API'larınızı otomatikleştirdiniz, CI/CD hattınız sorunsuz. Ama hâlâ otomasyonu bozan bir iş türü var: API’si olmayan eski kurumsal yazılımlar, REST öncesi masaüstü uygulamaları, çok adımlı kullanıcı arayüzleriyle dolu iş akışları.

Geleneksel RPA araçları (UiPath, Automation Anywhere) kırılgan ekran koordinatı betikleriyle bu işleri yapar; UI değiştiğinde otomasyon bozulur. Alternatif çoğu zaman manuel çalışmadır.

Bilgisayar kullanımında yapay zeka bu denklemi değiştiriyor: Ekran görüntülerini analiz edip tıklama, yazma ve kaydırma gibi işlemleri API olmadan, doğrudan GUI üzerinde yapan modeller artık mümkün. H Şirketi'nin 31 Mart 2026’da duyurduğu Holo3, bu tür görevler için şu an kamuya açık en güçlü model.

💡 Masaüstü yazılımlarına dokunan otomasyon iş akışları veya test hatları geliştiriyorsanız, Holo3 API’sini anlamak kritiktir. API’larınızı tasarlamak ve test etmek için Apidog kullanıyorsanız, aşağıda Holo3 çağrılarını iş akışınıza nasıl entegre edeceğinizi adım adım bulacaksınız.

Holo3 Nedir?

Holo3 bir bilgisayar kullanım modeli: Bir masaüstü ya da tarayıcı ekran görüntüsü verirsiniz, görev tanımı girersiniz, model ise o ekranda hangi eylemlerin (tıklama, yazma, kaydırma) yapılacağını JSON olarak döndürür. Her adımda ekran görüntüsü ve çıktı güncellenir, döngü görev bitene kadar devam eder.

Holo3 çalışma prensibi

İki varyant mevcut:

  • Holo3-122B-A10B — 122B parametre, 10B aktif (MoE). Sadece hcompany.ai/holo-models-api üzerinden API ile erişilebilir. Karşılaştırma testlerinde lider.
  • Holo3-35B-A3B — 35B parametre, 3B aktif. Apache 2.0 ile HuggingFace’te açık ağırlıklı. H Şirketi'nin API’sinde ücretsiz katman var, lokal çalıştırmaya uygun.

MoE (uzmanlar karışımı) mimarisi sayesinde, parametrelerin sadece bir kısmı aktif olur; bu da çalışma maliyetini ciddi şekilde düşürür. Holo3-122B-A10B, görev başına GPT-5.4 ve Opus 4.6’dan daha az maliyetli.

OSWorld-Verified: Karşılaştırma Testinin Gerçek Ölçütü

OSWorld-Verified, bilgisayar kullanımı için tasarlanmış bir karşılaştırma testidir. Sadece çıktı metniyle değil, gerçek bir bilgisayarda gerçek görevlerin tamamlanmasıyla ölçüm yapar ve sonuçlar sistemin gerçek durumuyla doğrulanır.

Görevler örnekleri:

  • Tek uygulama: Dosya açma, form doldurma
  • Uygulamalar arası: PDF’den veri çekip tabloya aktarma, e-posta gönderme
  • Çok uygulamalı diziler: Birden fazla sistemde, bağlamı kaybetmeden işlem yapmak

Holo3-122B-A10B bu testte %78,85 puan alıyor. Önceki lider modeller %60-65 bandındaydı; Holo3 bu barajı açık ara geçti.

Holo3 kıyas grafiği

H Kurumsal Karşılaştırma Testleri'nde (çok uygulamalı, e-ticaret, iş yazılımları, işbirliği) Holo3 özellikle uygulamalar arası görevlerde öne çıkıyor.

Holo3 Nasıl Eğitildi: Ajan Öğrenme Çarkı

Holo3’ün başarısının anahtarı, sürekli döngüsel bir eğitim yaklaşımı:

  1. Sentetik Navigasyon Verileri: İnsan ve üretici talimatlarla senaryoya özel örnekler üretildi.
  2. Alan Dışı Zenginleştirme: Senaryolar, beklenmedik UI durumları ve uç vakaları da içerecek şekilde genişletildi.
  3. Küratörlü Takviyeli Öğrenme: Her örnek filtrelendi ve RL hattında görev tamamlama oranı maksimize edildi.

Eğitim verileri, sıfırdan kurumsal web uygulamalarını oluşturan Sentetik Ortam Fabrikası’ndan sağlandı; her ortam, uçtan uca doğrulanabilir görevler içeriyor.

Sonuç: Holo3, daha fazla parametreye sahip temel modelleri geride bırakıyor. Farkı mimari değil, eğitim yöntemi yaratıyor.

Holo3 API’si Nasıl Çağrılır?

Aşağıdaki adımlarla Holo3 API’sini doğrudan iş akışınıza entegre edebilirsiniz.

1. Kimlik Doğrulamayı Ayarlayın

# H Company Çıkarım API temel URL'si
https://api.hcompany.ai/v1

# Başlıklar
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode

API anahtarınızı hcompany.ai/holo-models-api üzerinden alın. Ücretsiz katman Holo3-35B-A3B’yi kapsar.

2. Ekran Görüntüsünü Gönderin

import base64
import httpx

# Ekran görüntüsü alma (örnek: pyautogui)
import pyautogui
screenshot = pyautogui.screenshot()
screenshot.save("/tmp/screen.png")

with open("/tmp/screen.png", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = httpx.post(
    "https://api.hcompany.ai/v1/computer-use",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    json={
        "model": "holo3-122b-a10b",
        "task": "Fatura klasörünü açın ve en son PDF'i bulun",
        "screenshot": image_b64,
        "screen_width": 1920,
        "screen_height": 1080
    }
)

action = response.json()
print(action)
Enter fullscreen mode Exit fullscreen mode

3. Eylemi Ayrıştırıp Yürütün

API şu formatta yapılandırılmış bir eylem döndürür:

{
  "action_type": "click",
  "coordinate": [245, 380],
  "reasoning": "Fatura klasörü simgesi bu konumda görünür."
}
Enter fullscreen mode Exit fullscreen mode

Dönüş türleri: click, double_click, right_click, type, key, scroll, screenshot_request, task_complete.

4. Tamamlanana Kadar Döngüye Alın

def run_computer_use_task(task: str, max_steps: int = 20):
    for step in range(max_steps):
        screenshot = capture_screen()
        response = call_holo3_api(task, screenshot)
        action = response["action"]

        if action["action_type"] == "task_complete":
            print(f"Görev {step + 1} adımda tamamlandı")
            return response["result"]

        execute_action(action)

    raise TimeoutError("Görev adım limitinde tamamlanamadı")
Enter fullscreen mode Exit fullscreen mode

Holo3 API Çağrılarını Apidog ile Test Etme

API entegrasyonunuzu güvenilir kılmak için Apidog kullanabilirsiniz.

  • Uç nokta ekleyin: Apidog’da https://api.hcompany.ai/v1/computer-use için yeni HTTP isteği oluşturun. Authorization başlığını ortam değişkeni olarak ekleyin.
  • Yanıt doğrulama ayarlayın: Apidog’un test iddiaları ile yanıt yapısını otomatik kontrol edin:
// Apidog yanıt sonrası betik
pm.test("Eylem türü geçerli", () => {
    const validActions = ["click", "type", "key", "scroll", "task_complete", "screenshot_request"];
    pm.expect(validActions).to.include(pm.response.json().action.action_type);
});

pm.test("Koordinatlar ekran sınırları içinde", () => {
    const action = pm.response.json().action;
    if (action.coordinate) {
        pm.expect(action.coordinate[0]).to.be.within(0, 1920);
        pm.expect(action.coordinate[1]).to.be.within(0, 1080);
    }
});
Enter fullscreen mode Exit fullscreen mode
  • Geliştirme sırasında sahte yanıtlar: Apidog’un Smart Mock özelliği ile canlı API’yi tüketmeden gerçekçi Holo3 yanıtları üretin, entegrasyon testi ve ön uç geliştirme için kullanın.
  • Test senaryosu zincirleme: Birden fazla Holo3 API çağrısını Apidog Test Senaryosu’nda zincirleyip, çok adımlı görev döngüsünü simüle edin.

Holo3 vs Claude Bilgisayar Kullanımı vs OpenAI Operatörü

Holo3-122B Holo3-35B Claude Bilgisayar Kullanımı OpenAI Operatörü
OSWorld-Verified %78,85 ~%55 ~%65 ~%62
API erişimi Evet Evet Evet Evet
Açık ağırlıklar Hayır Evet Hayır Hayır
Kendi barındırma Hayır Evet Hayır Hayır
GPT-5.4’e göre maliyet Daha düşük Çok daha düşük Karşılaştırılabilir GPT-5.4 fiyatı
En uygun Üretim Test/Geliştirme Anthropic ekosistemi OpenAI ekosistemi

Pratik seçim yığınınıza bağlı:

  • Karmaşık, çok uygulamalı iş akışlarında en yüksek doğruluk ve güvenilirlik için Holo3-122B
  • Geliştirme, test, açık kaynak ve kendi barındırma için Holo3-35B
  • Anthropic ekosisteminde derin entegrasyon için Claude Bilgisayar Kullanımı
  • OpenAI ile tek satıcı ilişkisi için OpenAI Operatörü

Kurumsal Kullanım Senaryoları

Holo3 ile API’si olmayan iş akışlarını otomatikleştirin:

  • Eski sistem veri girişi: REST API’si olmayan ERP/CRM’lerde GUI üstünden veri girip çekin.
  • Platformlar arası mutabakat: PDF’den değer alıp tabloya yazıp pano güncelleyin – tüm akışı otonom yönetin.
  • Web uygulamaları regresyon testi: Kırılgan Selenium yerine sade dilde görev tanımıyla Holo3’e test yaptırın.
  • Rekabetçi istihbarat: Standart kazımayı engelleyen sitelerden düzenli veri çıkarın.

Holo3, çok uygulamalı iş akışlarında özellikle rakiplerinden daha iyi performans gösteriyor.

Sırada Ne Var: Uyarlanabilir Ajans

H Şirketi’nin odaklandığı bir sonraki adım: Uyarlanabilir Ajans — Model, daha önce hiç görmediği kurumsal yazılımlarda gerçek zamanlı olarak nasıl gezileceğini öğrenebilecek. Böylece, tamamen özel araçlarda bile eğitim verisine ihtiyaç olmadan görevler yapılabilecek.

Bu başarıldığında, bilgisayar kullanımı yapay zekasının kurumsal dağıtımda kalan ana sınırlaması kalkacak.

Sonuç

Holo3, masaüstü bilgisayar kullanımında yeni bir standart getiriyor. OSWorld-Verified’da %78,85 ile çok adımlı görevlerde rakiplerini geride bırakıyor. Holo3-35B-A3B’nin ücretsiz ve açık ağırlıklı sürümü, maliyetsiz test olanağı sunuyor.

Entegrasyon modeli basit: Ekran görüntüsü al, API’ye POST et, dönen eylemi uygula, tekrarla. Apidog ile yanıt yapıları doğrulanır, geliştirme sırasında sahte yanıtlarla test edilir, canlıya geçmeden önce tüm senaryolar zincirlenir.

Masaüstü GUI otomasyonu, test, ya da veri çıkarmada Apidog'u ücretsiz deneyin ve Holo3 entegrasyonunuzu canlıya almadan güvenle test edin.

SSS

Holo3 nedir?

Holo3, H Şirketi'nin bir bilgisayar kullanım yapay zeka modelidir; ekran görüntüsü alır ve masaüstünde/tarayıcıda görevleri tamamlamak için eylem dizisi üretir. OSWorld-Verified testinde %78,85 ile en yüksek puanı almıştır.

Holo3 açık kaynak mı?

Holo3-35B-A3B varyantı Apache 2.0 ile açık ağırlık ve HuggingFace’te indirilebilir. 122B modeli sadece API ile kullanılabilir. İki model de H Şirketi API’si üzerinden erişilebilir; 35B için ücretsiz katman var.

OSWorld karşılaştırma testi nasıl çalışır?

OSWorld, yapay zeka ajanlarını gerçek bilgisayar görevlerinde test eder. Başarı, çıktı değerlendirmesiyle değil, ajanın işlemleri sonrası sistem durumunun kontrolüyle ölçülür. Görevler tek uygulamadan çok uygulamalı dizilere kadar çeşitlidir.

Holo3, Claude Bilgisayar Kullanımı ile nasıl karşılaştırılır?

Holo3-122B daha yüksek skor alır (%78,85 vs. Claude ~%65) ve görev başına daha ucuzdur. Claude Bilgisayar Kullanımı ise Anthropic API’sini zaten kullanan ekipler için uygundur.

Holo3’ü yerel olarak çalıştırabilir miyim?

Evet, Holo3-35B-A3B ile mümkün. Ağırlıklar Apache 2.0 ile HuggingFace’te mevcut. 122B modeli sadece API’dır.

Bilgisayar kullanımı API’lerinin ana kullanım alanları nelerdir?

Eski sistem otomasyonu, uygulamalar arası veri akışı, kırılgan seçiciler olmadan web test otomasyonu, rekabetçi istihbarat kazıma ve manuel insan etkileşimi gerektiren masaüstü iş akışları.

Holo3 API entegrasyonumu nasıl test ederim?

Uç noktayı içe aktarın, yanıt doğrulama iddialarını kurun, geliştirme sırasında API’yi taklit edin ve istekleri Apidog test senaryolarında zincirleyin. Böylece canlı makinelerde çalıştırmadan önce entegrasyon hatalarını yakalarsınız.

Holo3’ün yol haritasındaki “Uyarlanabilir Ajans” nedir?

H Şirketi, önceden eğitim verisine ihtiyaç duymadan daha önce hiç görmediği kurumsal yazılımlarda gezinebilen, UI yapısını gerçek zamanlı öğrenen modeller geliştirmektedir. Bu, tamamen özel kurumsal dağıtımlar için kalan sınırlamayı ortadan kaldıracaktır.

Top comments (0)