DALL-E nedir? DALL-E: Metinden görüntü oluşturma

#tutorial #computerscience #python #programming

Dilde ifade edilebilen çeşitli kavramlar için başlıklarından görüntüler oluşturan DALL·E adlı bir sinir ağı. Yani Yapay zekâ alanının içerisinde bir derin öğrenme ürünüdür.

DALL·E, metin-görüntü çiftlerinden oluşan bir veri kümesi kullanarak metin açıklamalarından görüntüler oluşturmak üzere eğitilmiş, GPT-3'ün 12 milyar parametreli bir sürümüdür. [GPT-3, insanların yazdığı metinlere benzer içerik üretmek için derin öğrenmeyi kullanan özbağlanımlı dil modelidir.]

Teknik bilgiyi bir kenarı bırakırsak milyarlarca veri üzerinde eğitilmiş bir yapay zekadır. Bu yapay zekanın görevi girdiğimiz kelimelere göre bize görsel oluşturmasıdır. Aklınıza gelebilecek her şeyin görüntülerini üretebilir.

Daha fazla nesne tanıtıldıkça, DALL·E nesneler ve renkleri arasındaki ilişkileri karıştırmaya eğilimlidir ve başarı oranı keskin bir şekilde düşer. Yani her eklediğiniz kelime yapay zekanın dahada zorlanmasına yol açacaktır.

Dall-E sayesinde daha önce hiç oluşturulmamış tasarımlar oluşturmanız mümkün. Hayal gücünü aşan görseller ortaya çıkarabilir.

Bir örnek verirsek;