YAPAY ZEKA İLE GÖRSEL OLUŞTURMA

Yapay zeka, bilgisayar sistemlerinin insan benzeri zekaya benzer özellikleri taklit etmek veya gerçekleştirmek için tasarlandığı bir bilim dalıdır. Bu sistemler, veri analizi, öğrenme, problem çözme ve dil anlama gibi görevleri gerçekleştirebilir. Yapay zeka, bilgisayar programlarını geliştirme ve tasarlama süreçlerini içerir. 

Bir yapay zeka aynı zamanda kelimeleri, cümleleri kolaylıkla görsele dönüştürebilir. Üstelik bunu hiçbir sınırlama olmadan özgürce yapabilir. Bu yolla, hayalini kurduğumuz veya tasarlamak istediğimiz birçok şeyi somut olarak görebilir veya yapılmış diğer pek çok çalışmadan ilham alarak kendi çalışmalarımızı geliştirebiliriz. Fakat unutmamız gerekir ki yapay zeka programları aslında sıfırdan yeni bir şey üretmiyor, yalnızca daha önce yapılmış işleri baz alarak talep edilen işleri oluşturuyor. Yani oluşturmuş olduğunuz her görsel bu zamana kadar yapılmış olan sanat eserlerinin ve üretilen çalışmaların kolektif bir yansıması olarak karşımıza çıkıyor.

Kelime veya metinleri resme dönüştürme konsepti, özellikle “text-to-image synthesis” olarak bilinir. Bu tür bir yapay zeka uygulaması, metin tabanlı açıklamalar veya kelimeler kullanılarak görsel içeriklerin oluşturulmasını amaçlar. İşte bu tür bir sürecin nasıl işlediğini açıklayan temel adımlar:

  1. Veri Toplama ve Eğitim Veri Seti Oluşturma: Eğitim için geniş bir veri seti gerekir. Bu set, metin açıklamaları ile eşleştirilmiş görsel içerikleri içermelidir. Örneğin, “bir deniz manzarası” ifadesi ile bir deniz manzarasını içeren resimleri içeren bir veri seti oluşturulabilir.
  1. Metin Gömme (Text Embedding): Metin verilerini sayısal vektörlere dönüştürmeyi içerir. Bu, metin verilerinin sayısal bir temsilini elde etmek için kullanılır. Yapay zeka modeli, bu sayısal vektörleri kullanarak metinle ilgili özellikleri öğrenir.
  2. Görsel Öğrenme Modelinin Eğitimi: Genellikle Convolutional Neural Networks (CNN) gibi özel görsel işleme modelleri kullanılır. Metin gömme ve görsel verilerin birleştirilmesi ile model, metin açıklamalarına dayanarak görsel içerikleri oluşturmayı öğrenir.
  3. Metinden Görsel İçerik Üretimi: Eğitilen model, belirli bir metin girdisi alır ve bu metni temsil eden bir görsel çıktı oluşturur. Örneğin, “vazodaki çiçekler” ifadesi ile model, bir vazodaki çiçekleri içeren bir resim üretebilir.
  4. Sonuçların Değerlendirilmesi ve Ayarlamalar: Üretilen görsellerin kalitesi ve doğruluğu değerlendirilir. Modelin performansını artırmak veya özelleştirmek için gerektiğinde ayarlamalar yapılabilir.

Yapay Zeka İle Görsel Oluşturma Programlarını Hangi amaçlar için kullanabiliriz?

  • Eğitim:Eğitimciler ve öğrenciler için etkileşimli ders içeriği oluşturmak için idealdir. Öğretmenler, eğitim materyallerini daha çekici hale getirebilirler.
  • Eğlence: Kişisel ilgi alanlarınıza veya hobilerinize dayalı yaratıcı içerikler oluşturabilirsiniz. Örneğin, bloglar, podcastler, sanatsal projeler veya video içerikleri hazırlayabilirsiniz.
  • Sosyal medya:Çeşitli sosyal medya platformlarında paylaşmak üzere görsel içerikler oluşturmak amacıyla  kullanabilirsiniz. Görsel olarak ilgi uyandırıcı içerikler, kişi ve kurumları çekmek ve etkilemek için önemlidir.

Text-to-image synthesis konseptini uygulayan birkaç yapay zeka modeli ve program örnekleri:

Mindjourney: 

Yapay zeka teknolojisi, son yıllarda birçok alanda hayatı kolaylaştırma noktasında giderek önem kazanmaktadır. Son zamanların popüler uygulamalarından birisi olan Midjourney de bu teknolojinin son kullanıcıları için sunulan bir uygulama örneğidir. Kendisine verilen kelimeleri ve/veya kelime gruplarını kullanarak resimler oluşturan bu yapay zeka botu sayesinde kullanıcılar hayal ettiklerini kelimeler aracılığıyla resme dönüştürebilir. 

Midjourney bir sanatçı topluluğu tarafından kullanılmak üzere tasarlandı, bu yüzden Discord üzerinde çalışıyor. Yeni katılan kişilerin kullandığı #newbies kanallarında çok sayıda kullanıcı bulunabilir. Farklı kanallarda dolaşarak Midjourney’in nasıl çalıştığını gözlemleyebilir, oluşturulan görselleri inceleyebilirsiniz.

Midjourney programını kullanmak için aşağıda belirtilen adımları takip edebilirsiniz.

  1. Google arama motoru üzerinden “midjourney.com” adresini yazarak sayfayı açabilirsiniz. Açılan sayfadan karşınıza çıkan dört seçenekten “Join the Beta” seçeneğini seçtiğinizde sizi “Discord” sayfasına yönlendirecektir.
  2. Sizden istenilen e-posta ve şifre bilgilerini girerek kayıt işlemini tamamlayabilirsiniz.
  3. Açılan sayfada sol üst köşede bulunan “Midjourney” logosuna tıklayarak kenar çubuğundaki listede odalar başlığından “#newbies” yazan seçeneklerden birini seçerek resim oluşturmaya başlayabilirsiniz.
  4. Oluşturmak istediğiniz resmi birkaç cümle ile tanımlamanız gerekmektedir. Program İngilizce çalıştığı için buraya gireceğiniz harfler İngilizce olmalıdır.
  5. Alt kısımda yer alan metin çubuğunun başına “/” (slash) işareti koyarak “imagine” yazdığınızda hemen üst bölümde “prompt” komutu çıkacaktır.
  6. Daha sonra bu komutu seçerek metin çubuğuna istediğiniz kelimeleri yazarak Enter’a basabilirsiniz.

Midjourney girilen komutlar sonrasında istediğiniz görseli üstte beliren yüzdelik kısım tamamlandığında size sunacaktır. Dilerseniz bu hazırladığınız görselleri bilgisayarlarınıza da indirebilirsiniz.

Hayal gücünüzü ortaya koymak ya da geliştirmek için Midjourney’i rahatlıkla kullanabilirsiniz.

DALL-E

OpenAI tarafından geliştirilen bir yapay zeka modelidir. Model, metin tabanlı açıklamalara dayanarak çeşitli ve yaratıcı görseller üretebilen bir tür “text-to-image synthesis” modelidir. DALL-E, GPT-3 modelinin bir türevi olarak bilinen CLIP modeliyle benzer bir temele dayanır.

DALL-E’nin öne çıkan özelliklerinden biri, bir kelime veya kavram hakkında açıklamaları anlamak ve bu açıklamalara uygun görselleri üretmek için kullanılabilmesidir. Örneğin, “papatya yapraklarından yapılmış bir kuş” ifadesiyle ilginç ve benzersiz bir görsel üretebilir.

Modelin adı, ünlü sanatçı Salvador Dalí ile çizgi film karakteri Wall-E’nin birleşiminden gelir. Bu, modelin yaratıcı ve absürd görsel kombinasyonlar oluşturabilme yeteneğini vurgulamaktadır.

DALL-E, geniş bir veri setinde eğitilmiş olan büyük bir derin öğrenme modelidir ve metin tabanlı açıklamalara dayanarak gerçekçi, benzersiz ve çoğu zaman hayal gücünü zorlayan görseller üretebilir.

PEKİ DALL-E Programını Nasıl Ücretsiz Kullanırız ?

Microsoft, Bing Chat ve Bing Image Creator kullanıcılarına OpenAI’nin DALL-E 3 modeline erişim sağladığını açıkladı. Bu model, Mart 2023’ten beri kullanılan Bing Image Creator’ı daha yetenekli ve gerçekçi hale getiriyor. Ancak, bu özellik ChatGPT Plus veya Enterprise kullanıcısı olmadan, bir Microsoft hesabı ile ücretsiz olarak kullanılabiliyor.

Bing Image Creator, yapay zekâ tarafından oluşturulan görselleri üretmek için kullanılan bir araçtır. Ancak, bu tür teknolojilerin yaygınlaşması, deepfake gibi sorunları beraberinde getirerek endişelere neden olabilir. Bu teknolojinin kötü amaçlı kullanımını engellemek adına dikkatli olunması gerektiği belirtilmiştir.

Bing Image Creator’ın kullanımı için öncelikle bir Microsoft hesabı oluşturmanız gerekmektedir. Ardından, web sitesine girerek istediğiniz görselin açıklamasını yazabilirsiniz. Açıklamaların detaylı ve açık olması önemli. Bu durum, yapay zekanın isteğinizi doğru anlamasına yardımcı olabilir. Başlangıçta, işlemlerin daha hızlı çalışmasını sağlayan geliştirmeler alacaksınız, ancak bu geliştirmelerin sayısı sınırlıdır ve tükendikten sonra işlemler daha yavaş bir hale gelebilir.

Yapay zekâ tarafından üretilen görsellerin henüz mükemmel olmadığı ve bazı eksikliklere sahip olduğu ifade edilmiştir. Bu eksikliklere örnek olarak, bazen çarpık eller veya ürkütücü gözlerin oluşabileceği belirtilmiştir. Bu nedenle, bu tür teknolojilerin kullanımında dikkatli olunması ve kötü niyetli amaçlarla kullanılmaması önemlidir.

Galata Kulesi’nin gün batımında şiirsel bir görüntüsü. ( görsel: Mashable Türkiye)

KAYNAKÇA

Midjourney Nasıl Kullanılır? (n.d.). Technopat. https://www.technopat.net/2023/04/18/yapay-zeka-ile-gorseller-olusturun-midjourney-nasil-kullanilir/

https://turk.net/blog/midjourney-nedir-nasil-kullanilir/

Midjourney Nasıl Kullanılır? (n.d.). Technopat. https://www.technopat.net/2023/04/18/yapay-zeka-ile-gorseller-olusturun-midjourney-nasil-kullanilir/

What is DALL-E 3? Open AI’s Latest Image Generator Explained. (n.d.). Master Data Skills + AI. https://blog.enterprisedna.co/what-is-dall-e-3/

https://chat.openai.com/

https://inovax.net.tr/yapay-zeka/meta-imagine/

Bing Image Creator nasıl kullanılır? (Bing Resim Oluşturucu nedir). (n.d.). Mashable Türkiye – Teknoloji, Bilim, Sosyal Medya Haberleri ve Ürün İncelemeleri. https://tr.mashable.com/yapay-zeka/11319/dall-e-3-ile-bing-image-creator-nasil-kullanilir-tek-tek-anlatiyoruz


Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir