OpenAI, yeni nesil yapay zekâ modeli GPT-4o'nun görüntü üretim özelliklerini resmen kullanıma sundu. DALL-E 3’ün yerini alan bu yeni model, doğru metin yerleştirme, gelişmiş bağlam algılama ve daha tutarlı karakter tasarımlarıyla dikkat çekiyor.
Önceki modellerde, yapay zekânın metin yerleştirme konusunda sık sık hatalar yaptığı biliniyordu. GPT-4o, tabelalardan reklam panolarına, restoran menülerinden afişlere kadar her alanda doğru ve okunabilir metin içeren görseller üretebiliyor. Bununla birlikte kullanıcılar, oluşturulan bir görüntüye özel metin ekleyerek kişiselleştirilmiş tasarımlar oluşturabiliyor.

Ayrıca model, karakter ve nesne tutarlılığı konusunda da önemli bir gelişme sunuyor. Örneğin, bir sanatçı yapay zekâya belirli bir karakter oluşturmasını söyledikten sonra, aynı karakteri farklı pozlar veya sahnelerde kullanabiliyor. Bu özellikte önceki modellerde yaşanan renk ve form değişimi gibi sorunlar büyük ölçüde ortadan kalkmış durumda. Ancak modelin hâlâ bazı sınırlamaları bulunuyor. Matematiksel temsiller, tablolar ve çok dilli metinler konusunda bazı hatalar yapabiliyor.
Yeni özellikler tüm kullanıcılara açık
GPT-4o’nun yeni görüntü üretim modeli, tüm ChatGPT kullanıcıları için erişime açık durumda. Ücretsiz kullanıcılar bazı kullanım sınırlarıyla karşılaşsa da modelin sunduğu yeniliklerden faydalanabiliyor.