OpenAI’dan Yeni Hamle!
OpenAI, iddialara göre GPT-4’ü eğitmek için bir milyon saatten fazla YouTube videosunun metin haline getirilmesini sağlayan Whisper modelini geliştirdiği belirtiliyor. The New York Times’ın haberine göre, şirketin bu eylemi yasal olarak tartışmalı olmasına rağmen, OpenAI yöneticileri bunun adil kullanım kapsamında olduğuna inanıyordu. İddialara göre, OpenAI başkanı Greg Brockman, kullanılan videoların toplanmasında doğrudan yer aldı.
OpenAI sözcüsü Held ise şirketin her bir model için özel veri kümeleri oluşturduğunu ifade etti. Held’in aktardığına göre, bu veri kümeleri, modellerin dünyayı anlamalarına yardımcı olmak ve küresel araştırma rekabet gücünü korumak amacıyla oluştu. Ancak, Held, şirketin kamuya açık ve kamuya açık olmayan kaynaklardan, hatta kendi sentetik verilerini üretmek için araştırmalar yaptığını da belirtti.
Google sözcüsü Matt Bryant ise robots.txt dosyalarının ve Hizmet Şartları’nın YouTube içeriklerinin izinsiz bir şekilde kazınmasını veya indirilmesini yasakladığını hatırlattı. Geçen hafta gerçekleşen bir röportajda YouTube CEO’su Neal Mohan, OpenAI’ın Sora’yı eğitmek için YouTube videolarından yararlanması iddialarına karşılık, bu tür bir eylemin platformun ilkelerine aykırı olduğunu belirtmişti.
Times’ın haberine göre, Google da YouTube transkriptlerini topluyor. Ancak Matt Bryant, modellerinin YouTube içerik üreticileriyle varılan anlaşmalar doğrultusunda eğitildiğini belirtti.
Bu yazıyı paylaş: