Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Otomotiv devi tepetaklak oldu

Otomotiv devlerinden Tesla’nın Çin’deki en popüler modellerinden biri olan Model Y’nin satış grafiği temmuz ayında yeniden düşüşe geçti. Haziran ayında sınırlı da olsa yükseliş gösteren satışlar, bir ay sonra sert bir düşüş yaşadı.

Bebeklerin zekası anne karnında tespit edilecek

ABD merkezli yeni bir genetik girişimi, tüp bebek yöntemiyle oluşturulan embriyoların zeka düzeyini tahmin edebileceğini iddia ederek bilim dünyasında yankı uyandırdı.

Windows ve Apple bile çaresiz: ‘DoubleClick’ tuzağı ne olduğunu anlamadan banka hesabınızı saniyeler içinde boşaltıyor

Masum bir çift tıklamanın arkasına gizlenen bu yeni siber saldırı yöntemi, banka bilgilerinizi çalmayı ve onayınız olmadan para transferi yapmayı hedefliyor. Peki, bu görünmez tuzağa karşı nasıl korunabilirsiniz?

Google Maps’ten bir özellik daha kaldırılıyor

Google harita hizmetinden kullanıcılarının birbirini takip etmesini sağlayan imkanı eylül ayında kullanımdan kaldırmaya hazırlanıyor.

Elden Ring: Nightreign’e beklenen duo modu geliyor

Elden Ring: Nightreign’in beklenen Duo Expeditions modu 30 Temmuz’da geliyor. Yeni güncelleme, zorluk dengesi ve kullanıcı arayüzü iyileştirmeleriyle birlikte sunulacak.

ChatGPT’de “3 kelime kuralını” deneyin: Bir daha vazgeçemeyeceksiniz

Eğer ChatGPT’nin verdiği cevaplar sizi tatmin etmiyorsa, yapay zeka ile iletişiminizi kökten değiştirecek ve bir daha asla vazgeçemeyeceğiniz o ‘3 kelime kuralını’ mutlaka denemelisiniz.