Arama

Yapay zeka bunadı mı? Bilişsel testte sınıfta kaldı!

Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi.

19/12/2024 08:34 | Son Güncelleme : 01/05/2025 19:15 | Okunma Sayısı : 10 | BizimTrabzon


Yapay zeka bunadı mı? Bilişsel testte sınıfta kaldı!
Yapay zeka bunadı mı? Bilişsel testte sınıfta kaldı!

Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi. Yapay zeka teknolojilerinin testlerde beklenmedik şekilde bilişsel zayıflık sergilediği ortaya konuldu.

Yapay zekanın bilişsel yetenekleri ne kadar gelişmiş? Son yapılan bir araştırma, Montreal Bilişsel Değerlendirme Testi ile bu sorunun yanıtını aradı.
The BMJ dergisinde yayımlanan çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi (MoCA) üzerinde değerlendirildi. Bu test, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılıyor.
ChatGPT 4o: 30 üzerinden 26 puanla en yüksek skor. ChatGPT 4 ve Claude: 30 üzerinden 25 puan. Gemini 1.0: 30 üzerinden sadece 16 puanla en düşük skor.
Araştırma, tıpkı yaşlanan insanlar gibi, eski yapay zeka modellerinin de testlerde daha düşük performans gösterdiğini ortaya koydu. Bu bulgular, yapay zekanın yakın zamanda insan doktorlarının yerini alabileceği yönündeki düşünceye şüpheyle yaklaşılması gerektiğini gösteriyor.
Tüm modeller, sayı ve harfleri sıralama gibi yol izleme görevlerinde ve saat çizme testlerinde düşük performans gösterdi.Ayrıca Gemini modelleri, beş kelimelik bir diziyi hatırlama gibi gecikmeli hatırlama görevlerinde başarısız oldu. Buna karşın, adlandırma, dikkat, dil ve soyutlama gibi alanlarda tüm sohbet robotları başarılı bir performans sergiledi.
Son yıllarda yapay zekanın tıpta kullanılması konusundaki heyecan, bu çalışmayla yeni bir tartışma boyutuna taşındı. Daha önceki çalışmalar, büyük dil modellerinin tıbbi teşhislerde başarılı olduklarını ortaya koysa da, bilişsel bozukluklar gibi insan benzeri zaaflarının derinlemesine incelenmediği vurgulanıyor.
Etiketler :
Beğendim
Bayıldım
Komik Bu!
Beğenmedim!
Üzgünüm
Sinirlendim
Bu içeriğe zaten oy verdiniz.

ad image

Bunlar da ilginizi çekebilir

Kötü amaçlı mobil bankacılık yazılımları küresel çapta büyüyecek

Kötü amaçlı mobil bankacılık yazılımları küresel çapta büyüyecek

Yıllık Finansal Tehditler Raporu'na göre mobil bankacılığa dair kötü amaçlı yazılımlarda ve kripto para ile ilgili kimlik avında önemli artışlar olduğu ortaya çıktı. Rapor, dijital finansal varlıklara yönelik artan tehdidi işaret ediyor.

11 ay önce
Nintendo Switch 2 ve PlayStation 5 Pro 2024'e damga vurabilir

Nintendo Switch 2 ve PlayStation 5 Pro 2024'e damga vurabilir

Nintendo başkanı Shuntaro Furukawa, yeni Nintendo Switch'in 2024 yılı içerisinde duyurulacağını açıkladı. Öte yandan Rockstar Games, GTA 6'nın 2025'te çıkış yapacağını duyurmasıyla birlikte gözler PlayStation 5 Pro'ya çevirdi.

11 ay önce
Boeing'in Starliner kapsülünün ISS'e uçuşu iptal edildi

Boeing'in Starliner kapsülünün ISS'e uçuşu iptal edildi

Boeing'in Starliner kapsülünün Uluslararası Uzay İstasyonu'na (ISS) yapacağı test uçuşu, fırlatma Atlas V roketindeki bir sorun nedeniyle iptal edildi. NASA henüz yeni bir fırlatma tarihi belirlemedi.

11 ay önce
Yorumlar