ATI'nin DirectX 10 Çözümü Testte: Radeon HD 2900XT
14 Mayıs 2007 1:49, Murat Gamsız Yazdırılabilir Sayfa Yazdırılabilir Sayfa
İnceleme » Ekran Kartı Etiketler: ati, directx 10, radeon hd 2900xt
Nihayet beklenen an geldi ve AMD-ATI Directx 10 destekli ekran kartlarını piyasaya sundu. AMD daha önce bizim çağrılmadığımız Tunus lansmanında ürünü basına tanıtmış ve örneklerini vermişti. Biz ise Sapphire'dan satışa sunulacak bir örneği Cuma günü aldık ve incelemek için sadece iki günümüz vardı. Neyseki testleri yetiştirdik ama bazı detaylara inemedik. Tabii ortada hala DirectX 10 oyunu olmadığından, ne yapsak boş. Bu kartlar Directx 9 için tasarlanmadılar. Hatta ne zaman bir yetkili ile konuşsak, kartların DX10 altında gerçek performanslarını ortaya koyacağını söylüyorlar. Dolayısıyla DirectX 9 ile yapılan testler bize en ufak fikir veremezler gelecek hakkında. DX10 öncesi yapılacak testler sadece mevcut oyunlarda nasıl bir performans alacağınızı gösterecek o kadar. O nedenle bizim ve diğer kaynakların testlerine bakarken, kesin sonuç çıkarmayın.
Şimdiden söyleleyim: Hem Nvidia, hem de ATI çözümleri DX9 altında ciddi şekilde hızlılar. Zaman zaman biri zaman zaman da diğeri öne geçiyor ancak maalesef kesin çıkarım yapmamız ve birini birinci seçmemiz olanaksız. Bir iki tane DirectX10 oyunu çıkıp adam gibi test edilmeden net sonuçlar çıkarmak mümkün olmayacak. Bunu bilin ve öyle devam edin okumaya.
wit1.jpg
ATI aslında bugün inceleyeceğimiz kartın temellerini XBOX 360 ile atmış, hatta bugün Nvidia'dan sonra girdikleri DX10 pazarına aslında onlardan önce adım atmıştı. Piksel ve vertex shader'ların ortadan kalkışını ilk XBOX360 lansmanında öğrenmiştik. Ancak tabii iş aynı GPU'yu alıp ekran kartına çevirip satmak kadar kolay değil. Bir defa Nvidia'nın rekabeti söz konusu. 8800 serisi Nvidia'nın Playstation 3 için tasarladığı GPU'nun çok ötesinde bir GPU çıktı. Eğer onlar da ATI gibi konsola verdikleri GPU'yu geliştirselerdi muhtemelen ortaya 8800'den daha zayıf bir ürün çıkacaktı. Ama Nvidia 8800'ü sıfırdan tasarladı ve ATI'den önce piyasaya sürdü. ATI de rakibin hamlesini gördü ve muhtemelen oyun planını değiştirdi. Bu ve AMD'nin ATI'yi alması kartların çıkış tarihini geçiktirdi. Hatta belki şaşıracaksınız ama ATI Nvidia'nın en üst model kartına denk bir ürün çıkartmıyor bugün. HD 2900XTX yani GTX'in rakibi daha sonra çıkacak. Ne kadar sonra olacağını AMD bilir ama şu aşamada ancak GTS'ye kadar denk ürün çıkıyor. Ancak ATI ve Nvidia mimari açıdan farklı kartlar ürettiğinden direkt bir karşılaştırma hatalı olur. ATI'nin iddiası kartların performansının DX10 oyunlarında açığa çıkacağı yönünde. Test etmeden bilemeyeceğiz.
Radeon HD 2900XT nedir?
ATI '2' serisinden itibaren kartların başındaki 'X'i atıyor ve yerine 'HD' harflerini koyuyor. Bundan sonra kartlar HD 2900, 2600 ve 2400 diye gidecek. Ama aralarındaki farklar yine klasik XT ve Pro ekleri ile gösterilecek. Biz bugün HD 2900 XT'yi inceleyceğiz. Bu kart serinin en hızlı kartı. XTX modeli daha sonra çıkıp bu ünvanı alacak ama şu anda durum bu. ATI'nin 8800GTX'e karşı bir XTX'i yok. Bunun için sızlanmaya değer mi ileride göstereceğim ama kağıt üstünde ATI'nin bir model eksiği var Nvidia'dan.
HD2900XT_Card_02.jpg
ATI Radeon HD 2900XT
AMD'nin sunumunda yer almadığımız için, elimdeki bilgiler sunumda kullanılan slaytlardan ibaret. Maalsef ATI'nin FTP'sine koyduğu dosyaların bazıları çalışmadığı gibi FTP de erişilmez oldu. Ama yine de kritik bilgileri öğrenebildik.
GPU'nun içi. Büyütmek için resme tıklayın.
R600 ATI'nin de söylediği gibi, 1000 serisinin artılarından yola çıkan, XBOX360'taki Xenox GPU'sunda yapılan yenilikleri de içinde barındıran ve ötesine geçen bir GPU. ATI R600'ü 80 nanometre teknolojisiyle üretiyor. Tam 720 milyon transistöre sahip. Nvidia'nın G80'i 681 milyon transistöre sahip. Kuşkusuz bu farkın en önemli nedenlerinden biri ATI'nin kullandığı paralel işlemci sayısı. ATI de Nvidia gibi paralel işlemci kullanıyor artık. Sabit iş hatları yok. Nvidia 128 paralel işlemci kullanırken, ATI bu sayıyı 320'ye çıkartmış. Bunlar 80 adetlik dörtlü gruplar halinde bulunuyor. Dörtlü gruplar birbirlerine işhatlarıyla bağlı. Bu 320 küçük işlemci bir 'dağıtıcı/gönderici' işlemcisine bağlı. Bu işlemci vertex, geometri ve piksel shader komutlarını alıp, paralel işlemcilere gönderiyor. Bu yapının işlevi bu küçük paralel işlemcileri sürekli dolu tutmak. Bu sayede işlemci gücü boş bekleyerek harcanmıyor. Komutların bir kısmı da dört adet olan doku ünitelerine gönderiliyor.
Aslında GPU'nun yapısı işlemciye çok benziyor. İşlemcilerde problem olan 'cache miss' denen ve bir anlamda yanlış hesabın yeniden yapılması olarak canlandırabileceğiniz zaman kaybettirici sorunlar bu yeni GPU'larda da bulunuyor. O nedenle aynı işlemcilerdeki gibi bu tip gecikme sürelerini yükselten sorunlara karşı GPU'larda da önlem alınıyor. GPU'lar da hem aynı hesabın yeniden yapılmasını önlemek hem de eldeki sonuçların tekrar kullanılmasını sağlamak için ufak tampon belleklerden yararlanıyor. Ayrıca yine işlemcilerde olduğu gibi dallanma tahmin algoritmaları da R600'ün parçalarından biri. Bir diğer tedbir de veri bekleyen işlemin kenara alınması ve yerine hemen zaman kaybedilmeden yenisinin başlatılması. İçinde 80 küçük işlemci barındıran SIMD, Single Instruction, Multiple Data, bloku altı adet operayson gerçekleştirebiliyor. Bunlardan beşi matematik biri de akış kontrol operasyonu. Tüm bu operasyonlar aynı anda yapılıyor. Her Paralel işlemci 32-bit kayar nokta hasaslığında çalışıyor ve döngü başına beş çarpma toplama işlemi yapabiliyor. Ayrıca SIN ve COS gibi hesaplamaları da yapabiliyor.
Doku ünitesi sayısının dört olduğunu söylemiştik. Bunlar da işlemcilerde gördüğümüz gibi L1 ve L2 tampon belleğe sahipler. L2 tampon bellek, L1'de 'cache miss' olduğu takdirde sigorta görevi görüyor ve bu sayede gecikme aza iniyor. L2 miktarı 2900 serisinde 256KB iken, 2600 serisinde 128KB. 2400'de ise sadece L1 tampon bellek var. Gördüğünüz gibi GPU'lar arasındaki farklar artık sadece kapalı iş hatları ve saat hızı boyunda kalmıyor. R600'ün doku üniteleri 64-bit bilinear HDR filtreleme yapabiliyor. Anisotropic filtreleme her format altında açılabiliyor. Sürücülerde test sırasında bir eksiklik görmüştüm: X1000 serisinde yüksek kalite anisotropic filtering seçeneği varken, HD serisinde yok. Bunun sebebi her durumda yüksek kalite filtreleme yapılabilmesi. Yani artık HD serisinde yüksek kalite anisotropic filtreleme varsayılan olarak hep açık. Kapatma seçeneği yok. Bir diğer dikkat çekici gelişme ise doku çözünürlüğündeki büyüme. 67 megatexel yani 8192×8192 çözünürlüğünde doku desteği geliyor.
Anti-Aliasing tarafında ise performans artışı devam ediyor ve bu da yeni modları mümkün kılıyor. Narrow ve Wide tent denilen tekniklerle çok fazla ek hesaplama yükü getirmeden, çizgileri dolduracak piksellerin dağılımları klasik dörtgen sınırları içinde değilde dairesel bir yayılma sergileyebiliyor. Bu yayılmanın çapı da dar ve geniş diye ikiye ayrılıyor. Her iki mod da sürücüden seçilebiliyor. Yani kullanmak mecburi değil. Kendiniz karar verebilirsiniz.
Z ve stencil buffer'larda yapılan iyileştirmeler ise sıkıştırma oranlarını arttırmış. 8:1 olan oran, 16:1'den 128:1'e kadar uzanabiliyor. Ama buradaki en önemli detay sıkıştırma bilgisinin kart belleğinde ve GPU'daki tampon belleklerde saklanabilmesi. Yani çok daha fazla veri sıkıştırılabiliyor. Bu da sıkıştırmanın çok yüksek çözünürlüklere kadar kullanılabilmesine olanak sağlıyor. Bir başka deyişle çok yüksek çözünürlüklerde sıkıştırma sayesinde, bu çözünürlükler kullanılabilir hale geliyor.
Bunlar dışında bahsetmemiz gereken ne var diye baktığımda kart belleğinin kayıtlar için sanal bellek gibi kullanılabilmesi, DX10 altında 128-bit kayar nokta hassasiyetindeki formatların görüntülenebilmesi, stencil gölgeleme performansının, tekniği kullanan oyunlarda artması ve tek saat döngüsünde 32 piksele çıkması, 2600'lerde 8, geometri performansının artık birleşik olan yapı nedeniyle eski X1000 serisine oranla 10 kata kadar artabilmesini sayabiliriz.
Bir de tabii merak edilen bellek arabirimi olayı var. 2900 serisi ile ilk defa 512-bit bellek arabirimine geçiliyor. ATI I/O yoğunluğunu arttırmış ve 256-bit arabirim ile aynı alana daha fazla bağlantı koymayı başarmış. Benzetmek gerekirse sıkışık bir yolu rahatlatmak için yolun üzerine bir kat daha çıkıldığını düşünün. Zor bir iş ama yapıldığında kullanılan yolu genişletme derdine girmeden ki bu hem yer hem maliyet yüzünden mümkün olmayabilir, aynı yolun üzerine bir tane daha ekleyerek araç kapasitesini iki katına çıkarıyorsunuz. ATI de bu mantıkla hareket etmiş. Yeni bir sistem kurmak yerine eski ring bus mimarisini geliştirmiş. Bu sistem yeni kartlarda yeniden tasarım yapılmasını da gereksiz kılıyor. Gecikme değerleri de düşük oluyor. Kartta 8 adet 64-bit kontrolcü bulunuyor. 2900 serisi 100GB/s gibi oldukça yüksek bir bellek bant genişliği sunuyor.
Tepeden baktığımızda yeni özellikleri kenara koyarsak, tasarımın aslında müthiş bir trafik düzenlemesi olduğunu görüyoruz. Yapılan çalışmaların çoğu GPU içindeki birimlerin birbirleriyle olan iletişiminin mümkün olan en düşük gecikme ile gerçekleşmesi için yapılmış. Yine de bir sıkıntı olursa bu sıkıntının en kısa zamanda aşılması için de tedbirler alınmış.
Son olarak tessellation/mozaikleme ATI'nin üzerinde çok durduğu bir diğer detay.
Büyütmek için resme tıklayın.
Bu yöntemle kaba poligonlar alt parçalara ayrılarak, çok daha yuvarlak hatları mümkün kılıyor ve sonunda 'displacement mapping' ile de kabartma detayları verilerek gerçekçi bir görünüm sağlanıyor. Bu işin güzelliği ise tamamen GPU üzerinde yapılabilmesi. Normalde geometri işlerini işlemci yaptığından, bu kadar detaylı bir mozaikleme işlemi performans kaybına sebep olur. R600 ise bu işi becerebilecek güce sahip. Ama tabii oyun yapımcılarının kullanması gerekiyor bu özelliği. Yukarıdaki resim Valve çıkışlı. Half Life serisinin daha çok yararlanmasını bekleyebiliriz; zira ATI ile yakın çalışıyorlar.
Bu kısmın sonunda Directx 10 neydi onu da hatırlatalım kısaca önceki 8800 yazımızdan.
DirectX 10 desteği ile shader üniteleri arasında bir ilişki yok önce onu söyleyeyim. Yani eski sistemle devam etselerdi de Directx X10 desteği sağlanabilirdi. Ama unifed shader mimarisi çok daha verimli olduğundan hem DirectX 9 hem de 10 için performans avantajı yaratıyor. DirectX 10'un 9'a göre iki temel getirisi var. Geometri shader da artık vertex ve pixel shader yanında yerini alıyor. Bunun özelliği artık GPU'ların sadece çizim ve kaplama yapan birimler olmaktan çıkıp, cisimlere müdahale de edebilir hale gelmesi. Normalde bu işi ancak CPU yapabiliyor. Ancak artık cisimlerin şeklini değiştirmek ya da parçalamak için gereken hesaplamları GPU da yapabilecek. Kısacası GPU'ya cisimlere müdahale etme özelliği geliyor. CPU'nun başından bir yük daha kalkacağı gibi, eskiden yük olmasın diye yapılmayan efektler kullanılabilecek.
DirectX 10'un bir diğer önemli getirisi ise işlemci bağımlılığını azaltması. Mevcut sürümde işlemciye çok fazla 'danışılıyor'. Şöyle düşünün. Bir hizmetçiniz var ve ona bir alışveriş listesi verdiniz. Siz de işinize bakıyorsunuz. Hizmetçi aldığı her üründen sonra size telefon edip rapor veriyor ve listedeki diğer ürünü almak için izin istiyor. Halbuki elinde her şey yazılı. Siz de sürekli gelen telefonlarla sürekli bölünüyorsunuz ve diğer işlerinizi bırakıp laf yetiştiriyorsunuz. İşte DirectX 9'a kadar olan durum bu. Son derece gereksiz CPU haberleşmeleri gerçekleşiyor. Bu da hem işlemciyi meşgul ediyor hem de yapılacak işin beklemesine sebep oluyor. DirectX 10 işlemciyi grafik işlerinden mümkün olduğunca uzak tutmaya çalışıyor diyebiliriz. En azından gereksiz bir iletişim olmuyor.
Bu kadar teori yeterli. Şimdi kartları görelim.
HD 2900 XT HD 2600 XT HD 2600 Pro
HD 2400 XT
HD 2400 Pro
Üretim 80 nanometre 720 milyon transistör 65 nanometre 390 milyon transistör 65 nanometre 390 milyon transistör
65 nanometre 180 milyon transistör
65 nanometre 180 milyon transistör
Çekirdek hızı 740MHz 800MHz 600MHz
700MHz
525MHz
Birleşik iş hattı sayısı 128 64 64
32
32
Paralel işlemci sayısı 320 120 120
40
40
Bellek hızı 1650MHz 2200/1400MHz 1000MHz
1400MHz
800MHz
Bellek miktarı ve tipi 512MB GDDR3 128-512MB GDDR4/3 128-256MB DDR2
128-256MB GDDR3
128-256MB DDR2
Bellek arabirimi 512-bit 128-bit 128-bit
64-bit
64-bit
ROP sayısı 16 8 8
4
4
Arabirim PCI Express PCI Express PCI Express
PCI Express
PCI Express
DirectX versiyonu 9 ve10 9 ve10 9 ve10
9 ve10
9 ve 10
Son kullanıcı fiyatı 479$+KDV 170$+KDV 127$+KDV
110$+KDV
80$+KDV
TR'ye geliş tarihi 21mayıs Haziran başı Haziran başı
?
?
HD serisi bu şekilde sıralanıyor. En büyük kart 2900XT. Bundan ayrıca bahsedeceğiz. Bizi daha çok ilgilendiren kısım orta segment. Neler kısılmış diye bakınca saat hızlarının yüksekliği dikkat çekiyor ama 128-bit bellek yapısı da hemen göze çarpıyor. ATI de 256-bit kullanmamış. Bu yüzden, 2600 serisinde 100GB/sn bellek bant genişliği 35GB/sn'ye iniveriyor. Paralel işlemci sayıları tıpkı Nvidia'da olduğu gibi iniyor. Orta modellerde 120'ye kadar düşmüş. 65nanometre tekniği ile üretiliyor 2600 ve 2400 serisi.
2600XT'nin GDDR3 ve 4 diye iki modeli var. Tek fark bellek hızı. Pro modelinde saat hızları düşüyor. 2400 serisinde yine paralel işlemci sayısı düşüyor. 2400XT, 2600Pro'dan saat hızı tarafında hızlı ama karşılaştırmadan farkı söyleyemeyiz. Ama arada ciddi paralel işlemci sayısı farkı var. Saat hızları kartı kurtarmaya yetmeyecektir diye tahmin ediyoruz. 2400Pro en düşük hızlı model.
Bizim ilgimizi çeken model elbette 2600XT. 8600GTS'nin rakibi. Kağıt üstünde GTS'den avantajlı görünüyor. Ama Nvidia ile ATI kartları mimari açıdan elma ile armut. Böyle bir kıyas yapmak yanlış. Kartların bana gelen özellik listesinde çekici bir tarafı da 2600'lerden itibaren harici güç ihtiyacı olmaması. 8600GTS harici güç istiyor. Ayrıca 2400 serisi pasif olarak soğutulabiliyor üretici isterse. AGP kullanıcılarına da iyi haber verelim. 2600 ve 2400'ler Rialto dönüştürücüsü ile AGP olarak da piyasya çıkacak. Ama 2600XT harici güç isteyecek bu nedenle. 2600 ve 2400'ler haziran içinde ülkemizde olacak. Tabloya yazdığım fiyatlar son kullanıcı fiyatları. Her marka için genelleyemem ama aşağı yukarı böyle olacak. 2600XT'nin agresif bir fiyata sahip olduğunu söyleyebiliriz.
GeForce 8800 ve Radeon HD 2900 karşılaştırması ne kadar doğru?
Yukarıda size AMD/ATI tarafından aktarılan bilgileri özetledim. Yani bizim yorumumuz ya da bulduğumuz şeyler değil. Bir anlamda çeviri yaptık. Kaynağın her dediğine inanmamak gerektiğini biliyoruz. Teknik özelliklere janjanlı isimler takıp önümüze koyuyorlar sonuçta. Biz son kullanıcı olarak sonuca odaklanıyoruz. Sonuçta kaptana gemiyi limana getirip getirmediği sorulacak yolda yaşadıkları değil. Yine de özellikleri okurken benim aklıma takılan ve Sapphire'den tatmin edici cevaplar bulamadığım noktalar oldu. Sapphire'daki yetkili AMD'nin kendilerine birçok konuda detay vermediğini söyledi. AMD'den teknik kaynağımız olmadığından biz de sormadık direkt. Zaten Sapphire'a söylemediklerini bize söyleyecek halleri yoktu. Şimdi ben burada o noktaları belirteyim.
8800 GTX
8800 GTS
HD 2900 XT
Üretim
90 nanometre 681 milyon transistör
90 nanometre 681 milyon transistör
80 nanometre 720 milyon transistör
Çekirdek hızı
575MHz
500MHz
740MHz
Paralel işlemci hızı
1350MHz
1200MHz
?
Paralel işlemci sayısı
128
96
320
Bellek hızı
1800MHz
1600MHz
1650MHz
Bellek miktarı ve tipi
768MB GDDR3
640/320MB GDDR3
512MB GDDR3
Bellek arabirimi
384-bit
320-bit
512-bit
ROP sayısı
24
20
16
Arabirim
PCI Express
PCI Express
PCI Express
DirectX versiyonu
9 ve10
9 ve 10
9 ve10
Son kullanıcı fiyatı
Ortalama 555$+KDV
400/289$+KDV
479$+KDV
TR'ye geliş tarihi
Piyasada
Piyasada
21 mayıs
Öncelikle özellikler listesine bakınca 'unified shader pipeline' diye bir ifade ile karşılaştım. Adedi 128 ve kartların modeli düştükçe azalıyor. Birleşik iş hattı olarak ilk tabloda vermiştim. Bunun ne olduğunu tam olarak bilmiyorum. ATI'nin sunumlarında da hiç rastlamadım. Ama bana ayrı olarak gelen özellik tablosunda bu bilgi vardı. Ben de burada söylüyorum. Nvidia'da neye karşılık geldiği de meçhul. Bu açıklayamadığım ilk nokta.
ATI'nin 320 paralel işlemcisi Nvidia'nın 128 adetlik işlemci sayısına göre hayli yüksek. Öyle ki 8800GTX, 2600XT kadar bir kartmış gibi görünüyor. Açıkçası birebir karşılaştırma yapılabilceğinden şüphem var. Sanki aynı şeylerden bahsedilmiyor gibi. Belkide rakamlar olduğundan abartılı aktarılıyor bize bir şekilde. Pazarlama hilesi kurbanı olabiliriz. O yüzden siz bence "ATI'de 320 paralel işlemci varmış; Nvidia'ya taktı" tarzı ifadeler kullanmayın. Bunun kokusu DX10 testlerinde çıkar. Eğer ATI farklı şekilde öne geçebilirse o zaman ben de tüm bu sayılara inanırım.
Diğer konu paralel işlemcilerin saat hızları. Nvidia'da paralel işlemciler GPU'nun geri kalanından hızlı çalışıyor. Hatta bu hızı düşük modellerde bile fazla düşürmüyorlar zira ihtiyaç var. Ama ATI'deki durum belli değil. Sapphire'deki yetkili aynı mantıkla yani GPU'nun geri kalanından hızlı olduğunu ama AMD'nin bu hızları kendilerine iletmediğini söyledi.
İncelemeler yayınlandıkça bu detayları da öğrenebiliriz belki eğer AMD sunumlarına katılanlar bu soruları sorup yanıt alabildilerse. Benim size tavsiyem 8800 vs 2900 karşılaştırmalarında tamamen sonuca odaklı olmanız ve DX10 testlerini görmeden karar vermemeniz.