3DMGAME 3DM首页 新闻中心 前瞻 | 评测 游戏库 热门 | 最新 攻略中心 攻略 | 秘籍 下载中心 游戏 | 汉化 购买正版 论坛

注册 登录

QQ登录

只需一步,快速开始

查看: 16559|回复: 33
打印 上一主题 下一主题

[新闻] GPU当CPU使 AMD HD 7000显卡详细解析

  [复制链接]

9

主题

1648

帖子

2253

积分

游戏达人

Rank: 7Rank: 7Rank: 7

贡献度
194
金元
14769
积分
2253
精华
0
注册时间
2008-5-5
跳转到指定楼层
主题
发表于 2011-9-21 18:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
此前大家都在猜测,AMD会不会在下一代HD 7000显卡上,使用全新的Graphic Core Next架构,不过近日,国外某网站泄露的消息,验证了AMD迫切希望赢得一场全面胜利的信心。HD 7000系列将会引入全新的Graphic Core Next架构(后文简称GCN),并且随同推土机处理器组成一个整容强大的天蝎平台。
HD 7000系列除了全新Graphic Core Next架构以外,还采用了比GDDR5带宽高一倍的Rambus XDR2显存,它在功耗降低30%的情况下,带宽提升了一倍,达到最高256GB/s的带宽,以满足以后AMD CPU/GPU共享内存、显存协同计算的需要。
此次曝光了HD 7000系列8款显卡的型号、规格,其中New Zealand、Tahiti和Thames采用了新一代Graphic Core Next架构,而Lombok仍采用VLIW-4D老架构。让我们通过下表对具体情况进行下了解:


HD 7000 规格分析
首先我们看到,HD7000代号为Southern Islands,其中又分出4个小型号,按性能由强到弱依次为:New Zealand,Tahiti,Thames,Lombok。其中HD7990为HD6990的升级版,HD7970为HD6970的升级版,其他依次类推。那么这些升级版具体升级的是什么?让我们再来看下一张表:


以HD7970和HD6970来对比,在制作工艺上,由40nm升级到了28nm,SIMD阵列,流处理器数,GPU频率等均有大幅度提升,即使是略低一级的HD7950,各种规格也比HD6970高出不少。此外,HD7950在规格上高出HD6970的同时,功率也降低了40%,这对注重节能的朋友来说是一件好事。
具体来看最高端依然是双芯出场,代号New Zealand GCN HD 7990,它是基于两颗Tahiti XT/Pro核心,总共ALU数量将会达到4000以上,TDP在300W以上。随后是HD 7970和HD 7950。
  • HD 7970: 256bit/1000MHz/32CUs/2048ALUs/128TMUs/64ROPs/XDR2 8.0Gbps 256GB/S /190W TDP/ 2GB Memory
  • HD 7950: 256bit/900MHz/30CUs/1920ALUs/120TMUs/64ROPs/XDR2 7.2Gbps 230GB/S /150W TDP/ 2GB Memory

HD 7970(Tahiti XT)将会取代HD6970 (Cayman XT),并且会具备2048个SP,频率为1000Mhz,最大TDP功耗为190W,显存为2GB 8.0Gbps XDR2,带宽256GB/S。HD6970为1536个SP,频率为880Mhz
而HD7950 (Tahiti Pro)则是替代HD6950 (Cayman Pro),会具备1920个SP,频率为900Mhz,最大TDP功耗为150W,显存为2GB 7.2Gbps XDR2,带宽230GB/S。老的6950只有1408个SP,频率为800Mhz,显存带宽为160GB/s。
Thames XT/Thames Pro核心则分别是HD 7870和HD 7850,具体规格如下:
  • HD 7870: 950MHz/24SIMDs/1536ALUs/96TMUs/32ROPs/256bit GDDR5 5.8Gbps 186GB/S /2GB/ TDP 120W
  • HD 7850: 850MHz/22SIMDs/1408ALUs/88TMUs/32ROPs/256bit GDDR5 5.2Gbps 166GB/S /2GB/ TDP 90W

HD 7870(Thames XT)有1536个SP和HD6970等同,核心频率为950Mhz,32 ROP和2GB 256-bit GDDR5显存,带宽186GB/S。HD6870 (Barts XT)则有1120个SP,频率为900mhz,HD7870最大TDP功耗为120W。
HD 7850 (Thames Pro)将具备1408个Stream Processors,显存带宽166GB/s,实际为5.2GBps 2GB 256-bit显存,它将替代960SP Barts Pro核心HD6850(频率为775Mhz)
入门级则为:
  • HD 7670: 12SIMDs/768ALUs/48TMUs/16ROPs/900MHz/128bit/GDDR5 5.0Gbps 80GB/S /1GB/TDP 60W
  • HD 7570: 750MHz/12SIMDs/768ALUs/48TMUs/16ROPs/128bit GDDR5 4.0Gbps 64GB/s/1GB/50W TDP

当然依然采用VLIW4D结构的HD 7000显卡并不是一点改进都没有,它们改进了以下规格以提升效能:
-Multiple primitive pipelines for setup, etc.
-Real caching in L1, L2, separate color / z caches for graphics and atomics
-Concurrent tasks
-Out of order resource allocation
-ECC on srams and drams
预计HD7000系列显卡会在今年第四季度晚些时候推出,由于产能原因,我们推测7870 将会先出现,而更高端卡将会在明年上半年推出来,让我们共同期待吧。
Graphic Core Next GPU像CPU
“Graphic Core Next”是一个全新的GPU架构,AMD推出APU和异构计算显然已经让我们看到了AMD未来将会把GPU和CPU融合计算的思路,“Graphic Core Next”架构更是如此,甚至有可能未来AMD GPU会充当目前CPU的角色,那么究竟它如何实现CPU的功能的呢?接下来就让我们来分析分析。


首先需要分析AMD的技术背景和应用大环境,很明显AMD拥有图形技术,而在CPU技术方面处于弱势,如果能通过GPU技术弥补CPU弱势,会更容易取得竞争优势;而目前随着众多需要并行异构计算应用不断出现,CPU、GPU同时计算确实能够带来体验提升。
AMD Fusion开发者峰会(以下简称AFDS)上,微软此前就高调展示了自家对高性能并行计算的看法,他们宣称今年或明年将会推出针对Visual Studio和C++开放工具的C++ AMP (accelerated massive parallelism) 扩展程序。通过这个C++ AMP扩展程序,能够让程序员轻松调用CPU和GPU的异构并行计算性能。微软据称这个扩展程序未来将会公开,并且允许其他编译器集成它。
就像当年Intel 8086处理器可以搭配8087浮点处理器做协处理器使用,未来GPU的角色很有可能将会担当协处理器的角色,参与原本只有CPU才做的工作。
AMD下一代GPU可能用’graphics-enabled vector processor’(配图形功能的向量处理器)来形容更恰当,这比NVIDIA的Fermi GPU可能更过之而无不及。
AMD GPU/CPU将会不分你我
这个GPU具备X86内存寻址特性,换句话说就是可以和CPU一样调用系统内存,CPU通过MMU内存控制器访问内存,而GPU则是通过IOMMU实现内存调用。这种新技术允许系统设备在虚拟内存中进行寻址,也就是将虚拟内存地址映射为物理内存地址,让实体设备可以在虚拟的内存环境中工作,这样可以帮助系统扩充内存容量,提升性能。该技术可以通过搭配具备IOMMU的AMD 8系和9系主板来实现。


同时AMD下一代GPU还具备64bit x86指针、Page fault、地址转换缓存、分配内存的功能,操作系统将会同时为CPU、GPU内存调用全面服务。当然只是能够调用内存还不够,还需要让GPU能够接替原本CPU干的活,这方面我们看到了很多希望。


我们仔细总结AMD下一代GPU的架构特性:
  • 每个计算单元CU将基于vector向量处理器、scalar具备协处理器和特殊图形硬件
  • 每个计算单元CU将会具备4线程MIMD(用于多指令多数据计算)和64-op FMAD vector向量处理器单元(用于SIMD单指令多数据计算),并支持40路SMT多线程能力
  • 每个计算单元CU将独占16KB L1 cache,并搭配64KB L2 cache(可以被别的CU和CPU共享)
  • 可支持x86兼容寻址、指针、page faults、CPU/GPU共享L2 Cache和内存



很明显,GPU将会具备处理器的架构特点,那么它和处理器架构相似程度有多高呢?接下来就让我们来对比一下推土机的架构。
整体来说,AMD下一代GPU架构将会具备更多CPU架构的特点,并通过创新的共享内存、缓存平台创新,让GPU和CPU共同加速完成计算任务,也许未来CPU性能弱,通过GPU弥补也能比竞争对手要强。

评分

1

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|3DMGAME ( 京ICP备14006952号-1  沪公网安备 31011202006753号

GMT+8, 2026-4-10 06:36 , Processed in 0.026280 second(s), 18 queries , Memcached On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表