|
[c't-Homepc't 5/97, page 154 - Translation by Sabine Cianciolo
[aktuelles----------------------------------------------------------------
[Heft-ArchAndreas Stiller, Uwe Post
[English pages]
Move Over!
[Treiber-Service]
[FirmenkonAMD, Cyrix and Digital attack the market leader
There is a storm on the horizon -- at least for Intel. In April
[ftp-ServiAMD will attempt to seize the performance crown, before Intel
[News-Tickis able to shoot back with its Pentium-II and MMX-233 one month
later. But Cyrix and Digital are also lurking in the
background, waiting to intervene in the battle at the beginning
of summer.
The times where Intel could be on a high horse, and rule the
roost as it likes seem to be over. Up to now the Californian
chip giant was able to come up with a new processor generation
whenever the competition got too close. We can still hear the
slogans: 3 is better than 2, 4 is better than 3 and so on. But
it is more than questionable whether this will work again now.
Apparently the PPro based on Socket 8 does not have a future,
Socket 7 (home of the Pentium) is run over by the competition -
and we still have to wait and see whether the Pentium-II (also
called Klamath) with its clumsy format is going to be
successful.
K6 and M2 can build on a common board infrastructure - while
the Pentium-II needs new boards. Even older boards are K6/M2
suitable via an upgrade socket, if they can satisfy the
relatively high power consumption. Both competitors support and
are compatible to Intels multimedia extension MMX - even though
they are not allowed to call it just that.
[Image] AMDs K6 is ready for production now and was already
tested on the c't-testbed against Intels MMX-233,
PPro-200 and Pentium-II-233 (prototype). While it is possible
to use these actual benchmark data here, we can only estimate
and extrapolate the data for Cyrix's M2 and Digitals newest
scion 21164PC.
Even though Cyrix presented limited M2 samples (166 MHz clock
frequency, one error in the branch and 17 errors in the MMX
unit) at CeBIT - this version obviously was not ready for a
benchmark yet. IBM had finished another version of the mask
just before CeBIT, but Cyrix wanted to test it thoroughly
before letting the press get their hands on it - too bad.
During CeBIT Digital surprised with a real processor
announcement (the other three processor manufacturers left it
at "technology demonstrations"). DECs 21164PC was already
outlined at the Microprocessor Forum in October. It follows the
same idea as Intels Klamath: In comparison to the more
expensive predecessor (Alpha 21164 here, PPro there) the L2
cache was relocated, the L1 cache extended and multimedia
capabilities were added. While AMD, Intel and Cyrix are still
�crawling� at 233 and 266 MHz, the 21164PC offers impressive
clock rates up to 533 MHz. Until recently the Alpha processor
played only a minor role regarding available software, but now
its importance grows proportionally to Windows NT. Microsoft
announced NT 5.0 for Alpha and according to DEC also promised
to finally finish newer versions of the Office suite (Excel,
Word, Access, ...). On top of that DEC�s �compiling emulator�
FX32! can execute Intel code at Pentium speed (and better).
This may get very exciting, indeed.
Dilemma
Now Intel is in a dilemma: Emphasizing the floating point
performance, as demanded by modern 3D software, offers them a
good position compared to AMD and Cyrix, because their
processors are usually inferior in this discipline. On the
other hand, regarding floating point performance the Klamath is
fighting a losing battle against Alpha processors - even if it
runs at 300 MHz and more. By the way, also the PowerPCs
dominate here with randomly addressable 32 FP registers,
whereas x86 must do with a meager stack of 8 FP registers.
Emphasizing on integer performance, a strong wind from the
direction of K6 and M2 will blow in Intels face. Especially the
Landmark-2.0 benchmark, still favored in the USA, shows very
distinctly how the K6 dupes the Klamath prototype.
This leaves MMX; here Intel clearly leads because of two MMX
pipelines. There is a lot of hoopla around MMX, but its actual
usability is limited to a few tasks - and conflicts in many
cases (especially in 3D graphics) with floating point
calculations. Intels processors need an unusually long time for
the required context switch - AMDs K6 and particularly Cyrix�s
M2 manage this switch notably better. Sometimes there is no
gain in running very fast - if you fail the baton hand-off.
Shining examples like Chromakeying or Alpha Blending (image
processing) serve as basis for the Intel-Media-Bench (IMB), but
in practice they are almost meaningless. Regarding MPEG
decoding (also a part of IMB) the picture looks different
though. K6 and M2 are not at Klamath level as far as image
processing is concerned, but they can pit themselves against
the current Socket 7 crown prince MMX-200. And with MPEG the K6
leaves at least the Klamath prototype in the dust.
DEC thought of MMX as not very suitable for MPEG and developed
MVI (Motion Video Instructions) instead. MVI consists of a few
instructions that are only intended for this purpose. Contrary
to Intel, DEC did not need a separate unit with FPU register
mapping and time-consuming context switches - Alpha uses 64-bit
integer registers anyway.
Of course Intel knows about the weak spots of MMX and will
introduce an extended MMX version �MMX2� probably already with
its next processor generation �Deschutes�.
Socket-7 Battle
Intel does absolutely everything to spoil Socket-7 for the
competition - after all the corporation also dominates the chip
sets. Therefore Intel has no plans to offer the fast graphic
port AGP for Socket-7 chip sets or higher clock frequencies.
Both are kept for Klamaths Slot-1 chip sets (440LX and 440BX).
The 430HX chip set will be discontinued in favor of the 430TX -
deliberately the latter was limited to a L2 cache area of 64
MByte, so it does not have a future.
But AMD recognized the problem, cooperated with the Taiwanese
chip set manufacturer VIA and is now entering this market. For
now the AMD640 resembles only a sold-on VIA Apollo VP2, but for
fall a joined development is planned including AGP, 100 MHz
system clock and other goodies. Opti, Ali, SiS and ITE also see
their chance and will intensively embrace Socket-7 - it�s
future should be safe for now. Market observers estimate that
it will take three years before Slot-1 has caught up with
Socket-7. Until then they expect a demand of 200 million
Socket-7 boards. Whoever offers the best price/performance
ratio should have it made... The question is whether AMD and
the Cyrix plants can satisfy this demand.
It also has to be said here that Intels GTL+ bus of PPro and
Klamath processors is much more powerful than the old bus
design of the Socket-7 users. GTL+ is asynchronous, packet
oriented and can handle up to 8 waiting transfers. In single
processor systems this bus optimized for throughput is wasted.
Only in multi processor environments it can really demonstrate
its capabilities.
Neither K6 nor M2 (as well as K5 and 6x86) are suited for multi
processing, so the Pentium bus is enough for them. Looking at a
market share of 95 percent for single processor systems, the
renunciation of multi processor support is acceptable.
Nevertheless Intel will quite surely promote the multiprocessor
capabilities of their products strongly. The GTL bus is
patented by Intel. Whoever wants to develop hardware for it, is
at Intels mercy. But such proprietary solutions quite often
proofed to be a boomerang - like IBMs Micro- Channel that
started the downfall of this dynasty in the PC arena. Then came
open busses like EISA, VL and PCI ... and IBMs leading role was
history.
Market Economy
Somewhat important for the success of new processors is their
price. Here AMD and DEC really splash out. At 464 Dollars (when
sold in quantities of 1,000 and up) the K6 is quite a bit
cheaper than the Klamath-233 (with 512 KByte cache) that is
supposed to start at 624 Dollars (when sold in quantities of
10,000 and up). Intel does not even sell the Pentium-MMX-200
(according to prices for the second quarter) for the price of
the K6. But to be able to use an existing - and tested! - board
is more important for economic viability. System administrators
dread nothing more than changing a board.
DEC offers the Alpha 21164PC for an unusually low price. The
smallest with 400 MHz is already available for 295 Dollars
(when sold in quantities of 1,000). The Alphas need a special
board though (164SX with DEC 21174 chip set, PB cache of 256 KB
to 4 MByte, SD-RAM support), and nothing was said about its
price yet. But DEC definitely wants to stay competitive, so the
complete system will settle below 2600 Dollars.
Cyrix has not talked about M2 prices yet. Under no
circumstances they want to repeat the mistake made with the
c6x86 though and enter the race with much too high prices.
Hare and Tortoise
AMD delivered a K6-233 Revision 1 including a reference system
to us for testing. The latter was well equipped (FIC PA2011
board with VIA VP2 chip set, 32 MByte SDRAM, 1 MByte L2 cache,
DTP cache controller, Matrox Millenium etc.), so it achieves a
high WinBench97 value (74,9). But we decided to do the
comparison with our standard testbed (Asus TX97, Elsa Winner
2000Pro/x, Quantum Fireball, 32 MByte SDRAM) with only 512
KByte cache on a current TX-board that supports the K6. The
board was still set at 3,1 V for the K6-233 (since recently, it
wants 3,2 V), but no problems occurred. It ran without any
glitches even at 2,9 V.
With regard to performance, the TX97 board was at least equal
to the PA2011, partially even about 2 to 3 percent better.
[Image] The Pentium Pro could feel right at home, since he ran
on the Intel board Venus VS440 with Natoma 440FX chip
set. Soyo gave their current Slot-1 board SY 6KA to us for the
Pentium-II, which we used for the already somewhat ancient
Klamath prototype Rev 0. Quite to the dismay of Intel this
module already produced benchmark results (but with another
board). Unfortunately Intel could not or would not let us have
a current product version of the Pentium-II for testing - since
the official introduction of the crown prince is at the
beginning of May. The prototype has some peculiarities here and
there, so that the final performance might be a few percent
higher. For example the write combining does not work. This
hardly shows up in the BAPCo-Suite, but according to our
experiences with PPro the MPEG playback would be accelerated
immensely.
Besides that we described an inexplicable �Landmark weakness�.
It is quite understandable that in comparison to K6 the Pentium
PPro and Klamath both do badly in this benchmark entirely
running in L1 cache, because in the 16 bit integer multiplies
stopped by the Landmark bench they clearly stay behind (K6 and
M2: 3 clock cycles, PPro/Klamath: 5 clock cycles, Pentium: 11
clock cycles). Regarding the integer division the K6 wins
again, by the way. We also found that the PPro/Klamath
processors have substantial difficulties with the so-called
Read- Modify-Write instructions, like for example DEC [mem]
which �eats� up to 7 clock cycles (K6 1 clock cycle). The
PPro�s parallelism is better here, but with the Klamath
prototype this has a big influence. The question is whether
this resembles a bug or a feature. It is easy to clarify this
with Landmark 2.0. The PPro-200 achieves values around 1200,
the K6 about 2400 and the Klamath prototype crawls around at
715.
In a further analysis another stumbling block of the Klamath
prototype surfaced. Accesses via GS segment, meaning
mov,ax,gs:[0], take almost an eternity, actually 55 clock
cycles. But otherwise the PPro and Klamath values correspond to
eachother. In any case, we did not find any other
bug-suspicious parts. One can assume that the peculiarities
mentioned will be repaired in the market version of Pentium-II.
Intel will probably come out with a 266-MHz version right away.
[Image] To obtain the �internal values� of the processors we
also measured them without L2 cache and finally
without any cache. As a by-product we noticed how local the
benchmark software is, how much the performance depends on L2
cache and main memory. There was an immense difference between
NT 4.0 and Windows 95 in favor of NT, which apparently is
responsible for the better performance with NT.
[Image] We also discovered that measurements without cache are
not usable as an estimate for the quality of the
processor core, because PPro/Klamath are almost helpless
without L1 cache. Their performance decreased to the level of a
8-MHz- 286. If the L1 cache stays on and only the L2 cache is
switched off, Klamath does not stand a chance against the K6.
Its performance decreases an average of about 40 percent using
BAPCo32/NT, while K6 only suffers from a performance loss of 13
percent. On one hand this is the result of K6�s larger L1
cache, but further investigations also showed that the K6 core
is more efficient (regarding dispatch abilities, latency and
throughput times). PPro and Klamath obviously draw their
performance from the faster coupling of the L2 cache.
P-Rating 233
The BAPCo32 suite under NT 4.0 proofed: With standard
applications the K6-233 is equal to a Klamath-233 or PPro-200.
Klamath was only able to gain marginally. Otherwise those three
fought an exciting triathlon in the important business
discipline resulting in only minor differences. The Pentium-MMX
lacks a little bit behind, but only about 10 to 15 percent at
233 MHz.
[Image] Using floating point intensive software (c�t
Mandelbrot set, POVRay raytracing, audio in the Intel
Media Bench, Quake) the Intel processors were partly able to
put themselves in the limelight. But on the other hand the
difference in the HINT benchmark with floating point
calculations is only marginal anyhow. The K6 compensates for
this deficiency in the area of computing intensive integer
software (HINT integer, chess benchmark), where it is up to 30
percent faster than the Klamath prototype - not to mention the
phenomenal Landmark and Norton-SI results. K6 also compiled
Linux just a hint faster (2 s) than the Klamath-233.
But in the MMX arena Klamath shines. Its two MMX pipes are
almost unbeatable. While K6 and M2 are able to execute one MMX
instruction per clock cycle, Klamath manages 2 instructions at
the same time. Klamath therefore clearly leads in all MMX
benchmarks. K6 does not do too badly though. In the Intel Media
Bench it achieved the level of a Pentium-MMX-200.
The Ball is Round
[Image] AMDs K6 finally brings some action to the scene. It
already was quite boring to always see the same
champion in the Soccer-7 second division. Borussia AMD got
promoted into this league only one year ago with the 75-MHz-K5
[3] and now is leading the division with the three times faster
K6, at least for a short time. Already there are rumors about
secret negotiations between Intels co- trainer Compaq and AMD.
And the teams of Cyrix and DEC are warming up to get heavily
involved in the league in summer. Manager Vobis is filled with
enthusiasm for the DEC team and wants to invest. After all DEC
now has a miracle forward in its FX32!, who knows how to score
goals against Intel.
Even though regarding floating point and MMX Intels chips
perform a little bit better than K6 and M2, the latter will
surely be able to seize a good part of the x86 market because
of their better price/performance ratio. Intel comes under
pressure - it is about time, too.(as)
----------------------------------------------------------------
Low-Cost-Alpha
Partnering with Mitsubishi, Digital wants to enter the market
dominated by Intel with a slimmed down Alpha 21164. The Alpha
21164PC does not have an integrated L2 cache anymore, but an
extended L1 cache from 8 to 16 Kbyte for instruction code. The
data cache remains unchanged. This way it was possible to
decrease the die size immensely, increasing the yield and
lowering the costs. According to DEC the average performance is
only 10 percent below the larger Alpha brother at the same
clock speed, 14,3 SPECint95 and 17 SPECfp95 for the 533-MHz
version. As a comparison: The PPro achieved 8,7 SPECint95 and 6
SPECfp95. The Hint benchmark values we measured with an
Alpha-500 confirm these ratios. As a goodie DEC added special
instructions to the 21164PC that are supposed to enable the
processor to decode DVD videos with AC-3 audio and MPEG-2
without using additional hardware.
The new processor uses the instruction extension MVI (Motion
Video Instructions) that have not more in common with Intels
MMX than just the first letter. Digital added five integer
instructions to the existing instruction set. Two of these
(PACK, UNPACK) change 16 or 32 bit words into individual bytes
(and back). Eight bytes together fill one of the processors
64-bit registers. In parallel two other new instructions
determine minima (MIN) and maxima (MAX) of two registers, in
total 16 bytes. Finally the last added instruction (PERR)
calculates the sum of the absolute differences of all eight
byte pairs in two registers.
To give systems based on the new processor a chance in the
targeted market, Digital supports every software running under
NT 4.0 in close teamwork with Microsoft and with that every
existing Windows program. Especially the FX32! emulator draws
attention, because it can execute Wintel software with high
performance.
A special feature of the 21164PC is the dynamic cache test.
With every booting the processor checks its cache and maps
lines in reserve onto faulty lines if necessary. This saves
costly repairs during manufacturing.
The 21164PC will be available with 400, 466 and 533 MHz. With
2,5 V internal and 3,3 V external power supply they consume
about as much power as Intels Pentium Pro. Digital plans to
deliver in summer 1997 with pricing starting at 295, 395 and
495 US dollars (when sold in quantities of 1,000 and up).
----------------------------------------------------------------
K6-Upgrade
[Image] Customers do not necessarily have to buy a new board
if they want to enjoy Pentium MMX, K6 and M2. There
are Pentium-MMX Overdrive processors for up to 166 MHz.
Additionally they can order an upgrade socket for 119 Marks
from Madex, Neu-Isenburg, that upgrades the necessary voltages
and the probably missing BF1 jumper - if the voltage regulator
can satisfy the power hunger of the new companion. The K6 wants
at least 10 A. Earlier versions of the Cyrix-6x86 wanted the
same, so boards supporting the c6x86 had to be equipped
properly. Madex has not accounted for the new BF2 jumper yet,
but it is only needed for 266 MHz and above (for 233 MHz the
setting :x1,5 - formerly for Pentium 100 - is chosen).
Since the listed VCC2 voltages have a tolerance range of +- 0,1
V, the K6-233 should work with a voltage of 3,3 V even in older
boards (if these can drive 10 A). Sometimes the processor also
runs with 2,9 V without problems - just try it out.(as)
[top]
----------------------------------------------------------------------------
[Home] Copyright Verlag Heinz Heise. Last changed by J�rgen Kuri,
07.04.97
|
|
[c't-Homepc't 05/97, S. 154
[aktuelles----------------------------------------------------------------
[Heft-ArchAndreas Stiller, Uwe Post
[English pages]
Platz da!
[Treiber-Service]
[FirmenkonAMD, Cyrix und Digital attackieren den Marktf�hrer
Die Zeichen stehen auf Sturm - jedenfalls f�r Intel. Im April
[ftp-Serviwill zun�chst AMD mit dem K6 die Performance-Krone ergreifen,
[News-Tickbevor Intel laut Plan einen Monat sp�ter mit dem Pentium-II und
dem MMX-233 zur�ckschie�en kann. Aber da stehen au�erdem noch
Cyrix und Digital Pfeil bei Fu�, um im Fr�hsommer in den Kampf
einzugreifen.
Die Zeiten, in denen Intel, auf dem hohen Ro� sitzend, die
Szene nach Belieben beherrschte, scheinen vorbei zu sein.
Bislang konnte der kalifornische Chip-Gigant immer dann, wenn
die Konkurrenz ihm zu nahe kam, zu einer neuen
Prozessorgeneration entfleuchen. Man hat die Slogans noch im
Ohr: 3 ist besser als 2, 4 ist besser als 3 und so weiter. Ob
das jetzt noch klappt, ist mehr als fraglich. Der PPro auf
Basis des Sockel 8 hat offenbar keine Zukunft mehr, beim Sockel
7 (in dem der Pentium zu Hause ist) zieht die Konkurrenz vorbei
- und ob der Pentium-II (auch Klamath genannt) mit seinem
unf�rmigen Format Erfolg haben wird, bleibt noch abzuwarten.
K6 und M2 k�nnen auf eine verbreitete Board-Infrastruktur
aufbauen - w�hrend der Pentium-II neue Boards erfordert. Sogar
�ltere Pentium-Boards sind via Upgrade-Sockel K6/M2-tauglich,
wenn sie den verh�ltnism��ig hohen Stromhunger der beiden
befriedigen k�nnen. Beide Herausforderer unterst�tzen
kompatibel Intels Multimedia-Erweiterung MMX - auch wenn sie
diese nicht so nennen d�rfen.
AMDs K6 ist jetzt produktionsreif und konnte sich auf dem
c't-Pr�fstand schon mal mit dem Intel-Dreigespann MMX-233,
PPro-200 und Pentium-II-233 (Prototyp) messen. W�hrend man hier
also auf konkrete Benchmark-Daten zur�ckgreifen kann, ist man
bei Cyrixens M2 und Digitals neuestem Spro�, dem 21164PC, noch
auf Sch�tzungen und Extrapolationen angewiesen.
Cyrix konnte zwar auf der CeBIT eingeschr�nkt lauff�hige
M2-Muster pr�sentieren (mit 166 MHz Takt, einem Fehler in der
Branch- und 17 Fehlern in der MMX-Unit) - benchmarkf�hig war
diese Version offenbar noch nicht. Zwar hatte IBM kurz vor der
CeBIT die n�chste Maskenversion fertig gebacken, doch wollte
Cyrix sie erst ausf�hrlich testen, bevor sie in die H�nde der
Presse durfte - schade.
Digital �berraschte w�hrend der CeBIT mit einer echten
Prozessorank�ndigung (alle anderen drei Prozessorschmieden
belie�en es bei `Technologie-Demonstrationen�). DECs 21164PC
wurde bereits im Oktober auf dem Microprocessor Forum
skizziert. Er verfolgt die gleiche Idee wie Intels Klamath: Wie
bei n�mlichen wurde gegen�ber dem teuren Vorg�nger (hie Alpha
21164, dort PPro) der L2-Cache ausgelagert, der L1-Cache
vergr��ert und eine Multimedia-F�higkeit hinzugef�gt. W�hrend
AMD, Intel und Cyrix bei 233 und 266 MHz `herumkrebsen�, wartet
der 21164PC mit beeindruckenden Taktraten auf: bis zu 533 MHz.
War der Alpha-Prozessor bislang softwarem��ig auf einem
Nebengleis, so w�chst seine Bedeutung proportional zu Windows
NT. Microsoft hat NT 5.0 f�r Alpha angek�ndigt und laut DEC
auch versprochen, endlich neuere Versionen der Office-Suite
(Excel, Word, Access ...) fertigzustellen. Au�erdem hat DEC mit
dem `kompilierenden Emulator� FX32! ein Tool in der Hand, das
Intel-Code mit Pentium-Geschwindigkeit (und besser) auszuf�hren
vermag ... Das d�rfte noch spannend werden.
In der Zwickm�hle
Intel ist nun in der Zwickm�hle: betont man st�rker die
Flie�kommaleistung, wie sie moderne 3D-Software erfordert, so
kann man sich zwar gegen�ber AMD und Cyrix gut in Szene setzen,
da deren Prozessoren in dieser Disziplin zumeist unterlegen
sind. Andererseits steht bei Flie�komma der Klamath gegen�ber
den Alpha-Prozessoren auf v�llig verlorenem Posten - selbst
wenn er mit 300 MHz und mehr daherkommt. Hier dominieren
�brigens auch die PowerPCs mit ihren frei adressierbaren 32
FP-Registern, wogegen x86er mit einem mickrigen Stack von 8
FP-Registern auskommen m�ssen.
Setzt man hingegen st�rker auf die Integerleistung, weht Intel
ein heftiger K6- und M2-Wind entgegen. Besonders bei dem in den
USA immer noch beliebten Landmark-2.0-Benchmark wird das
deutlich, wo der K6 den Klamath-Prototyp geradezu d�piert.
Bleibt noch MMX; hier hat Intel dank zweier MMX-Pipelines die
Nase klar vorn. MMX wird zwar stark beworben, ist aber auf
wenige Einsatzzwecke beschr�nkt - und `bei�t� sich in vielen
F�llen (vor allem bei 3D-Grafik) mit Flie�kommaberechnungen.
F�r den daf�r n�tigen Context-Switch brauchen Intels
Prozessoren unverh�ltnism��ig viel Zeit - AMDs K6 und
insbesondere Cyrix M2 beherrschen diesen Wechsel deutlich
besser. Es n�tzt mitunter nichts, superschnell zu laufen - wenn
man beim Staffelwechsel versagt ...
[Benchmarks Performance-Einsch�tzung]
Die Paradebeispiele wie Chromakeying oder Alpha Blending (Image
Processing) dienen zwar als Grundlage f�r den Intel-Media-Bench
(IMB) - sind aber in der Praxis nahezu bedeutungslos. Anders
sieht es da schon mit dem MPEG-Decoding aus (ebenfalls ein
Bestandteil des IMB). Beim Image Processing liegen K6 und M2
zwar nicht auf Klamath-Niveau, k�nnen aber dem aktuellen
Sockel-7-Kronprinzen MMX-200 Paroli bieten. Und bei MPEG h�ngt
der K6 zumindest den Klamath-Prototyp ab.
DEC hat MMX-artiges f�r MPEG als wenig tauglich empfunden und
statt dessen MVI (Motion Video Instructions) entwickelt. MVI
besteht aus wenigen Befehlen, die nur f�r diesen Einsatzzweck
gedacht sind (siehe Kasten). Anders als Intel mu�te DEC hierzu
keine eigene Einheit mit FPU-Register-Mapping und
zeitfressenden Context-Switches bem�hen - die Integer-Register
sind beim Alpha halt von Haus aus 64bittig. Intel kennt
nat�rlich die schwachen Punkte von MMX und wird wahrscheinlich
schon mit der n�chsten Prozessorgeneration `Deschutes� eine
erweiterte MMX-Version `MMX2� einf�hren.
Sockel-7-Gefecht
Intel tut nun alles, um den Konkurrenten den Sockel 7 zu
vermiesen - schlie�lich dominiert die Corporation auch bei den
Chips�tzen. So will Intel den schnellen Grafikport AGP nicht
f�r Sockel-7-Chips�tze anbieten, ebensowenig wie h�here
Taktraten. Beides bleibt Slot-1-Chips�tzen f�r Klamath
vorbehalten (440LX und 440BX). Den 430HX-Chipsatz will man
zugunsten des 430TX einstellen - letzteren hat man
`wohlweislich� auf einen L2-Cache-Bereich von 64 MByte
besch�nkt, damit er blo� keine Zukunft hat.
Doch AMD hat das Problem erkannt, sich mit der taiwanischen
Chipsatzschmiede VIA zusammengetan und steigt jetzt in diesen
Gesch�ftszweig ein. Der AMD640 ist zun�chst nur ein
durchverkaufter VIA Apollo VP2, f�r den Herbst ist jedoch eine
gemeinsame Weiterentwicklung mit AGP, 100 MHz Systemtakt und
weiteren Goodies geplant. Auch Opti, Ali, SiS, ITE wittern ihre
Chance und werden sich intensiv um den Sockel 7 k�mmern - seine
Zukunft d�rfte erst mal gesichert sein. Marktbeobachter
sch�tzen, da� es drei Jahre dauern wird, bis Slot-1 den Sockel
7 eingeholt hat. Bis dahin rechnet man mit einer Nachfrage von
200 Millionen Sockel-7-Boards. Wer hier das beste
Preis/Leistungsverh�ltnis bietet, d�rfte saniert sein ... Fragt
sich nur, ob AMD und die Cyrix-Schmieden diese Nachfrage
�berhaupt befriedigen k�nnen.
[Checkliste: Die gro�en F�nf]
An dieser Stelle mu� man allerdings betonen, da� Intels
GTL+-Bus des PPro- und Klamath-Prozessors deutlich
leistungsf�higer ist als das �ltliche Bus-Design der
Sockel-7-Benutzer. GTL+ ist asynchron, paketorientiert und kann
bis zu acht ausstehende Transfers behandeln. In
Single-Prozessorsystemen ist dieser auf Durchsatz optimierte
Bus jedoch wie `Perlen vor die S�ue� geworfen. Erst in
Multiprozessor-Umgebungen kann er wirklich zeigen, was in ihm
steckt.
Weder K6 noch M2 (ebensowenig wie K5 und 6x86) sind derzeit
multiprozessortauglich, so da� f�r sie der Pentium-Bus
ausreichend ist. Angesichts einer Marktdeckung von �ber 95
Prozent Single-Prozessorsystemen ist der Verzicht auf
Mehrprozessor-Support verschmerzbar. Dennoch wird Intel
sicherlich die Multiprozessor-F�higkeit ihrer Produkte
verst�rkt in den Vordergrund stellen. Allerdings ist der
GTL+-Bus ein Intel-Patent. Wer hierf�r Hardware entwickeln
will, ist also von Intels Gnaden abh�ngig. Solch propriet�re
L�sungen haben sich jedoch schon des �fteren als Bumerang
erwiesen - man denke an IBMs Micro-Channel, der den Niedergang
dieser Dynastie im PC-Bereich einleitete. Da kamen dann offene
Busse wie EISA, VL und PCI ... und aus war�s mit IBMs
Vorreiterrolle.
Marktwirtschaft
Nicht ganz unwichtig f�r den Erfolg neuer Prozessoren ist
letztlich ihr Preis. Und hier haben sich AMD und
DEC/Mitsubishis nicht lumpen lassen. Mit 464 Dollar (ab 1000)
liegt der K6-233 weit unterhalb des geplanten Einstandspreises
der Klamath-233 (bei 512 KByte Cache), der auf 624 Dollar (ab
10 0000) taxiert wird. F�r den K6-Preis bekommt man von Intel
nicht einmal den Pentium-MMX-200 (Preis vom zweiten Quartal).
Wichtig f�r die Wirtschaftlichkeit ist aber vor allem, da� man
in vielen F�llen ein vorhandenes - und erprobtes! - Board
weiter benutzen kann. Nichts graust einen Systemadministrator
mehr als ein Board-Wechsel.
[Grafik Hint-Benchmark]
DEC hat den Alpha 21164PC ebenfalls ungew�hnlich g�nstig
positioniert, der kleinste mit 400 MHz ist schon f�r 295 Dollar
(ab 1000) erh�ltlich. F�r die Alphas ist allerdings ein
spezielles Board vonn�ten (164SX mit DEC-21174-Chipsatz,
PB-Cache von 256 KB bis 4 MByte, SD-RAM-Support), �ber dessen
Preis noch nichts zu erfahren war. Aber DEC will auch hier `auf
alle F�lle konkurrenzf�hig� sein, so da� das Gesamtsystem auf
unter 2600 Dollar zu liegen kommt.
Cyrix hat noch nichts �ber M2-Preise verlauten lassen.
Keinesfalls aber wolle man den beim c6x86 gemachten Fehler
wiederholen, mit viel zu hohen Preisen in das Rennen
einzusteigen.
Hase und Igel
F�r die Tests lieferte uns AMD einen K6-233 Revision 1 samt
Referenzsystem. Selbiges war gut best�ckt (FIC-PA2011-Board mit
VIA-VP2-Chipsatz, 32 MByte SDRAM, 1 MByte L2-Cache,
DTP-Cache-Controller, Matrox Millenium etc.), damit es auch
einen m�glichst guten WinBench97-Wert erzielt (74,9). Wir
beschlossen aber, den Vergleich bei nur 512 KByte Cache in
einem aktuellen K6-tauglichen TX-Board mit unserer
Standard-Umgebung durchzuf�hren (Asus TX97, Elsa Winner
2000Pro/X, Quantum Fireball, 32 MByte SDRAM). Das Board war
zwar noch auf 3,1 V f�r den K6-233 eingerichtet (der m�chte
neuerdings lieber 3,2 V), Probleme zeigten sich damit jedoch
nicht. Selbst bei nur 2,9 V lief es st�rungsfrei.
In der Performance erwies sich das TX97-Board gegen�ber dem
PA2011 �brigens trotz kleinerem Cache als mindestens
gleichwertig, teilweise war es gar um zwei bis drei Prozent
besser.
[Balkendiagramme: Performance unter Win 95 und NT 4.0]
Der Pentium Pro durfte sich ganz zu Hause f�hlen, er lief
n�mlich in dem Intel-Board Venus VS440 mit
Natoma-440FX-Chipsatz. F�r den Pentium-II stellte uns Soyo ihr
aktuelles Slot-1-Board SY 6KA zur Verf�gung, in das wir unseren
schon etwas betagten Klamath-Prototyp Rev 0 hineinsteckten.
Dieses Modul lieferte ja schon in [1] sehr zum �rger von Intel
erste Benchmark-Ergebnisse (allerdings in einem anderen Board).
Leider konnte oder wollte Intel uns immer noch keine aktuelle
Produktionsversion des Pentium-II zum Test �berlassen - ist
doch erst Anfang Mai die offizielle Vorstellung der
Kronprinzen. Der Prototyp hat hier und da noch einige
Merkw�rdigkeiten, so da� die endg�ltige Performance gut und
gerne ein paar Prozent h�her liegen d�rfte. So funktioniert das
Write Combining offenbar nicht. In der BAPCo-Suite macht sich
das zwar kaum bemerkbar, aber die MPEG-Wiedergabe w�rde sich
nach den Erfahrungen mit dem PPro erheblich beschleunigen.
Daneben beschrieben wir in [1] eine unerkl�rliche
`Landmark-Schw�che�. Da� Pentium PPro und Klamath gleicherma�en
bei diesem ausschlie�lich im L1-Cache ablaufenden Benchmark im
Vergleich zum K6 schlecht abschneiden, ist verst�ndlich, denn
in der vom Landmark-Bench gestoppten 16bittigen
Integer-Multiplikation liegen sie klar zur�ck (K6 und M2: 3
Takte, PPro/Klamath 5 Takte, Pentium 11 Takte). Auch bei der
Integer-Division obsiegt �brigens der K6. Daneben zeigte es
sich, da� die PPro/Klamath-Prozessoren erhebliche
Schwierigkeiten mit sogenannten Read-Modify-Write-Befehlen
haben, so etwa DEC [mem], welcher bis zu 7 Takte verschlingt
(K6 1 Takt). Der PPro kann hierbei besser parallelisieren, beim
Klamath-Prototyp schlagen diese Takte hingegen voll zu Buche.
Fragt sich, ob das ein Bug oder Feature ist. Mit Landmark 2.0
l��t sich das leicht herausfinden, der PPro-200 erreicht hier
Werte um 1200, der K6 von 2400 und der Klamath-Prototyp krebst
bei 715 herum.
[Tabelle Stromverbrauch]
Bei der weiteren Analyse enttarnte sich noch ein Stolperstein
des Klamath-Prototyp. Zugriffe via GS-Segment, also mov
ax,gs:[0] dauern eine mittlere Ewigkeit, n�mlich 55 Takte.
Ansonsten aber entsprechen sich die PPro- und Klamath-Werte,
jedenfalls haben wir keine weiteren Bug-verd�chtigen Stellen
gefunden. Man kann davon ausgehen, da� obige Unbotm��igkeiten
mit der Marktversion des Pentium-II behoben sein werden.
M�glicherweise wird Intel von vornherein gleich mit einer
266-MHz-Version ins Rennen gehen.
Um die `inneren Werte� der Prozessoren abzuklopfen, wurden sie
auch ohne L2-Cache und schlie�lich ganz ohne Cache vermessen.
Als Nebenprodukt fiel dabei ab, wie lokal die
Benchmark-Software ist, wie stark die Peformance also von
L2-Cache und Hauptspeicher abh�ngt. Hier ergab sich ein
erheblicher Unterschied zwischen NT 4.0 und Windows 95
zugunsten von NT, was wohl vorrangig f�r die bessere
Performance unter NT verantwortlich ist.
[Flie�komma- und Integer-Performance]
Es zeigte sich ferner, da� die cachefreie Messung als
Absch�tzung f�r die Prozessorkern-Qualit�t unbrauchbar ist, da
PPro/Klamath ohne L1-Cache nahezu hilflos sind: ihre
Performance sank auf das Niveau eines 8-MHz-286ers herab. L��t
man den L1-Cache an, schaltet nur L2 ab, so hat Klamath gegen
den K6 keine Chance, seine Performance sinkt etwa bei der
BAPCo32/NT um durchschnittlich 40 Prozent, w�hrend der K6 nur
13 Prozent Performance-Verlust erleidet. Das liegt zum einen
nat�rlich an dem gr��eren L1-Cache des K6, weitere
Untersuchungen unterlegten aber, da� der K6-Kern auch
effizienter ist (was Dispatcher-F�higkeit, Latency- und
Throughput-Zeiten angeht). PPro und Klamath zehren ihre
Leistungsf�higkeit offensichtlich mehr aus der schnelleren
Ankopplung des L2-Caches.
Den inneren Aufbau von K6 und M2 hatten wir schon in der
letzten Ausgabe vorgestellt [2], so da� wir hier auf eine
Wiederholung verzichten wollen. Statt dessen steht die Frage im
Vordergrund, welche Performance AMDs neuer Prozessor denn nun
bietet.
P-Rating 233
Die BAPCo32-Suite unter NT 4.0 erbrachte bis auf `Rauschen� den
Beweis: der K6-233 ist bei Standardapplikationen einem
Klamath-233 oder PPro-200 ebenb�rtig. Der Klamath konnte nur
einen ganz geringf�gigen Vorsprung herausholen. Ansonsten
liefern sich die drei in der wichtigen Busine�-Disziplin einen
packenden Dreikampf mit nur unwesentlichen Unterschieden.
Demgegen�ber f�llt der Pentium-MMX etwas zur�ck, bei 233 MHz
aber auch nur um etwa zehn bis 15 Prozent.
Bei flie�kommaintensiver Software (c't-Apfelm�nnchen,
POVRay-Raytracing, Audio im Intel-Media-Bench, Quake) k�nnen
sich die Intel-Prozessoren teilweise erheblich besser in Szene
setzen, wiewohl andererseits der Unterschied beim
HINT-Benchmark mit Flie�kommaberechnungen nur marginal ist. Der
K6 gleicht dieses Manko bei rechenintensiver Integer-Software
zum guten Teil wieder aus (Hint-Integer, Chess-Benchmark), wo
er bis zu 30 Prozent besser als der Klamath-Prototyp dasteht -
ganz zu schweigen von den ph�nomenalen Landmark- und
Norton-SI-Ergebnissen. Auch Linux kompilierte der K6 um den
Hauch schneller (2 s) als der Klamath-233.
[MMX-Performance]
Im MMX-Bereich brilliert hingegen Klamath. Seine beiden
MMX-Pipes sind kaum zu schlagen. W�hrend K6 und M2 einen
MMX-Befehl pro Takt ausf�hren, kann Klamath gleichzeitig zwei
Befehle durchschleusen. In allen MMX-Benchmarks liegt somit
Klamath klar in Front. So schlecht schl�gt sich der K6 dennoch
nicht, beim Intel Media Bench erreicht er etwa das Niveau eines
Pentium-MMX-200.
Der Ball ist rund
Mit AMDs K6 kommt endlich Schwung in die Szene. Es war schon
ziemlich langweilig, immer den gleichen Meister in der
Soccer-7-Oberliga zu haben. Borussia AMD ist erst vor einem
Jahr mit dem 75-MHz-K5 in diese Liga aufgestiegen [3] und
stellt nun mit dem dreimal schnelleren K6 zumindest kurzzeitig
den Tabellenf�hrer. Schon h�rt man von geheimen Verhandlungen
zwischen Intels Co-Trainer Compaq und AMD. Und die Mannschaften
von Cyrix und DEC laufen sich m�chtig warm, um im Sommer in der
Liga kr�ftig mitmischen zu k�nnen. Manager Vobis ist vom
DEC-Team ganz begeistert und will hier investieren. Schlie�lich
hat DEC jetzt mit FX32! einen Wunderst�rmer, der wei�, wie man
gegen Intel Tore schie�t.
Auch wenn Intels Chips bei Flie�komma und MMX etwas
performanter als K6 und M2 sind, nicht zuletzt wegen ihres
besseren Preis/Leistungsverh�ltnisses werden sie sicherlich
einen guten Teil des x86-Marktkuchens f�r sich abschneiden
k�nnen. Intel kommt unter Druck - wurde aber auch h�chste Zeit.
(as)
[zum]
----------------------------------------------------------------------------
[Home] Copyright Verlag Heinz Heise. Zuletzt aktualisiert von Michael
Kurzidim, 07.04.97
|