[Search for users] [Overall Top Noters] [List of all Conferences] [Download this site]

Conference 7.286::digital

Title:The Digital way of working
Moderator:QUARK::LIONELON
Created:Fri Feb 14 1986
Last Modified:Fri Jun 06 1997
Last Successful Update:Fri Jun 06 1997
Number of topics:5321
Total number of notes:139771

5235.0. "German Press Article about Alpha...." by SAPEC3::GREBE () Thu Apr 10 1997 17:34

    Hi,
    
    
      one of our best German PC Magazins 
    
    	c't
    
    has a very positive article about Alpha in it's newest issue.
    
    
    The Title is:
    
    
    	Move Over! 
    
    	AMD, Cyrix and Digital attack the market leader 
    
    
    
    See it on the Web:
    
    
    	http://www.heise.de/ct/english/9705154
    
    
    
    \juergen
T.RTitleUserPersonal
Name
DateLines
5235.1here it is in ENGLISHMUNICH::REINHow come holes in SWISS CHEESE??Fri Apr 11 1997 04:51395
  [c't-Homepc't 5/97, page 154 - Translation by Sabine Cianciolo
  [aktuelles----------------------------------------------------------------

  [Heft-ArchAndreas Stiller, Uwe Post

  [English pages]
            Move Over!
  [Treiber-Service]

  [FirmenkonAMD, Cyrix and Digital attack the market leader
            There is a storm on the horizon -- at least for Intel. In April
  [ftp-ServiAMD will attempt to seize the performance crown, before Intel

  [News-Tickis able to shoot back with its Pentium-II and MMX-233 one month
            later. But Cyrix and Digital are also lurking in the
            background, waiting to intervene in the battle at the beginning
            of summer.

            The times where Intel could be on a high horse, and rule the
            roost as it likes seem to be over. Up to now the Californian
            chip giant was able to come up with a new processor generation
            whenever the competition got too close. We can still hear the
            slogans: 3 is better than 2, 4 is better than 3 and so on. But
            it is more than questionable whether this will work again now.
            Apparently the PPro based on Socket 8 does not have a future,
            Socket 7 (home of the Pentium) is run over by the competition -
            and we still have to wait and see whether the Pentium-II (also
            called Klamath) with its clumsy format is going to be
            successful.

            K6 and M2 can build on a common board infrastructure - while
            the Pentium-II needs new boards. Even older boards are K6/M2
            suitable via an upgrade socket, if they can satisfy the
            relatively high power consumption. Both competitors support and
            are compatible to Intels multimedia extension MMX - even though
            they are not allowed to call it just that.

             [Image] AMDs K6 is ready for production now and was already
                     tested on the c't-testbed against Intels MMX-233,
            PPro-200 and Pentium-II-233 (prototype). While it is possible
            to use these actual benchmark data here, we can only estimate
            and extrapolate the data for Cyrix's M2 and Digitals newest
            scion 21164PC.

            Even though Cyrix presented limited M2 samples (166 MHz clock
            frequency, one error in the branch and 17 errors in the MMX
            unit) at CeBIT - this version obviously was not ready for a
            benchmark yet. IBM had finished another version of the mask
            just before CeBIT, but Cyrix wanted to test it thoroughly
            before letting the press get their hands on it - too bad.

            During CeBIT Digital surprised with a real processor
            announcement (the other three processor manufacturers left it
            at "technology demonstrations"). DECs 21164PC was already
            outlined at the Microprocessor Forum in October. It follows the
            same idea as Intels Klamath: In comparison to the more
            expensive predecessor (Alpha 21164 here, PPro there) the L2
            cache was relocated, the L1 cache extended and multimedia
            capabilities were added. While AMD, Intel and Cyrix are still
            �crawling� at 233 and 266 MHz, the 21164PC offers impressive
            clock rates up to 533 MHz. Until recently the Alpha processor
            played only a minor role regarding available software, but now
            its importance grows proportionally to Windows NT. Microsoft
            announced NT 5.0 for Alpha and according to DEC also promised
            to finally finish newer versions of the Office suite (Excel,
            Word, Access, ...). On top of that DEC�s �compiling emulator�
            FX32! can execute Intel code at Pentium speed (and better).
            This may get very exciting, indeed.

            Dilemma

            Now Intel is in a dilemma: Emphasizing the floating point
            performance, as demanded by modern 3D software, offers them a
            good position compared to AMD and Cyrix, because their
            processors are usually inferior in this discipline. On the
            other hand, regarding floating point performance the Klamath is
            fighting a losing battle against Alpha processors - even if it
            runs at 300 MHz and more. By the way, also the PowerPCs
            dominate here with randomly addressable 32 FP registers,
            whereas x86 must do with a meager stack of 8 FP registers.

            Emphasizing on integer performance, a strong wind from the
            direction of K6 and M2 will blow in Intels face. Especially the
            Landmark-2.0 benchmark, still favored in the USA, shows very
            distinctly how the K6 dupes the Klamath prototype.

            This leaves MMX; here Intel clearly leads because of two MMX
            pipelines. There is a lot of hoopla around MMX, but its actual
            usability is limited to a few tasks - and conflicts in many
            cases (especially in 3D graphics) with floating point
            calculations. Intels processors need an unusually long time for
            the required context switch - AMDs K6 and particularly Cyrix�s
            M2 manage this switch notably better. Sometimes there is no
            gain in running very fast - if you fail the baton hand-off.

            Shining examples like Chromakeying or Alpha Blending (image
            processing) serve as basis for the Intel-Media-Bench (IMB), but
            in practice they are almost meaningless. Regarding MPEG
            decoding (also a part of IMB) the picture looks different
            though. K6 and M2 are not at Klamath level as far as image
            processing is concerned, but they can pit themselves against
            the current Socket 7 crown prince MMX-200. And with MPEG the K6
            leaves at least the Klamath prototype in the dust.

            DEC thought of MMX as not very suitable for MPEG and developed
            MVI (Motion Video Instructions) instead. MVI consists of a few
            instructions that are only intended for this purpose. Contrary
            to Intel, DEC did not need a separate unit with FPU register
            mapping and time-consuming context switches - Alpha uses 64-bit
            integer registers anyway.

            Of course Intel knows about the weak spots of MMX and will
            introduce an extended MMX version �MMX2� probably already with
            its next processor generation �Deschutes�.

            Socket-7 Battle

            Intel does absolutely everything to spoil Socket-7 for the
            competition - after all the corporation also dominates the chip
            sets. Therefore Intel has no plans to offer the fast graphic
            port AGP for Socket-7 chip sets or higher clock frequencies.
            Both are kept for Klamaths Slot-1 chip sets (440LX and 440BX).
            The 430HX chip set will be discontinued in favor of the 430TX -
            deliberately the latter was limited to a L2 cache area of 64
            MByte, so it does not have a future.

            But AMD recognized the problem, cooperated with the Taiwanese
            chip set manufacturer VIA and is now entering this market. For
            now the AMD640 resembles only a sold-on VIA Apollo VP2, but for
            fall a joined development is planned including AGP, 100 MHz
            system clock and other goodies. Opti, Ali, SiS and ITE also see
            their chance and will intensively embrace Socket-7 - it�s
            future should be safe for now. Market observers estimate that
            it will take three years before Slot-1 has caught up with
            Socket-7. Until then they expect a demand of 200 million
            Socket-7 boards. Whoever offers the best price/performance
            ratio should have it made... The question is whether AMD and
            the Cyrix plants can satisfy this demand.

            It also has to be said here that Intels GTL+ bus of PPro and
            Klamath processors is much more powerful than the old bus
            design of the Socket-7 users. GTL+ is asynchronous, packet
            oriented and can handle up to 8 waiting transfers. In single
            processor systems this bus optimized for throughput is wasted.
            Only in multi processor environments it can really demonstrate
            its capabilities.

            Neither K6 nor M2 (as well as K5 and 6x86) are suited for multi
            processing, so the Pentium bus is enough for them. Looking at a
            market share of 95 percent for single processor systems, the
            renunciation of multi processor support is acceptable.
            Nevertheless Intel will quite surely promote the multiprocessor
            capabilities of their products strongly. The GTL bus is
            patented by Intel. Whoever wants to develop hardware for it, is
            at Intels mercy. But such proprietary solutions quite often
            proofed to be a boomerang - like IBMs Micro- Channel that
            started the downfall of this dynasty in the PC arena. Then came
            open busses like EISA, VL and PCI ... and IBMs leading role was
            history.

            Market Economy

            Somewhat important for the success of new processors is their
            price. Here AMD and DEC really splash out. At 464 Dollars (when
            sold in quantities of 1,000 and up) the K6 is quite a bit
            cheaper than the Klamath-233 (with 512 KByte cache) that is
            supposed to start at 624 Dollars (when sold in quantities of
            10,000 and up). Intel does not even sell the Pentium-MMX-200
            (according to prices for the second quarter) for the price of
            the K6. But to be able to use an existing - and tested! - board
            is more important for economic viability. System administrators
            dread nothing more than changing a board.

            DEC offers the Alpha 21164PC for an unusually low price. The
            smallest with 400 MHz is already available for 295 Dollars
            (when sold in quantities of 1,000). The Alphas need a special
            board though (164SX with DEC 21174 chip set, PB cache of 256 KB
            to 4 MByte, SD-RAM support), and nothing was said about its
            price yet. But DEC definitely wants to stay competitive, so the
            complete system will settle below 2600 Dollars.

            Cyrix has not talked about M2 prices yet. Under no
            circumstances they want to repeat the mistake made with the
            c6x86 though and enter the race with much too high prices.

            Hare and Tortoise

            AMD delivered a K6-233 Revision 1 including a reference system
            to us for testing. The latter was well equipped (FIC PA2011
            board with VIA VP2 chip set, 32 MByte SDRAM, 1 MByte L2 cache,
            DTP cache controller, Matrox Millenium etc.), so it achieves a
            high WinBench97 value (74,9). But we decided to do the
            comparison with our standard testbed (Asus TX97, Elsa Winner
            2000Pro/x, Quantum Fireball, 32 MByte SDRAM) with only 512
            KByte cache on a current TX-board that supports the K6. The
            board was still set at 3,1 V for the K6-233 (since recently, it
            wants 3,2 V), but no problems occurred. It ran without any
            glitches even at 2,9 V.

            With regard to performance, the TX97 board was at least equal
            to the PA2011, partially even about 2 to 3 percent better.

             [Image] The Pentium Pro could feel right at home, since he ran
                     on the Intel board Venus VS440 with Natoma 440FX chip
            set. Soyo gave their current Slot-1 board SY 6KA to us for the
            Pentium-II, which we used for the already somewhat ancient
            Klamath prototype Rev 0. Quite to the dismay of Intel this
            module already produced benchmark results (but with another
            board). Unfortunately Intel could not or would not let us have
            a current product version of the Pentium-II for testing - since
            the official introduction of the crown prince is at the
            beginning of May. The prototype has some peculiarities here and
            there, so that the final performance might be a few percent
            higher. For example the write combining does not work. This
            hardly shows up in the BAPCo-Suite, but according to our
            experiences with PPro the MPEG playback would be accelerated
            immensely.

            Besides that we described an inexplicable �Landmark weakness�.
            It is quite understandable that in comparison to K6 the Pentium
            PPro and Klamath both do badly in this benchmark entirely
            running in L1 cache, because in the 16 bit integer multiplies
            stopped by the Landmark bench they clearly stay behind (K6 and
            M2: 3 clock cycles, PPro/Klamath: 5 clock cycles, Pentium: 11
            clock cycles). Regarding the integer division the K6 wins
            again, by the way. We also found that the PPro/Klamath
            processors have substantial difficulties with the so-called
            Read- Modify-Write instructions, like for example DEC [mem]
            which �eats� up to 7 clock cycles (K6 1 clock cycle). The
            PPro�s parallelism is better here, but with the Klamath
            prototype this has a big influence. The question is whether
            this resembles a bug or a feature. It is easy to clarify this
            with Landmark 2.0. The PPro-200 achieves values around 1200,
            the K6 about 2400 and the Klamath prototype crawls around at
            715.

            In a further analysis another stumbling block of the Klamath
            prototype surfaced. Accesses via GS segment, meaning
            mov,ax,gs:[0], take almost an eternity, actually 55 clock
            cycles. But otherwise the PPro and Klamath values correspond to
            eachother. In any case, we did not find any other
            bug-suspicious parts. One can assume that the peculiarities
            mentioned will be repaired in the market version of Pentium-II.
            Intel will probably come out with a 266-MHz version right away.

             [Image] To obtain the �internal values� of the processors we
                     also measured them without L2 cache and finally
            without any cache. As a by-product we noticed how local the
            benchmark software is, how much the performance depends on L2
            cache and main memory. There was an immense difference between
            NT 4.0 and Windows 95 in favor of NT, which apparently is
            responsible for the better performance with NT.

             [Image] We also discovered that measurements without cache are
                     not usable as an estimate for the quality of the
            processor core, because PPro/Klamath are almost helpless
            without L1 cache. Their performance decreased to the level of a
            8-MHz- 286. If the L1 cache stays on and only the L2 cache is
            switched off, Klamath does not stand a chance against the K6.
            Its performance decreases an average of about 40 percent using
            BAPCo32/NT, while K6 only suffers from a performance loss of 13
            percent. On one hand this is the result of K6�s larger L1
            cache, but further investigations also showed that the K6 core
            is more efficient (regarding dispatch abilities, latency and
            throughput times). PPro and Klamath obviously draw their
            performance from the faster coupling of the L2 cache.

            P-Rating 233

            The BAPCo32 suite under NT 4.0 proofed: With standard
            applications the K6-233 is equal to a Klamath-233 or PPro-200.
            Klamath was only able to gain marginally. Otherwise those three
            fought an exciting triathlon in the important business
            discipline resulting in only minor differences. The Pentium-MMX
            lacks a little bit behind, but only about 10 to 15 percent at
            233 MHz.

             [Image] Using floating point intensive software (c�t
                     Mandelbrot set, POVRay raytracing, audio in the Intel
            Media Bench, Quake) the Intel processors were partly able to
            put themselves in the limelight. But on the other hand the
            difference in the HINT benchmark with floating point
            calculations is only marginal anyhow. The K6 compensates for
            this deficiency in the area of computing intensive integer
            software (HINT integer, chess benchmark), where it is up to 30
            percent faster than the Klamath prototype - not to mention the
            phenomenal Landmark and Norton-SI results. K6 also compiled
            Linux just a hint faster (2 s) than the Klamath-233.

            But in the MMX arena Klamath shines. Its two MMX pipes are
            almost unbeatable. While K6 and M2 are able to execute one MMX
            instruction per clock cycle, Klamath manages 2 instructions at
            the same time. Klamath therefore clearly leads in all MMX
            benchmarks. K6 does not do too badly though. In the Intel Media
            Bench it achieved the level of a Pentium-MMX-200.

            The Ball is Round

             [Image] AMDs K6 finally brings some action to the scene. It
                     already was quite boring to always see the same
            champion in the Soccer-7 second division. Borussia AMD got
            promoted into this league only one year ago with the 75-MHz-K5
            [3] and now is leading the division with the three times faster
            K6, at least for a short time. Already there are rumors about
            secret negotiations between Intels co- trainer Compaq and AMD.
            And the teams of Cyrix and DEC are warming up to get heavily
            involved in the league in summer. Manager Vobis is filled with
            enthusiasm for the DEC team and wants to invest. After all DEC
            now has a miracle forward in its FX32!, who knows how to score
            goals against Intel.

            Even though regarding floating point and MMX Intels chips
            perform a little bit better than K6 and M2, the latter will
            surely be able to seize a good part of the x86 market because
            of their better price/performance ratio. Intel comes under
            pressure - it is about time, too.(as)

            ----------------------------------------------------------------

            Low-Cost-Alpha

            Partnering with Mitsubishi, Digital wants to enter the market
            dominated by Intel with a slimmed down Alpha 21164. The Alpha
            21164PC does not have an integrated L2 cache anymore, but an
            extended L1 cache from 8 to 16 Kbyte for instruction code. The
            data cache remains unchanged. This way it was possible to
            decrease the die size immensely, increasing the yield and
            lowering the costs. According to DEC the average performance is
            only 10 percent below the larger Alpha brother at the same
            clock speed, 14,3 SPECint95 and 17 SPECfp95 for the 533-MHz
            version. As a comparison: The PPro achieved 8,7 SPECint95 and 6
            SPECfp95. The Hint benchmark values we measured with an
            Alpha-500 confirm these ratios. As a goodie DEC added special
            instructions to the 21164PC that are supposed to enable the
            processor to decode DVD videos with AC-3 audio and MPEG-2
            without using additional hardware.

            The new processor uses the instruction extension MVI (Motion
            Video Instructions) that have not more in common with Intels
            MMX than just the first letter. Digital added five integer
            instructions to the existing instruction set. Two of these
            (PACK, UNPACK) change 16 or 32 bit words into individual bytes
            (and back). Eight bytes together fill one of the processors
            64-bit registers. In parallel two other new instructions
            determine minima (MIN) and maxima (MAX) of two registers, in
            total 16 bytes. Finally the last added instruction (PERR)
            calculates the sum of the absolute differences of all eight
            byte pairs in two registers.

            To give systems based on the new processor a chance in the
            targeted market, Digital supports every software running under
            NT 4.0 in close teamwork with Microsoft and with that every
            existing Windows program. Especially the FX32! emulator draws
            attention, because it can execute Wintel software with high
            performance.

            A special feature of the 21164PC is the dynamic cache test.
            With every booting the processor checks its cache and maps
            lines in reserve onto faulty lines if necessary. This saves
            costly repairs during manufacturing.

            The 21164PC will be available with 400, 466 and 533 MHz. With
            2,5 V internal and 3,3 V external power supply they consume
            about as much power as Intels Pentium Pro. Digital plans to
            deliver in summer 1997 with pricing starting at 295, 395 and
            495 US dollars (when sold in quantities of 1,000 and up).

            ----------------------------------------------------------------

            K6-Upgrade

             [Image] Customers do not necessarily have to buy a new board
                     if they want to enjoy Pentium MMX, K6 and M2. There
            are Pentium-MMX Overdrive processors for up to 166 MHz.
            Additionally they can order an upgrade socket for 119 Marks
            from Madex, Neu-Isenburg, that upgrades the necessary voltages
            and the probably missing BF1 jumper - if the voltage regulator
            can satisfy the power hunger of the new companion. The K6 wants
            at least 10 A. Earlier versions of the Cyrix-6x86 wanted the
            same, so boards supporting the c6x86 had to be equipped
            properly. Madex has not accounted for the new BF2 jumper yet,
            but it is only needed for 266 MHz and above (for 233 MHz the
            setting :x1,5 - formerly for Pentium 100 - is chosen).

            Since the listed VCC2 voltages have a tolerance range of +- 0,1
            V, the K6-233 should work with a voltage of 3,3 V even in older
            boards (if these can drive 10 A). Sometimes the processor also
            runs with 2,9 V without problems - just try it out.(as)

                                                                      [top]
----------------------------------------------------------------------------
  [Home]  Copyright Verlag Heinz Heise. Last changed by J�rgen Kuri,
          07.04.97
    
5235.2And here in GERMANMUNICH::REINHow come holes in SWISS CHEESE??Fri Apr 11 1997 04:57368
  [c't-Homepc't 05/97, S. 154
  [aktuelles----------------------------------------------------------------

  [Heft-ArchAndreas Stiller, Uwe Post

  [English pages]
            Platz da!
  [Treiber-Service]

  [FirmenkonAMD, Cyrix und Digital attackieren den Marktf�hrer
            Die Zeichen stehen auf Sturm - jedenfalls f�r Intel. Im April
  [ftp-Serviwill zun�chst AMD mit dem K6 die Performance-Krone ergreifen,

  [News-Tickbevor Intel laut Plan einen Monat sp�ter mit dem Pentium-II und
            dem MMX-233 zur�ckschie�en kann. Aber da stehen au�erdem noch
            Cyrix und Digital Pfeil bei Fu�, um im Fr�hsommer in den Kampf
            einzugreifen.

            Die Zeiten, in denen Intel, auf dem hohen Ro� sitzend, die
            Szene nach Belieben beherrschte, scheinen vorbei zu sein.
            Bislang konnte der kalifornische Chip-Gigant immer dann, wenn
            die Konkurrenz ihm zu nahe kam, zu einer neuen
            Prozessorgeneration entfleuchen. Man hat die Slogans noch im
            Ohr: 3 ist besser als 2, 4 ist besser als 3 und so weiter. Ob
            das jetzt noch klappt, ist mehr als fraglich. Der PPro auf
            Basis des Sockel 8 hat offenbar keine Zukunft mehr, beim Sockel
            7 (in dem der Pentium zu Hause ist) zieht die Konkurrenz vorbei
            - und ob der Pentium-II (auch Klamath genannt) mit seinem
            unf�rmigen Format Erfolg haben wird, bleibt noch abzuwarten.

            K6 und M2 k�nnen auf eine verbreitete Board-Infrastruktur
            aufbauen - w�hrend der Pentium-II neue Boards erfordert. Sogar
            �ltere Pentium-Boards sind via Upgrade-Sockel K6/M2-tauglich,
            wenn sie den verh�ltnism��ig hohen Stromhunger der beiden
            befriedigen k�nnen. Beide Herausforderer unterst�tzen
            kompatibel Intels Multimedia-Erweiterung MMX - auch wenn sie
            diese nicht so nennen d�rfen.

            AMDs K6 ist jetzt produktionsreif und konnte sich auf dem
            c't-Pr�fstand schon mal mit dem Intel-Dreigespann MMX-233,
            PPro-200 und Pentium-II-233 (Prototyp) messen. W�hrend man hier
            also auf konkrete Benchmark-Daten zur�ckgreifen kann, ist man
            bei Cyrixens M2 und Digitals neuestem Spro�, dem 21164PC, noch
            auf Sch�tzungen und Extrapolationen angewiesen.

            Cyrix konnte zwar auf der CeBIT eingeschr�nkt lauff�hige
            M2-Muster pr�sentieren (mit 166 MHz Takt, einem Fehler in der
            Branch- und 17 Fehlern in der MMX-Unit) - benchmarkf�hig war
            diese Version offenbar noch nicht. Zwar hatte IBM kurz vor der
            CeBIT die n�chste Maskenversion fertig gebacken, doch wollte
            Cyrix sie erst ausf�hrlich testen, bevor sie in die H�nde der
            Presse durfte - schade.

            Digital �berraschte w�hrend der CeBIT mit einer echten
            Prozessorank�ndigung (alle anderen drei Prozessorschmieden
            belie�en es bei `Technologie-Demonstrationen�). DECs 21164PC
            wurde bereits im Oktober auf dem Microprocessor Forum
            skizziert. Er verfolgt die gleiche Idee wie Intels Klamath: Wie
            bei n�mlichen wurde gegen�ber dem teuren Vorg�nger (hie Alpha
            21164, dort PPro) der L2-Cache ausgelagert, der L1-Cache
            vergr��ert und eine Multimedia-F�higkeit hinzugef�gt. W�hrend
            AMD, Intel und Cyrix bei 233 und 266 MHz `herumkrebsen�, wartet
            der 21164PC mit beeindruckenden Taktraten auf: bis zu 533 MHz.
            War der Alpha-Prozessor bislang softwarem��ig auf einem
            Nebengleis, so w�chst seine Bedeutung proportional zu Windows
            NT. Microsoft hat NT 5.0 f�r Alpha angek�ndigt und laut DEC
            auch versprochen, endlich neuere Versionen der Office-Suite
            (Excel, Word, Access ...) fertigzustellen. Au�erdem hat DEC mit
            dem `kompilierenden Emulator� FX32! ein Tool in der Hand, das
            Intel-Code mit Pentium-Geschwindigkeit (und besser) auszuf�hren
            vermag ... Das d�rfte noch spannend werden.

            In der Zwickm�hle

            Intel ist nun in der Zwickm�hle: betont man st�rker die
            Flie�kommaleistung, wie sie moderne 3D-Software erfordert, so
            kann man sich zwar gegen�ber AMD und Cyrix gut in Szene setzen,
            da deren Prozessoren in dieser Disziplin zumeist unterlegen
            sind. Andererseits steht bei Flie�komma der Klamath gegen�ber
            den Alpha-Prozessoren auf v�llig verlorenem Posten - selbst
            wenn er mit 300 MHz und mehr daherkommt. Hier dominieren
            �brigens auch die PowerPCs mit ihren frei adressierbaren 32
            FP-Registern, wogegen x86er mit einem mickrigen Stack von 8
            FP-Registern auskommen m�ssen.

            Setzt man hingegen st�rker auf die Integerleistung, weht Intel
            ein heftiger K6- und M2-Wind entgegen. Besonders bei dem in den
            USA immer noch beliebten Landmark-2.0-Benchmark wird das
            deutlich, wo der K6 den Klamath-Prototyp geradezu d�piert.

            Bleibt noch MMX; hier hat Intel dank zweier MMX-Pipelines die
            Nase klar vorn. MMX wird zwar stark beworben, ist aber auf
            wenige Einsatzzwecke beschr�nkt - und `bei�t� sich in vielen
            F�llen (vor allem bei 3D-Grafik) mit Flie�kommaberechnungen.
            F�r den daf�r n�tigen Context-Switch brauchen Intels
            Prozessoren unverh�ltnism��ig viel Zeit - AMDs K6 und
            insbesondere Cyrix M2 beherrschen diesen Wechsel deutlich
            besser. Es n�tzt mitunter nichts, superschnell zu laufen - wenn
            man beim Staffelwechsel versagt ...

            [Benchmarks Performance-Einsch�tzung]

            Die Paradebeispiele wie Chromakeying oder Alpha Blending (Image
            Processing) dienen zwar als Grundlage f�r den Intel-Media-Bench
            (IMB) - sind aber in der Praxis nahezu bedeutungslos. Anders
            sieht es da schon mit dem MPEG-Decoding aus (ebenfalls ein
            Bestandteil des IMB). Beim Image Processing liegen K6 und M2
            zwar nicht auf Klamath-Niveau, k�nnen aber dem aktuellen
            Sockel-7-Kronprinzen MMX-200 Paroli bieten. Und bei MPEG h�ngt
            der K6 zumindest den Klamath-Prototyp ab.

            DEC hat MMX-artiges f�r MPEG als wenig tauglich empfunden und
            statt dessen MVI (Motion Video Instructions) entwickelt. MVI
            besteht aus wenigen Befehlen, die nur f�r diesen Einsatzzweck
            gedacht sind (siehe Kasten). Anders als Intel mu�te DEC hierzu
            keine eigene Einheit mit FPU-Register-Mapping und
            zeitfressenden Context-Switches bem�hen - die Integer-Register
            sind beim Alpha halt von Haus aus 64bittig. Intel kennt
            nat�rlich die schwachen Punkte von MMX und wird wahrscheinlich
            schon mit der n�chsten Prozessorgeneration `Deschutes� eine
            erweiterte MMX-Version `MMX2� einf�hren.

            Sockel-7-Gefecht

            Intel tut nun alles, um den Konkurrenten den Sockel 7 zu
            vermiesen - schlie�lich dominiert die Corporation auch bei den
            Chips�tzen. So will Intel den schnellen Grafikport AGP nicht
            f�r Sockel-7-Chips�tze anbieten, ebensowenig wie h�here
            Taktraten. Beides bleibt Slot-1-Chips�tzen f�r Klamath
            vorbehalten (440LX und 440BX). Den 430HX-Chipsatz will man
            zugunsten des 430TX einstellen - letzteren hat man
            `wohlweislich� auf einen L2-Cache-Bereich von 64 MByte
            besch�nkt, damit er blo� keine Zukunft hat.

            Doch AMD hat das Problem erkannt, sich mit der taiwanischen
            Chipsatzschmiede VIA zusammengetan und steigt jetzt in diesen
            Gesch�ftszweig ein. Der AMD640 ist zun�chst nur ein
            durchverkaufter VIA Apollo VP2, f�r den Herbst ist jedoch eine
            gemeinsame Weiterentwicklung mit AGP, 100 MHz Systemtakt und
            weiteren Goodies geplant. Auch Opti, Ali, SiS, ITE wittern ihre
            Chance und werden sich intensiv um den Sockel 7 k�mmern - seine
            Zukunft d�rfte erst mal gesichert sein. Marktbeobachter
            sch�tzen, da� es drei Jahre dauern wird, bis Slot-1 den Sockel
            7 eingeholt hat. Bis dahin rechnet man mit einer Nachfrage von
            200 Millionen Sockel-7-Boards. Wer hier das beste
            Preis/Leistungsverh�ltnis bietet, d�rfte saniert sein ... Fragt
            sich nur, ob AMD und die Cyrix-Schmieden diese Nachfrage
            �berhaupt befriedigen k�nnen.

            [Checkliste: Die gro�en F�nf]

            An dieser Stelle mu� man allerdings betonen, da� Intels
            GTL+-Bus des PPro- und Klamath-Prozessors deutlich
            leistungsf�higer ist als das �ltliche Bus-Design der
            Sockel-7-Benutzer. GTL+ ist asynchron, paketorientiert und kann
            bis zu acht ausstehende Transfers behandeln. In
            Single-Prozessorsystemen ist dieser auf Durchsatz optimierte
            Bus jedoch wie `Perlen vor die S�ue� geworfen. Erst in
            Multiprozessor-Umgebungen kann er wirklich zeigen, was in ihm
            steckt.

            Weder K6 noch M2 (ebensowenig wie K5 und 6x86) sind derzeit
            multiprozessortauglich, so da� f�r sie der Pentium-Bus
            ausreichend ist. Angesichts einer Marktdeckung von �ber 95
            Prozent Single-Prozessorsystemen ist der Verzicht auf
            Mehrprozessor-Support verschmerzbar. Dennoch wird Intel
            sicherlich die Multiprozessor-F�higkeit ihrer Produkte
            verst�rkt in den Vordergrund stellen. Allerdings ist der
            GTL+-Bus ein Intel-Patent. Wer hierf�r Hardware entwickeln
            will, ist also von Intels Gnaden abh�ngig. Solch propriet�re
            L�sungen haben sich jedoch schon des �fteren als Bumerang
            erwiesen - man denke an IBMs Micro-Channel, der den Niedergang
            dieser Dynastie im PC-Bereich einleitete. Da kamen dann offene
            Busse wie EISA, VL und PCI ... und aus war�s mit IBMs
            Vorreiterrolle.

            Marktwirtschaft

            Nicht ganz unwichtig f�r den Erfolg neuer Prozessoren ist
            letztlich ihr Preis. Und hier haben sich AMD und
            DEC/Mitsubishis nicht lumpen lassen. Mit 464 Dollar (ab 1000)
            liegt der K6-233 weit unterhalb des geplanten Einstandspreises
            der Klamath-233 (bei 512 KByte Cache), der auf 624 Dollar (ab
            10 0000) taxiert wird. F�r den K6-Preis bekommt man von Intel
            nicht einmal den Pentium-MMX-200 (Preis vom zweiten Quartal).
            Wichtig f�r die Wirtschaftlichkeit ist aber vor allem, da� man
            in vielen F�llen ein vorhandenes - und erprobtes! - Board
            weiter benutzen kann. Nichts graust einen Systemadministrator
            mehr als ein Board-Wechsel.

            [Grafik Hint-Benchmark]

            DEC hat den Alpha 21164PC ebenfalls ungew�hnlich g�nstig
            positioniert, der kleinste mit 400 MHz ist schon f�r 295 Dollar
            (ab 1000) erh�ltlich. F�r die Alphas ist allerdings ein
            spezielles Board vonn�ten (164SX mit DEC-21174-Chipsatz,
            PB-Cache von 256 KB bis 4 MByte, SD-RAM-Support), �ber dessen
            Preis noch nichts zu erfahren war. Aber DEC will auch hier `auf
            alle F�lle konkurrenzf�hig� sein, so da� das Gesamtsystem auf
            unter 2600 Dollar zu liegen kommt.

            Cyrix hat noch nichts �ber M2-Preise verlauten lassen.
            Keinesfalls aber wolle man den beim c6x86 gemachten Fehler
            wiederholen, mit viel zu hohen Preisen in das Rennen
            einzusteigen.

            Hase und Igel

            F�r die Tests lieferte uns AMD einen K6-233 Revision 1 samt
            Referenzsystem. Selbiges war gut best�ckt (FIC-PA2011-Board mit
            VIA-VP2-Chipsatz, 32 MByte SDRAM, 1 MByte L2-Cache,
            DTP-Cache-Controller, Matrox Millenium etc.), damit es auch
            einen m�glichst guten WinBench97-Wert erzielt (74,9). Wir
            beschlossen aber, den Vergleich bei nur 512 KByte Cache in
            einem aktuellen K6-tauglichen TX-Board mit unserer
            Standard-Umgebung durchzuf�hren (Asus TX97, Elsa Winner
            2000Pro/X, Quantum Fireball, 32 MByte SDRAM). Das Board war
            zwar noch auf 3,1 V f�r den K6-233 eingerichtet (der m�chte
            neuerdings lieber 3,2 V), Probleme zeigten sich damit jedoch
            nicht. Selbst bei nur 2,9 V lief es st�rungsfrei.

            In der Performance erwies sich das TX97-Board gegen�ber dem
            PA2011 �brigens trotz kleinerem Cache als mindestens
            gleichwertig, teilweise war es gar um zwei bis drei Prozent
            besser.

            [Balkendiagramme: Performance unter Win 95 und NT 4.0]

            Der Pentium Pro durfte sich ganz zu Hause f�hlen, er lief
            n�mlich in dem Intel-Board Venus VS440 mit
            Natoma-440FX-Chipsatz. F�r den Pentium-II stellte uns Soyo ihr
            aktuelles Slot-1-Board SY 6KA zur Verf�gung, in das wir unseren
            schon etwas betagten Klamath-Prototyp Rev 0 hineinsteckten.
            Dieses Modul lieferte ja schon in [1] sehr zum �rger von Intel
            erste Benchmark-Ergebnisse (allerdings in einem anderen Board).
            Leider konnte oder wollte Intel uns immer noch keine aktuelle
            Produktionsversion des Pentium-II zum Test �berlassen - ist
            doch erst Anfang Mai die offizielle Vorstellung der
            Kronprinzen. Der Prototyp hat hier und da noch einige
            Merkw�rdigkeiten, so da� die endg�ltige Performance gut und
            gerne ein paar Prozent h�her liegen d�rfte. So funktioniert das
            Write Combining offenbar nicht. In der BAPCo-Suite macht sich
            das zwar kaum bemerkbar, aber die MPEG-Wiedergabe w�rde sich
            nach den Erfahrungen mit dem PPro erheblich beschleunigen.

            Daneben beschrieben wir in [1] eine unerkl�rliche
            `Landmark-Schw�che�. Da� Pentium PPro und Klamath gleicherma�en
            bei diesem ausschlie�lich im L1-Cache ablaufenden Benchmark im
            Vergleich zum K6 schlecht abschneiden, ist verst�ndlich, denn
            in der vom Landmark-Bench gestoppten 16bittigen
            Integer-Multiplikation liegen sie klar zur�ck (K6 und M2: 3
            Takte, PPro/Klamath 5 Takte, Pentium 11 Takte). Auch bei der
            Integer-Division obsiegt �brigens der K6. Daneben zeigte es
            sich, da� die PPro/Klamath-Prozessoren erhebliche
            Schwierigkeiten mit sogenannten Read-Modify-Write-Befehlen
            haben, so etwa DEC [mem], welcher bis zu 7 Takte verschlingt
            (K6 1 Takt). Der PPro kann hierbei besser parallelisieren, beim
            Klamath-Prototyp schlagen diese Takte hingegen voll zu Buche.
            Fragt sich, ob das ein Bug oder Feature ist. Mit Landmark 2.0
            l��t sich das leicht herausfinden, der PPro-200 erreicht hier
            Werte um 1200, der K6 von 2400 und der Klamath-Prototyp krebst
            bei 715 herum.

            [Tabelle Stromverbrauch]

            Bei der weiteren Analyse enttarnte sich noch ein Stolperstein
            des Klamath-Prototyp. Zugriffe via GS-Segment, also mov
            ax,gs:[0] dauern eine mittlere Ewigkeit, n�mlich 55 Takte.
            Ansonsten aber entsprechen sich die PPro- und Klamath-Werte,
            jedenfalls haben wir keine weiteren Bug-verd�chtigen Stellen
            gefunden. Man kann davon ausgehen, da� obige Unbotm��igkeiten
            mit der Marktversion des Pentium-II behoben sein werden.
            M�glicherweise wird Intel von vornherein gleich mit einer
            266-MHz-Version ins Rennen gehen.

            Um die `inneren Werte� der Prozessoren abzuklopfen, wurden sie
            auch ohne L2-Cache und schlie�lich ganz ohne Cache vermessen.
            Als Nebenprodukt fiel dabei ab, wie lokal die
            Benchmark-Software ist, wie stark die Peformance also von
            L2-Cache und Hauptspeicher abh�ngt. Hier ergab sich ein
            erheblicher Unterschied zwischen NT 4.0 und Windows 95
            zugunsten von NT, was wohl vorrangig f�r die bessere
            Performance unter NT verantwortlich ist.

            [Flie�komma- und Integer-Performance]

            Es zeigte sich ferner, da� die cachefreie Messung als
            Absch�tzung f�r die Prozessorkern-Qualit�t unbrauchbar ist, da
            PPro/Klamath ohne L1-Cache nahezu hilflos sind: ihre
            Performance sank auf das Niveau eines 8-MHz-286ers herab. L��t
            man den L1-Cache an, schaltet nur L2 ab, so hat Klamath gegen
            den K6 keine Chance, seine Performance sinkt etwa bei der
            BAPCo32/NT um durchschnittlich 40 Prozent, w�hrend der K6 nur
            13 Prozent Performance-Verlust erleidet. Das liegt zum einen
            nat�rlich an dem gr��eren L1-Cache des K6, weitere
            Untersuchungen unterlegten aber, da� der K6-Kern auch
            effizienter ist (was Dispatcher-F�higkeit, Latency- und
            Throughput-Zeiten angeht). PPro und Klamath zehren ihre
            Leistungsf�higkeit offensichtlich mehr aus der schnelleren
            Ankopplung des L2-Caches.

            Den inneren Aufbau von K6 und M2 hatten wir schon in der
            letzten Ausgabe vorgestellt [2], so da� wir hier auf eine
            Wiederholung verzichten wollen. Statt dessen steht die Frage im
            Vordergrund, welche Performance AMDs neuer Prozessor denn nun
            bietet.

            P-Rating 233

            Die BAPCo32-Suite unter NT 4.0 erbrachte bis auf `Rauschen� den
            Beweis: der K6-233 ist bei Standardapplikationen einem
            Klamath-233 oder PPro-200 ebenb�rtig. Der Klamath konnte nur
            einen ganz geringf�gigen Vorsprung herausholen. Ansonsten
            liefern sich die drei in der wichtigen Busine�-Disziplin einen
            packenden Dreikampf mit nur unwesentlichen Unterschieden.
            Demgegen�ber f�llt der Pentium-MMX etwas zur�ck, bei 233 MHz
            aber auch nur um etwa zehn bis 15 Prozent.

            Bei flie�kommaintensiver Software (c't-Apfelm�nnchen,
            POVRay-Raytracing, Audio im Intel-Media-Bench, Quake) k�nnen
            sich die Intel-Prozessoren teilweise erheblich besser in Szene
            setzen, wiewohl andererseits der Unterschied beim
            HINT-Benchmark mit Flie�kommaberechnungen nur marginal ist. Der
            K6 gleicht dieses Manko bei rechenintensiver Integer-Software
            zum guten Teil wieder aus (Hint-Integer, Chess-Benchmark), wo
            er bis zu 30 Prozent besser als der Klamath-Prototyp dasteht -
            ganz zu schweigen von den ph�nomenalen Landmark- und
            Norton-SI-Ergebnissen. Auch Linux kompilierte der K6 um den
            Hauch schneller (2 s) als der Klamath-233.

            [MMX-Performance]

            Im MMX-Bereich brilliert hingegen Klamath. Seine beiden
            MMX-Pipes sind kaum zu schlagen. W�hrend K6 und M2 einen
            MMX-Befehl pro Takt ausf�hren, kann Klamath gleichzeitig zwei
            Befehle durchschleusen. In allen MMX-Benchmarks liegt somit
            Klamath klar in Front. So schlecht schl�gt sich der K6 dennoch
            nicht, beim Intel Media Bench erreicht er etwa das Niveau eines
            Pentium-MMX-200.

            Der Ball ist rund

            Mit AMDs K6 kommt endlich Schwung in die Szene. Es war schon
            ziemlich langweilig, immer den gleichen Meister in der
            Soccer-7-Oberliga zu haben. Borussia AMD ist erst vor einem
            Jahr mit dem 75-MHz-K5 in diese Liga aufgestiegen [3] und
            stellt nun mit dem dreimal schnelleren K6 zumindest kurzzeitig
            den Tabellenf�hrer. Schon h�rt man von geheimen Verhandlungen
            zwischen Intels Co-Trainer Compaq und AMD. Und die Mannschaften
            von Cyrix und DEC laufen sich m�chtig warm, um im Sommer in der
            Liga kr�ftig mitmischen zu k�nnen. Manager Vobis ist vom
            DEC-Team ganz begeistert und will hier investieren. Schlie�lich
            hat DEC jetzt mit FX32! einen Wunderst�rmer, der wei�, wie man
            gegen Intel Tore schie�t.

            Auch wenn Intels Chips bei Flie�komma und MMX etwas
            performanter als K6 und M2 sind, nicht zuletzt wegen ihres
            besseren Preis/Leistungsverh�ltnisses werden sie sicherlich
            einen guten Teil des x86-Marktkuchens f�r sich abschneiden
            k�nnen. Intel kommt unter Druck - wurde aber auch h�chste Zeit.
            (as)

                                                                       [zum]
----------------------------------------------------------------------------
  [Home]  Copyright Verlag Heinz Heise. Zuletzt aktualisiert von Michael
          Kurzidim, 07.04.97
    
5235.3Das habt ihr gut gemacht!MKTCRV::MANNERINGSFri Apr 11 1997 05:246
    Congratulations to whoever did the work to get this article printed.
    
    The German subsidiary is Digital's most profitable one in terms of
    contribution margin. There is a hugh market out there to win.
    
    ..Kevin..
5235.4Playing with the Audiencegeraldo.reo.dec.com::ConnollyGOne of those awfully nice AlphaStudio PeopleFri Apr 11 1997 10:361
re .3 I am sure John Rando said that about the UK here Yesterday!
5235.5NETCAD::GENOVAFri Apr 11 1997 16:227
    
    rep .0
    
    
    Das ist sehr gut!
    
    /art
5235.660675::nessus.cao.dec.com::MayneA wretched hive of scum and villainySat Apr 12 1997 00:293
Why does everybody spell it "FX32!"?

PJDM
5235.7LGP30::FLEISCHERwithout vision the people perish (DTN 381-0426 ZKO1-1)Sun Apr 13 1997 06:3912
re Note 5235.6 by 60675::nessus.cao.dec.com::Mayne:

> Why does everybody spell it "FX32!"?
  
        Why does it have a "!" in it at all?  I've never heard a
        person say "eff-ecks-bang-thirty-two" (or
        "eff-ecks-exclamation-thirty-two").

        (I know, I know why -- I just want a good reason that has
        nothing to do with courts or lawyers.)

        Bob
5235.8BUSY::SLABWanted: a life. Will pay top dollar.Sun Apr 13 1997 13:057
    
    	Maybe you're supposed to yell out
    
    	X!
    
    	and the F, 3 and 2 should be uttered in a normal speaking voice.
    
5235.960675::BAKERI work in a black comedySun Apr 13 1997 20:401
    2mchLSD atthe avertisink! agency??
5235.10MUDGEE::ZORBASNULL JuniorSun Apr 13 1997 21:351
    Hey, could you translate .1 into English? It was all Greek to me. ;-)
5235.11Double Whammy!RDGENG::SPINKJMon Apr 14 1997 05:577
    The whole thing has beena double whammy for Digital as in the CEBIT CT
    magazine we had a glowing review of an Alpha clone. So we get not just
    a point article, but we build up some momentum. 
    
    Thanks to whoever did the translation - it made great reading!
    
    Jim 
5235.12Interesting note on Intel ..OTOU01::MAINSystems Integration-Canada,621-5078Wed Apr 16 1997 00:368
    Looks like press starting to state Intels pushing the
    limits of x86 technology .. reference:
    
    http://www.pcweek.com/opinion/0414/14chip.html
    
    Regards,
    
    / Kerry
5235.13JANRHSCASS1::WISNIEWSKIADEPT of the Virtual Space.Thu Apr 17 1997 15:468
    I seem to remember that the "!" character represented an audible
    "Click" sound for some African dialect when written down:
    
    F(i)X "Click" Thirty two
    
    JANRH (Just Another RatHole)
    
    John W.