Extended (80-Bit) Double Floating Point in x87, nicht SSE2 - wir verpassen es nicht?

ch las heute überForscher, die feststellen, dass NVidias Phys-X-Bibliotheken x87 FP im Vergleich zu SSE2 verwenden. Dies ist offensichtlich suboptimal für parallele Datensätze, bei denen Geschwindigkeit die Präzision übertrifft. Der Autor des Artikels zitiert jedoch weiter:

Intel begann Ende 2000 mit der Einführung des P4 von der Verwendung von x87 abzuraten. AMD veraltete x87 seit dem K8 im Jahr 2003, da x86-64 mit SSE2-Unterstützung definiert ist. VIAs C7 unterstützt seit 2005 SSE2. In 64-Bit-Versionen von Windows ist x87 für den Benutzermodus veraltet und im Kernelmodus vollständig verboten. Ziemlich jeder in der Branche hat SSE über x87 seit 2005 empfohlen, und es gibt keinen Grund, x87 zu verwenden, es sei denn, die Software muss auf einem eingebetteten Pentium oder 486 ausgeführt werden.

Ich habe mich darüber gewundert. Ich weiß, dass x87 80-Bit Extended Doubles verwendet, um intern Werte zu berechnen, und SSE2 nicht. Ist das für niemanden wichtig? Es scheint mir überraschend. Ich weiß, wenn ich Berechnungen an Punkten, Linien und Polygonen in einer Ebene durchführe, können Werte bei Subtraktionen überraschend falsch sein, und Bereiche können aufgrund mangelnder Genauigkeit kollabieren und Alias-Linien zueinander bilden. Die Verwendung von 80-Bit-Werten im Vergleich zu 64-Bit-Werten könnte hier Abhilfe schaffen.

Ist das falsch? Wenn nicht, was können wir verwenden, um erweiterte Double-FP-Operationen durchzuführen, wenn x87 ausläuft?