docs/hdk/_v_m___s_i_m_d_8h_source.html

 /*

  * PROPRIETARY INFORMATION.  This software is proprietary to

  * Side Effects Software Inc., and is not to be reproduced,

  * transmitted, or disclosed in any way without written permission.

  *

  * NAME:        VM_SIMD.C ( VM Library, C++)

  *

  * COMMENTS:

  */


 #ifndef __VM_SIMD__

 #define __VM_SIMD__


 #include <SYS/SYS_Inline.h>

 #include <SYS/SYS_Math.h>

 #include <SYS/SYS_StaticAssert.h>

 #include <SYS/SYS_Types.h>

 #include <SYS/SYS_TypeTraits.h>

 #include <SYS/SYS_Visibility.h>

 #include <cstdint>


 //#define FORCE_NON_SIMD


 // Some older versions of glibc don't correctly align the stack for extra

 // threads (this problem should have been fixed in 2.3.4 - see

 // http://sources.redhat.com/bugzilla/show_bug.cgi?id=723).  Instead of

 // checking the glibc version, check the compiler version and assume newer

 // compilers are used with newer glibc.


 #if defined(FORCE_NON_SIMD)

     #include "VM_BasicFunc.h"

 #else

     #if defined(LINUX) && SYS_IS_GCC_GE(3, 4) && defined(__SSE2__)

         #include "VM_SSEFunc.h"

     #elif defined(WIN32)

         #include "VM_SSEFunc.h"

     #elif defined(MBSD_INTEL)

         #include "VM_SSEFunc.h"

     #elif defined(ARM64)

         #include "VM_SSEFunc.h"

     #else

         #include "VM_BasicFunc.h"

     #endif

 #endif


 class v4uf;


 class v4uu {

 public:

     // NOTE: For unknown reasons, BVH construction is significantly

     //       slower on GCC 5.4 if v4uu and v4uf are POD types, so I put

     //       back the previous code.

 #if 0

     SYS_FORCE_INLINE v4uu() noexcept = default;

     SYS_FORCE_INLINE v4uu(const v4si &v) : vector(v) {

         SYS_STATIC_ASSERT_MSG(SYSisPOD<v4uu>(), "v4uu should be POD, for better performance in UT_Array, etc.");

     }

     SYS_FORCE_INLINE v4uu(const v4uu &v) noexcept = default;

     SYS_FORCE_INLINE v4uu &operator=(const v4uu &v) noexcept = default;

 #else

     SYS_FORCE_INLINE v4uu() {}

     SYS_FORCE_INLINE v4uu(const v4si &v) : vector(v) {}

     SYS_FORCE_INLINE v4uu(const v4uu &v) : vector(v.vector) {}

     SYS_FORCE_INLINE v4uu operator=(const v4uu &v)

     { vector = v.vector; return *this; }

 #endif

     explicit SYS_FORCE_INLINE v4uu(int32 v) { vector = VM_SPLATS(v); }

     explicit SYS_FORCE_INLINE v4uu(const int32 v[4])

     { vector = VM_LOAD(v); }

     SYS_FORCE_INLINE v4uu(int32 a, int32 b, int32 c, int32 d)

     { vector = VM_SPLATS(a, b, c, d); }


     // store (readback)

     SYS_FORCE_INLINE void store(int32 v[4]) const

         { VM_STORE(v, vector); }


     // Assignment

     SYS_FORCE_INLINE v4uu operator=(int32 v)

                 { vector = v4uu(v).vector; return *this; }

     SYS_FORCE_INLINE v4uu operator=(v4si v)

                 { vector = v; return *this; }


     SYS_FORCE_INLINE void condAssign(const v4uu &val, const v4uu &c)

                 { *this = (c & val) | ((!c) & *this); }


     // Comparison

     SYS_FORCE_INLINE v4uu operator == (const v4uu &v) const

                 { return v4uu(VM_ICMPEQ(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator != (const v4uu &v) const

                 { return ~(*this == v); }

     SYS_FORCE_INLINE v4uu operator >  (const v4uu &v) const

                 { return v4uu(VM_ICMPGT(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator <  (const v4uu &v) const

                 { return v4uu(VM_ICMPLT(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator >= (const v4uu &v) const

                 { return ~(*this < v); }

     SYS_FORCE_INLINE v4uu operator <= (const v4uu &v) const

                 { return ~(*this > v); }


     SYS_FORCE_INLINE v4uu operator == (int32 v) const { return *this == v4uu(v); }

     SYS_FORCE_INLINE v4uu operator != (int32 v) const { return *this != v4uu(v); }

     SYS_FORCE_INLINE v4uu operator >  (int32 v) const { return *this > v4uu(v); }

     SYS_FORCE_INLINE v4uu operator <  (int32 v) const { return *this < v4uu(v); }

     SYS_FORCE_INLINE v4uu operator >= (int32 v) const { return *this >= v4uu(v); }

     SYS_FORCE_INLINE v4uu operator <= (int32 v) const { return *this <= v4uu(v); }


     // BitShifting

     SYS_FORCE_INLINE v4uu operator << (int32 c) const { return VM_SHIFTLEFT(vector,c); }

     SYS_FORCE_INLINE v4uu operator >> (int32 c) const { return VM_SHIFTRIGHT(vector,c); }


     // Basic math

     SYS_FORCE_INLINE v4uu operator+(const v4uu &r) const

                  { return v4uu(VM_IADD(vector, r.vector)); }

     SYS_FORCE_INLINE v4uu operator-(const v4uu &r) const

                  { return v4uu(VM_ISUB(vector, r.vector)); }

 #if defined(VM_IMUL)

     SYS_FORCE_INLINE v4uu operator*(const v4uu &r) const

                  { return v4uu(VM_IMUL(vector, r.vector)); }

 #else

     SYS_FORCE_INLINE v4uu operator*(const v4uu &r) const

     {

         return v4uu((*this)[0] * r[0],

                     (*this)[1] * r[1],

                     (*this)[2] * r[2],

                     (*this)[3] * r[3]);

     }

 #endif

     SYS_FORCE_INLINE v4uu operator+=(const v4uu &r) { return (*this = *this + r); }

     SYS_FORCE_INLINE v4uu operator-=(const v4uu &r) { return (*this = *this - r); }

     SYS_FORCE_INLINE v4uu operator*=(const v4uu &r) { return (*this = *this * r); }

     SYS_FORCE_INLINE v4uu operator+(int32 r) const { return *this + v4uu(r); }

     SYS_FORCE_INLINE v4uu operator-(int32 r) const { return *this - v4uu(r); }

     SYS_FORCE_INLINE v4uu operator*(int32 r) const { return *this * v4uu(r); }

     SYS_FORCE_INLINE v4uu operator+=(int32 r) { return (*this = *this + r); }

     SYS_FORCE_INLINE v4uu operator-=(int32 r) { return (*this = *this - r); }

     SYS_FORCE_INLINE v4uu operator*=(int32 r) { return (*this = *this * r); }


     // Modulo

     SYS_FORCE_INLINE v4uu operator%(const v4uu &r) const

     {

         return v4uu((*this)[0] % r[0],

                     (*this)[1] % r[1],

                     (*this)[2] % r[2],

                     (*this)[3] % r[3]);

     }

     SYS_FORCE_INLINE v4uu operator%(int r) const

     {

         return v4uu((*this)[0] % r,

                     (*this)[1] % r,

                     (*this)[2] % r,

                     (*this)[3] % r);

     }

     SYS_FORCE_INLINE v4uu operator%=(const v4uu &r) { return (*this = *this % r); }

     SYS_FORCE_INLINE v4uu operator%=(int r) { return (*this = *this % r); }


     // logical/bitwise


     SYS_FORCE_INLINE v4uu operator||(const v4uu &r) const

                 { return v4uu(VM_OR(vector, r.vector)); }

     SYS_FORCE_INLINE v4uu operator&&(const v4uu &r) const

                 { return v4uu(VM_AND(vector, r.vector)); }

     SYS_FORCE_INLINE v4uu operator^(const v4uu &r) const

                 { return v4uu(VM_XOR(vector, r.vector)); }

     SYS_FORCE_INLINE v4uu operator!() const

                 { return *this == v4uu(0); }


     SYS_FORCE_INLINE v4uu operator|(const v4uu &r) const { return *this || r; }

     SYS_FORCE_INLINE v4uu operator&(const v4uu &r) const { return *this && r; }

     SYS_FORCE_INLINE v4uu operator~() const

                 { return *this ^ v4uu(0xFFFFFFFF); }

     SYS_FORCE_INLINE void operator|=(const v4uu &r) { vector = VM_OR(vector, r.vector); }

     SYS_FORCE_INLINE void operator&=(const v4uu &r) { vector = VM_AND(vector, r.vector); }

     SYS_FORCE_INLINE void operator^=(const v4uu &r) { vector = VM_XOR(vector, r.vector); }


     // component

     SYS_FORCE_INLINE int32 operator[](int idx) const { return VM_EXTRACT(vector, idx); }

     SYS_FORCE_INLINE void setComp(int idx, int32 v) { vector = VM_INSERT(vector, v, idx); }


     v4uf toFloat() const;


     operator v4uf() const;


 public:

     v4si vector;

 };


 class v4uf {

 public:

     SYS_FORCE_INLINE v4uf() noexcept = default;

     // NOTE: For unknown reasons, BVH construction is significantly

     //       slower on GCC 5.4 if v4uu and v4uf are POD types, so I put

     //       back the previous code.

 #if 0

     SYS_FORCE_INLINE v4uf(const v4uf &v) noexcept = default;

     SYS_FORCE_INLINE v4uf(const v4sf &v) noexcept : vector(v) {

         SYS_STATIC_ASSERT_MSG(SYSisPOD<v4uf>(), "v4uf should be POD, for better performance in UT_Array, etc.");

     }

     SYS_FORCE_INLINE v4uf &operator=(const v4uf &v) noexcept = default;

 #else

     SYS_FORCE_INLINE v4uf(const v4sf &v) noexcept : vector(v) {}

     SYS_FORCE_INLINE v4uf(const v4uf &v) noexcept : vector(v.vector) {}

     SYS_FORCE_INLINE v4uf operator=(const v4uf &v) noexcept

     { vector = v.vector; return *this; }

 #endif

     explicit SYS_FORCE_INLINE v4uf(float v) { vector = VM_SPLATS(v); }

     explicit SYS_FORCE_INLINE v4uf(const float v[4])

     { vector = VM_LOAD(v); }

     SYS_FORCE_INLINE v4uf(float a, float b, float c, float d)

     { vector = VM_SPLATS(a, b, c, d); }


     // store (readback)

     SYS_FORCE_INLINE void store(float v[4]) const

         { VM_STORE(v, vector); }


     // Assignment

     SYS_FORCE_INLINE v4uf operator=(float v)

                 { vector = v4uf(v).vector; return *this; }

     SYS_FORCE_INLINE v4uf operator=(v4sf v) noexcept

                 { vector = v; return *this; }


     SYS_FORCE_INLINE void condAssign(const v4uf &val, const v4uu &c)

                 { *this = (val & c) | (*this & ~c); }


     // Comparison

     SYS_FORCE_INLINE v4uu operator == (const v4uf &v) const

                 { return v4uu(VM_CMPEQ(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator != (const v4uf &v) const

                 { return v4uu(VM_CMPNE(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator >  (const v4uf &v) const

                 { return v4uu(VM_CMPGT(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator <  (const v4uf &v) const

                 { return v4uu(VM_CMPLT(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator >= (const v4uf &v) const

                 { return v4uu(VM_CMPGE(vector, v.vector)); }

     SYS_FORCE_INLINE v4uu operator <= (const v4uf &v) const

                 { return v4uu(VM_CMPLE(vector, v.vector)); }


     SYS_FORCE_INLINE v4uu operator == (float v) const { return *this == v4uf(v); }

     SYS_FORCE_INLINE v4uu operator != (float v) const { return *this != v4uf(v); }

     SYS_FORCE_INLINE v4uu operator >  (float v) const { return *this > v4uf(v); }

     SYS_FORCE_INLINE v4uu operator <  (float v) const { return *this < v4uf(v); }

     SYS_FORCE_INLINE v4uu operator >= (float v) const { return *this >= v4uf(v); }

     SYS_FORCE_INLINE v4uu operator <= (float v) const { return *this <= v4uf(v); }


     // Basic math

     SYS_FORCE_INLINE v4uf operator+(const v4uf &r) const

                  { return v4uf(VM_ADD(vector, r.vector)); }

     SYS_FORCE_INLINE v4uf operator-(const v4uf &r) const

                  { return v4uf(VM_SUB(vector, r.vector)); }

     SYS_FORCE_INLINE v4uf operator-() const

                  { return v4uf(VM_NEG(vector)); }

     SYS_FORCE_INLINE v4uf operator*(const v4uf &r) const

                  { return v4uf(VM_MUL(vector, r.vector)); }

     SYS_FORCE_INLINE v4uf operator/(const v4uf &r) const

                  { return v4uf(VM_DIV(vector, r.vector)); }


     SYS_FORCE_INLINE v4uf operator+=(const v4uf &r) { return (*this = *this + r); }

     SYS_FORCE_INLINE v4uf operator-=(const v4uf &r) { return (*this = *this - r); }

     SYS_FORCE_INLINE v4uf operator*=(const v4uf &r) { return (*this = *this * r); }

     SYS_FORCE_INLINE v4uf operator/=(const v4uf &r) { return (*this = *this / r); }


     SYS_FORCE_INLINE v4uf operator+(float r) const { return *this + v4uf(r); }

     SYS_FORCE_INLINE v4uf operator-(float r) const { return *this - v4uf(r); }

     SYS_FORCE_INLINE v4uf operator*(float r) const { return *this * v4uf(r); }

     SYS_FORCE_INLINE v4uf operator/(float r) const { return *this / v4uf(r); }

     SYS_FORCE_INLINE v4uf operator+=(float r) { return (*this = *this + r); }

     SYS_FORCE_INLINE v4uf operator-=(float r) { return (*this = *this - r); }

     SYS_FORCE_INLINE v4uf operator*=(float r) { return (*this = *this * r); }

     SYS_FORCE_INLINE v4uf operator/=(float r) { return (*this = *this / r); }


     // logical/bitwise


     SYS_FORCE_INLINE v4uf operator||(const v4uu &r) const

                 { return v4uf(V4SF(VM_OR(V4SI(vector), r.vector))); }

     SYS_FORCE_INLINE v4uf operator&&(const v4uu &r) const

                 { return v4uf(V4SF(VM_AND(V4SI(vector), r.vector))); }

     SYS_FORCE_INLINE v4uf operator^(const v4uu &r) const

                 { return v4uf(V4SF(VM_XOR(V4SI(vector), r.vector))); }

     SYS_FORCE_INLINE v4uf operator!() const

                 { return v4uf(V4SF((*this == v4uf(0.0F)).vector)); }


     SYS_FORCE_INLINE v4uf operator||(const v4uf &r) const

                 { return v4uf(V4SF(VM_OR(V4SI(vector), V4SI(r.vector)))); }

     SYS_FORCE_INLINE v4uf operator&&(const v4uf &r) const

                 { return v4uf(V4SF(VM_AND(V4SI(vector), V4SI(r.vector)))); }

     SYS_FORCE_INLINE v4uf operator^(const v4uf &r) const

                 { return v4uf(V4SF(VM_XOR(V4SI(vector), V4SI(r.vector)))); }


     SYS_FORCE_INLINE v4uf operator|(const v4uu &r) const { return *this || r; }

     SYS_FORCE_INLINE v4uf operator&(const v4uu &r) const { return *this && r; }

     SYS_FORCE_INLINE v4uf operator~() const

                 { return *this ^ v4uu(0xFFFFFFFF); }


     SYS_FORCE_INLINE v4uf operator|(const v4uf &r) const { return *this || r; }

     SYS_FORCE_INLINE v4uf operator&(const v4uf &r) const { return *this && r; }


     // component

     SYS_FORCE_INLINE float operator[](int idx) const { return VM_EXTRACT(vector, idx); }

     SYS_FORCE_INLINE void setComp(int idx, float v) { vector = VM_INSERT(vector, v, idx); }


     // more math

     SYS_FORCE_INLINE v4uf abs() const { return v4uf(VM_ABS(vector)); }

     SYS_FORCE_INLINE v4uf clamp(const v4uf &low, const v4uf &high) const

                  { return v4uf(

                          VM_MIN(VM_MAX(vector, low.vector), high.vector)); }

     SYS_FORCE_INLINE v4uf clamp(float low, float high) const

                  { return v4uf(VM_MIN(VM_MAX(vector,

                                  v4uf(low).vector), v4uf(high).vector)); }

     SYS_FORCE_INLINE v4uf recip() const { return v4uf(VM_INVERT(vector)); }


     /// This is a lie, it is a signed int.

     SYS_FORCE_INLINE v4uu toUnsignedInt() const { return VM_INT(vector); }

     SYS_FORCE_INLINE v4uu toSignedInt() const { return VM_INT(vector); }


     v4uu floor() const

     {

         VM_P_FLOOR();

         v4uu result = VM_FLOOR(vector);

         VM_E_FLOOR();

         return result;

     }


     /// Returns the integer part of this float, this becomes the

     /// 0..1 fractional component.

     v4uu splitFloat()

     {

         v4uu base = toSignedInt();

         *this -= base.toFloat();

         return base;

     }


     template <int A, int B, int C, int D>

     SYS_FORCE_INLINE v4uf swizzle() const

     {

         return VM_SHUFFLE<A,B,C,D>(vector);

     }


     SYS_FORCE_INLINE v4uu isFinite() const

     {

         // If the exponent is the maximum value, it's either infinite or NaN.

         const v4si mask = VM_SPLATS(0x7F800000);

         return ~v4uu(VM_ICMPEQ(VM_AND(V4SI(vector), mask), mask));

     }


 public:

     v4sf vector;

 };


 SYS_FORCE_INLINE v4uf

 v4uu::toFloat() const

 {

     return v4uf(VM_IFLOAT(vector));

 }

 SYS_FORCE_INLINE

 v4uu::operator v4uf() const

 {

     return toFloat();

 }


 static SYS_FORCE_INLINE v4uf

 operator+(float r, const v4uf &v) noexcept

 {

     return v4uf(r) + v;

 }


 static SYS_FORCE_INLINE v4uf

 operator-(float r, const v4uf &v) noexcept

 {

     return v4uf(r) - v;

 }


 static SYS_FORCE_INLINE v4uf

 operator*(float r, const v4uf &v) noexcept

 {

     return v4uf(r) * v;

 }

 static SYS_FORCE_INLINE v4uf

 operator/(float r, const v4uf &v) noexcept

 {

     return v4uf(r) / v;

 }


 //

 // Bitcast

 //

 static SYS_FORCE_INLINE v4uf

 bitCastIntToFloat(const v4uu &v) { return V4SF(v.vector); }


 static SYS_FORCE_INLINE v4uu

 bitCastFloatToInt(const v4uf &v) { return V4SI(v.vector); }


 //

 // Custom vector operations

 //


 static SYS_FORCE_INLINE v4uf

 sqrt(const v4uf &a)

 {

     return v4uf(VM_SQRT(a.vector));

 }


 static SYS_FORCE_INLINE v4uf

 fabs(const v4uf &a)

 {

     return a.abs();

 }


 // Use this operation to mask disabled values to 0

 // rval = !a ? b : 0;


 static SYS_FORCE_INLINE v4uf

 andn(const v4uu &a, const v4uf &b)

 {

     return v4uf(V4SF(VM_ANDNOT(a.vector, V4SI(b.vector))));

 }


 static SYS_FORCE_INLINE v4uu

 andn(const v4uu &a, const v4uu &b)

 {

     return v4uu(VM_ANDNOT(a.vector, b.vector));

 }


 // rval = a ? b : c;

 static SYS_FORCE_INLINE v4uf

 ternary(const v4uu &a, const v4uf &b, const v4uf &c)

 {

     return (b & a) | andn(a, c);

 }


 static SYS_FORCE_INLINE v4uu

 ternary(const v4uu &a, const v4uu &b, const v4uu &c)

 {

     return (b & a) | andn(a, c);

 }


 // rval = !(a && b)

 static SYS_FORCE_INLINE v4uu

 nand(const v4uu &a, const v4uu &b)

 {

     return !v4uu(VM_AND(a.vector, b.vector));

 }


 static SYS_FORCE_INLINE v4uf

 vmin(const v4uf &a, const v4uf &b)

 {

     return v4uf(VM_MIN(a.vector, b.vector));

 }


 static SYS_FORCE_INLINE v4uf

 vmax(const v4uf &a, const v4uf &b)

 {

     return v4uf(VM_MAX(a.vector, b.vector));

 }


 static SYS_FORCE_INLINE v4uf

 clamp(const v4uf &a, const v4uf &b, const v4uf &c)

 {

     return vmax(vmin(a, c), b);

 }


 static SYS_FORCE_INLINE v4uf

 clamp(const v4uf &a, float b, float c)

 {

     return vmax(vmin(a, v4uf(c)), v4uf(b));

 }


 // Returns an integer with the lower 4 bits set

 // if the corresponding sign bit in a is set.

 // Useful after comparisons as comparisons will

 // be -1 or 0; so no need for an allbits test.

 // 1 is a[0], 2 is a[1], and 8 is a[3].

 static SYS_FORCE_INLINE int

 signbits(const v4uu &a)

 {

     return vm_signbits(a.vector);

 }


 static SYS_FORCE_INLINE int

 signbits(const v4uf &a)

 {

     return vm_signbits(a.vector);

 }


 static SYS_FORCE_INLINE bool

 allbits(const v4uu &a)

 {

     return vm_allbits(a.vector);

 }


 static SYS_FORCE_INLINE bool

 anybits(const v4uu &a)

 {

     return !allbits(~a);

 }


 static SYS_FORCE_INLINE v4uf

 madd(const v4uf &v, const v4uf &f, const v4uf &a)

 {

     return v4uf(VM_MADD(v.vector, f.vector, a.vector));

 }


 static SYS_FORCE_INLINE v4uf

 madd(const v4uf &v, float f, float a)

 {

     return v4uf(VM_MADD(v.vector, v4uf(f).vector, v4uf(a).vector));

 }


 static SYS_FORCE_INLINE v4uf

 madd(const v4uf &v, float f, const v4uf &a)

 {

     return v4uf(VM_MADD(v.vector, v4uf(f).vector, a.vector));

 }


 static SYS_FORCE_INLINE v4uf

 msub(const v4uf &v, const v4uf &f, const v4uf &s)

 {

     return madd(v, f, -s);

 }


 static SYS_FORCE_INLINE v4uf

 msub(const v4uf &v, float f, float s)

 {

     return madd(v, f, -s);

 }


 static SYS_FORCE_INLINE v4uf

 lerp(const v4uf &a, const v4uf &b, const v4uf &w)

 {

     v4uf w1 = v4uf(1.0F) - w;

     return madd(a, w1, b*w);

 }


 static SYS_FORCE_INLINE v4uf

 luminance(const v4uf &r, const v4uf &g, const v4uf &b,

           float rw, float gw, float bw)

 {

     return v4uf(madd(r, v4uf(rw), madd(g, v4uf(gw), b * bw)));

 }


 static SYS_FORCE_INLINE float

 dot3(const v4uf &a, const v4uf &b)

 {

     v4uf res = a*b;

     return res[0] + res[1] + res[2];

 }


 static SYS_FORCE_INLINE float

 dot4(const v4uf &a, const v4uf &b)

 {

     v4uf res = a*b;

     return res[0] + res[1] + res[2] + res[3];

 }


 static SYS_FORCE_INLINE float

 length(const v4uf &a)

 {

     return SYSsqrt(dot3(a, a));

 }


 static SYS_FORCE_INLINE v4uf

 normalize(const v4uf &a)

 {

     return a / length(a);

 }


 static SYS_FORCE_INLINE v4uf

 cross(const v4uf &a, const v4uf &b)

 {

     return v4uf(a[1]*b[2] - a[2]*b[1],

                 a[2]*b[0] - a[0]*b[2],

                 a[0]*b[1] - a[1]*b[0], 0);

 }


 // Convert 4 fpreal32 to 4 fpreal16's, returned as an int64

 #if defined(AMD64) && (defined(__SSE4_1__) || defined(_MSC_VER))

 #include <smmintrin.h> // SSE 4.1

 static SYS_FORCE_INLINE int64

 VMconvert4F32ToF16(v4si input)

 {

     // Separate sign bit and the rest

     __m128i sign_mask = _mm_set1_epi32(0x80000000);

     __m128i sign = _mm_and_si128(sign_mask, input);

     __m128i positive = _mm_andnot_si128(sign_mask, input); // order matters here


     // Move the sign bit to its new location.

     sign = _mm_srli_epi32(sign,16);


     // Clamp the value to avoid problems below.

     __m128i min_value = _mm_set1_epi32((127-15)<<23);

     __m128i max_value = _mm_set1_epi32((127+16)<<23);

     positive = _mm_max_epi32(positive, min_value); // SSE4.1

     positive = _mm_min_epi32(positive, max_value); // SSE4.1


     // Isolate the bit that's going to determine whether we round up or down.

     __m128i bit0_mask = _mm_set1_epi32(1);

     __m128i round_bit = _mm_srli_epi32(positive, (23-10-1));

     round_bit = _mm_and_si128(round_bit, bit0_mask);


     // Isolate the exponent, change it from excess-127 to excess-15,

     // then shift it into its new location.

     __m128i exponent_diff = _mm_set1_epi32(127-15);

     __m128i exponent = _mm_srli_epi32(positive, 23);

     exponent = _mm_sub_epi32(exponent, exponent_diff);

     exponent = _mm_slli_epi32(exponent, 10);


     // Isolate the mantissa bits that we'll be keeping.

     __m128i ten_bits_mask = _mm_set1_epi32(0x3FF);

     positive = _mm_srli_epi32(positive, 23-10);

     positive = _mm_and_si128(positive, ten_bits_mask);


     // Combine the exponent, mantissa, and sign

     __m128i f16s = _mm_or_si128(exponent, positive);

     f16s = _mm_or_si128(f16s, sign);


     // Add the rounding bit

     f16s = _mm_add_epi32(f16s, round_bit);


     // Pack the 4 low 16 bits for each 32-bit integer into

     // first 4 16-bit integers, (and last 4 16-bit integers,

     // but we don't care about those.)

     f16s = _mm_packus_epi32(f16s,f16s); // SSE4.1


     // Just extract out the first 4 16-bit integers.

     return _mm_cvtsi128_si64(f16s);

 }

 #else

 static SYS_FORCE_INLINE int64

 VMconvert4F32ToF16(v4si input)

 {

     int64               result;

     const fpreal32 *    src = reinterpret_cast<const fpreal32 *>(&input);

     fpreal16 *          dst = reinterpret_cast<fpreal16 *>(&result);


     for (int i = 0; i < 4; ++i)

         dst[i] = fpreal16(src[i]);


     return result;

 }

 #endif

 static SYS_FORCE_INLINE int64

 VMconvert4F32ToF16(v4sf input)

 {

     return VMconvert4F32ToF16(V4SI(input));

 }


 // SYS version of everything


 static SYS_FORCE_INLINE v4uu

 SYSmin(const v4uu &a, const v4uu &b)

 {

     return ternary(a < b, a, b);

 }

 static SYS_FORCE_INLINE v4uu

 SYSmax(const v4uu &a, const v4uu &b)

 {

     return ternary(a > b, a, b);

 }

 static SYS_FORCE_INLINE v4uu

 SYSclamp(const v4uu &a, const v4uu &b, const v4uu &c)

 {

     return SYSmax(SYSmin(a, c), b);

 }

 static SYS_FORCE_INLINE v4uu

 SYSclamp(const v4uu &a, int b, int c)

 {

     return SYSmax(SYSmin(a, v4uu(c)), v4uu(b));

 }


 static SYS_FORCE_INLINE v4uf

 SYSmin(const v4uf &a, const v4uf &b)

 {

     return v4uf(VM_MIN(a.vector, b.vector));

 }


 static SYS_FORCE_INLINE v4uf

 SYSmax(const v4uf &a, const v4uf &b)

 {

     return v4uf(VM_MAX(a.vector, b.vector));

 }


 static SYS_FORCE_INLINE v4uf

 SYSlerp(const v4uf &a, const v4uf &b, const v4uf &t)

 {

     v4uf diff = b-a;

     return madd(diff, t, a);

 }


 static SYS_FORCE_INLINE v4uf

 SYSlerp(const v4uf &a, const v4uf &b, const float t)

 {

     v4uf diff = b-a;

     return madd(diff, t, a);

 }

 static SYS_FORCE_INLINE v4uf

 SYSclamp(const v4uf &a, const v4uf &b, const v4uf &c)

 {

     return vmax(vmin(a, c), b);

 }


 static SYS_FORCE_INLINE v4uf

 SYSclamp(const v4uf &a, float b, float c)

 {

     return vmax(vmin(a, v4uf(c)), v4uf(b));

 }


 static SYS_FORCE_INLINE v4uf

 sin(const v4uf &x)

 {

     return (v4uf)VM_SIN(x.vector);

 }


 static SYS_FORCE_INLINE v4uf

 cos(const v4uf &x)

 {

     return (v4uf)VM_COS(x.vector);

 }


 static SYS_FORCE_INLINE v4uf

 tan(const v4uf &x)

 {

     return (v4uf)VM_TAN(x.vector);

 }


 static SYS_FORCE_INLINE void

 sincos(const v4uf &x, v4uf *s, v4uf *c)

 {

     VM_SINCOS(x.vector, &(s->vector), &(c->vector));

 }


 static SYS_FORCE_INLINE v4uu

 SYSfastFloor(const v4uf &a)

 {

     // The following are two versions of floor.

     //

     // 1.

     // This floor is a bit problematic around 0. For example if x is a

     // very small (in magnitude) denormal number, then floor(x) = -1

     // and x - floor(x) = 1, which could be unexpected.

     return ternary(a < v4uf(0.f), a.toSignedInt() - 1, a.toSignedInt());

     //

     // 2.

     //

     // This version is broken on some platforms. On thoth,

     // SYSfastFloor(v4uf(-0.716626)) == v4ui(0)

     //

     //return a.floor();


 }

 static SYS_FORCE_INLINE v4uu

 SYSfloor(const v4uf &a)

 {

     return a.floor();

 }


 // Currently there is no specific support for signed integers

 typedef v4uu v4ui;


 // Assuming that ptr is an array of elements of type STYPE, this operation

 // will return the index of the first element that is aligned to (1<<ASIZE)

 // bytes.

 #define VM_ALIGN(ptr, ASIZE, STYPE)     \

                 ((((1<<ASIZE)-(intptr_t)ptr)&((1<<ASIZE)-1))/sizeof(STYPE))


 #endif

detail::max_value
constexpr auto max_value() -> T
Definition: format.h:484

v4uf::operator/
SYS_FORCE_INLINE v4uf operator/(float r) const
Definition: VM_SIMD.h:267

v4uu::operator=
SYS_FORCE_INLINE v4uu operator=(const v4uu &v)
Definition: VM_SIMD.h:64

SYSmax
#define SYSmax(a, b)
Definition: SYS_Math.h:1582

v4uf::operator+=
SYS_FORCE_INLINE v4uf operator+=(float r)
Definition: VM_SIMD.h:268

openvdb::OPENVDB_VERSION_NAME::math::Mat3::operator*
Mat3< typename promote< S, T >::type > operator*(S scalar, const Mat3< T > &m)
Multiply each element of the given matrix by scalar and return the result.
Definition: Mat3.h:561

VM_IADD
#define VM_IADD
Definition: VM_BasicFunc.h:412

SYS_FastMath::cos
SYS_API double cos(double x)

SYS_Visibility.h

v4uf::operator&&
SYS_FORCE_INLINE v4uf operator&&(const v4uf &r) const
Definition: VM_SIMD.h:286

v4ui
v4uu v4ui
Definition: VM_SIMD.h:758

int32
int int32
Definition: SYS_Types.h:39

VM_IMUL
#define VM_IMUL
Definition: VM_BasicFunc.h:414

v4uu::operator>=
SYS_FORCE_INLINE v4uu operator>=(const v4uu &v) const
Definition: VM_SIMD.h:95

fpreal16
Definition: fpreal16.h:110

v4uu::operator=
SYS_FORCE_INLINE v4uu operator=(v4si v)
Definition: VM_SIMD.h:80

VM_STORE
#define VM_STORE
Definition: VM_BasicFunc.h:399

VM_SIN
#define VM_SIN
Definition: VM_BasicFunc.h:450

clamp
GLenum clamp
Definition: glcorearb.h:1234

v4uf::operator^
SYS_FORCE_INLINE v4uf operator^(const v4uu &r) const
Definition: VM_SIMD.h:279

v4uf::v4uf
SYS_FORCE_INLINE v4uf(const v4uf &v) noexcept
Definition: VM_SIMD.h:202

SYS_STATIC_ASSERT_MSG
#define SYS_STATIC_ASSERT_MSG(expr, msg)
Definition: SYS_StaticAssert.h:26

v4uu::operator||
SYS_FORCE_INLINE v4uu operator||(const v4uu &r) const
Definition: VM_SIMD.h:159

v4uf::operator-
SYS_FORCE_INLINE v4uf operator-() const
Definition: VM_SIMD.h:252

VM_DIV
#define VM_DIV
Definition: VM_BasicFunc.h:419

VM_SHIFTRIGHT
#define VM_SHIFTRIGHT(A, C)
Definition: VM_BasicFunc.h:457

v
const GLdouble * v
Definition: glcorearb.h:837

v4uu::operator&&
SYS_FORCE_INLINE v4uu operator&&(const v4uu &r) const
Definition: VM_SIMD.h:161

openvdb::OPENVDB_VERSION_NAME::math::Mat3::operator+
Mat3< typename promote< T0, T1 >::type > operator+(const Mat3< T0 > &m0, const Mat3< T1 > &m1)
Add corresponding elements of m0 and m1 and return the result.
Definition: Mat3.h:577

v4uu::operator-
SYS_FORCE_INLINE v4uu operator-(const v4uu &r) const
Definition: VM_SIMD.h:114

v4uu::operator*
SYS_FORCE_INLINE v4uu operator*(int32 r) const
Definition: VM_SIMD.h:133

lerp
virtual bool lerp(GA_AttributeOperand &d, GA_AttributeOperand &a, GA_AttributeOperand &b, GA_AttributeOperand &t) const
d = SYSlerp(a, b, t);

v4uf::toUnsignedInt
SYS_FORCE_INLINE v4uu toUnsignedInt() const
This is a lie, it is a signed int.
Definition: VM_SIMD.h:314

simd::sqrt
vfloat4 sqrt(const vfloat4 &a)
Definition: simd.h:7694

g
GLboolean GLboolean g
Definition: glcorearb.h:1222

v4uu::v4uu
SYS_FORCE_INLINE v4uu(const int32 v[4])
Definition: VM_SIMD.h:68

SYS_StaticAssert.h

v4uu::operator%=
SYS_FORCE_INLINE v4uu operator%=(const v4uu &r)
Definition: VM_SIMD.h:153

v4uf::operator=
SYS_FORCE_INLINE v4uf operator=(v4sf v) noexcept
Definition: VM_SIMD.h:219

VM_CMPEQ
#define VM_CMPEQ
Definition: VM_BasicFunc.h:405

sincos
OIIO_HOSTDEVICE void sincos(float x, float *sine, float *cosine)
Definition: fmath.h:711

v4uu::operator*=
SYS_FORCE_INLINE v4uu operator*=(int32 r)
Definition: VM_SIMD.h:136

v4uu::operator+
SYS_FORCE_INLINE v4uu operator+(const v4uu &r) const
Definition: VM_SIMD.h:112

VM_INSERT
#define VM_INSERT
Definition: VM_BasicFunc.h:396

a
GLboolean GLboolean GLboolean GLboolean a
Definition: glcorearb.h:1222

s
GLdouble s
Definition: glad.h:3009

v4uf::operator=
SYS_FORCE_INLINE v4uf operator=(float v)
Definition: VM_SIMD.h:217

v4uu::operator==
SYS_FORCE_INLINE v4uu operator==(const v4uu &v) const
Definition: VM_SIMD.h:87

length
GLuint GLsizei GLsizei * length
Definition: glcorearb.h:795

v4uu::operator<
SYS_FORCE_INLINE v4uu operator<(const v4uu &v) const
Definition: VM_SIMD.h:93

v4uu::v4uu
SYS_FORCE_INLINE v4uu(int32 v)
Definition: VM_SIMD.h:67

VM_ICMPGT
#define VM_ICMPGT
Definition: VM_BasicFunc.h:409

VM_FLOOR
#define VM_FLOOR
Definition: VM_BasicFunc.h:443

v4uu::operator%
SYS_FORCE_INLINE v4uu operator%(const v4uu &r) const
Definition: VM_SIMD.h:139

v4uu::operator|=
SYS_FORCE_INLINE void operator|=(const v4uu &r)
Definition: VM_SIMD.h:172

msub
OIIO_FORCEINLINE OIIO_HOSTDEVICE float msub(float a, float b, float c)
Fused multiply and subtract: (a*b - c)
Definition: fmath.h:430

result
**But if you need a result
Definition: thread.h:622

v4uu::condAssign
SYS_FORCE_INLINE void condAssign(const v4uu &val, const v4uu &c)
Definition: VM_SIMD.h:83

SYSlerp
UT_Matrix2T< T > SYSlerp(const UT_Matrix2T< T > &v1, const UT_Matrix2T< T > &v2, S t)
Definition: UT_Matrix2.h:675

VM_ICMPEQ
#define VM_ICMPEQ
Definition: VM_BasicFunc.h:410

VM_AND
#define VM_AND
Definition: VM_BasicFunc.h:433

v4uu::operator!
SYS_FORCE_INLINE v4uu operator!() const
Definition: VM_SIMD.h:165

VM_MAX
#define VM_MAX
Definition: VM_BasicFunc.h:431

fpreal32
float fpreal32
Definition: SYS_Types.h:200

v4uf::operator-
SYS_FORCE_INLINE v4uf operator-(float r) const
Definition: VM_SIMD.h:265

v4uu::operator+=
SYS_FORCE_INLINE v4uu operator+=(int32 r)
Definition: VM_SIMD.h:134

VM_MIN
#define VM_MIN
Definition: VM_BasicFunc.h:430

simd::dot3
float dot3(const vfloat4 &a, const vfloat4 &b)
Return the float 3-component dot (inner) product of a and b.
Definition: simd.h:7524

v4uf::abs
SYS_FORCE_INLINE v4uf abs() const
Definition: VM_SIMD.h:304

v4uf::floor
v4uu floor() const
Definition: VM_SIMD.h:317

v4uf::operator|
SYS_FORCE_INLINE v4uf operator|(const v4uf &r) const
Definition: VM_SIMD.h:296

VM_EXTRACT
#define VM_EXTRACT
Definition: VM_BasicFunc.h:395

v4uf::operator*=
SYS_FORCE_INLINE v4uf operator*=(float r)
Definition: VM_SIMD.h:270

v4uf::store
SYS_FORCE_INLINE void store(float v[4]) const
Definition: VM_SIMD.h:213

SYS_Math.h

SYS_Inline.h

SYS_Types.h

VM_CMPNE
#define VM_CMPNE
Definition: VM_BasicFunc.h:406

f
GLfloat f
Definition: glcorearb.h:1926

VM_XOR
#define VM_XOR
Definition: VM_BasicFunc.h:436

v4uf::operator/
SYS_FORCE_INLINE v4uf operator/(const v4uf &r) const
Definition: VM_SIMD.h:256

v4uf::v4uf
SYS_FORCE_INLINE v4uf(float a, float b, float c, float d)
Definition: VM_SIMD.h:209

v4uf::recip
SYS_FORCE_INLINE v4uf recip() const
Definition: VM_SIMD.h:311

v4uu::operator&
SYS_FORCE_INLINE v4uu operator&(const v4uu &r) const
Definition: VM_SIMD.h:169

openvdb::OPENVDB_VERSION_NAME::math::Mat3::operator-
Mat3< typename promote< T0, T1 >::type > operator-(const Mat3< T0 > &m0, const Mat3< T1 > &m1)
Subtract corresponding elements of m0 and m1 and return the result.
Definition: Mat3.h:587

v4uu::operator+=
SYS_FORCE_INLINE v4uu operator+=(const v4uu &r)
Definition: VM_SIMD.h:128

v4uu::operator^
SYS_FORCE_INLINE v4uu operator^(const v4uu &r) const
Definition: VM_SIMD.h:163

v4uu::operator=
SYS_FORCE_INLINE v4uu operator=(int32 v)
Definition: VM_SIMD.h:78

VM_ADD
#define VM_ADD
Definition: VM_BasicFunc.h:416

v4uf::v4uf
SYS_FORCE_INLINE v4uf() noexcept=default

v4uu::v4uu
SYS_FORCE_INLINE v4uu(const v4si &v)
Definition: VM_SIMD.h:62

v4uu
Definition: VM_SIMD.h:48

v4uf::toSignedInt
SYS_FORCE_INLINE v4uu toSignedInt() const
Definition: VM_SIMD.h:315

v4uf::operator&
SYS_FORCE_INLINE v4uf operator&(const v4uf &r) const
Definition: VM_SIMD.h:297

SYS_FORCE_INLINE
#define SYS_FORCE_INLINE
Definition: SYS_Inline.h:45

v4uf::operator<=
SYS_FORCE_INLINE v4uu operator<=(const v4uf &v) const
Definition: VM_SIMD.h:236

v4uf::operator=
SYS_FORCE_INLINE v4uf operator=(const v4uf &v) noexcept
Definition: VM_SIMD.h:203

v4uf::operator!
SYS_FORCE_INLINE v4uf operator!() const
Definition: VM_SIMD.h:281

SYSclamp
UT_Vector3T< T > SYSclamp(const UT_Vector3T< T > &v, const UT_Vector3T< T > &min, const UT_Vector3T< T > &max)
Definition: UT_Vector3.h:1057

v4uf::operator||
SYS_FORCE_INLINE v4uf operator||(const v4uf &r) const
Definition: VM_SIMD.h:284

v4uf
Definition: VM_SIMD.h:188

VM_INT
#define VM_INT
Definition: VM_BasicFunc.h:446

mask
GLint GLuint mask
Definition: glcorearb.h:124

v4uf::operator>
SYS_FORCE_INLINE v4uu operator>(const v4uf &v) const
Definition: VM_SIMD.h:230

v4uf::setComp
SYS_FORCE_INLINE void setComp(int idx, float v)
Definition: VM_SIMD.h:301

v4uu::store
SYS_FORCE_INLINE void store(int32 v[4]) const
Definition: VM_SIMD.h:74

madd
OIIO_FORCEINLINE OIIO_HOSTDEVICE float madd(float a, float b, float c)
Fused multiply and add: (a*b + c)
Definition: fmath.h:421

v4uf::v4uf
SYS_FORCE_INLINE v4uf(const float v[4])
Definition: VM_SIMD.h:207

v4uf::clamp
SYS_FORCE_INLINE v4uf clamp(float low, float high) const
Definition: VM_SIMD.h:308

VM_NEG
#define VM_NEG
Definition: VM_BasicFunc.h:421

v4uf::operator==
SYS_FORCE_INLINE v4uu operator==(const v4uf &v) const
Definition: VM_SIMD.h:226

int64
long long int64
Definition: SYS_Types.h:116

v4uu::operator*
SYS_FORCE_INLINE v4uu operator*(const v4uu &r) const
Definition: VM_SIMD.h:117

v4uu::operator%
SYS_FORCE_INLINE v4uu operator%(int r) const
Definition: VM_SIMD.h:146

v4uu::operator-=
SYS_FORCE_INLINE v4uu operator-=(int32 r)
Definition: VM_SIMD.h:135

SYSfloor
SYS_API fpreal32 SYSfloor(fpreal32 val)

VM_SUB
#define VM_SUB
Definition: VM_BasicFunc.h:417

v4uf::operator^
SYS_FORCE_INLINE v4uf operator^(const v4uf &r) const
Definition: VM_SIMD.h:288

v4uu::operator-
SYS_FORCE_INLINE v4uu operator-(int32 r) const
Definition: VM_SIMD.h:132

v4uf::operator[]
SYS_FORCE_INLINE float operator[](int idx) const
Definition: VM_SIMD.h:300

v4uu::operator^=
SYS_FORCE_INLINE void operator^=(const v4uu &r)
Definition: VM_SIMD.h:174

sign
IMATH_HOSTDEVICE constexpr int sign(T a) IMATH_NOEXCEPT
Definition: ImathFun.h:33

v4uu::v4uu
SYS_FORCE_INLINE v4uu()
Definition: VM_SIMD.h:61

v4uf::condAssign
SYS_FORCE_INLINE void condAssign(const v4uf &val, const v4uu &c)
Definition: VM_SIMD.h:222

v4uf::operator<
SYS_FORCE_INLINE v4uu operator<(const v4uf &v) const
Definition: VM_SIMD.h:232

b
GLboolean GLboolean GLboolean b
Definition: glcorearb.h:1222

x
GLint GLenum GLint x
Definition: glcorearb.h:409

v4uu::operator!=
SYS_FORCE_INLINE v4uu operator!=(const v4uu &v) const
Definition: VM_SIMD.h:89

v4sf
Definition: VM_BasicFunc.h:24

VM_ANDNOT
#define VM_ANDNOT
Definition: VM_BasicFunc.h:434

v4uf::operator*
SYS_FORCE_INLINE v4uf operator*(float r) const
Definition: VM_SIMD.h:266

v4uf::operator>=
SYS_FORCE_INLINE v4uu operator>=(const v4uf &v) const
Definition: VM_SIMD.h:234

v4uu::operator|
SYS_FORCE_INLINE v4uu operator|(const v4uu &r) const
Definition: VM_SIMD.h:168

t
GLdouble t
Definition: glad.h:2397

VM_CMPLE
#define VM_CMPLE
Definition: VM_BasicFunc.h:402

v4uf::operator*
SYS_FORCE_INLINE v4uf operator*(const v4uf &r) const
Definition: VM_SIMD.h:254

VM_BasicFunc.h

v4uf::operator-
SYS_FORCE_INLINE v4uf operator-(const v4uf &r) const
Definition: VM_SIMD.h:250

v4uu::setComp
SYS_FORCE_INLINE void setComp(int idx, int32 v)
Definition: VM_SIMD.h:178

VM_CMPGT
#define VM_CMPGT
Definition: VM_BasicFunc.h:403

v4uf::operator&
SYS_FORCE_INLINE v4uf operator&(const v4uu &r) const
Definition: VM_SIMD.h:292

VM_SHIFTLEFT
#define VM_SHIFTLEFT(A, C)
Definition: VM_BasicFunc.h:456

VM_SSEFunc.h

SYS_FastMath::tan
SYS_API double tan(double x)

v4uu::operator%=
SYS_FORCE_INLINE v4uu operator%=(int r)
Definition: VM_SIMD.h:154

dst
GLenum GLenum dst
Definition: glcorearb.h:1793

v4uu::operator-=
SYS_FORCE_INLINE v4uu operator-=(const v4uu &r)
Definition: VM_SIMD.h:129

v4uu::operator<=
SYS_FORCE_INLINE v4uu operator<=(const v4uu &v) const
Definition: VM_SIMD.h:97

v4uu::operator>
SYS_FORCE_INLINE v4uu operator>(const v4uu &v) const
Definition: VM_SIMD.h:91

VM_ABS
#define VM_ABS
Definition: VM_BasicFunc.h:425

v4uf::operator&&
SYS_FORCE_INLINE v4uf operator&&(const v4uu &r) const
Definition: VM_SIMD.h:277

v4uu::vector
v4si vector
Definition: VM_SIMD.h:185

v4uf::splitFloat
v4uu splitFloat()
Definition: VM_SIMD.h:327

val
GLuint GLfloat * val
Definition: glcorearb.h:1608

normalize
FMT_CONSTEXPR basic_fp< F > normalize(basic_fp< F > value)
Definition: format.h:1701

v4uf::clamp
SYS_FORCE_INLINE v4uf clamp(const v4uf &low, const v4uf &high) const
Definition: VM_SIMD.h:305

VM_SINCOS
#define VM_SINCOS
Definition: VM_BasicFunc.h:453

VM_MUL
#define VM_MUL
Definition: VM_BasicFunc.h:418

v4uu::v4uu
SYS_FORCE_INLINE v4uu(int32 a, int32 b, int32 c, int32 d)
Definition: VM_SIMD.h:70

nanovdb::io::c
c
Definition: IO.h:328

VM_INVERT
#define VM_INVERT
Definition: VM_BasicFunc.h:428

VM_P_FLOOR
#define VM_P_FLOOR()
Definition: VM_BasicFunc.h:442

v4uf::swizzle
SYS_FORCE_INLINE v4uf swizzle() const
Definition: VM_SIMD.h:335

VM_E_FLOOR
#define VM_E_FLOOR()
Definition: VM_BasicFunc.h:444

SYS_TypeTraits.h

v4uu::operator<<
SYS_FORCE_INLINE v4uu operator<<(int32 c) const
Definition: VM_SIMD.h:108

w
GLubyte GLubyte GLubyte GLubyte w
Definition: glcorearb.h:857

v4uu::operator[]
SYS_FORCE_INLINE int32 operator[](int idx) const
Definition: VM_SIMD.h:177

v4uu::operator+
SYS_FORCE_INLINE v4uu operator+(int32 r) const
Definition: VM_SIMD.h:131

v4uf::operator/=
SYS_FORCE_INLINE v4uf operator/=(float r)
Definition: VM_SIMD.h:271

v4uf::v4uf
SYS_FORCE_INLINE v4uf(float v)
Definition: VM_SIMD.h:206

v4uf::operator!=
SYS_FORCE_INLINE v4uu operator!=(const v4uf &v) const
Definition: VM_SIMD.h:228

V4SF
#define V4SF(A)
Definition: VM_BasicFunc.h:68

r
GLboolean r
Definition: glcorearb.h:1222

v4uf::operator-=
SYS_FORCE_INLINE v4uf operator-=(const v4uf &r)
Definition: VM_SIMD.h:260

v4uf::operator~
SYS_FORCE_INLINE v4uf operator~() const
Definition: VM_SIMD.h:293

VM_ISUB
#define VM_ISUB
Definition: VM_BasicFunc.h:413

VM_LOAD
#define VM_LOAD
Definition: VM_BasicFunc.h:398

VM_COS
#define VM_COS
Definition: VM_BasicFunc.h:451

VM_SPLATS
#define VM_SPLATS
Definition: VM_BasicFunc.h:397

v4uu::operator&=
SYS_FORCE_INLINE void operator&=(const v4uu &r)
Definition: VM_SIMD.h:173

v4uf::operator||
SYS_FORCE_INLINE v4uf operator||(const v4uu &r) const
Definition: VM_SIMD.h:275

v4uf::operator+
SYS_FORCE_INLINE v4uf operator+(float r) const
Definition: VM_SIMD.h:264

VM_MADD
#define VM_MADD
Definition: VM_BasicFunc.h:427

VM_OR
#define VM_OR
Definition: VM_BasicFunc.h:435

v4uf::operator*=
SYS_FORCE_INLINE v4uf operator*=(const v4uf &r)
Definition: VM_SIMD.h:261

v4uf::operator+=
SYS_FORCE_INLINE v4uf operator+=(const v4uf &r)
Definition: VM_SIMD.h:259

v4uu::operator>>
SYS_FORCE_INLINE v4uu operator>>(int32 c) const
Definition: VM_SIMD.h:109

SYSmin
#define SYSmin(a, b)
Definition: SYS_Math.h:1583

V4SI
#define V4SI(A)
Definition: VM_BasicFunc.h:69

operator/
IMATH_HOSTDEVICE constexpr Quat< T > operator/(const Quat< T > &q1, const Quat< T > &q2) IMATH_NOEXCEPT
Quaterion division.
Definition: ImathQuat.h:871

v4uf::operator/=
SYS_FORCE_INLINE v4uf operator/=(const v4uf &r)
Definition: VM_SIMD.h:262

VM_SQRT
#define VM_SQRT
Definition: VM_BasicFunc.h:422

v4uf::operator-=
SYS_FORCE_INLINE v4uf operator-=(float r)
Definition: VM_SIMD.h:269

v4uu::v4uu
SYS_FORCE_INLINE v4uu(const v4uu &v)
Definition: VM_SIMD.h:63

VM_TAN
#define VM_TAN
Definition: VM_BasicFunc.h:452

v4uf::operator+
SYS_FORCE_INLINE v4uf operator+(const v4uf &r) const
Definition: VM_SIMD.h:248

v4uu::operator~
SYS_FORCE_INLINE v4uu operator~() const
Definition: VM_SIMD.h:170

cross
SIM_DerVector3 cross(const SIM_DerVector3 &lhs, const SIM_DerVector3 &rhs)
Definition: SIM_DerVector3.h:304

v4uf::v4uf
SYS_FORCE_INLINE v4uf(const v4sf &v) noexcept
Definition: VM_SIMD.h:201

VM_IFLOAT
#define VM_IFLOAT
Definition: VM_BasicFunc.h:448

SYS_FastMath::sin
SYS_API double sin(double x)

VM_CMPLT
#define VM_CMPLT
Definition: VM_BasicFunc.h:401

v4uf::vector
v4sf vector
Definition: VM_SIMD.h:348

v4uu::toFloat
v4uf toFloat() const
Definition: VM_SIMD.h:352

v4si
Definition: VM_BasicFunc.h:40

v4uf::isFinite
SYS_FORCE_INLINE v4uu isFinite() const
Definition: VM_SIMD.h:340

VM_CMPGE
#define VM_CMPGE
Definition: VM_BasicFunc.h:404

VM_ICMPLT
#define VM_ICMPLT
Definition: VM_BasicFunc.h:408

src
GLenum src
Definition: glcorearb.h:1793

v4uf::operator|
SYS_FORCE_INLINE v4uf operator|(const v4uu &r) const
Definition: VM_SIMD.h:291

v4uu::operator*=
SYS_FORCE_INLINE v4uu operator*=(const v4uu &r)
Definition: VM_SIMD.h:130