llvm/test/CodeGen/X86/avx512-arith.ll

; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl | FileCheck %s

; CHECK-LABEL: addpd512
; CHECK: vaddpd
; CHECK: ret
define <8 x double> @addpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %add.i = fadd <8 x double> %x, %y
  ret <8 x double> %add.i
}

; CHECK-LABEL: addpd512fold
; CHECK: vaddpd LCP{{.*}}(%rip)
; CHECK: ret
define <8 x double> @addpd512fold(<8 x double> %y) {
entry:
  %add.i = fadd <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.800000e+00, double 2.300000e+00, double 1.200000e+00>
  ret <8 x double> %add.i
}

; CHECK-LABEL: addps512
; CHECK: vaddps
; CHECK: ret
define <16 x float> @addps512(<16 x float> %y, <16 x float> %x) {
entry:
  %add.i = fadd <16 x float> %x, %y
  ret <16 x float> %add.i
}

; CHECK-LABEL: addps512fold
; CHECK: vaddps LCP{{.*}}(%rip)
; CHECK: ret
define <16 x float> @addps512fold(<16 x float> %y) {
entry:
  %add.i = fadd <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 4.500000e+00, float 4.500000e+00, float 0x400B333340000000,  float 0x4002666660000000, float 0x3FF3333340000000>
  ret <16 x float> %add.i
}

; CHECK-LABEL: subpd512
; CHECK: vsubpd
; CHECK: ret
define <8 x double> @subpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %sub.i = fsub <8 x double> %x, %y
  ret <8 x double> %sub.i
}

; CHECK-LABEL: @subpd512fold
; CHECK: vsubpd (%
; CHECK: ret
define <8 x double> @subpd512fold(<8 x double> %y, <8 x double>* %x) {
entry:
  %tmp2 = load <8 x double>* %x, align 8
  %sub.i = fsub <8 x double> %y, %tmp2
  ret <8 x double> %sub.i
}

; CHECK-LABEL: @subps512
; CHECK: vsubps
; CHECK: ret
define <16 x float> @subps512(<16 x float> %y, <16 x float> %x) {
entry:
  %sub.i = fsub <16 x float> %x, %y
  ret <16 x float> %sub.i
}

; CHECK-LABEL: subps512fold
; CHECK: vsubps (%
; CHECK: ret
define <16 x float> @subps512fold(<16 x float> %y, <16 x float>* %x) {
entry:
  %tmp2 = load <16 x float>* %x, align 4
  %sub.i = fsub <16 x float> %y, %tmp2
  ret <16 x float> %sub.i
}

; CHECK-LABEL: mulpd512
; CHECK: vmulpd
; CHECK: ret
define <8 x double> @mulpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %mul.i = fmul <8 x double> %x, %y
  ret <8 x double> %mul.i
}

; CHECK-LABEL: mulpd512fold
; CHECK: vmulpd LCP{{.*}}(%rip)
; CHECK: ret
define <8 x double> @mulpd512fold(<8 x double> %y) {
entry:
  %mul.i = fmul <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
  ret <8 x double> %mul.i
}

; CHECK-LABEL: mulps512
; CHECK: vmulps
; CHECK: ret
define <16 x float> @mulps512(<16 x float> %y, <16 x float> %x) {
entry:
  %mul.i = fmul <16 x float> %x, %y
  ret <16 x float> %mul.i
}

; CHECK-LABEL: mulps512fold
; CHECK: vmulps LCP{{.*}}(%rip)
; CHECK: ret
define <16 x float> @mulps512fold(<16 x float> %y) {
entry:
  %mul.i = fmul <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
  ret <16 x float> %mul.i
}

; CHECK-LABEL: divpd512
; CHECK: vdivpd
; CHECK: ret
define <8 x double> @divpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %div.i = fdiv <8 x double> %x, %y
  ret <8 x double> %div.i
}

; CHECK-LABEL: divpd512fold
; CHECK: vdivpd LCP{{.*}}(%rip)
; CHECK: ret
define <8 x double> @divpd512fold(<8 x double> %y) {
entry:
  %div.i = fdiv <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
  ret <8 x double> %div.i
}

; CHECK-LABEL: divps512
; CHECK: vdivps
; CHECK: ret
define <16 x float> @divps512(<16 x float> %y, <16 x float> %x) {
entry:
  %div.i = fdiv <16 x float> %x, %y
  ret <16 x float> %div.i
}

; CHECK-LABEL: divps512fold
; CHECK: vdivps LCP{{.*}}(%rip)
; CHECK: ret
define <16 x float> @divps512fold(<16 x float> %y) {
entry:
  %div.i = fdiv <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000>
  ret <16 x float> %div.i
}

; CHECK-LABEL: vpaddq_test
; CHECK: vpaddq %zmm
; CHECK: ret
define <8 x i64> @vpaddq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {
  %x = add <8 x i64> %i, %j
  ret <8 x i64> %x
}

; CHECK-LABEL: vpaddd_test
; CHECK: vpaddd %zmm
; CHECK: ret
define <16 x i32> @vpaddd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {
  %x = add <16 x i32> %i, %j
  ret <16 x i32> %x
}

; CHECK-LABEL: vpsubq_test
; CHECK: vpsubq %zmm
; CHECK: ret
define <8 x i64> @vpsubq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {
  %x = sub <8 x i64> %i, %j
  ret <8 x i64> %x
}

; CHECK-LABEL: vpsubd_test
; CHECK: vpsubd
; CHECK: ret
define <16 x i32> @vpsubd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {
  %x = sub <16 x i32> %i, %j
  ret <16 x i32> %x
}

; CHECK-LABEL: vpmulld_test
; CHECK: vpmulld %zmm
; CHECK: ret
define <16 x i32> @vpmulld_test(<16 x i32> %i, <16 x i32> %j) {
  %x = mul <16 x i32> %i, %j
  ret <16 x i32> %x
}

; CHECK-LABEL: addq_broadcast
; CHECK: vpaddq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0
; CHECK: ret
define <8 x i64> @addq_broadcast(<8 x i64> %a) nounwind {
  %b = add <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
  ret <8 x i64> %b
}

; CHECK-LABEL: orq_broadcast
; CHECK: vporq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0
; CHECK: ret
define <8 x i64> @orq_broadcast(<8 x i64> %a) nounwind {
  %b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
  ret <8 x i64> %b
}

; CHECK-LABEL: andd512fold
; CHECK: vpandd (%
; CHECK: ret
define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {
entry:
  %a = load <16 x i32>* %x, align 4
  %b = and <16 x i32> %y, %a
  ret <16 x i32> %b
}

; CHECK-LABEL: andqbrst
; CHECK: vpandq  (%rdi){1to8}, %zmm
; CHECK: ret
define <8 x i64> @andqbrst(<8 x i64> %p1, i64* %ap) {
entry:
  %a = load i64* %ap, align 8
  %b = insertelement <8 x i64> undef, i64 %a, i32 0
  %c = shufflevector <8 x i64> %b, <8 x i64> undef, <8 x i32> zeroinitializer
  %d = and <8 x i64> %p1, %c
  ret <8 x i64>%d
}
AVX-512: added arithmetic and logical operations. ADD, SUB, MUL integer and FP types. OR, AND, XOR. Added embeded broadcast form for these instructions. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@188673 91177308-0d34-0410-b5e6-96231b3b80d8 2013-08-19 13:26:14 +00:00			`; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl \| FileCheck %s`

			`; CHECK-LABEL: addpd512`
			`; CHECK: vaddpd`
			`; CHECK: ret`
			`define <8 x double> @addpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%add.i = fadd <8 x double> %x, %y`
			`ret <8 x double> %add.i`
			`}`

			`; CHECK-LABEL: addpd512fold`
			`; CHECK: vaddpd LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <8 x double> @addpd512fold(<8 x double> %y) {`
			`entry:`
			`%add.i = fadd <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.800000e+00, double 2.300000e+00, double 1.200000e+00>`
			`ret <8 x double> %add.i`
			`}`

			`; CHECK-LABEL: addps512`
			`; CHECK: vaddps`
			`; CHECK: ret`
			`define <16 x float> @addps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%add.i = fadd <16 x float> %x, %y`
			`ret <16 x float> %add.i`
			`}`

			`; CHECK-LABEL: addps512fold`
			`; CHECK: vaddps LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <16 x float> @addps512fold(<16 x float> %y) {`
			`entry:`
			`%add.i = fadd <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 4.500000e+00, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>`
			`ret <16 x float> %add.i`
			`}`

			`; CHECK-LABEL: subpd512`
			`; CHECK: vsubpd`
			`; CHECK: ret`
			`define <8 x double> @subpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%sub.i = fsub <8 x double> %x, %y`
			`ret <8 x double> %sub.i`
			`}`

			`; CHECK-LABEL: @subpd512fold`
			`; CHECK: vsubpd (%`
			`; CHECK: ret`
			`define <8 x double> @subpd512fold(<8 x double> %y, <8 x double>* %x) {`
			`entry:`
			`%tmp2 = load <8 x double>* %x, align 8`
			`%sub.i = fsub <8 x double> %y, %tmp2`
			`ret <8 x double> %sub.i`
			`}`

			`; CHECK-LABEL: @subps512`
			`; CHECK: vsubps`
			`; CHECK: ret`
			`define <16 x float> @subps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%sub.i = fsub <16 x float> %x, %y`
			`ret <16 x float> %sub.i`
			`}`

			`; CHECK-LABEL: subps512fold`
			`; CHECK: vsubps (%`
			`; CHECK: ret`
			`define <16 x float> @subps512fold(<16 x float> %y, <16 x float>* %x) {`
			`entry:`
			`%tmp2 = load <16 x float>* %x, align 4`
			`%sub.i = fsub <16 x float> %y, %tmp2`
			`ret <16 x float> %sub.i`
			`}`

			`; CHECK-LABEL: mulpd512`
			`; CHECK: vmulpd`
			`; CHECK: ret`
			`define <8 x double> @mulpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%mul.i = fmul <8 x double> %x, %y`
			`ret <8 x double> %mul.i`
			`}`

			`; CHECK-LABEL: mulpd512fold`
			`; CHECK: vmulpd LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <8 x double> @mulpd512fold(<8 x double> %y) {`
			`entry:`
			`%mul.i = fmul <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>`
			`ret <8 x double> %mul.i`
			`}`

			`; CHECK-LABEL: mulps512`
			`; CHECK: vmulps`
			`; CHECK: ret`
			`define <16 x float> @mulps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%mul.i = fmul <16 x float> %x, %y`
			`ret <16 x float> %mul.i`
			`}`

			`; CHECK-LABEL: mulps512fold`
			`; CHECK: vmulps LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <16 x float> @mulps512fold(<16 x float> %y) {`
			`entry:`
			`%mul.i = fmul <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>`
			`ret <16 x float> %mul.i`
			`}`

			`; CHECK-LABEL: divpd512`
			`; CHECK: vdivpd`
			`; CHECK: ret`
			`define <8 x double> @divpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%div.i = fdiv <8 x double> %x, %y`
			`ret <8 x double> %div.i`
			`}`

			`; CHECK-LABEL: divpd512fold`
			`; CHECK: vdivpd LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <8 x double> @divpd512fold(<8 x double> %y) {`
			`entry:`
			`%div.i = fdiv <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>`
			`ret <8 x double> %div.i`
			`}`

			`; CHECK-LABEL: divps512`
			`; CHECK: vdivps`
			`; CHECK: ret`
			`define <16 x float> @divps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%div.i = fdiv <16 x float> %x, %y`
			`ret <16 x float> %div.i`
			`}`

			`; CHECK-LABEL: divps512fold`
			`; CHECK: vdivps LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <16 x float> @divps512fold(<16 x float> %y) {`
			`entry:`
			`%div.i = fdiv <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000>`
			`ret <16 x float> %div.i`
			`}`

			`; CHECK-LABEL: vpaddq_test`
			`; CHECK: vpaddq %zmm`
			`; CHECK: ret`
			`define <8 x i64> @vpaddq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {`
			`%x = add <8 x i64> %i, %j`
			`ret <8 x i64> %x`
			`}`

			`; CHECK-LABEL: vpaddd_test`
			`; CHECK: vpaddd %zmm`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {`
			`%x = add <16 x i32> %i, %j`
			`ret <16 x i32> %x`
			`}`

			`; CHECK-LABEL: vpsubq_test`
			`; CHECK: vpsubq %zmm`
			`; CHECK: ret`
			`define <8 x i64> @vpsubq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {`
			`%x = sub <8 x i64> %i, %j`
			`ret <8 x i64> %x`
			`}`

			`; CHECK-LABEL: vpsubd_test`
			`; CHECK: vpsubd`
			`; CHECK: ret`
			`define <16 x i32> @vpsubd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {`
			`%x = sub <16 x i32> %i, %j`
			`ret <16 x i32> %x`
			`}`

			`; CHECK-LABEL: vpmulld_test`
			`; CHECK: vpmulld %zmm`
			`; CHECK: ret`
			`define <16 x i32> @vpmulld_test(<16 x i32> %i, <16 x i32> %j) {`
			`%x = mul <16 x i32> %i, %j`
			`ret <16 x i32> %x`
			`}`

			`; CHECK-LABEL: addq_broadcast`
			`; CHECK: vpaddq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0`
			`; CHECK: ret`
			`define <8 x i64> @addq_broadcast(<8 x i64> %a) nounwind {`
			`%b = add <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>`
			`ret <8 x i64> %b`
			`}`

			`; CHECK-LABEL: orq_broadcast`
			`; CHECK: vporq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0`
			`; CHECK: ret`
			`define <8 x i64> @orq_broadcast(<8 x i64> %a) nounwind {`
			`%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>`
			`ret <8 x i64> %b`
			`}`

			`; CHECK-LABEL: andd512fold`
			`; CHECK: vpandd (%`
			`; CHECK: ret`
			`define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {`
			`entry:`
			`%a = load <16 x i32>* %x, align 4`
			`%b = and <16 x i32> %y, %a`
			`ret <16 x i32> %b`
			`}`

			`; CHECK-LABEL: andqbrst`
			`; CHECK: vpandq (%rdi){1to8}, %zmm`
			`; CHECK: ret`
			`define <8 x i64> @andqbrst(<8 x i64> %p1, i64* %ap) {`
			`entry:`
			`%a = load i64* %ap, align 8`
			`%b = insertelement <8 x i64> undef, i64 %a, i32 0`
			`%c = shufflevector <8 x i64> %b, <8 x i64> undef, <8 x i32> zeroinitializer`
			`%d = and <8 x i64> %p1, %c`
			`ret <8 x i64>%d`
			`}`