mirror of
https://github.com/RPCSX/llvm.git
synced 2025-01-12 15:30:46 +00:00
Apply loop-rotate to several vectorizer tests.
Such loops shouldn't be vectorized due to the loops form. After applying loop-rotate (+simplifycfg) the tests again start to check what they are intended to check. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@223170 91177308-0d34-0410-b5e6-96231b3b80d8
This commit is contained in:
parent
ec49b722fd
commit
6845cace0e
@ -31,25 +31,23 @@ define void @foo(i32 addrspace(1)* %a, i32 addrspace(1)* %b, i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %idxprom
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %idxprom
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %idxprom1
|
||||||
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -60,25 +58,23 @@ define void @bar0(i32* %a, i32 addrspace(1)* %b, i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %idxprom
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %idxprom
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds i32* %a, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds i32* %a, i64 %idxprom1
|
||||||
store i32 %mul, i32* %arrayidx2, align 4
|
store i32 %mul, i32* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -89,25 +85,23 @@ define void @bar1(i32 addrspace(1)* %a, i32* %b, i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds i32* %b, i64 %idxprom
|
%arrayidx = getelementptr inbounds i32* %b, i64 %idxprom
|
||||||
%0 = load i32* %arrayidx, align 4
|
%0 = load i32* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %idxprom1
|
||||||
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -119,25 +113,23 @@ define void @bar2(i32* noalias %a, i32 addrspace(1)* noalias %b, i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %idxprom
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %idxprom
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds i32* %a, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds i32* %a, i64 %idxprom1
|
||||||
store i32 %mul, i32* %arrayidx2, align 4
|
store i32 %mul, i32* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -149,25 +141,23 @@ define void @arst0(i32* %b, i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds i32* %b, i64 %idxprom
|
%arrayidx = getelementptr inbounds i32* %b, i64 %idxprom
|
||||||
%0 = load i32* %arrayidx, align 4
|
%0 = load i32* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds [1024 x i32] addrspace(1)* @g_as1, i64 0, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds [1024 x i32] addrspace(1)* @g_as1, i64 0, i64 %idxprom1
|
||||||
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -180,25 +170,23 @@ define void @arst1(i32* %b, i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds [1024 x i32] addrspace(1)* @g_as1, i64 0, i64 %idxprom
|
%arrayidx = getelementptr inbounds [1024 x i32] addrspace(1)* @g_as1, i64 0, i64 %idxprom
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds i32* %b, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds i32* %b, i64 %idxprom1
|
||||||
store i32 %mul, i32* %arrayidx2, align 4
|
store i32 %mul, i32* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -210,25 +198,23 @@ define void @aoeu(i32 %n) #0 {
|
|||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
%cmp1 = icmp slt i32 0, %n
|
||||||
|
br i1 %cmp1, label %for.body, label %for.end
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
|
%i.02 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
|
||||||
%cmp = icmp slt i32 %i.0, %n
|
%idxprom = sext i32 %i.02 to i64
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%idxprom = sext i32 %i.0 to i64
|
|
||||||
%arrayidx = getelementptr inbounds [1024 x i32] addrspace(2)* @q_as2, i64 0, i64 %idxprom
|
%arrayidx = getelementptr inbounds [1024 x i32] addrspace(2)* @q_as2, i64 0, i64 %idxprom
|
||||||
%0 = load i32 addrspace(2)* %arrayidx, align 4
|
%0 = load i32 addrspace(2)* %arrayidx, align 4
|
||||||
%mul = mul nsw i32 %0, 3
|
%mul = mul nsw i32 %0, 3
|
||||||
%idxprom1 = sext i32 %i.0 to i64
|
%idxprom1 = sext i32 %i.02 to i64
|
||||||
%arrayidx2 = getelementptr inbounds [1024 x i32] addrspace(1)* @g_as1, i64 0, i64 %idxprom1
|
%arrayidx2 = getelementptr inbounds [1024 x i32] addrspace(1)* @g_as1, i64 0, i64 %idxprom1
|
||||||
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
store i32 %mul, i32 addrspace(1)* %arrayidx2, align 4
|
||||||
%inc = add nsw i32 %i.0, 1
|
%inc = add nsw i32 %i.02, 1
|
||||||
br label %for.cond
|
%cmp = icmp slt i32 %inc, %n
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body, %entry
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -8,26 +8,24 @@ define void @add_ints_1_1_1(i32 addrspace(1)* %a, i32 addrspace(1)* %b, i32 addr
|
|||||||
; CHECK-LABEL: @add_ints_1_1_1(
|
; CHECK-LABEL: @add_ints_1_1_1(
|
||||||
; CHECK: <4 x i32>
|
; CHECK: <4 x i32>
|
||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
br label %for.body
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
%i.01 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
||||||
%cmp = icmp ult i64 %i.0, 200
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.01
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.0
|
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%arrayidx1 = getelementptr inbounds i32 addrspace(1)* %c, i64 %i.0
|
%arrayidx1 = getelementptr inbounds i32 addrspace(1)* %c, i64 %i.01
|
||||||
%1 = load i32 addrspace(1)* %arrayidx1, align 4
|
%1 = load i32 addrspace(1)* %arrayidx1, align 4
|
||||||
%add = add nsw i32 %0, %1
|
%add = add nsw i32 %0, %1
|
||||||
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %i.0
|
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %i.01
|
||||||
store i32 %add, i32 addrspace(1)* %arrayidx2, align 4
|
store i32 %add, i32 addrspace(1)* %arrayidx2, align 4
|
||||||
%inc = add i64 %i.0, 1
|
%inc = add i64 %i.01, 1
|
||||||
br label %for.cond
|
%cmp = icmp ult i64 %inc, 200
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -35,26 +33,24 @@ define void @add_ints_as_1_0_0(i32 addrspace(1)* %a, i32* %b, i32* %c) #0 {
|
|||||||
; CHECK-LABEL: @add_ints_as_1_0_0(
|
; CHECK-LABEL: @add_ints_as_1_0_0(
|
||||||
; CHECK-NOT: <4 x i32>
|
; CHECK-NOT: <4 x i32>
|
||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
br label %for.body
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
%i.01 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
||||||
%cmp = icmp ult i64 %i.0, 200
|
%arrayidx = getelementptr inbounds i32* %b, i64 %i.01
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%arrayidx = getelementptr inbounds i32* %b, i64 %i.0
|
|
||||||
%0 = load i32* %arrayidx, align 4
|
%0 = load i32* %arrayidx, align 4
|
||||||
%arrayidx1 = getelementptr inbounds i32* %c, i64 %i.0
|
%arrayidx1 = getelementptr inbounds i32* %c, i64 %i.01
|
||||||
%1 = load i32* %arrayidx1, align 4
|
%1 = load i32* %arrayidx1, align 4
|
||||||
%add = add nsw i32 %0, %1
|
%add = add nsw i32 %0, %1
|
||||||
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %i.0
|
%arrayidx2 = getelementptr inbounds i32 addrspace(1)* %a, i64 %i.01
|
||||||
store i32 %add, i32 addrspace(1)* %arrayidx2, align 4
|
store i32 %add, i32 addrspace(1)* %arrayidx2, align 4
|
||||||
%inc = add i64 %i.0, 1
|
%inc = add i64 %i.01, 1
|
||||||
br label %for.cond
|
%cmp = icmp ult i64 %inc, 200
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -62,26 +58,24 @@ define void @add_ints_as_0_1_0(i32* %a, i32 addrspace(1)* %b, i32* %c) #0 {
|
|||||||
; CHECK-LABEL: @add_ints_as_0_1_0(
|
; CHECK-LABEL: @add_ints_as_0_1_0(
|
||||||
; CHECK-NOT: <4 x i32>
|
; CHECK-NOT: <4 x i32>
|
||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
br label %for.body
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
%i.01 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
||||||
%cmp = icmp ult i64 %i.0, 200
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.01
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.0
|
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%arrayidx1 = getelementptr inbounds i32* %c, i64 %i.0
|
%arrayidx1 = getelementptr inbounds i32* %c, i64 %i.01
|
||||||
%1 = load i32* %arrayidx1, align 4
|
%1 = load i32* %arrayidx1, align 4
|
||||||
%add = add nsw i32 %0, %1
|
%add = add nsw i32 %0, %1
|
||||||
%arrayidx2 = getelementptr inbounds i32* %a, i64 %i.0
|
%arrayidx2 = getelementptr inbounds i32* %a, i64 %i.01
|
||||||
store i32 %add, i32* %arrayidx2, align 4
|
store i32 %add, i32* %arrayidx2, align 4
|
||||||
%inc = add i64 %i.0, 1
|
%inc = add i64 %i.01, 1
|
||||||
br label %for.cond
|
%cmp = icmp ult i64 %inc, 200
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -89,26 +83,24 @@ define void @add_ints_as_0_1_1(i32* %a, i32 addrspace(1)* %b, i32 addrspace(1)*
|
|||||||
; CHECK-LABEL: @add_ints_as_0_1_1(
|
; CHECK-LABEL: @add_ints_as_0_1_1(
|
||||||
; CHECK-NOT: <4 x i32>
|
; CHECK-NOT: <4 x i32>
|
||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
br label %for.body
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
%i.01 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
||||||
%cmp = icmp ult i64 %i.0, 200
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.01
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.0
|
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%arrayidx1 = getelementptr inbounds i32 addrspace(1)* %c, i64 %i.0
|
%arrayidx1 = getelementptr inbounds i32 addrspace(1)* %c, i64 %i.01
|
||||||
%1 = load i32 addrspace(1)* %arrayidx1, align 4
|
%1 = load i32 addrspace(1)* %arrayidx1, align 4
|
||||||
%add = add nsw i32 %0, %1
|
%add = add nsw i32 %0, %1
|
||||||
%arrayidx2 = getelementptr inbounds i32* %a, i64 %i.0
|
%arrayidx2 = getelementptr inbounds i32* %a, i64 %i.01
|
||||||
store i32 %add, i32* %arrayidx2, align 4
|
store i32 %add, i32* %arrayidx2, align 4
|
||||||
%inc = add i64 %i.0, 1
|
%inc = add i64 %i.01, 1
|
||||||
br label %for.cond
|
%cmp = icmp ult i64 %inc, 200
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -116,26 +108,24 @@ define void @add_ints_as_0_1_2(i32* %a, i32 addrspace(1)* %b, i32 addrspace(2)*
|
|||||||
; CHECK-LABEL: @add_ints_as_0_1_2(
|
; CHECK-LABEL: @add_ints_as_0_1_2(
|
||||||
; CHECK-NOT: <4 x i32>
|
; CHECK-NOT: <4 x i32>
|
||||||
; CHECK: ret
|
; CHECK: ret
|
||||||
|
|
||||||
entry:
|
entry:
|
||||||
br label %for.cond
|
br label %for.body
|
||||||
|
|
||||||
for.cond: ; preds = %for.body, %entry
|
for.body: ; preds = %entry, %for.body
|
||||||
%i.0 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
%i.01 = phi i64 [ 0, %entry ], [ %inc, %for.body ]
|
||||||
%cmp = icmp ult i64 %i.0, 200
|
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.01
|
||||||
br i1 %cmp, label %for.body, label %for.end
|
|
||||||
|
|
||||||
for.body: ; preds = %for.cond
|
|
||||||
%arrayidx = getelementptr inbounds i32 addrspace(1)* %b, i64 %i.0
|
|
||||||
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
%0 = load i32 addrspace(1)* %arrayidx, align 4
|
||||||
%arrayidx1 = getelementptr inbounds i32 addrspace(2)* %c, i64 %i.0
|
%arrayidx1 = getelementptr inbounds i32 addrspace(2)* %c, i64 %i.01
|
||||||
%1 = load i32 addrspace(2)* %arrayidx1, align 4
|
%1 = load i32 addrspace(2)* %arrayidx1, align 4
|
||||||
%add = add nsw i32 %0, %1
|
%add = add nsw i32 %0, %1
|
||||||
%arrayidx2 = getelementptr inbounds i32* %a, i64 %i.0
|
%arrayidx2 = getelementptr inbounds i32* %a, i64 %i.01
|
||||||
store i32 %add, i32* %arrayidx2, align 4
|
store i32 %add, i32* %arrayidx2, align 4
|
||||||
%inc = add i64 %i.0, 1
|
%inc = add i64 %i.01, 1
|
||||||
br label %for.cond
|
%cmp = icmp ult i64 %inc, 200
|
||||||
|
br i1 %cmp, label %for.body, label %for.end
|
||||||
|
|
||||||
for.end: ; preds = %for.cond
|
for.end: ; preds = %for.body
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -13,53 +13,47 @@ target triple = "x86_64-unknown-linux-gnu"
|
|||||||
|
|
||||||
define void @vectorized(float* nocapture %a, i64 %size) {
|
define void @vectorized(float* nocapture %a, i64 %size) {
|
||||||
entry:
|
entry:
|
||||||
%cmp1 = icmp sgt i64 %size, 0
|
%cmp1 = icmp sle i64 %size, 0
|
||||||
br i1 %cmp1, label %for.header, label %for.end
|
%cmp21 = icmp sgt i64 0, %size
|
||||||
|
%or.cond = or i1 %cmp1, %cmp21
|
||||||
|
br i1 %or.cond, label %for.end, label %for.body
|
||||||
|
|
||||||
for.header:
|
for.body: ; preds = %entry, %for.body
|
||||||
%indvars.iv = phi i64 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
|
%indvars.iv2 = phi i64 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
|
||||||
%cmp2 = icmp sgt i64 %indvars.iv, %size
|
%arrayidx = getelementptr inbounds float* %a, i64 %indvars.iv2
|
||||||
br i1 %cmp2, label %for.end, label %for.body
|
|
||||||
|
|
||||||
for.body:
|
|
||||||
|
|
||||||
%arrayidx = getelementptr inbounds float* %a, i64 %indvars.iv
|
|
||||||
%0 = load float* %arrayidx, align 4
|
%0 = load float* %arrayidx, align 4
|
||||||
%mul = fmul float %0, %0
|
%mul = fmul float %0, %0
|
||||||
store float %mul, float* %arrayidx, align 4
|
store float %mul, float* %arrayidx, align 4
|
||||||
|
%indvars.iv.next = add nuw nsw i64 %indvars.iv2, 1
|
||||||
|
%cmp2 = icmp sgt i64 %indvars.iv.next, %size
|
||||||
|
br i1 %cmp2, label %for.end, label %for.body
|
||||||
|
|
||||||
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
|
for.end: ; preds = %entry, %for.body
|
||||||
br label %for.header
|
|
||||||
|
|
||||||
for.end:
|
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
|
||||||
define void @not_vectorized(float* nocapture %a, i64 %size) {
|
define void @not_vectorized(float* nocapture %a, i64 %size) {
|
||||||
entry:
|
entry:
|
||||||
%cmp1 = icmp sgt i64 %size, 0
|
%cmp1 = icmp sle i64 %size, 0
|
||||||
br i1 %cmp1, label %for.header, label %for.end
|
%cmp21 = icmp sgt i64 0, %size
|
||||||
|
%or.cond = or i1 %cmp1, %cmp21
|
||||||
|
br i1 %or.cond, label %for.end, label %for.body
|
||||||
|
|
||||||
for.header:
|
for.body: ; preds = %entry, %for.body
|
||||||
%indvars.iv = phi i64 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
|
%indvars.iv2 = phi i64 [ %indvars.iv.next, %for.body ], [ 0, %entry ]
|
||||||
%cmp2 = icmp sgt i64 %indvars.iv, %size
|
%0 = add nsw i64 %indvars.iv2, -5
|
||||||
br i1 %cmp2, label %for.end, label %for.body
|
|
||||||
|
|
||||||
for.body:
|
|
||||||
|
|
||||||
%0 = add nsw i64 %indvars.iv, -5
|
|
||||||
%arrayidx = getelementptr inbounds float* %a, i64 %0
|
%arrayidx = getelementptr inbounds float* %a, i64 %0
|
||||||
%1 = load float* %arrayidx, align 4
|
%1 = load float* %arrayidx, align 4
|
||||||
%2 = add nsw i64 %indvars.iv, 2
|
%2 = add nsw i64 %indvars.iv2, 2
|
||||||
%arrayidx2 = getelementptr inbounds float* %a, i64 %2
|
%arrayidx2 = getelementptr inbounds float* %a, i64 %2
|
||||||
%3 = load float* %arrayidx2, align 4
|
%3 = load float* %arrayidx2, align 4
|
||||||
%mul = fmul float %1, %3
|
%mul = fmul float %1, %3
|
||||||
%arrayidx4 = getelementptr inbounds float* %a, i64 %indvars.iv
|
%arrayidx4 = getelementptr inbounds float* %a, i64 %indvars.iv2
|
||||||
store float %mul, float* %arrayidx4, align 4
|
store float %mul, float* %arrayidx4, align 4
|
||||||
|
%indvars.iv.next = add nuw nsw i64 %indvars.iv2, 1
|
||||||
|
%cmp2 = icmp sgt i64 %indvars.iv.next, %size
|
||||||
|
br i1 %cmp2, label %for.end, label %for.body
|
||||||
|
|
||||||
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
|
for.end: ; preds = %entry, %for.body
|
||||||
br label %for.header
|
|
||||||
|
|
||||||
for.end:
|
|
||||||
ret void
|
ret void
|
||||||
}
|
}
|
||||||
|
Loading…
x
Reference in New Issue
Block a user