Fix bug in vus2i (thanks unknown), recognize vectors in IR disasm

2024-11-24 05:49:58 +00:00 · 2016-05-15 23:35:33 +02:00 · 2016-05-15 23:35:33 +02:00 · f544364c4a
commit f544364c4a
parent 0698515274
5 changed files with 67 additions and 27 deletions
--- a/Core/MIPS/IR/IRCompVFPU.cpp
+++ b/Core/MIPS/IR/IRCompVFPU.cpp
@ -1363,7 +1363,7 @@ namespace MIPSComp {
 		bool unsignedOp = ((op >> 16) & 1) == 0; // vi2uc (0), vi2us (2)

 		// These instructions pack pairs or quads of integers into 32 bits.
-		// The unsigned (u) versions skip the sign bit when packing, but first clamping to 0.
+		// The unsigned (u) versions skip the sign bit when packing, first doing a signed clamp to 0 (so the sign bit won't ever be 1).

 		VectorSize sz = GetVecSize(op);
 		VectorSize outsize;
@ -1422,7 +1422,6 @@ namespace MIPSComp {
 					ir.Write(IROp::Vec2Pack31To16, tempregs[1], IRVTEMP_0 + 2);
 				}
 			} else {  //vi2s
-				DISABLE;  // Can't figure out what's wrong with this! Doesn't pass cpu/vfpu/convert
 				ir.Write(IROp::Vec2Pack32To16, tempregs[0], srcregs[0]);
 				if (outsize == V_Pair) {
 					ir.Write(IROp::Vec2Pack32To16, tempregs[1], srcregs[2]);
@ -1459,6 +1458,7 @@ namespace MIPSComp {
 		VectorSize outsize;
 		if (bits == 8) {
 			outsize = V_Quad;
+			sz = V_Single;  // For some reason, sz is set to Quad in this case though the outsize is Single.
 		} else {
 			switch (sz) {
 			case V_Single:
--- a/Core/MIPS/IR/IRInst.cpp
+++ b/Core/MIPS/IR/IRInst.cpp
@ -3,6 +3,18 @@
 #include "Core/MIPS/IR/IRPassSimplify.h"
 #include "Core/MIPS/MIPSDebugInterface.h"

+// Legend
+// ======================
+//  _ = ignore
+//  G = GPR register
+//  C = 32-bit constant from array
+//  I = immediate value from instruction
+//  F = FPR register, single
+//  V = FPR register, Vec4. Reg number always divisible by 4.
+//  2 = FPR register, Vec2 (uncommon)
+//  v = Vec4Init constant, chosen by immediate
+//  s = Shuffle immediate (4 2-bit fields, choosing a xyzw shuffle)
+
 static const IRMeta irMeta[] = {
 	{ IROp::Nop, "Nop", "" },
 	{ IROp::SetConst, "SetConst", "GC" },
@ -60,12 +72,12 @@ static const IRMeta irMeta[] = {
 	{ IROp::Load16Ext, "Load16Ext", "GGC" },
 	{ IROp::Load32, "Load32", "GGC" },
 	{ IROp::LoadFloat, "LoadFloat", "FGC" },
-	{ IROp::LoadVec4, "LoadVec4", "FGC" },
+	{ IROp::LoadVec4, "LoadVec4", "VGC" },
 	{ IROp::Store8, "Store8", "GGC", IRFLAG_SRC3 },
 	{ IROp::Store16, "Store16", "GGC", IRFLAG_SRC3 },
 	{ IROp::Store32, "Store32", "GGC", IRFLAG_SRC3 },
 	{ IROp::StoreFloat, "StoreFloat", "FGC", IRFLAG_SRC3 },
-	{ IROp::StoreVec4, "StoreVec4", "FGC", IRFLAG_SRC3 },
+	{ IROp::StoreVec4, "StoreVec4", "VGC", IRFLAG_SRC3 },
 	{ IROp::FAdd, "FAdd", "FFF" },
 	{ IROp::FSub, "FSub", "FFF" },
 	{ IROp::FMul, "FMul", "FFF" },
@ -103,30 +115,30 @@ static const IRMeta irMeta[] = {
 	{ IROp::FCmovVfpuCC, "FCmovVfpuCC", "FFI" },
 	{ IROp::FCmpVfpuBit, "FCmpVfpuBit", "IFF" },
 	{ IROp::FCmpVfpuAggregate, "FCmpVfpuAggregate", "" },
-	{ IROp::Vec4Init, "Vec4Init", "Fv" },
-	{ IROp::Vec4Shuffle, "Vec4Shuffle", "FFs" },
-	{ IROp::Vec4Mov, "Vec4Mov", "FF" },
-	{ IROp::Vec4Add, "Vec4Add", "FFF" },
-	{ IROp::Vec4Sub, "Vec4Sub", "FFF" },
-	{ IROp::Vec4Div, "Vec4Div", "FFF" },
-	{ IROp::Vec4Mul, "Vec4Mul", "FFF" },
-	{ IROp::Vec4Scale, "Vec4Scale", "FFF" },
-	{ IROp::Vec4Dot, "Vec4Dot", "FFF" },
-	{ IROp::Vec4Neg, "Vec4Neg", "FF" },
-	{ IROp::Vec4Abs, "Vec4Abs", "FF" },
+	{ IROp::Vec4Init, "Vec4Init", "Vv" },
+	{ IROp::Vec4Shuffle, "Vec4Shuffle", "VVs" },
+	{ IROp::Vec4Mov, "Vec4Mov", "VV" },
+	{ IROp::Vec4Add, "Vec4Add", "VVV" },
+	{ IROp::Vec4Sub, "Vec4Sub", "VVV" },
+	{ IROp::Vec4Div, "Vec4Div", "VVV" },
+	{ IROp::Vec4Mul, "Vec4Mul", "VVV" },
+	{ IROp::Vec4Scale, "Vec4Scale", "VVF" },
+	{ IROp::Vec4Dot, "Vec4Dot", "FVV" },
+	{ IROp::Vec4Neg, "Vec4Neg", "VV" },
+	{ IROp::Vec4Abs, "Vec4Abs", "VV" },

 		// Pack/Unpack
-	{ IROp::Vec2Unpack16To31, "Vec2Unpack16To31", "FF" },  // Note that the result is shifted down by 1, hence 31
-	{ IROp::Vec2Unpack16To32, "Vec2Unpack16To32", "FF" },
-	{ IROp::Vec4Unpack8To32, "Vec4Unpack8To32", "FF" },
-	{ IROp::Vec4DuplicateUpperBitsAndShift1, "Vec4DuplicateUpperBitsAndShift1", "FF" },
+	{ IROp::Vec2Unpack16To31, "Vec2Unpack16To31", "2F" },  // Note that the result is shifted down by 1, hence 31
+	{ IROp::Vec2Unpack16To32, "Vec2Unpack16To32", "2F" },
+	{ IROp::Vec4Unpack8To32, "Vec4Unpack8To32", "VF" },
+	{ IROp::Vec4DuplicateUpperBitsAndShift1, "Vec4DuplicateUpperBitsAndShift1", "VV" },

-	{ IROp::Vec4ClampToZero, "Vec4ClampToZero", "FF" },
-	{ IROp::Vec2ClampToZero, "Vec2ClampToZero", "FF" },
-	{ IROp::Vec4Pack32To8, "Vec4Pack32To8", "FF" },
-	{ IROp::Vec4Pack31To8, "Vec4Pack31To8", "FF" },
-	{ IROp::Vec2Pack32To16, "Vec2Pack32To16", "FF" },
-	{ IROp::Vec2Pack31To16, "Vec2Pack31To16", "FF" },
+	{ IROp::Vec4ClampToZero, "Vec4ClampToZero", "VV" },
+	{ IROp::Vec2ClampToZero, "Vec2ClampToZero", "22" },
+	{ IROp::Vec4Pack32To8, "Vec4Pack32To8", "FV" },
+	{ IROp::Vec4Pack31To8, "Vec4Pack31To8", "FV" },
+	{ IROp::Vec2Pack32To16, "Vec2Pack32To16", "2V" },
+	{ IROp::Vec2Pack31To16, "Vec2Pack31To16", "2V" },

 	{ IROp::Interpret, "Interpret", "_C" },
 	{ IROp::Downcount, "Downcount", "_II" },
@ -240,6 +252,20 @@ void DisassembleParam(char *buf, int bufSize, u8 param, char type, const u32 *co
 			snprintf(buf, bufSize, "f%d", param);
 		}
 		break;
+	case 'V':
+		if (param >= 32) {
+			snprintf(buf, bufSize, "v%d..v%d", param - 32, param - 32 + 3);
+		} else {
+			snprintf(buf, bufSize, "f%d..f%d", param, param + 3);
+		}
+		break;
+	case '2':
+		if (param >= 32) {
+			snprintf(buf, bufSize, "v%d,v%d", param - 32, param - 32 + 1);
+		} else {
+			snprintf(buf, bufSize, "f%d,f%d", param, param + 1);
+		}
+		break;
 	case 'C':
 		snprintf(buf, bufSize, "%08x", constPool[param]);
 		break;
--- a/Core/MIPS/IR/IRInterpreter.cpp
+++ b/Core/MIPS/IR/IRInterpreter.cpp
@ -246,7 +246,7 @@ u32 IRInterpret(MIPSState *mips, const IRInst *inst, const u32 *constPool, int c
 		case IROp::Vec2Pack32To16:
 		{
 			u32 val = mips->fi[inst->src1] >> 16;
-			mips->fi[inst->dest] = (mips->fi[inst->src1 + 1] & 0xFFFF) | val;
+			mips->fi[inst->dest] = (mips->fi[inst->src1 + 1] & 0xFFFF0000) | val;
 			break;
 		}

--- a/Core/MIPS/IR/IRPassSimplify.cpp
+++ b/Core/MIPS/IR/IRPassSimplify.cpp
@ -202,6 +202,19 @@ bool ThreeOpToTwoOp(const IRWriter &in, IRWriter &out) {
 				out.Write(inst);
 			}
 			break;
+
+		case IROp::Vec4Add:
+		case IROp::Vec4Sub:
+		case IROp::Vec4Mul:
+		case IROp::Vec4Div:
+			if (inst.src1 != inst.dest && inst.src2 != inst.dest) {
+				out.Write(IROp::Vec4Mov, inst.dest, inst.src1);
+				out.Write(inst.op, inst.dest, inst.dest, inst.src2);
+			} else {
+				out.Write(inst);
+			}
+			break;
+
 		default:
 			out.Write(inst);
 			break;
--- a/Core/MIPS/x86/CompVFPU.cpp
+++ b/Core/MIPS/x86/CompVFPU.cpp
@ -1801,7 +1801,8 @@ void Jit::Comp_Vf2i(MIPSOpcode op) {
 	const double *mult = &mulTableVf2i[imm];

 	int setMXCSR = -1;
-	switch ((op >> 21) & 0x1f) {
+	int rmode = (op >> 21) & 0x1f;
+	switch (rmode) {
 	case 17:
 		break; //z - truncate. Easy to support.
 	case 16: