vendor/llvm/llvm-trunk-r338536

author: Dimitry Andric <dim@FreeBSD.org> 2018-08-02 17:32:43 +0000
committer: Dimitry Andric <dim@FreeBSD.org> 2018-08-02 17:32:43 +0000
commit: b7eb8e35e481a74962664b63dfb09483b200209a (patch)
tree: 1937fb4a348458ce2d02ade03ac3bb0aa18d2fcd /lib/Target/AMDGPU/AMDGPUISelLowering.cpp
parent: eb11fae6d08f479c0799db45860a98af528fa6e7 (diff)
download: src-test2-b7eb8e35e481a74962664b63dfb09483b200209a.tar.gz
src-test2-b7eb8e35e481a74962664b63dfb09483b200209a.zip
1 files changed, 7 insertions, 10 deletions
diff --git a/lib/Target/AMDGPU/AMDGPUISelLowering.cpp b/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
index b201126c593b..21e44e9589d3 100644
--- a/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
+++ b/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
@@ -554,6 +554,7 @@ static bool fnegFoldsIntoOp(unsigned Opc) {
   case ISD::FTRUNC:
   case ISD::FRINT:
   case ISD::FNEARBYINT:
+  case ISD::FCANONICALIZE:
   case AMDGPUISD::RCP:
   case AMDGPUISD::RCP_LEGACY:
   case AMDGPUISD::RCP_IFLAG:
@@ -907,6 +908,7 @@ void AMDGPUTargetLowering::analyzeFormalArgumentsCompute(
   LLVMContext &Ctx = Fn.getParent()->getContext();
   const AMDGPUSubtarget &ST = AMDGPUSubtarget::get(MF);
   const unsigned ExplicitOffset = ST.getExplicitKernelArgOffset(Fn);
+  CallingConv::ID CC = Fn.getCallingConv();
 
   unsigned MaxAlign = 1;
   uint64_t ExplicitArgOffset = 0;
@@ -940,16 +942,10 @@ void AMDGPUTargetLowering::analyzeFormalArgumentsCompute(
 
       EVT ArgVT = ValueVTs[Value];
       EVT MemVT = ArgVT;
-      MVT RegisterVT =
-        getRegisterTypeForCallingConv(Ctx, ArgVT);
-      unsigned NumRegs =
-        getNumRegistersForCallingConv(Ctx, ArgVT);
-
-      if (!Subtarget->isAmdHsaOS() &&
-          (ArgVT == MVT::i16 || ArgVT == MVT::i8 || ArgVT == MVT::f16)) {
-        // The ABI says the caller will extend these values to 32-bits.
-        MemVT = ArgVT.isInteger() ? MVT::i32 : MVT::f32;
-      } else if (NumRegs == 1) {
+      MVT RegisterVT = getRegisterTypeForCallingConv(Ctx, CC, ArgVT);
+      unsigned NumRegs = getNumRegistersForCallingConv(Ctx, CC, ArgVT);
+
+      if (NumRegs == 1) {
         // This argument is not split, so the IR type is the memory type.
         if (ArgVT.isExtended()) {
           // We have an extended type, like i24, so we should just use the
@@ -3600,6 +3596,7 @@ SDValue AMDGPUTargetLowering::performFNegCombine(SDNode *N,
   case ISD::FRINT:
   case ISD::FNEARBYINT: // XXX - Should fround be handled?
   case ISD::FSIN:
+  case ISD::FCANONICALIZE:
   case AMDGPUISD::RCP:
   case AMDGPUISD::RCP_LEGACY:
   case AMDGPUISD::RCP_IFLAG:
author	Dimitry Andric <dim@FreeBSD.org>	2018-08-02 17:32:43 +0000
committer	Dimitry Andric <dim@FreeBSD.org>	2018-08-02 17:32:43 +0000
commit	b7eb8e35e481a74962664b63dfb09483b200209a (patch)
tree	1937fb4a348458ce2d02ade03ac3bb0aa18d2fcd /lib/Target/AMDGPU/AMDGPUISelLowering.cpp
parent	eb11fae6d08f479c0799db45860a98af528fa6e7 (diff)
download	src-test2-b7eb8e35e481a74962664b63dfb09483b200209a.tar.gz src-test2-b7eb8e35e481a74962664b63dfb09483b200209a.zip