src - FreeBSD source tree

diff options


context:
space:
mode:

author	Dimitry Andric <dim@FreeBSD.org>	2019-08-20 20:50:12 +0000
committer	Dimitry Andric <dim@FreeBSD.org>	2019-08-20 20:50:12 +0000
commit	e6d1592492a3a379186bfb02bd0f4eda0669c0d5 (patch)
tree	599ab169a01f1c86eda9adc774edaedde2f2db5b /lib/Target/AMDGPU/SIMemoryLegalizer.cpp
parent	1a56a5ead7a2e84bee8240f5f6b033b5f1707154 (diff)

vendor/llvm/llvm-trunk-r366426

Notes

Diffstat (limited to 'lib/Target/AMDGPU/SIMemoryLegalizer.cpp')

-rw-r--r--

lib/Target/AMDGPU/SIMemoryLegalizer.cpp

322

1 files changed, 296 insertions, 26 deletions

diff --git a/lib/Target/AMDGPU/SIMemoryLegalizer.cpp b/lib/Target/AMDGPU/SIMemoryLegalizer.cpp
index b4a4e9e33133..4320e6c957a0 100644
--- a/lib/Target/AMDGPU/SIMemoryLegalizer.cpp
+++ b/lib/Target/AMDGPU/SIMemoryLegalizer.cpp

@@ -1,9 +1,8 @@

//===- SIMemoryLegalizer.cpp ----------------------------------------------===//

-// The LLVM Compiler Infrastructure

-//

-// This file is distributed under the University of Illinois Open Source

-// License. See LICENSE.TXT for details.

+// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

+// See https://llvm.org/LICENSE.txt for license information.

+// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//===----------------------------------------------------------------------===//

@@ -146,7 +145,7 @@ private:

// only contains a single address space.

if ((OrderingAddrSpace == InstrAddrSpace) &&

isPowerOf2_32(uint32_t(InstrAddrSpace)))

- IsCrossAddressSpaceOrdering = false;

+ this->IsCrossAddressSpaceOrdering = false;

}

public:

@@ -353,6 +352,40 @@ public:

};

+class SIGfx10CacheControl : public SIGfx7CacheControl {

+protected:

+ bool CuMode = false;

+ /// Sets DLC bit to "true" if present in \p MI. Returns true if \p MI

+ /// is modified, false otherwise.

+ bool enableDLCBit(const MachineBasicBlock::iterator &MI) const {

+ return enableNamedBit<AMDGPU::OpName::dlc>(MI);

+ }

+public:

+ SIGfx10CacheControl(const GCNSubtarget &ST, bool CuMode) :

+ SIGfx7CacheControl(ST), CuMode(CuMode) {};

+ bool enableLoadCacheBypass(const MachineBasicBlock::iterator &MI,

+ SIAtomicScope Scope,

+ SIAtomicAddrSpace AddrSpace) const override;

+ bool enableNonTemporal(const MachineBasicBlock::iterator &MI) const override;

+ bool insertCacheInvalidate(MachineBasicBlock::iterator &MI,

+ SIAtomicScope Scope,

+ SIAtomicAddrSpace AddrSpace,

+ Position Pos) const override;

+ bool insertWait(MachineBasicBlock::iterator &MI,

+ SIAtomicScope Scope,

+ SIAtomicAddrSpace AddrSpace,

+ SIMemOp Op,

+ bool IsCrossAddrSpaceOrdering,

+ Position Pos) const override;

+};

class SIMemoryLegalizer final : public MachineFunctionPass {

private:

@@ -418,35 +451,46 @@ void SIMemOpAccess::reportUnsupported(const MachineBasicBlock::iterator &MI,

Optional<std::tuple<SIAtomicScope, SIAtomicAddrSpace, bool>>

SIMemOpAccess::toSIAtomicScope(SyncScope::ID SSID,

SIAtomicAddrSpace InstrScope) const {

- /// TODO: For now assume OpenCL memory model which treats each

- /// address space as having a separate happens-before relation, and

- /// so an instruction only has ordering with respect to the address

- /// space it accesses, and if it accesses multiple address spaces it

- /// does not require ordering of operations in different address

- /// spaces.

- if (SSID == SyncScope::System)

+ if (SSID == SyncScope::System)

+ return std::make_tuple(SIAtomicScope::SYSTEM,

+ SIAtomicAddrSpace::ATOMIC,

+ true);

+ if (SSID == MMI->getAgentSSID())

+ return std::make_tuple(SIAtomicScope::AGENT,

+ SIAtomicAddrSpace::ATOMIC,

+ true);

+ if (SSID == MMI->getWorkgroupSSID())

+ return std::make_tuple(SIAtomicScope::WORKGROUP,

+ SIAtomicAddrSpace::ATOMIC,

+ true);

+ if (SSID == MMI->getWavefrontSSID())

+ return std::make_tuple(SIAtomicScope::WAVEFRONT,

+ SIAtomicAddrSpace::ATOMIC,

+ true);

+ if (SSID == SyncScope::SingleThread)

+ return std::make_tuple(SIAtomicScope::SINGLETHREAD,

+ SIAtomicAddrSpace::ATOMIC,

+ true);

+ if (SSID == MMI->getSystemOneAddressSpaceSSID())

return std::make_tuple(SIAtomicScope::SYSTEM,