doc/html/Panzer__HierarchicParallelism_8cpp_source.html

 // @HEADER

 // *****************************************************************************

 //           Panzer: A partial differential equation assembly

 //       engine for strongly coupled complex multiphysics systems

 //

 // Copyright 2011 NTESS and the Panzer contributors.

 // SPDX-License-Identifier: BSD-3-Clause

 // *****************************************************************************

 // @HEADER


 #include "Panzer_HierarchicParallelism.hpp"


 namespace panzer {


   HP::HP() :

     use_auto_team_size_(true),

     team_size_(-1),

     vector_size_(1),

     fad_vector_size_(1),

     use_shared_memory_(true),

     fad_use_shared_memory_(false)

   {

 #if defined(SACADO_VIEW_CUDA_HIERARCHICAL_DFAD)

 #if defined(KOKKOS_ENABLE_CUDA)

     fad_vector_size_ = 32;

 #endif

 #if defined(KOKKOS_ENABLE_HIP)

     fad_vector_size_ = 64;

 #endif

 #endif

   }


   HP& HP::inst()

   {

     static HP hp;

     return hp;

   }


   namespace {

     int roundDownToPowerOfTwo(int in) {

       int out=1;

       while (in > 1) {

         out *= 2;

         in /= 2;

       }

       return out;

     }

   }

   void HP::overrideSizes(const int& in_team_size,

        const int& in_vector_size,

        const int& in_fad_vector_size,

                          const bool force_override)

   {

     use_auto_team_size_ = false;

     if ( force_override ) {

       team_size_=in_team_size;

       vector_size_=in_vector_size;

       fad_vector_size_=in_fad_vector_size;

       return;

     }


     Kokkos::TeamPolicy<PHX::Device> policy(1, Kokkos::AUTO);

     auto blank_functor = KOKKOS_LAMBDA ( const Kokkos::TeamPolicy<PHX::exec_space>::member_type) {};


     int team_size_max = std::min(in_team_size, policy.team_size_max(blank_functor, Kokkos::ParallelForTag()));

     team_size_=roundDownToPowerOfTwo(team_size_max);


     int vec_size_max = policy.vector_length_max();

     vector_size_ = roundDownToPowerOfTwo(std::min(vec_size_max, in_vector_size));

     fad_vector_size_ = roundDownToPowerOfTwo(std::min(vec_size_max, in_fad_vector_size));

   }


   void HP::setUseSharedMemory(const bool& in_use_shared_memory,

             const bool& in_fad_use_shared_memory)

   {

     use_shared_memory_ = in_use_shared_memory;

     fad_use_shared_memory_ = in_fad_use_shared_memory;

   }


 }

panzer::HP::fad_vector_size_
int fad_vector_size_
Default vector size for non-AD types.
Definition: Panzer_HierarchicParallelism.hpp:23

panzer::HP::use_shared_memory_
bool use_shared_memory_
FAD vector size.
Definition: Panzer_HierarchicParallelism.hpp:24

use_shared_memory_
const bool use_shared_memory_
Definition: Panzer_DOFGradient_impl.hpp:36

panzer::HP::vector_size_
int vector_size_
User specified team size.
Definition: Panzer_HierarchicParallelism.hpp:22

panzer::HP::fad_use_shared_memory_
bool fad_use_shared_memory_
Use shared memory kokkos kernels for non-fad types.
Definition: Panzer_HierarchicParallelism.hpp:25

panzer::HP::team_size_
int team_size_
If true, the team size is set with Kokkos::AUTO()
Definition: Panzer_HierarchicParallelism.hpp:21

panzer::HP::use_auto_team_size_
bool use_auto_team_size_
Definition: Panzer_HierarchicParallelism.hpp:20

panzer::HP::overrideSizes
void overrideSizes(const int &team_size, const int &vector_size, const int &fad_vector_size, const bool force_override_safety=false)
Definition: Panzer_HierarchicParallelism.cpp:49

Panzer_HierarchicParallelism.hpp

panzer::HP::HP
HP()
Use shared memory kokkos kernels for fad types.
Definition: Panzer_HierarchicParallelism.cpp:15

panzer::HP
Singleton class for accessing kokkos hierarchical parallelism parameters.
Definition: Panzer_HierarchicParallelism.hpp:19

panzer::HP::inst
static HP & inst()
Private ctor.
Definition: Panzer_HierarchicParallelism.cpp:33

panzer::HP::setUseSharedMemory
void setUseSharedMemory(const bool &use_shared_memory, const bool &fad_use_shared_memory)
Tell kokkos kernels if they should use shared memory. This is very problem dependent.
Definition: Panzer_HierarchicParallelism.cpp:73