geometries/html/mpi__fieldaligned_8h_source.html

#pragma once


#include "dg/algorithm.h"

#include "fieldaligned.h"

#include "dg/backend/timer.h"


namespace dg{

namespace geo{


template <class ProductMPIGeometry, class MIMatrix, class LocalContainer>

struct Fieldaligned< ProductMPIGeometry, MIMatrix, MPI_Vector<LocalContainer> >

{

    Fieldaligned(){}

    template <class Limiter>

    Fieldaligned(const dg::geo::TokamakMagneticField& vec,

        const ProductMPIGeometry& grid,

        dg::bc bcx = dg::NEU,

        dg::bc bcy = dg::NEU,

        Limiter limit = FullLimiter(),

        double eps = 1e-5,

        unsigned mx=12, unsigned my=12,

        double deltaPhi = -1, std::string interpolation_method = "linear-nearest",

        bool benchmark = true):

            Fieldaligned( dg::geo::createBHat(vec), grid, bcx, bcy, limit, eps,

                    mx, my, deltaPhi, interpolation_method, benchmark)

    {

    }

    template <class Limiter>

    Fieldaligned(const dg::geo::CylindricalVectorLvl1& vec,

        const ProductMPIGeometry& grid,

        dg::bc bcx = dg::NEU,

        dg::bc bcy = dg::NEU,

        Limiter limit = FullLimiter(),

        double eps = 1e-5,

        unsigned mx=12, unsigned my=12,

        double deltaPhi = -1, std::string interpolation_method = "linear-nearest",

        bool benchmark = true);

    template<class ...Params>

    void construct( Params&& ...ps)

    {

        //construct and swap

        *this = Fieldaligned( std::forward<Params>( ps)...);

    }


    dg::bc bcx()const{

        return m_bcx;

    }

    dg::bc bcy()const{

        return m_bcy;

    }


    void set_boundaries( dg::bc bcz, double left, double right)

    {

        m_bcz = bcz;

        dg::blas1::copy( left, m_left);

        dg::blas1::copy( right, m_right);

    }


    void set_boundaries( dg::bc bcz, const MPI_Vector<LocalContainer>& left, const MPI_Vector<LocalContainer>& right)

    {

        m_bcz = bcz;

        m_left = left;

        m_right = right;

    }


    void set_boundaries( dg::bc bcz, const MPI_Vector<LocalContainer>& global, double scal_left, double scal_right)

    {

        dg::split( global, m_f, *m_g);

        dg::blas1::axpby( scal_left,  m_f[0],                   0., m_left);

        dg::blas1::axpby( scal_right, m_f[m_g->local().Nz()-1], 0., m_right);

        m_bcz = bcz;

    }


    void operator()(enum whichMatrix which, const MPI_Vector<LocalContainer>& in, MPI_Vector<LocalContainer>& out);


    double deltaPhi() const{return m_deltaPhi;}

    const MPI_Vector<LocalContainer>& hbm()const {

        return m_hbm;

    }

    const MPI_Vector<LocalContainer>& hbp()const {

        return m_hbp;

    }

    const MPI_Vector<LocalContainer>& sqrtG()const {

        return m_G;

    }

    const MPI_Vector<LocalContainer>& sqrtGm()const {

        return m_Gm;

    }

    const MPI_Vector<LocalContainer>& sqrtGp()const {

        return m_Gp;

    }

    const MPI_Vector<LocalContainer>& bphi()const {

        return m_bphi;

    }

    const MPI_Vector<LocalContainer>& bphiM()const {

        return m_bphiM;

    }

    const MPI_Vector<LocalContainer>& bphiP()const {

        return m_bphiP;

    }

    const MPI_Vector<LocalContainer>& bbm()const {

        return m_bbm;

    }

    const MPI_Vector<LocalContainer>& bbo()const {

        return m_bbo;

    }

    const MPI_Vector<LocalContainer>& bbp()const {

        return m_bbp;

    }

    const ProductMPIGeometry& grid() const{return *m_g;}


    template< class BinaryOp, class UnaryOp>

    MPI_Vector<LocalContainer> evaluate( BinaryOp f, UnaryOp g, unsigned p0,

            unsigned rounds) const;

    std::string method() const{return m_interpolation_method;}

  private:

    void ePlus( enum whichMatrix which, const MPI_Vector<LocalContainer>& in, MPI_Vector<LocalContainer>& out);

    void eMinus(enum whichMatrix which, const MPI_Vector<LocalContainer>& in, MPI_Vector<LocalContainer>& out);

    void zero(enum whichMatrix which, const MPI_Vector<LocalContainer>& in, MPI_Vector<LocalContainer>& out);

    MIMatrix m_plus, m_zero, m_minus, m_plusT, m_minusT; //2d interpolation matrices

    MPI_Vector<LocalContainer> m_hbm, m_hbp; //3d size

    MPI_Vector<LocalContainer> m_G, m_Gm, m_Gp; //3d size

    MPI_Vector<LocalContainer> m_bphi, m_bphiM, m_bphiP; //3d size

    MPI_Vector<LocalContainer> m_bbm, m_bbp, m_bbo; //3d size


    MPI_Vector<LocalContainer> m_left, m_right; //2d size

    MPI_Vector<LocalContainer> m_limiter; //2d size

    mutable MPI_Vector<LocalContainer> m_ghostM, m_ghostP; //2d size

    mutable std::vector<MPI_Vector<dg::View<const LocalContainer>> > m_f;

    mutable std::vector<MPI_Vector<dg::View<LocalContainer>> > m_temp;

    dg::ClonePtr<ProductMPIGeometry> m_g;

    dg::bc m_bcx, m_bcy, m_bcz;

    unsigned m_Nz, m_perp_size, m_mx, m_my;

    double m_deltaPhi, m_eps;

    std::string m_interpolation_method;

    dg::geo::CylindricalVectorLvl1 m_vec; // to reconstruct adjoint

    unsigned m_coords2, m_sizeZ; //number of processes in z

    //we need to manually send data through the host for cuda-unaware-mpi

    mutable thrust::host_vector<double> m_buffer; //2d size

    dg::detail::MPIContiguousGather m_from_minus, m_from_plus;

    bool m_have_adjoint = false;

    void updateAdjoint( )

    {

        auto vol = dg::tensor::volume(m_g->metric()), vol2d0(vol);

        auto vol2d = dg::split( vol, *m_g);

        dg::assign( vol2d[0], vol2d0);

        dg::ClonePtr<dg::aMPIGeometry2d> grid_transform( m_g->perp_grid()) ;

        dg::ClonePtr<dg::aGeometry2d> global_grid_magnetic;

        std::array<thrust::host_vector<double>,3> yp_trafo, ym_trafo;

        thrust::host_vector<double> hbp, hbm;

        thrust::host_vector<bool> in_boxp, in_boxm;


        make_matrices( m_vec, grid_transform, global_grid_magnetic,

            m_bcx, m_bcy, m_eps, m_mx, m_my, m_deltaPhi,

            m_interpolation_method,

            false, true, vol2d0, hbp, hbm,

            in_boxp, in_boxm,

            yp_trafo, ym_trafo);

    }


    void make_matrices(

        const dg::geo::CylindricalVectorLvl1& vec,

        const dg::ClonePtr<dg::aMPIGeometry2d>& grid_transform,

        dg::ClonePtr<dg::aGeometry2d>& global_grid_magnetic,

        dg::bc bcx, dg::bc bcy, double eps,

        unsigned mx, unsigned my,

        double deltaPhi, std::string interpolation_method,

        bool benchmark, bool make_adjoint,

        const MPI_Vector<thrust::host_vector<double>>& vol2d0,

        thrust::host_vector<double>& hbp,

        thrust::host_vector<double>& hbm,

        thrust::host_vector<bool>& in_boxp,

        thrust::host_vector<bool>& in_boxm,

        std::array<thrust::host_vector<double>,3>& yp_trafo,

        std::array<thrust::host_vector<double>,3>& ym_trafo

        )

    {

    int rank;

    MPI_Comm_rank( m_g->communicator(), &rank);

    std::string inter_m, project_m, fine_m;

    detail::parse_method( interpolation_method, inter_m, project_m, fine_m);

    if( benchmark && rank==0)

        std::cout << "# Interpolation method: \""<<inter_m

            << "\" projection method: \""<<project_m

            <<"\" fine grid \""<<fine_m<<"\"\n";

    //  grid_trafo -> grid_equi -> grid_fine -> grid_equi -> grid_trafo

    dg::Timer t;

    if( benchmark) t.tic();

    // We do not need metric of grid_equidist or or grid_fine

    // We only need grid_fine_local and grid_equidist_global: multiplying cell numbers on an MPI grid would redistribute points for non-equipartition

    // So we make them RealGrid

    dg::RealGrid2d<double> grid_equidist_global( grid_transform->global()) ;

    dg::RealGrid2d<double> grid_fine_local( grid_transform->local());

    grid_equidist_global.set( 1, grid_equidist_global.shape(0), grid_equidist_global.shape(1));

    dg::ClonePtr<dg::aMPIGeometry2d> grid_magnetic = grid_transform;//INTEGRATE HIGH ORDER GRID

    grid_magnetic->set( grid_transform->n() < 3 ? 4 : 7, grid_magnetic->Nx(), grid_magnetic->Ny());

    global_grid_magnetic = grid_magnetic->global_geometry();

    // For project method "const" we round up to the nearest multiple of n

    if( project_m != "dg" && fine_m == "dg")

    {

        unsigned rx = mx % grid_transform->nx(), ry = my % grid_transform->ny();

        if( 0 != rx || 0 != ry)

        {

            if(rank==0)std::cerr << "#Warning: for projection method \"const\" mx and my must be multiples of nx and ny! Rounding up for you ...\n";

            mx = mx + grid_transform->nx() - rx;

            my = my + grid_transform->ny() - ry;

        }

    }

    if( fine_m == "equi")

        grid_fine_local.set( 1, grid_fine_local.shape(0), grid_fine_local.shape(1));

    grid_fine_local.multiplyCellNumbers((double)mx, (double)my);

    if( benchmark)

    {

        t.toc();

        if(rank==0) std::cout << "# DS: High order grid gen   took: "<<t.diff()<<"\n";

        t.tic();

    }

    std::array<thrust::host_vector<double>,3> yp, ym;

    detail::integrate_all_fieldlines2d( vec, *global_grid_magnetic,

            grid_transform->local(), yp_trafo, vol2d0.data(), hbp, in_boxp,

            deltaPhi, eps);

    detail::integrate_all_fieldlines2d( vec, *global_grid_magnetic,

            grid_transform->local(), ym_trafo, vol2d0.data(), hbm, in_boxm,

            -deltaPhi, eps);

    dg::HVec Xf = dg::evaluate(  dg::cooX2d, grid_fine_local);

    dg::HVec Yf = dg::evaluate(  dg::cooY2d, grid_fine_local);

    {

    dg::IHMatrix interpolate = dg::create::interpolation( Xf, Yf,

            grid_transform->local(), dg::NEU, dg::NEU, grid_transform->n() < 3 ? "cubic" : "dg");

    yp.fill(dg::evaluate( dg::zero, grid_fine_local));

    ym = yp;

    for( int i=0; i<2; i++)

    {

        dg::blas2::symv( interpolate, yp_trafo[i], yp[i]);

        dg::blas2::symv( interpolate, ym_trafo[i], ym[i]);

    }

    } // release memory for interpolate matrix

    if(benchmark)

    {

        t.toc();

        if(rank==0) std::cout << "# DS: Fieldline integration took: "<<t.diff()<<"\n";

        t.tic();

    }

    { // free memory after use

    dg::IHMatrix fine, projection, multi, temp;

    if( project_m ==  "dg")

        projection = dg::create::projection( grid_transform->global(), grid_fine_local);

    else

        projection = dg::create::projection( grid_equidist_global, grid_fine_local, project_m);


    std::array<dg::HVec*,3> xcomp{ &yp[0], &Xf, &ym[0]};

    std::array<dg::HVec*,3> ycomp{ &yp[1], &Yf, &ym[1]};

    std::array<MIMatrix*,3> result{ &m_plus, &m_zero, &m_minus};

    std::array<MIMatrix*,3> resultT{ &m_plusT, &m_zero, &m_minusT};

    for( unsigned u=0; u<3; u++)

    {

        if( inter_m == "dg")

        {

            multi = projection * dg::create::interpolation( *xcomp[u], *ycomp[u],

                grid_transform->global(), bcx, bcy, "dg");

            multi = dg::convertGlobal2LocalRows( multi, *grid_transform);

        }

        else

        {

            multi = projection * dg::create::interpolation( *xcomp[u], *ycomp[u],

                grid_equidist_global, bcx, bcy, inter_m) *

                dg::create::backproject( grid_transform->global()); // from dg to equidist

            multi = dg::convertGlobal2LocalRows( multi, *grid_transform);

        }


        if( project_m != "dg")

        {

            multi = dg::create::inv_backproject( grid_transform->local()) * multi;

        }

        dg::MIHMatrix mpi = dg::make_mpi_matrix( multi, *grid_transform); //, tempT;

        dg::blas2::transfer( mpi, *result[u]);

        if( make_adjoint and  u != 1)

        {

            dg::IHMatrix multiT = multi.transpose();

            // multiT is column distributed

            // multiT has global rows and local column indices

            dg::convertLocal2GlobalCols( multiT, *grid_transform);

            // now multiT has global rows and global column indices

            auto mat = dg::convertGlobal2LocalRows( multiT, *grid_transform);

            // now mat is row distributed with global column indices

            auto mpi_mat = dg::make_mpi_matrix(  mat, *grid_transform);

            dg::blas2::transfer( mpi_mat, *resultT[u]);

            m_have_adjoint = true;

        }

    }

    }

    if( benchmark)

    {

        t.toc();

        if(rank==0) std::cout << "# DS: Multiplication PI     took: "<<t.diff()<<"\n";

    }

    }

};

template<class MPIGeometry, class MIMatrix, class LocalContainer>

template <class Limiter>

Fieldaligned<MPIGeometry, MIMatrix, MPI_Vector<LocalContainer> >::Fieldaligned(

    const dg::geo::CylindricalVectorLvl1& vec,

    const MPIGeometry& grid,

    dg::bc bcx, dg::bc bcy, Limiter limit, double eps,

    unsigned mx, unsigned my,

    double deltaPhi, std::string interpolation_method, bool benchmark

    ):

        m_g(grid), m_bcx(bcx), m_bcy(bcy), m_bcz(grid.bcz()),

        m_Nz( grid.local().Nz()), m_mx(mx), m_my(my), m_eps(eps),

        m_interpolation_method(interpolation_method),

        m_vec(vec)

{

    int rank;

    MPI_Comm_rank( grid.communicator(), &rank);

    int dims[3], periods[3], coords[3];

    MPI_Cart_get( m_g->communicator(), 3, dims, periods, coords);

    m_coords2 = coords[2], m_sizeZ = dims[2];


    if( (grid.bcx() == PER && bcx != PER) || (grid.bcx() != PER && bcx == PER) )

        throw( dg::Error(dg::Message(_ping_)<<"Fieldaligned: Got conflicting periodicity in x. The grid says "<<bc2str(grid.bcx())<<" while the parameter says "<<bc2str(bcx)));

    if( (grid.bcy() == PER && bcy != PER) || (grid.bcy() != PER && bcy == PER) )

        throw( dg::Error(dg::Message(_ping_)<<"Fieldaligned: Got conflicting boundary conditions in y. The grid says "<<bc2str(grid.bcy())<<" while the parameter says "<<bc2str(bcy)));

    if( deltaPhi <=0) deltaPhi = grid.hz();

    m_deltaPhi = deltaPhi; // store for evaluate


    auto vol = dg::tensor::volume(grid.metric()), vol2d0(vol);

    auto vol2d = dg::split( vol, grid);

    dg::assign( vol2d[0], vol2d0);

    dg::ClonePtr<dg::aMPIGeometry2d> grid_transform( grid.perp_grid()) ;

    dg::ClonePtr<dg::aGeometry2d> global_grid_magnetic;

    std::array<thrust::host_vector<double>,3> yp_trafo, ym_trafo;

    thrust::host_vector<double> hbp, hbm;

    thrust::host_vector<bool> in_boxp, in_boxm;


    make_matrices( vec, grid_transform, global_grid_magnetic,

            bcx, bcy, eps, mx, my, m_deltaPhi, interpolation_method,

            benchmark, false, vol2d0, hbp, hbm,

            in_boxp, in_boxm,

            yp_trafo, ym_trafo);

    dg::HVec hbphi( yp_trafo[2]), hbphiP(hbphi), hbphiM(hbphi);

    auto tmp = dg::pullback( vec.z(), *grid_transform);

    hbphi = tmp.data();

    //this is a pullback bphi( R(zeta, eta), Z(zeta, eta)):

    if( dynamic_cast<const dg::CartesianMPIGrid2d*>( grid_transform.get()))

    {

        for( unsigned i=0; i<hbphiP.size(); i++)

        {

            hbphiP[i] = vec.z()(yp_trafo[0][i], yp_trafo[1][i]);

            hbphiM[i] = vec.z()(ym_trafo[0][i], ym_trafo[1][i]);

        }

    }

    else

    {

        dg::HVec Ihbphi = dg::pullback( vec.z(), *global_grid_magnetic);

        dg::HVec Lhbphi = dg::forward_transform( Ihbphi, *global_grid_magnetic);

        for( unsigned i=0; i<yp_trafo[0].size(); i++)

        {

            hbphiP[i] = dg::interpolate( dg::lspace, Lhbphi, yp_trafo[0][i],

                    yp_trafo[1][i], *global_grid_magnetic);

            hbphiM[i] = dg::interpolate( dg::lspace, Lhbphi, ym_trafo[0][i],

                    ym_trafo[1][i], *global_grid_magnetic);

        }

    }

    dg::assign3dfrom2d( dg::MHVec(hbphi,  grid_transform->communicator()), m_bphi,  grid);

    dg::assign3dfrom2d( dg::MHVec(hbphiM, grid_transform->communicator()), m_bphiM, grid);

    dg::assign3dfrom2d( dg::MHVec(hbphiP, grid_transform->communicator()), m_bphiP, grid);


    dg::assign3dfrom2d( dg::MHVec(yp_trafo[2], grid_transform->communicator()), m_Gp, grid);

    dg::assign3dfrom2d( dg::MHVec(ym_trafo[2], grid_transform->communicator()), m_Gm, grid);

    MPI_Vector<LocalContainer> weights = dg::create::weights( grid);

    m_G = vol;

    dg::blas1::pointwiseDot( m_G, weights, m_G);

    dg::blas1::pointwiseDot( m_Gp, weights, m_Gp);

    dg::blas1::pointwiseDot( m_Gm, weights, m_Gm);


    dg::assign( dg::evaluate( dg::zero, grid), m_hbm);

    m_temp = dg::split( m_hbm, grid); //3d vector

    m_f = dg::split( (const MPI_Vector<LocalContainer>&)m_hbm, grid);

    dg::assign3dfrom2d( dg::MHVec(hbp, grid_transform->communicator()), m_hbp, grid);

    dg::assign3dfrom2d( dg::MHVec(hbm, grid_transform->communicator()), m_hbm, grid);

    dg::blas1::scal( m_hbm, -1.);

    thrust::host_vector<double> bbm( in_boxp.size(),0.), bbo(bbm), bbp(bbm);

    for( unsigned i=0; i<in_boxp.size(); i++)

    {

        if( !in_boxp[i] && !in_boxm[i])

            bbo[i] = 1.;

        else if( !in_boxp[i] && in_boxm[i])

            bbp[i] = 1.;

        else if( in_boxp[i] && !in_boxm[i])

            bbm[i] = 1.;

        // else all are 0

    }

    dg::assign3dfrom2d( dg::MHVec(bbm, grid_transform->communicator()), m_bbm, grid);

    dg::assign3dfrom2d( dg::MHVec(bbo, grid_transform->communicator()), m_bbo, grid);

    dg::assign3dfrom2d( dg::MHVec(bbp, grid_transform->communicator()), m_bbp, grid);


    m_perp_size = grid_transform->local().size();

    dg::assign( dg::pullback(limit, *grid_transform), m_limiter);

    dg::assign( dg::evaluate(dg::zero, *grid_transform), m_left);

    m_ghostM = m_ghostP = m_right = m_left;

    int source, dest;

    dg::detail::MsgChunk chunk { 0, (int)m_perp_size};


    MPI_Cart_shift( grid.comm(2), 0, +1, &source, &dest);

    std::map<int, thrust::host_vector<dg::detail::MsgChunk>> recvMsgP =

        {{ dest, thrust::host_vector<dg::detail::MsgChunk>( 1, chunk)}};

    m_from_plus = dg::detail::MPIContiguousGather( recvMsgP, grid.comm(2));


    MPI_Cart_shift( grid.comm(2), 0, -1, &source, &dest);

    std::map<int, thrust::host_vector<dg::detail::MsgChunk>> recvMsgM =

        {{ dest, thrust::host_vector<dg::detail::MsgChunk>( 1, chunk)}};

    m_from_minus = dg::detail::MPIContiguousGather( recvMsgM, grid.comm(2));

}


template<class G, class M, class container>

void Fieldaligned<G, M, MPI_Vector<container> >::operator()(enum

        whichMatrix which, const MPI_Vector<container>& f,

        MPI_Vector<container>& fe)

{

    if(which == einsPlus || which == einsMinusT) ePlus( which, f, fe);

    if(which == einsMinus || which == einsPlusT) eMinus( which, f, fe);

    if(     which == einsPlus  || which == einsMinusT ) ePlus(  which, f, fe);

    else if(which == einsMinus || which == einsPlusT  ) eMinus( which, f, fe);

    else if(which == zeroMinus || which == zeroPlus ||

            which == zeroMinusT|| which == zeroPlusT ||

            which == zeroForw  ) zero(   which, f, fe);

}

template< class G, class M, class container>

void Fieldaligned<G, M, MPI_Vector<container> >::zero( enum whichMatrix which, const MPI_Vector<container>& f, MPI_Vector<container>& f0)

{

    dg::split( f, m_f, *m_g);

    dg::split( f0, m_temp, *m_g);

    //1. compute 2d interpolation in every plane and store in m_temp

    for( unsigned i0=0; i0<m_Nz; i0++)

    {

        if(which == zeroPlus)

            dg::blas2::symv( m_plus,   m_f[i0], m_temp[i0]);

        else if(which == zeroMinus)

            dg::blas2::symv( m_minus,  m_f[i0], m_temp[i0]);

        else if(which == zeroPlusT)

        {

            if( ! m_have_adjoint) updateAdjoint( );

            dg::blas2::symv( m_plusT,  m_f[i0], m_temp[i0]);

        }

        else if(which == zeroMinusT)

        {

            if( ! m_have_adjoint) updateAdjoint( );

            dg::blas2::symv( m_minusT, m_f[i0], m_temp[i0]);

        }

        else if( which == zeroForw)

        {

            if ( m_interpolation_method != "dg" )

            {

                dg::blas2::symv( m_zero, m_f[i0], m_temp[i0]);

            }

            else

                dg::blas1::copy( m_f[i0], m_temp[i0]);

        }

    }

}


template<class G, class M, class container>

void Fieldaligned<G,M, MPI_Vector<container> >::ePlus( enum whichMatrix which, const MPI_Vector<container>& f, MPI_Vector<container>& fpe )

{

    dg::split( f, m_f, *m_g);

    dg::split( fpe, m_temp, *m_g);

    MPI_Vector<dg::View<container>> send_buf(

            {m_ghostP.data().data(), m_ghostP.size()}, m_g->get_perp_comm());

    //1. compute 2d interpolation in every plane and store in m_temp

    for( unsigned i0=0; i0<m_Nz; i0++)

    {

        // If communication necessary we write the symv result into send buffer

        bool comm_plane = (m_sizeZ != 1 and i0 == m_Nz -1);

        unsigned ip = (i0==m_Nz-1) ? 0:i0+1;

        if(which == einsPlus)

            dg::blas2::symv( m_plus,   m_f[ip], comm_plane ? send_buf : m_temp[i0]);

        else if(which == einsMinusT)

        {

            if( ! m_have_adjoint) updateAdjoint( );

            dg::blas2::symv( m_minusT, m_f[ip], comm_plane ? send_buf : m_temp[i0]);

        }

    }


    //2. communicate halo in z

    if( m_sizeZ != 1)

    {

        unsigned i0 = m_Nz-1;

        m_from_plus.global_gather_init( send_buf.data(), m_temp[i0].data());

        m_from_plus.global_gather_wait( m_temp[i0].data());

    }


    //3. apply right boundary conditions in last plane

    unsigned i0=m_Nz-1;

    if( m_bcz != dg::PER && m_g->local().z1() == m_g->global().z1())

    {

        if( m_bcz == dg::DIR || m_bcz == dg::NEU_DIR)

            dg::blas1::axpby( 2, m_right, -1., m_f[i0], m_ghostP);

        if( m_bcz == dg::NEU || m_bcz == dg::DIR_NEU)

            dg::blas1::axpby( m_deltaPhi, m_right, 1., m_f[i0], m_ghostP);

        //interlay ghostcells with periodic cells: L*g + (1-L)*fpe

        dg::blas1::axpby( 1., m_ghostP, -1., m_temp[i0], m_ghostP);

        dg::blas1::pointwiseDot( 1., m_limiter, m_ghostP, 1., m_temp[i0]);

    }

}


template<class G, class M, class container>

void Fieldaligned<G, M, MPI_Vector<container> >::eMinus( enum

    whichMatrix which, const MPI_Vector<container>& f, MPI_Vector<container>& fme )

{

    int rank;

    MPI_Comm_rank(m_g->communicator(), &rank);

    dg::split( f, m_f, *m_g);

    dg::split( fme, m_temp, *m_g);

    MPI_Vector<dg::View<container>> send_buf(

            {m_ghostM.data().data(), m_ghostM.size()}, m_g->get_perp_comm());

    //1. compute 2d interpolation in every plane and store in m_temp

    for( unsigned i0=0; i0<m_Nz; i0++)

    {

        // If communication necessary we write the symv result into send buffer

        bool comm_plane = (m_sizeZ != 1 and i0 == 0);

        unsigned im = (i0==0) ? m_Nz-1:i0-1;

        if(which == einsPlusT)

        {

            if( ! m_have_adjoint) updateAdjoint( );

            dg::blas2::symv( m_plusT, m_f[im], comm_plane ? send_buf : m_temp[i0]);

        }

        else if(which == einsMinus)

            dg::blas2::symv( m_minus, m_f[im], comm_plane ? send_buf : m_temp[i0]);

    }


    //2. communicate halo in z

    if( m_sizeZ != 1)

    {

        unsigned i0 = 0;

        m_from_minus.global_gather_init( send_buf.data(), m_temp[i0].data());

        m_from_minus.global_gather_wait( m_temp[i0].data());

    }


    //3. apply left boundary conditions in first plane

    unsigned i0=0;

    if( m_bcz != dg::PER && m_g->local().z0() == m_g->global().z0())

    {

        if( m_bcz == dg::DIR || m_bcz == dg::DIR_NEU)

            dg::blas1::axpby( 2., m_left,  -1., m_f[i0], m_ghostM);

        if( m_bcz == dg::NEU || m_bcz == dg::NEU_DIR)

            dg::blas1::axpby( -m_deltaPhi, m_left, 1., m_f[i0], m_ghostM);

        //interlay ghostcells with periodic cells: L*g + (1-L)*fme

        dg::blas1::axpby( 1., m_ghostM, -1., m_temp[i0], m_ghostM);

        dg::blas1::pointwiseDot( 1., m_limiter, m_ghostM, 1., m_temp[i0]);

    }

}


template<class G, class M, class container>

template< class BinaryOp, class UnaryOp>

MPI_Vector<container> Fieldaligned<G,M, MPI_Vector<container> >::evaluate( BinaryOp binary, UnaryOp unary, unsigned p0, unsigned rounds) const

{

    //idea: simply apply I+/I- enough times on the init2d vector to get the result in each plane

    //unary function is always such that the p0 plane is at x=0

    assert( p0 < m_g->global().Nz());

    const dg::ClonePtr<aMPIGeometry2d> g2d = m_g->perp_grid();

    MPI_Vector<container> init2d = dg::pullback( binary, *g2d);

    MPI_Vector<container> zero2d = dg::evaluate( dg::zero, *g2d);

    unsigned globalNz = m_g->global().Nz();


    MPI_Vector<container> temp(init2d), tempP(init2d), tempM(init2d);

    MPI_Vector<container> vec3d = dg::evaluate( dg::zero, *m_g);

    std::vector<MPI_Vector<container> >  plus2d(globalNz, zero2d), minus2d(plus2d), result(plus2d);

    unsigned turns = rounds;

    if( turns ==0) turns++;

    //first apply Interpolation many times, scale and store results

    for( unsigned r=0; r<turns; r++)

        for( unsigned i0=0; i0<globalNz; i0++)

        {

            dg::blas1::copy( init2d, tempP);

            dg::blas1::copy( init2d, tempM);

            unsigned rep = r*globalNz + i0;

            for(unsigned k=0; k<rep; k++)

            {

                dg::blas2::symv( m_minus, tempP, temp);

                temp.swap( tempP);

                dg::blas2::symv( m_plus, tempM, temp);

                temp.swap( tempM);

            }

            dg::blas1::scal( tempP, unary(  (double)rep*m_deltaPhi ) );

            dg::blas1::scal( tempM, unary( -(double)rep*m_deltaPhi ) );

            dg::blas1::axpby( 1., tempP, 1., plus2d[i0]);

            dg::blas1::axpby( 1., tempM, 1., minus2d[i0]);

        }

    //now we have the plus and the minus filaments

    if( rounds == 0) //there is a limiter

    {

        for( unsigned i0=0; i0<m_Nz; i0++)

        {

            int idx = (int)(i0+m_coords2*m_Nz)  - (int)p0;

            if(idx>=0)

                result[i0] = plus2d[idx];

            else

                result[i0] = minus2d[abs(idx)];

            thrust::copy( result[i0].data().begin(), result[i0].data().end(),

                    vec3d.data().begin() + i0*m_perp_size);

        }

    }

    else //sum up plus2d and minus2d

    {

        for( unsigned i0=0; i0<globalNz; i0++)

        {

            unsigned revi0 = (globalNz - i0)%globalNz; //reverted index

            dg::blas1::axpby( 1., plus2d[i0], 0., result[i0]);

            dg::blas1::axpby( 1., minus2d[revi0], 1., result[i0]);

        }

        dg::blas1::axpby( -1., init2d, 1., result[0]);

        for(unsigned i0=0; i0<m_Nz; i0++)

        {

            int idx = ((int)i0 + m_coords2*m_Nz -(int)p0 + globalNz)%globalNz; //shift index

            thrust::copy( result[idx].data().begin(), result[idx].data().end(),

                    vec3d.data().begin() + i0*m_perp_size);

        }

    }

    return vec3d;

}


template<class BinaryOp, class UnaryOp>


MPI_Vector<thrust::host_vector<double>> fieldaligned_evaluate(

        const aProductMPIGeometry3d& grid,

        const CylindricalVectorLvl0& vec,

        const BinaryOp& binary,

        const UnaryOp& unary,

        unsigned p0,

        unsigned rounds,

        double eps = 1e-5)

{

    unsigned Nz = grid.Nz();

    const dg::ClonePtr<aMPIGeometry2d> g2d = grid.perp_grid();

    // Construct for field-aligned output

    dg::MHVec vec3d = dg::evaluate( dg::zero, grid);

    dg::MHVec tempP = dg::evaluate( dg::zero, *g2d), tempM( tempP);

    std::vector<dg::MHVec>  plus2d(Nz, tempP), minus2d(plus2d), result(plus2d);

    dg::MHVec init2d = dg::pullback( binary, *g2d);

    std::array<dg::HVec,3> yy0{

        dg::evaluate( dg::cooX2d, g2d->local()),

        dg::evaluate( dg::cooY2d, g2d->local()),

        dg::evaluate( dg::zero, g2d->local())}, yy1(yy0), xx0( yy0), xx1(yy0); //s

    dg::geo::detail::DSFieldCylindrical3 cyl_field(vec);

    double deltaPhi = grid.hz();

    double phiM0 = 0., phiP0 = 0.;

    unsigned turns = rounds;

    if( turns == 0) turns++;

    for( unsigned r=0; r<turns; r++)

        for( unsigned  i0=0; i0<Nz; i0++)

        {

            unsigned rep = r*Nz + i0;

            if( rep == 0)

                tempM = tempP = init2d;

            else

            {

                dg::Adaptive<dg::ERKStep<std::array<double,3>>> adapt(

                        "Dormand-Prince-7-4-5", std::array<double,3>{0,0,0});

                dg::AdaptiveTimeloop<std::array<double,3>> odeint( adapt,

                    cyl_field, dg::pid_control, dg::fast_l2norm, eps, 1e-10);

                for( unsigned i=0; i<g2d->local().size(); i++)

                {

                    // minus direction needs positive integration!

                    double phiM1 = phiM0 + deltaPhi;

                    std::array<double,3>

                        coords0{yy0[0][i],yy0[1][i],yy0[2][i]}, coords1;

                    odeint.integrate_in_domain( phiM0, coords0, phiM1,

                            coords1, deltaPhi, g2d->global(), eps);

                    yy1[0][i] = coords1[0], yy1[1][i] = coords1[1], yy1[2][i] =

                        coords1[2];

                    tempM.data()[i] = binary( yy1[0][i], yy1[1][i]);


                    // plus direction needs negative integration!

                    double phiP1 = phiP0 - deltaPhi;

                    coords0 = std::array<double,3>{xx0[0][i],xx0[1][i],xx0[2][i]};

                    odeint.integrate_in_domain( phiP0, coords0, phiP1,

                            coords1, -deltaPhi, g2d->global(), eps);

                    xx1[0][i] = coords1[0], xx1[1][i] = coords1[1], xx1[2][i] =

                        coords1[2];

                    tempP.data()[i] = binary( xx1[0][i], xx1[1][i]);

                }

                std::swap( yy0, yy1);

                std::swap( xx0, xx1);

                phiM0 += deltaPhi;

                phiP0 -= deltaPhi;

            }

            dg::blas1::scal( tempM, unary( -(double)rep*deltaPhi ) );

            dg::blas1::scal( tempP, unary(  (double)rep*deltaPhi ) );

            dg::blas1::axpby( 1., tempM, 1., minus2d[i0]);

            dg::blas1::axpby( 1., tempP, 1., plus2d[i0]);

        }

    //now we have the plus and the minus filaments

    int dims[3], periods[3], coords[3];

    MPI_Cart_get( grid.communicator(), 3, dims, periods, coords);

    unsigned coords2 = coords[2];

    if( rounds == 0) //there is a limiter

    {

        for( unsigned i0=0; i0<grid.local().Nz(); i0++)

        {

            int idx = (int)(i0+coords2*grid.local().Nz()) - (int)p0;

            if(idx>=0)

                result[i0] = plus2d[idx];

            else

                result[i0] = minus2d[abs(idx)];

            thrust::copy( result[i0].data().begin(), result[i0].data().end(),

                    vec3d.data().begin() + i0*g2d->local().size());

        }

    }

    else //sum up plus2d and minus2d

    {

        for( unsigned i0=0; i0<Nz; i0++)

        {

            unsigned revi0 = (Nz - i0)%Nz; //reverted index

            dg::blas1::axpby( 1., plus2d[i0], 0., result[i0]);

            dg::blas1::axpby( 1., minus2d[revi0], 1., result[i0]);

        }

        dg::blas1::axpby( -1., init2d, 1., result[0]);

        for( unsigned i0=0; i0<grid.local().Nz(); i0++)

        {

            int idx = ((int)i0 +coords2*grid.local().Nz()-(int)p0 + Nz)%Nz;

            //shift index

            thrust::copy( result[idx].data().begin(), result[idx].data().end(),

                    vec3d.data().begin() + i0*g2d->local().size());

        }

    }

    return vec3d;

}


}//namespace geo

}//namespace dg

dg::Error

dg::Message

fieldaligned.h

dg::cooX2d
DG_DEVICE double cooX2d(double x, double)

dg::cooY2d
DG_DEVICE double cooY2d(double, double y)

dg::zero
DG_DEVICE T zero(T, Ts ...)

dg::blas1::copy
void copy(const ContainerTypeIn &source, ContainerTypeOut &target)

dg::blas1::axpby
void axpby(value_type alpha, const ContainerType1 &x, value_type1 beta, ContainerType &y)

dg::blas1::pointwiseDot
void pointwiseDot(value_type alpha, const ContainerType1 &x1, const ContainerType2 &x2, value_type1 beta, ContainerType &y)

dg::assign
void assign(const from_ContainerType &from, ContainerType &to, Params &&... ps)

dg::blas1::scal
void scal(ContainerType &x, value_type alpha)

dg::blas2::transfer
void transfer(const MatrixType &x, AnotherMatrixType &y)

dg::blas2::symv
void symv(MatrixType &&M, const ContainerType1 &x, ContainerType2 &y)

dg::bc2str
std::string bc2str(bc bcx)

dg::bc
bc

dg::NEU_DIR
NEU_DIR

dg::PER
PER

dg::NEU
NEU

dg::DIR
DIR

dg::DIR_NEU
DIR_NEU

dg::lspace
lspace

dg::create::weights
auto weights(const Topology &g)

dg::evaluate
auto evaluate(Functor &&f, const Topology &g)

dg::geo::whichMatrix
whichMatrix
Enum for the use in Fieldaligned.
Definition fieldaligned.h:16

dg::geo::fieldaligned_evaluate
thrust::host_vector< double > fieldaligned_evaluate(const aProductGeometry3d &grid, const CylindricalVectorLvl0 &vec, const BinaryOp &binary, const UnaryOp &unary, unsigned p0, unsigned rounds, double eps=1e-5)
Evaluate a 2d functor and transform to all planes along the fieldlines
Definition fieldaligned.h:1014

dg::geo::FullLimiter
ONE FullLimiter
Full Limiter means there is a limiter everywhere.
Definition fieldaligned.h:30

dg::forward_transform
Topology::host_vector forward_transform(const typename Topology::host_vector &in, const Topology &g)

dg::interpolate
real_type interpolate(dg::space sp, const host_vector &v, real_type x, const RealGrid1d< real_type > &g, dg::bc bcx=dg::NEU)

dg::create::projection
dg::MIHMatrix_t< typename MPITopology::value_type > projection(const MPITopology &g_new, const MPITopology &g_old, std::string method="dg")

dg::create::interpolation
dg::SparseMatrix< int, real_type, thrust::host_vector > interpolation(const RecursiveHostVector &x, const aRealTopology< real_type, Nd > &g, std::array< dg::bc, Nd > bcx, std::string method="dg")

dg::geo::createBHat
CylindricalVectorLvl1 createBHat(const TokamakMagneticField &mag)
Contravariant components of the magnetic unit vector field and its Divergence and derivative in cylin...
Definition magnetic_field.h:934

dg::convertLocal2GlobalCols
void convertLocal2GlobalCols(dg::IHMatrix_t< real_type > &local, const ConversionPolicy &policy)

dg::convertGlobal2LocalRows
dg::IHMatrix_t< real_type > convertGlobal2LocalRows(const dg::IHMatrix_t< real_type > &global, const ConversionPolicy &row_policy)

dg::make_mpi_matrix
dg::MIHMatrix_t< real_type > make_mpi_matrix(const dg::IHMatrix_t< real_type > &global_cols, const ConversionPolicy &col_policy)

dg::pullback
Geometry::host_vector pullback(const Functor &f, const Geometry &g)

dg::assign3dfrom2d
void assign3dfrom2d(const host_vector &in2d, Container &out, const Topology &grid)

dg::create::inv_backproject
dg::IHMatrix_t< real_type > inv_backproject(const aRealTopology< real_type, Nd > &g)

dg::create::backproject
dg::IHMatrix_t< real_type > backproject(const aRealTopology< real_type, Nd > &g)

dg::split
void split(SharedContainer &in, std::vector< View< SharedContainer > > &out, const aRealTopology3d< real_type > &grid)

dg::tensor::volume
ContainerType volume(const SparseTensor< ContainerType > &t)

dg::pid_control
static auto pid_control

dg::fast_l2norm
static auto fast_l2norm

dg::HVec
thrust::host_vector< double > HVec

dg

dg::Adaptive

dg::AdaptiveTimeloop

dg::ClonePtr

dg::ClonePtr::get
Cloneable * get()

dg::MPI_Vector

dg::MPI_Vector::data
const container & data() const

dg::MPIDistMat

dg::RealCartesianMPIGrid2d

dg::RealGrid

dg::SparseMatrix

dg::SparseMatrix::transpose
SparseMatrix transpose() const

dg::Timer

dg::Timer::diff
double diff() const

dg::Timer::toc
void toc()

dg::Timer::tic
void tic()

dg::aRealMPITopology::hz
real_type hz() const

dg::aRealMPITopology::communicator
MPI_Comm communicator() const

dg::aRealMPITopology::Nz
unsigned Nz() const

dg::aRealMPITopology::local
const RealGrid< real_type, Nd > & local() const

dg::aRealProductMPIGeometry3d

dg::aRealProductMPIGeometry3d::perp_grid
aRealMPIGeometry2d< real_type > * perp_grid() const

dg::geo::CylindricalVectorLvl0
Definition fluxfunctions.h:415

dg::geo::CylindricalVectorLvl1
This struct bundles a vector field and its divergence.
Definition fluxfunctions.h:443

dg::geo::CylindricalVectorLvl1::z
const CylindricalFunctor & z() const
z-component of the vector
Definition fluxfunctions.h:473

dg::geo::Fieldaligned::bcx
dg::bc bcx() const
Definition fieldaligned.h:322

dg::geo::Fieldaligned::hbp
const container & hbp() const
Distance between the planes .
Definition fieldaligned.h:399

dg::geo::Fieldaligned::bphi
const container & bphi() const
bphi
Definition fieldaligned.h:419

dg::geo::Fieldaligned::bbp
const container & bbp() const
Mask plus, 1 if fieldline intersects wall in plus direction but not in minus direction,...
Definition fieldaligned.h:444

dg::geo::Fieldaligned::evaluate
container evaluate(BinaryOp binary, UnaryOp unary, unsigned p0, unsigned rounds) const
Evaluate a 2d functor and transform to all planes along the fieldline

dg::geo::Fieldaligned::sqrtG
const container & sqrtG() const
Volume form (including weights) .
Definition fieldaligned.h:404

dg::geo::Fieldaligned::operator()
void operator()(enum whichMatrix which, const container &in, container &out)
Apply the interpolation to three-dimensional vectors.

dg::geo::Fieldaligned::sqrtGm
const container & sqrtGm() const
Volume form on minus plane (including weights) .
Definition fieldaligned.h:409

dg::geo::Fieldaligned::set_boundaries
void set_boundaries(dg::bc bcz, double left, double right)
Set boundary conditions in the limiter region.
Definition fieldaligned.h:339

dg::geo::Fieldaligned::method
std::string method() const
Return the interpolation_method string given in the constructor.
Definition fieldaligned.h:509

dg::geo::Fieldaligned::hbm
const container & hbm() const
Distance between the planes and the boundary .
Definition fieldaligned.h:394

dg::geo::Fieldaligned::bphiM
const container & bphiM() const
bphi on minus plane
Definition fieldaligned.h:424

dg::geo::Fieldaligned::bcy
dg::bc bcy() const
Definition fieldaligned.h:325

dg::geo::Fieldaligned::deltaPhi
double deltaPhi() const
Definition fieldaligned.h:391

dg::geo::Fieldaligned::Fieldaligned
Fieldaligned()
do not allocate memory; no member call except construct is valid
Definition fieldaligned.h:274

dg::geo::Fieldaligned::construct
void construct(Params &&...ps)
Perfect forward parameters to one of the constructors.
Definition fieldaligned.h:316

dg::geo::Fieldaligned::bbo
const container & bbo() const
Mask both, 1 if fieldline intersects wall in plus direction and in minus direction,...
Definition fieldaligned.h:439

dg::geo::Fieldaligned::bbm
const container & bbm() const
Mask minus, 1 if fieldline intersects wall in minus direction but not in plus direction,...
Definition fieldaligned.h:434

dg::geo::Fieldaligned::sqrtGp
const container & sqrtGp() const
Volume form on plus plane (including weights) .
Definition fieldaligned.h:414

dg::geo::Fieldaligned::bphiP
const container & bphiP() const
bphi on plus plane
Definition fieldaligned.h:429

dg::geo::Fieldaligned::grid
const ProductGeometry & grid() const
Grid used for construction.
Definition fieldaligned.h:448

dg::geo::TokamakMagneticField
A tokamak field as given by R0, Psi and Ipol plus Meta-data like shape and equilibrium.
Definition magnetic_field.h:165