docs/REMORA__gls_8cpp_source.html

#include <REMORA.H>


using namespace amrex;


/**

 * @param[in   ] lev            level to operate on

 * @param[inout] mf_gls         turbulent generic length scale

 * @param[inout] mf_tke         turbulent kinetic energy

 * @param[in   ] mf_W           vertical velocity

 * @param[in   ] mf_msku        land-sea mask on u points

 * @param[in   ] mf_mskv        land-sea mask on v points

 * @param[in   ] nstp           index of last time step in gls and tke MultiFabs

 * @param[in   ] nnew           index of time step to update in gls and tke MultiFabs

 * @param[in   ] iic            which time step we're on

 * @param[in   ] ntfirst        what is the first time step?

 * @param[in   ] N              number of vertical levels

 * @param[in   ] dt_lev         time step at this level

 */

void


REMORA::gls_prestep (int lev, MultiFab* mf_gls, MultiFab* mf_tke,

                     MultiFab& mf_W, MultiFab* mf_msku, MultiFab* mf_mskv,

                     const int nstp, const int nnew,

                     const int iic, const int ntfirst, const int N, const Real dt_lev)

{

    BL_PROFILE("REMORA::gls_prestep()");

    // temps: grad, gradL, XF, FX, FXL, EF, FE, FEL

    for ( MFIter mfi(*mf_gls, TilingIfNotGPU()); mfi.isValid(); ++mfi) {

        Array4<Real> const& gls = mf_gls->array(mfi);

        Array4<Real> const& tke = mf_tke->array(mfi);

        Array4<Real const> const& W = mf_W.const_array(mfi);


        Array4<Real const> const& Huon = vec_Huon[lev]->const_array(mfi);

        Array4<Real const> const& Hvom = vec_Hvom[lev]->const_array(mfi);

        Array4<Real const> const& Hz = vec_Hz[lev]->const_array(mfi);

        Array4<Real const> const& pm = vec_pm[lev]->const_array(mfi);

        Array4<Real const> const& pn = vec_pn[lev]->const_array(mfi);

        Array4<Real const> const& msku = mf_msku->const_array(mfi);

        Array4<Real const> const& mskv = mf_mskv->const_array(mfi);


        Box bx = mfi.tilebox();

        Box xbx = surroundingNodes(bx,0);

        Box ybx = surroundingNodes(bx,1);


        Box xbx_hi = growHi(xbx,0,1);


        Box ybx_hi = growHi(ybx,0,1);


        const Box& domain = geom[lev].Domain();

        const auto dlo = amrex::lbound(domain);

        const auto dhi = amrex::ubound(domain);


        GeometryData const& geomdata = geom[0].data();

        bool is_periodic_in_x = geomdata.isPeriodic(0);

        bool is_periodic_in_y = geomdata.isPeriodic(1);


        int ncomp = 1;

        Vector<BCRec> bcrs_x(ncomp);

        Vector<BCRec> bcrs_y(ncomp);

        amrex::setBC(xbx,domain,xvel_bc(),0,1,domain_bcs_type,bcrs_x);

        amrex::setBC(ybx,domain,yvel_bc(),0,1,domain_bcs_type,bcrs_y);


        FArrayBox fab_XF(xbx_hi, 1, amrex::The_Async_Arena()); fab_XF.template setVal<RunOn::Device>(0.);

        FArrayBox fab_FX(xbx_hi, 1, amrex::The_Async_Arena()); fab_FX.template setVal<RunOn::Device>(0.);

        FArrayBox fab_FXL(xbx_hi, 1, amrex::The_Async_Arena()); fab_FXL.template setVal<RunOn::Device>(0.);

        FArrayBox fab_EF(ybx_hi, 1, amrex::The_Async_Arena()); fab_EF.template setVal<RunOn::Device>(0.);

        FArrayBox fab_FE(ybx_hi, 1, amrex::The_Async_Arena()); fab_FE.template setVal<RunOn::Device>(0.);

        FArrayBox fab_FEL(ybx_hi, 1, amrex::The_Async_Arena()); fab_FEL.template setVal<RunOn::Device>(0.);

        FArrayBox fab_Hz_half(bx, 1, amrex::The_Async_Arena()); fab_Hz_half.template setVal<RunOn::Device>(0.);

        FArrayBox fab_CF(convert(bx,IntVect(0,0,0)), 1, amrex::The_Async_Arena()); fab_CF.template setVal<RunOn::Device>(0.);

        FArrayBox fab_FC(convert(bx,IntVect(0,0,0)), 1, amrex::The_Async_Arena()); fab_FC.template setVal<RunOn::Device>(0.);

        FArrayBox fab_FCL(convert(bx,IntVect(0,0,0)), 1, amrex::The_Async_Arena()); fab_FCL.template setVal<RunOn::Device>(0.);


        auto XF  = fab_XF.array();

        auto FX  = fab_FX.array();

        auto FXL = fab_FXL.array();

        auto EF  = fab_EF.array();

        auto FE  = fab_FE.array();

        auto FEL = fab_FEL.array();

        auto Hz_half = fab_Hz_half.array();

        auto CF  = fab_CF.array();

        auto FC  = fab_FC.array();

        auto FCL = fab_FCL.array();


        // need XF/FX/FXL from  [xlo to xhi] by [ylo to yhi  ] on u points

        ParallelFor(grow(xbx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real grad_im1 = (tke(i-1,j,k,nstp) - tke(i-2,j,k,nstp)) * msku(i-1,j,0);

            Real grad_ip1 = (tke(i+1,j,k,nstp) - tke(i  ,j,k,nstp)) * msku(i+1,j,0);


            Real gradL_im1 = (gls(i-1,j,k,nstp) - gls(i-2,j,k,nstp)) * msku(i-1,j,0);

            Real gradL_ip1 = (gls(i+1,j,k,nstp) - gls(i  ,j,k,nstp)) * msku(i+1,j,0);


            // Adjust boundaries

            // TODO: Make sure indices match with what ROMS does

            if (i == dlo.x-1 && !is_periodic_in_x) {

                grad_im1  = tke(i,j,k,nstp) - tke(i-1,j,k,nstp);

                gradL_im1 = gls(i,j,k,nstp) - gls(i-1,j,k,nstp);

            }

            else if (i == dhi.x+1 && !is_periodic_in_x) {

                grad_ip1  = tke(i,j,k,nstp) - tke(i-1,j,k,nstp);

                gradL_ip1 = gls(i,j,k,nstp) - gls(i-1,j,k,nstp);

            }

            Real cff = 1.0_rt/6.0_rt;

            XF(i,j,k) = 0.5_rt * (Huon(i,j,k) + Huon(i,j,k-1));

            FX(i,j,k) = XF(i,j,k) * 0.5_rt * (tke(i-1,j,k,nstp) + tke(i,j,k,nstp) -

                cff * (grad_ip1 - grad_im1));

            FXL(i,j,k) = XF(i,j,k) * 0.5_rt * (gls(i-1,j,k,nstp) + gls(i,j,k,nstp) -

                cff * (gradL_ip1 - gradL_im1));

        });


        // need EF/FE/FEL from  [xlo to xhi  ] by [ylo to yhi+1]

        ParallelFor(grow(ybx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real grad_jm1 = (tke(i,j-1,k,nstp) - tke(i,j-2,k,nstp)) * mskv(i,j-1,0);

            Real grad_jp1 = (tke(i,j+1,k,nstp) - tke(i,j  ,k,nstp)) * mskv(i,j+1,0);


            Real gradL_jm1 = (gls(i,j-1,k,nstp) - gls(i,j-2,k,nstp)) * mskv(i,j-1,0);

            Real gradL_jp1 = (gls(i,j+1,k,nstp) - gls(i,j  ,k,nstp)) * mskv(i,j+1,0);


            // Adjust boundaries

            // TODO: Make sure indices match with what ROMS does

            if (j == dlo.y-1 && !is_periodic_in_y) {

                grad_jm1  = tke(i,j,k,nstp) - tke(i,j-1,k,nstp);

                gradL_jm1 = gls(i,j,k,nstp) - gls(i,j-1,k,nstp);

            }

            else if (j == dhi.y+1 && !is_periodic_in_y) {

                grad_jp1  = tke(i,j,k,nstp) - tke(i,j-1,k,nstp);

                gradL_jp1 = gls(i,j,k,nstp) - gls(i,j-1,k,nstp);

            }

            Real cff = 1.0_rt/6.0_rt;

            EF(i,j,k) = 0.5_rt * (Hvom(i,j,k) + Hvom(i,j,k-1));

            FE(i,j,k) = EF(i,j,k) * 0.5_rt * (tke(i,j-1,k,nstp) + tke(i,j,k,nstp) -

                cff * (grad_jp1 - grad_jm1));

            FEL(i,j,k) = EF(i,j,k) * 0.5_rt * (gls(i,j-1,k,nstp) + gls(i,j,k,nstp) -

                cff * (gradL_jp1 - gradL_jm1));

        });


        Real gamma = 1.0_rt / 6.0_rt;

        Real cff1, cff2, cff3;

        int indx;

        // Time step horizontal advection

        if (iic == ntfirst) {

            cff1 = 1.0_rt;

            cff2 = 0.0_rt;

            cff3 = 0.5_rt * dt_lev;

            indx = nstp;

        } else {

            cff1 = 0.5_rt + gamma;

            cff2 = 0.5_rt - gamma;

            cff3 = (1.0_rt - gamma) * dt_lev;

            indx = 1 - nstp;

        }


        // update tke, gls from [xlo to xhi  ] by [ylo to yhi  ]

        // need XF/FX/FXL from  [xlo to xhi+1] by [ylo to yhi  ]

        // need EF/FE/FEL from  [xlo to xhi  ] by [ylo to yhi+1]

        ParallelFor(grow(bx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real cff = 0.5_rt * (Hz(i,j,k) + Hz(i,j,k-1));

            Real cff4 = cff3 * pm(i,j,0) * pn(i,j,0);

            Hz_half(i,j,k) = cff - cff4 * (XF(i+1,j,k)-XF(i,j,k)+EF(i,j+1,k)-EF(i,j,k));

            tke(i,j,k,2) = cff * (cff1*tke(i,j,k,nstp) + cff2*tke(i,j,k,indx)) -

                           cff4 * (FX(i+1,j,k)-FX(i,j,k)+FE(i,j+1,k)-FE(i,j,k));

            gls(i,j,k,2) = cff * (cff1 * gls(i,j,k,nstp) + cff2 * gls(i,j,k,indx)) -

                           cff4 * (FXL(i+1,j,k)-FXL(i,j,k)+FEL(i,j+1,k)-FEL(i,j,k));

            tke(i,j,k,nnew) = cff * tke(i,j,k,nstp);

            gls(i,j,k,nnew) = cff * gls(i,j,k,nstp);

        });


        // Will do a FillPatch after this, so don't need to do any ghost zones in x,y

        // Compute vertical advection

        ParallelFor(convert(bx,IntVect(0,0,0)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            // CF and FC/FCL are on rho points

            CF(i,j,k) = 0.5_rt * (W(i,j,k+1) + W(i,j,k));

            if (k == 0) {

                Real cff1_vadv = 1.0_rt / 3.0_rt;

                Real cff2_vadv = 5.0_rt / 6.0_rt;

                Real cff3_vadv = 1.0_rt / 6.0_rt;

                FC(i,j,k)  = CF(i,j,k) * (cff1_vadv * tke(i,j,0,nstp) +

                                          cff2_vadv * tke(i,j,1,nstp) -

                                          cff3_vadv * tke(i,j,2,nstp));

                FCL(i,j,k) = CF(i,j,k) * (cff1_vadv * gls(i,j,0,nstp) +

                                          cff2_vadv * gls(i,j,1,nstp) -

                                          cff3_vadv * gls(i,j,2,nstp));

            } else if (k == N) {

                Real cff1_vadv = 1.0_rt / 3.0_rt;

                Real cff2_vadv = 5.0_rt / 6.0_rt;

                Real cff3_vadv = 1.0_rt / 6.0_rt;

                FC(i,j,k)  = CF(i,j,k) * (cff1_vadv * tke(i,j,k+1,  nstp) +

                                          cff2_vadv * tke(i,j,k  ,nstp)-

                                          cff3_vadv * tke(i,j,k-1,nstp));

                FCL(i,j,k) = CF(i,j,k) * (cff1_vadv * gls(i,j,k+1,nstp) +

                                          cff2_vadv * gls(i,j,k  ,nstp)-

                                          cff3_vadv * gls(i,j,k-1,nstp));

            } else {

                Real cff1_vadv = 7.0_rt / 12.0_rt;

                Real cff2_vadv = 1.0_rt / 12.0_rt;

                FC(i,j,k)  = CF(i,j,k) * (cff1_vadv * (tke(i,j,k  ,nstp) + tke(i,j,k+1,nstp)) -

                                          cff2_vadv * (tke(i,j,k-1,nstp) + tke(i,j,k+2,nstp)));

                FCL(i,j,k) = CF(i,j,k) * (cff1_vadv * (gls(i,j,k  ,nstp) + gls(i,j,k+1,nstp)) -

                                          cff2_vadv * (gls(i,j,k-1,nstp) + gls(i,j,k+2,nstp)));

            }

        });


        // Time-step vertical advection

        if (iic == ntfirst) {

            cff3 = 0.5_rt * dt_lev;

        } else {

            cff3 = (1.0_rt - gamma) * dt_lev;

        }

        // DO k=1,N-1

        ParallelFor(grow(bx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real cff4 = cff3 * pm(i,j,0) * pn(i,j,0);

            Hz_half(i,j,k) = Hz_half(i,j,k) - cff4 * (CF(i,j,k)-CF(i,j,k-1));

            Real cff1_loc = 1.0_rt / Hz_half(i,j,k);

            tke(i,j,k,2) = cff1_loc * (tke(i,j,k,2) - cff4 * (FC (i,j,k) - FC (i,j,k-1)));

            gls(i,j,k,2) = cff1_loc * (gls(i,j,k,2) - cff4 * (FCL(i,j,k) - FCL(i,j,k-1)));

        });

    }


    for (int icomp=0; icomp<3; icomp++) {

        FillPatch(lev, t_old[lev], *vec_tke[lev], GetVecOfPtrs(vec_tke), zvel_bc(), BdyVars::null, icomp, false, false);

        FillPatch(lev, t_old[lev], *vec_gls[lev], GetVecOfPtrs(vec_gls), zvel_bc(), BdyVars::null, icomp, false, false);

    }

}


/**

 * @param[in   ] lev            level to operate on

 * @param[inout] mf_gls         turbulent generic length scale

 * @param[inout] mf_tke         turbulent kinetic energy

 * @param[in   ] mf_W           vertical velocity

 * @param[inout] mf_Akv         vertical viscosity coefficient

 * @param[inout] mf_Akt         vertical diffusivity coefficients

 * @param[inout] mf_Akk         turbulent kinetic energy vertical diffusion coefficient

 * @param[inout] mf_Akp         turbulent length scale vertical diffusion coefficient

 * @param[in   ] mf_mskr        land-sea mask on rho points

 * @param[in   ] mf_msku        land-sea mask on u points

 * @param[in   ] mf_mskv        land-sea mask on v points

 * @param[in   ] nstp           index of last time step in gls and tke MultiFabs

 * @param[in   ] nnew           index of time step to update in gls and tke MultiFabs

 * @param[in   ] N              number of vertical levels

 * @param[in   ] dt_lev         time step at this level

 */

void


REMORA::gls_corrector (int lev, MultiFab* mf_gls, MultiFab* mf_tke,

                       MultiFab& mf_W, MultiFab* mf_Akv, MultiFab* mf_Akt,

                       MultiFab* mf_Akk, MultiFab* mf_Akp,

                       MultiFab* mf_mskr,

                       MultiFab* mf_msku, MultiFab* mf_mskv,

                       const int nstp, const int nnew,

                       const int N, const Real dt_lev)

{

    BL_PROFILE("REMORA::gls_corrector()");

//-----------------------------------------------------------------------

//  Compute several constants.

//-----------------------------------------------------------------------

    bool Lmy25 = ((solverChoice.gls_p == 0.0) &&

                  (solverChoice.gls_n == 1.0) &&

                  (solverChoice.gls_m == 1.0)) ? true : false;


    Real L_sft = vonKar;

    Real gls_sigp_cb = solverChoice.gls_sigp;

    Real ogls_sigp = 1.0_rt/gls_sigp_cb;


    Real gls_c3m = solverChoice.gls_c3m;

    Real gls_c3p = solverChoice.gls_c3p;

    Real gls_cmu0 = solverChoice.gls_cmu0;


    Real gls_m = solverChoice.gls_m;

    Real gls_n = solverChoice.gls_n;

    Real gls_p = solverChoice.gls_p;


    Real gls_Gh0 = solverChoice.gls_Gh0;

    Real gls_Ghcri = solverChoice.gls_Ghcri;

    Real gls_Ghmin = solverChoice.gls_Ghmin;


    Real Akv_bak = solverChoice.Akv_bak;

    Real Akt_bak = solverChoice.Akt_bak;

    Real Akp_bak = solverChoice.Akp_bak;

    Real Akk_bak = solverChoice.Akk_bak;


    Real gls_c1 = solverChoice.gls_c1;

    Real gls_c2 = solverChoice.gls_c2;

    Real gls_E2 = solverChoice.gls_E2;

    Real gls_sigk = solverChoice.gls_sigk;

    auto gls_stability_type = solverChoice.gls_stability_type;


    Real sqrt2 = std::sqrt(2.0_rt);

    Real cmu_fac1 = std::pow(solverChoice.gls_cmu0,(-solverChoice.gls_p/solverChoice.gls_n));

    Real cmu_fac2 = std::pow(solverChoice.gls_cmu0,(3.0_rt+solverChoice.gls_p/solverChoice.gls_n));

    Real cmu_fac3 = 1.0_rt/std::pow(solverChoice.gls_cmu0,2.0_rt);


    Real gls_fac2 = std::pow(solverChoice.gls_cmu0,solverChoice.gls_p)*solverChoice.gls_n*std::pow(vonKar,solverChoice.gls_n);

    Real gls_fac3 = std::pow(solverChoice.gls_cmu0,solverChoice.gls_p)*solverChoice.gls_n;

    Real gls_fac4 = std::pow(solverChoice.gls_cmu0,solverChoice.gls_p);

    Real gls_fac5 = std::pow(0.56_rt,0.5_rt*solverChoice.gls_n)*std::pow(solverChoice.gls_cmu0,solverChoice.gls_p);

    Real gls_fac6 = 8.0_rt/std::pow(solverChoice.gls_cmu0,6.0_rt);


    Real gls_exp1 = 1.0_rt/solverChoice.gls_n;

    Real tke_exp1 = solverChoice.gls_m/solverChoice.gls_n;

    Real tke_exp2 = 0.5_rt+solverChoice.gls_m/solverChoice.gls_n;

    Real tke_exp4 = solverChoice.gls_m+0.5_rt*solverChoice.gls_n;


    Real cmu0_exp_p = std::pow(gls_cmu0, gls_p);

    Real gls_cmu0_cube = gls_cmu0 * gls_cmu0 * gls_cmu0;


    Real gls_s0, gls_s1, gls_s2, gls_s4, gls_s5, gls_s6;

    Real gls_b0, gls_b1, gls_b2, gls_b3, gls_b4, gls_b5;

    Real my_Sm2, my_Sh1, my_Sh2, my_Sm3, my_Sm4;


    // Compute parameters for Canuto et al. (2001) stability functions.

    // (Canuto, V.M., Cheng, H.Y., and Dubovikov, M.S., 2001: Ocean

    // turbulence. Part I: One-point closure model - momentum and

    // heat vertical diffusivities, JPO, 1413-1426).


    if (solverChoice.gls_stability_type == GLS_StabilityType::Canuto_A ||

        solverChoice.gls_stability_type == GLS_StabilityType::Canuto_B) {


        gls_s0=3.0_rt/2.0_rt*solverChoice.gls_L1*solverChoice.gls_L5*solverChoice.gls_L5;

        gls_s1=-solverChoice.gls_L4*(solverChoice.gls_L6+solverChoice.gls_L7)

                        +2.0_rt*solverChoice.gls_L4*solverChoice.gls_L5*

                        (solverChoice.gls_L1-1.0_rt/3.0_rt*solverChoice.gls_L2-solverChoice.gls_L3)

                        +3.0_rt/2.0_rt*

                        solverChoice.gls_L1*solverChoice.gls_L5*solverChoice.gls_L8;

        gls_s2=-3.0_rt/8.0_rt*solverChoice.gls_L1

            *(solverChoice.gls_L6*solverChoice.gls_L6-solverChoice.gls_L7*solverChoice.gls_L7);

        gls_s4=2.0_rt*solverChoice.gls_L5;

        gls_s5=2.0_rt*solverChoice.gls_L4;

        gls_s6=2.0_rt/3.0_rt*solverChoice.gls_L5

            *(3.0_rt*solverChoice.gls_L3*solverChoice.gls_L3-solverChoice.gls_L2*solverChoice.gls_L2)-

                    1.0_rt/2.0_rt*solverChoice.gls_L5*solverChoice.gls_L1*(3.0_rt*solverChoice.gls_L3-solverChoice.gls_L2)+

                    3.0_rt/4.0_rt*solverChoice.gls_L1*(solverChoice.gls_L6-solverChoice.gls_L7);

        gls_b0=3.0_rt*solverChoice.gls_L5*solverChoice.gls_L5;

        gls_b1=solverChoice.gls_L5*(7.0_rt*solverChoice.gls_L4+3.0_rt*solverChoice.gls_L8);

        gls_b2=solverChoice.gls_L5*solverChoice.gls_L5*(3.0_rt*solverChoice.gls_L3*solverChoice.gls_L3-solverChoice.gls_L2*solverChoice.gls_L2)-

                    3.0_rt/4.0_rt*(solverChoice.gls_L6*solverChoice.gls_L6-solverChoice.gls_L7*solverChoice.gls_L7);

        gls_b3=solverChoice.gls_L4*(4.0_rt*solverChoice.gls_L4+3.0_rt*solverChoice.gls_L8);

        gls_b5=1.0_rt/4.0_rt*(solverChoice.gls_L2*solverChoice.gls_L2-3.0_rt*solverChoice.gls_L3*solverChoice.gls_L3)*

                    (solverChoice.gls_L6*solverChoice.gls_L6-solverChoice.gls_L7*solverChoice.gls_L7);

        gls_b4=solverChoice.gls_L4*(solverChoice.gls_L2*solverChoice.gls_L6-3.0_rt*solverChoice.gls_L3*solverChoice.gls_L7-

                    solverChoice.gls_L5*(solverChoice.gls_L2*solverChoice.gls_L2-solverChoice.gls_L3*solverChoice.gls_L3))+solverChoice.gls_L5*solverChoice.gls_L8*

                    (3.0_rt*solverChoice.gls_L3*solverChoice.gls_L3-solverChoice.gls_L2*solverChoice.gls_L2);

        my_Sm2 = 0.0_rt;

        my_Sm3 = 0.0_rt;

        my_Sm4 = 0.0_rt;

        my_Sh1 = 0.0_rt;

        my_Sh2 = 0.0_rt;

    } else {

        gls_s0 = 0.0_rt;

        gls_s1 = 0.0_rt;

        gls_s2 = 0.0_rt;

        gls_s4 = 0.0_rt;

        gls_s5 = 0.0_rt;

        gls_s6 = 0.0_rt;

        gls_b0 = 0.0_rt;

        gls_b1 = 0.0_rt;

        gls_b2 = 0.0_rt;

        gls_b3 = 0.0_rt;

        gls_b4 = 0.0_rt;

        gls_b5 = 0.0_rt;

        my_Sm2=9.0_rt*solverChoice.my_A1*solverChoice.my_A2;

        my_Sm3=solverChoice.my_A1*(1.0_rt-3.0_rt*solverChoice.my_C1-6.0_rt*solverChoice.my_A1/solverChoice.my_B1);

        my_Sm4=18.0_rt*solverChoice.my_A1*solverChoice.my_A1+9.0_rt*solverChoice.my_A1*solverChoice.my_A2;

        my_Sh1=solverChoice.my_A2*(1.0_rt-6.0_rt*solverChoice.my_A1/solverChoice.my_B1);

        my_Sh2=3.0_rt*solverChoice.my_A2*(6.0_rt*solverChoice.my_A1+solverChoice.my_B2);

    }


    Real Zos_min = std::max(solverChoice.Zos, 0.0001_rt);

    Real Zos_eff = Zos_min;

    Real Gadv = 1.0_rt/3.0_rt;

    Real eps = 1.0e-10_rt;


    const BoxArray&            ba = cons_old[lev]->boxArray();

    const DistributionMapping& dm = cons_old[lev]->DistributionMap();


    int ncomp_w = 0;

    int dU_comp = ncomp_w++;

    int dV_comp = ncomp_w++;

    int CF_comp = ncomp_w++;


    int ncomp = 0;

    int shear2_comp = ncomp++;

    int shear2_cache_comp = ncomp++;

    int buoy2_comp = ncomp++;


    MultiFab mf_w(convert(ba, IntVect(0,0,1)),dm,ncomp_w,IntVect(NGROW,NGROW,0));

    MultiFab mf(ba,dm,ncomp,IntVect(NGROW,NGROW,0));


    const Box& domain = geom[0].Domain();

    const auto dlo = amrex::lbound(domain);

    const auto dhi = amrex::ubound(domain);


    GeometryData const& geomdata = geom[0].data();

    bool is_periodic_in_x = geomdata.isPeriodic(0);

    bool is_periodic_in_y = geomdata.isPeriodic(1);


    for ( MFIter mfi(*mf_gls, TilingIfNotGPU()); mfi.isValid(); ++mfi )

    {

        Box   bx = mfi.tilebox();

        Box gbx1 = mfi.growntilebox(IntVect(NGROW-1,NGROW-1,0));


        Box bxD = bx;

        bxD.makeSlab(2,0);

        Box gbx1D = gbx1;

        gbx1D.makeSlab(2,0);


        Array4<Real> const& Hz = vec_Hz[lev]->array(mfi);

        Array4<Real> const& u = xvel_old[lev]->array(mfi);

        Array4<Real> const& v = yvel_old[lev]->array(mfi);


        auto dU = mf_w.array(mfi,dU_comp);

        auto dV = mf_w.array(mfi,dV_comp);

        auto CF = mf_w.array(mfi,CF_comp);

        auto shear2_cached = mf.array(mfi,shear2_cache_comp);


        ParallelFor(gbx1D, [=] AMREX_GPU_DEVICE (int i, int j, int )

        {

            CF(i,j,0) = 0.0_rt;

            dU(i,j,0) = 0.0_rt;

            dV(i,j,0) = 0.0_rt;

            for (int k=1; k<=N; k++) {

                Real cff = 1.0_rt / (2.0_rt * Hz(i,j,k) + Hz(i,j,k-1)*(2.0_rt - CF(i,j,k-1)));

                CF(i,j,k) = cff * Hz(i,j,k);

                dU(i,j,k)=cff*(3.0_rt*(u(i  ,j,k)-u(i,  j,k-1)+

                                       u(i+1,j,k)-u(i+1,j,k-1))-Hz(i,j,k-1)*dU(i,j,k-1));

                dV(i,j,k)=cff*(3.0_rt*(v(i,j  ,k)-v(i,j  ,k-1)+

                                       v(i,j+1,k)-v(i,j+1,k-1))-Hz(i,j,k-1)*dV(i,j,k-1));

            }

            dU(i,j,N+1) = 0.0_rt;

            dV(i,j,N+1) = 0.0_rt;

            for (int k=N; k>=1; k--) {

                dU(i,j,k) = dU(i,j,k) - CF(i,j,k) * dU(i,j,k+1);

                dV(i,j,k) = dV(i,j,k) - CF(i,j,k) * dV(i,j,k+1);

            }

            shear2_cached(i,j,0) = 0.0_rt;

            for (int k=1; k<=N; k++) {

                shear2_cached(i,j,k) = dU(i,j,k) * dU(i,j,k) + dV(i,j,k) * dV(i,j,k);

            }

        });

    }


    // While potentially counterintuitive, this is what ROMS does for handling shear2 at all boundaries, even

    // periodic

    (*physbcs[lev])(mf,*mf_mskr,shear2_cache_comp,1,mf.nGrowVect(),t_new[lev],foextrap_bc());

    mf.setVal(0.0_rt,CF_comp,1);


    int ncomp_fab = 0;

    int tmp_buoy_comp  = ncomp_fab++;

    int tmp_shear_comp = ncomp_fab++;

    int curvK_comp = ncomp_fab++;

    int curvP_comp = ncomp_fab++;

    int FXK_comp = ncomp_fab++;

    int FXP_comp = ncomp_fab++;

    int FEK_comp = ncomp_fab++;

    int FEP_comp = ncomp_fab++;

    int FCK_comp = ncomp_fab++;

    int FCP_comp = ncomp_fab++;

    int BCK_comp = ncomp_fab++;

    int BCP_comp = ncomp_fab++;


    for ( MFIter mfi(*mf_gls, TilingIfNotGPU()); mfi.isValid(); ++mfi )

    {

        Box  bx = mfi.tilebox();

        Box xbx = surroundingNodes(bx,0);

        Box ybx = surroundingNodes(bx,1);

        Box gbx1 = grow(bx,IntVect(NGROW-1,NGROW-1,0));


        Box bx_rho = bx;

        bx_rho.convert(IntVect(0,0,0));

        Box bx_growloxy = growLo(growLo(grow(bx,IntVect(0,0,-1)),0,1),1,1);


        Box bxD = bx;

        bxD.makeSlab(2,0);

        Box gbx1D = gbx1;

        gbx1D.makeSlab(2,0);


        int ncompbc = 1;

        Vector<BCRec> bcrs_x(ncompbc);

        Vector<BCRec> bcrs_y(ncompbc);

        amrex::setBC(xbx,domain,xvel_bc(),0,1,domain_bcs_type,bcrs_x);

        amrex::setBC(ybx,domain,yvel_bc(),0,1,domain_bcs_type,bcrs_y);


        Array4<Real const> const& W = mf_W.const_array(mfi);

        Array4<Real> const& Hz = vec_Hz[lev]->array(mfi);

        Array4<Real> const& pm = vec_pm[lev]->array(mfi);

        Array4<Real> const& pn = vec_pn[lev]->array(mfi);

        Array4<Real> const& Lscale = vec_Lscale[lev]->array(mfi);


        Array4<Real> const& Huon = vec_Huon[lev]->array(mfi);

        Array4<Real> const& Hvom = vec_Hvom[lev]->array(mfi);

        Array4<Real> const& z_w = vec_z_w[lev]->array(mfi);


        Array4<Real> const& tke = mf_tke->array(mfi);

        Array4<Real> const& gls = mf_gls->array(mfi);


        Array4<Real const> const& sustr = vec_sustr[lev]->const_array(mfi);

        Array4<Real const> const& svstr = vec_svstr[lev]->const_array(mfi);

        Array4<Real const> const& bustr = vec_bustr[lev]->const_array(mfi);

        Array4<Real const> const& bvstr = vec_bvstr[lev]->const_array(mfi);

        Array4<Real const> const& msku = mf_msku->const_array(mfi);

        Array4<Real const> const& mskv = mf_mskv->const_array(mfi);


        Array4<Real> const& ZoBot = vec_ZoBot[lev]->array(mfi);


        FArrayBox fab(gbx1,ncomp_fab, amrex::The_Async_Arena()); fab.template setVal<RunOn::Device>(0.);


        auto CF = mf_w.array(mfi,CF_comp);

        auto shear2 = mf.array(mfi,shear2_comp);

        auto shear2_cached = mf.array(mfi,shear2_cache_comp);

        auto buoy2 = mf.array(mfi,buoy2_comp);

        Array4<Real> const& bvf = vec_bvf[lev]->array(mfi);


        auto tmp_buoy = fab.array(tmp_buoy_comp);

        auto tmp_shear = fab.array(tmp_shear_comp);

        auto curvK = fab.array(curvK_comp);

        auto curvP = fab.array(curvP_comp);

        auto FXK = fab.array(FXK_comp);

        auto FXP = fab.array(FXP_comp);

        auto FEK = fab.array(FEK_comp);

        auto FEP = fab.array(FEP_comp);

        auto FCK = fab.array(FCK_comp);

        auto FCP = fab.array(FCP_comp);

        auto BCK = fab.array(BCK_comp);

        auto BCP = fab.array(BCP_comp);


        auto Akt = mf_Akt->array(mfi);

        auto Akv = mf_Akv->array(mfi);

        auto Akp = mf_Akp->array(mfi);

        auto Akk = mf_Akk->array(mfi);


        ParallelFor(bx_growloxy, [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            tmp_buoy(i,j,k)=0.25_rt * (bvf(i,j,k) + bvf(i+1,j,k) + bvf(i,j+1,k)+bvf(i+1,j+1,k));

            tmp_shear(i,j,k)=0.25_rt * (shear2_cached(i,j,k) + shear2_cached(i+1,j,k) + shear2_cached(i,j+1,k)+shear2_cached(i+1,j+1,k));

        });


        ParallelFor(grow(bx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            buoy2(i,j,k)=0.25_rt * (tmp_buoy(i,j,k) + tmp_buoy(i-1,j,k) + tmp_buoy(i,j-1,k)+tmp_buoy(i-1,j-1,k));

            shear2(i,j,k)=0.25_rt * (tmp_shear(i,j,k) + tmp_shear(i-1,j,k) + tmp_shear(i,j-1,k)+tmp_shear(i-1,j-1,k));

        });


        //Time step advective terms

        ParallelFor(growLo(grow(xbx,IntVect(0,0,-1)),0,1), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real gradK, gradK_ip1, gradP, gradP_ip1;


            if (i == dlo.x-1 && !is_periodic_in_x) {

                gradK_ip1 = tke(i+1,j,k,2)-tke(i  ,j,k,2);

                gradK = gradK_ip1;

                gradP_ip1 = gls(i+1,j,k,2)-gls(i  ,j,k,2);

                gradP = gradP_ip1;

            } else if (i == dhi.x+1 && !is_periodic_in_x) {

                gradK = tke(i  ,j,k,2)-tke(i-1,j,k,2);

                gradK_ip1 = gradK;

                gradP = gls(i  ,j,k,2)-gls(i-1,j,k,2);

                gradP_ip1 = gradP;

            } else {

                gradK     = (tke(i  ,j,k,2)-tke(i-1,j,k,2)) * msku(i  ,j,0);

                gradK_ip1 = (tke(i+1,j,k,2)-tke(i  ,j,k,2)) * msku(i+1,j,0);

                gradP     = (gls(i  ,j,k,2)-gls(i-1,j,k,2)) * msku(i  ,j,0);

                gradP_ip1 = (gls(i+1,j,k,2)-gls(i  ,j,k,2)) * msku(i+1,j,0);

            }


            curvK(i,j,k) = gradK_ip1 - gradK;

            curvP(i,j,k) = gradP_ip1 - gradP;

        });

        ParallelFor(grow(xbx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real cff = 0.5_rt * (Huon(i,j,k) + Huon(i,j,k-1));

            Real cff1 = (cff > 0.0) ? curvK(i-1,j,k) : curvK(i,j,k);

            Real cff2 = (cff > 0.0) ? curvP(i-1,j,k) : curvP(i,j,k);


            FXK(i,j,k) = cff * 0.5_rt * (tke(i-1,j,k,2)+tke(i,j,k,2)-Gadv*cff1);

            FXP(i,j,k) = cff * 0.5_rt * (gls(i-1,j,k,2)+gls(i,j,k,2)-Gadv*cff2);

        });


        //Time step advective terms

        ParallelFor(growLo(grow(ybx,IntVect(0,0,-1)),1,1), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real gradK     = (tke(i,j  ,k,2)-tke(i,j-1,k,2)) * mskv(i,j  ,0);

            Real gradK_jp1 = (tke(i,j+1,k,2)-tke(i,j  ,k,2)) * mskv(i,j+1,0);

            Real gradP     = (gls(i,j  ,k,2)-gls(i,j-1,k,2)) * mskv(i,j  ,0);

            Real gradP_jp1 = (gls(i,j+1,k,2)-gls(i,j  ,k,2)) * mskv(i,j+1,0);


            if (j == dlo.y-1 && !is_periodic_in_y) {

                gradK = gradK_jp1;

                gradP = gradP_jp1;

            }

            else if (j == dhi.y+1 && !is_periodic_in_y) {

                gradK_jp1 = gradK;

                gradP_jp1 = gradP;

            }


            curvK(i,j,k) = gradK_jp1 - gradK;

            curvP(i,j,k) = gradP_jp1 - gradP;

        });

        ParallelFor(grow(ybx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real cff = 0.5_rt * (Hvom(i,j,k) + Hvom(i,j,k-1));

            Real cff1 = (cff > 0.0) ? curvK(i,j-1,k) : curvK(i,j,k);

            Real cff2 = (cff > 0.0) ? curvP(i,j-1,k) : curvP(i,j,k);


            FEK(i,j,k) = cff * 0.5_rt * (tke(i,j-1,k,2)+tke(i,j,k,2)-Gadv*cff1);

            FEP(i,j,k) = cff * 0.5_rt * (gls(i,j-1,k,2)+gls(i,j,k,2)-Gadv*cff2);

        });


        Real gls_Kmin = solverChoice.gls_Kmin;

        Real gls_Pmin = solverChoice.gls_Pmin;

        ParallelFor(grow(bx,IntVect(0,0,-1)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real cff = dt_lev * pm(i,j,0) * pn(i,j,0);

            tke(i,j,k,nnew) = tke(i,j,k,nnew) - cff * (FXK(i+1,j  ,k)-FXK(i,j,k)+

                                                       FEK(i  ,j+1,k)-FEK(i,j,k));

            tke(i,j,k,nnew) = std::max(tke(i,j,k,nnew), gls_Kmin);


            gls(i,j,k,nnew) = gls(i,j,k,nnew) - cff * (FXP(i+1,j  ,k)-FXP(i,j,k)+

                                                       FEP(i  ,j+1,k)-FEP(i,j,k));

            gls(i,j,k,nnew) = std::max(gls(i,j,k,nnew), gls_Pmin);

        });


        // Vertical advection

        ParallelFor(bxD, [=] AMREX_GPU_DEVICE (int i, int j, int )

        {

            Real cff1 = 7.0_rt / 12.0_rt;

            Real cff2 = 1.0_rt / 12.0_rt;

            for (int k=1; k<=N-1; k++) {

                Real cff = 0.5_rt * (W(i,j,k+1)+W(i,j,k));

                FCK(i,j,k) = cff * (cff1 * (tke(i,j,k  ,2)+tke(i,j,k+1,2))-

                                    cff2 * (tke(i,j,k-1,2)+tke(i,j,k+2,2)));

                FCP(i,j,k) = cff * (cff1 * (gls(i,j,k  ,2)+gls(i,j,k+1,2))-

                                    cff2 * (gls(i,j,k-1,2)+gls(i,j,k+2,2)));

            }

            cff1 = 1.0_rt/3.0_rt;

            cff2 = 5.0_rt/6.0_rt;

            Real cff3 = 1.0_rt / 6.0_rt;

            Real cff = 0.5_rt * (W(i,j,0)+W(i,j,1));

            FCK(i,j,0) = cff * (cff1 * tke(i,j,0,2)+cff2 * tke(i,j,1,2)-cff3 * tke(i,j,2,2));

            FCP(i,j,0) = cff * (cff1 * gls(i,j,0,2)+cff2 * gls(i,j,1,2)-cff3 * gls(i,j,2,2));

            cff = 0.5_rt * (W(i,j,N+1)+W(i,j,N));

            FCK(i,j,N) = cff * (cff1 * tke(i,j,N+1,2)+cff2*tke(i,j,N,2)-cff3*tke(i,j,N-1,2));

            FCP(i,j,N) = cff * (cff1 * gls(i,j,N+1,2)+cff2*gls(i,j,N,2)-cff3*gls(i,j,N-1,2));

        });

        const int ncons_local = ncons;


        ParallelFor(grow(bx,2,-1), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            Real cff = dt_lev * pm(i,j,0) * pn(i,j,0);

            tke(i,j,k,nnew) = tke(i,j,k,nnew) - cff*(FCK(i,j,k  )-FCK(i,j,k-1));

            tke(i,j,k,nnew) = std::max(tke(i,j,k,nnew),gls_Kmin);

            gls(i,j,k,nnew) = gls(i,j,k,nnew) - cff*(FCP(i,j,k  )-FCP(i,j,k-1));

            gls(i,j,k,nnew) = std::max(gls(i,j,k,nnew),gls_Pmin);

        });


        // Compute vertical mixing, turbulent production and turbulent

        // dissipation.

        //

        Real cff = -0.5 * dt_lev;

        ParallelFor(convert(bx,IntVect(0,0,0)), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            if (k==0 or k==N) {

                FCK(i,j,k) = 0.0_rt;

                FCP(i,j,k) = 0.0_rt;

            } else {

                FCK(i,j,k) = cff * (Akk(i,j,k) + Akk(i,j,k+1)) / Hz(i,j,k);

                FCP(i,j,k) = cff * (Akp(i,j,k) + Akp(i,j,k+1)) / Hz(i,j,k);

            }

        });

        // Compute production and dissipation terms.

        ParallelFor(grow(bx,2,-1), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            // Compute shear and buoyant production of turbulent energy (m3/s3)

            // at W-points (ignore small negative values of buoyancy).

            Real strat2 = buoy2(i,j,k);

            Real gls_c3 = (strat2 > 0.0) ? gls_c3m : gls_c3p;

            Real Kprod = shear2(i,j,k) * (Akv(i,j,k)-Akv_bak) -

                         strat2 * (Akt(i,j,k,Temp_comp)-Akt_bak);

            Real Pprod = gls_c1 * shear2(i,j,k) * (Akv(i,j,k)-Akv_bak) -

                         gls_c3 * strat2 * (Akt(i,j,k,Temp_comp)-Akt_bak);


            // If negative production terms, then add buoyancy to dissipation terms

            // (BCK and BCP) below, using "cff1" and "cff2" as the on/off switch.

            Real cff1 = (Kprod < 0.0_rt) ? 0.0_rt : 1.0_rt;

            Real cff2 = (Pprod < 0.0_rt) ? 0.0_rt : 1.0_rt;

            Kprod = (Kprod < 0.0_rt) ? Kprod + strat2*(Akt(i,j,k,Temp_comp)-Akt_bak) : Kprod;

            Pprod = (Pprod < 0.0_rt) ? Pprod + gls_c3*strat2*(Akt(i,j,k,Temp_comp)-Akt_bak) : Pprod;

            // Time-step shear and buoyancy production terms.

            Real cff_Hz = 0.5_rt * (Hz(i,j,k) + Hz(i,j,k-1));

            tke(i,j,k,nnew) = tke(i,j,k,nnew)+dt_lev * cff_Hz * Kprod;

            gls(i,j,k,nnew) = gls(i,j,k,nnew)+dt_lev

                                *cff_Hz*Pprod*gls(i,j,k,nstp) / std::max(tke(i,j,k,nstp),gls_Kmin);


            Real gls_exp_exp1 = std::pow(gls(i,j,k,nstp),gls_exp1);

            Real gls_exp_mexp1 = 1.0_rt / (gls_exp_exp1);

            Real tke_exp_mexp1 = std::pow(tke(i,j,k,nstp),-tke_exp1);

            Real tke_exp_exp2 = std::pow(tke(i,j,k,nstp),tke_exp2);


            // Compute dissipation of turbulent energy (m3/s3).

            Real wall_fac = 1.0_rt;

            if (Lmy25) {

                wall_fac=1.0_rt+gls_E2/(vonKar*vonKar)*

                        std::pow(gls_exp_exp1*cmu_fac1*

                         tke_exp_mexp1*

                         (1.0_rt/ (z_w(i,j,k)-z_w(i,j,0))),2)+

                        0.25_rt/(vonKar*vonKar)*

                        std::pow(gls_exp_exp1*cmu_fac1*

                         tke_exp_mexp1*

                         (1.0_rt/ (z_w(i,j,N+1)-z_w(i,j,k))),2);

            }

            BCK(i,j,k)=cff_Hz*(1.0_rt+dt_lev*

                          gls_exp_mexp1*cmu_fac2*

                          tke_exp_exp2+

                          dt_lev*(1.0_rt-cff1)*strat2*

                          (Akt(i,j,k,Temp_comp)-Akt_bak)/

                          tke(i,j,k,nstp))-

                          FCK(i,j,k)-FCK(i,j,k-1);

            BCP(i,j,k)=cff_Hz*(1.0_rt+dt_lev*gls_c2*wall_fac*

                          gls_exp_mexp1*cmu_fac2*

                          tke_exp_exp2+

                          dt_lev*(1.0_rt-cff2)*gls_c3*strat2*

                          (Akt(i,j,k,Temp_comp)-Akt_bak)/

                          tke(i,j,k,nstp))-

                          FCP(i,j,k)-FCP(i,j,k-1);

        });


        // Compute production and dissipation terms.

        ParallelFor(bxD, [=] AMREX_GPU_DEVICE (int i, int j, int )

        {

            Real Zob_min = std::max(ZoBot(i,j,0), 0.0001_rt);

            //----------------------------------------------------------------------

            // Time-step dissipation and vertical diffusion terms implicitly.

            //----------------------------------------------------------------------

            //

            // Set Dirichlet surface and bottom boundary conditions. Compute

            // surface roughness from wind stress (Charnok) and set Craig and

            // Banner wave breaking surface flux, if appropriate.


            tke(i,j,N+1,nnew)=std::max(cmu_fac3*0.5_rt*

                                     std::sqrt((sustr(i,j,0)+sustr(i+1,j,0))*(sustr(i,j,0)+sustr(i+1,j,0))+

                                          (svstr(i,j,0)+svstr(i,j+1,0))*(svstr(i,j,0)+svstr(i,j+1,0))),

                                     gls_Kmin);

            tke(i,j,0,nnew)=std::max(cmu_fac3*0.5_rt*

                                 std::sqrt((bustr(i,j,0)+bustr(i+1,j,0))*(bustr(i,j,0)+bustr(i+1,j,0))+

                                      (bvstr(i,j,0)+bvstr(i,j+1,0))*(bvstr(i,j,0)+bvstr(i,j+1,0))),

                                        gls_Kmin);


            gls(i,j,N+1,nnew)=std::max(cmu0_exp_p*

                                    std::pow(tke(i,j,N+1,nnew),gls_m)*

                                    std::pow(L_sft*Zos_eff,gls_n), gls_Pmin);

            Real cff_gls = gls_fac4*std::pow(vonKar*Zob_min,gls_n);

            gls(i,j,0,nnew)=std::max(cff_gls*std::pow(tke(i,j,0,nnew),(gls_m)), gls_Pmin);


            // Solve tri-diagonal system for turbulent kinetic energy.

            // Might be N instead of N-1?

            Real tke_fluxt = 0.0_rt;

            Real tke_fluxb = 0.0_rt;

            Real cff_BCK = 1.0_rt/BCK(i,j,N);

            CF(i,j,N)=cff_BCK*FCK(i,j,N-1);

            tke(i,j,N,nnew)=cff_BCK*(tke(i,j,N,nnew)+tke_fluxt);

            for (int k=N-1;k>=1;k--) {

                cff_BCK = 1.0_rt / (BCK(i,j,k)-CF(i,j,k+1)*FCK(i,j,k));

                CF(i,j,k) = cff_BCK * FCK(i,j,k-1);

                tke(i,j,k,nnew) = cff_BCK * (tke(i,j,k,nnew) - FCK(i,j,k) * tke(i,j,k+1,nnew));

            }

            tke(i,j,1,nnew) = tke(i,j,1,nnew) - cff_BCK * tke_fluxb;

            tke(i,j,1,nnew) = std::max(tke(i,j,1,nnew),gls_Kmin);

            for (int k=2;k<=N;k++) {

                tke(i,j,k,nnew) = tke(i,j,k,nnew) - CF(i,j,k) * tke(i,j,k-1,nnew);

                tke(i,j,k,nnew) = std::max(tke(i,j,k,nnew), gls_Kmin);

            }


            // Solve tri-diagonal system for generic statistical field.

            Real cff_tke = 0.5_rt * (tke(i,j,N+1,nnew) + tke(i,j,N,nnew));

            Real gls_fluxt = dt_lev*gls_fac3*std::pow(cff_tke,gls_m)*

                             std::pow(L_sft,(gls_n))*

                             std::pow(Zos_eff+0.5_rt*Hz(i,j,N),gls_n-1.0_rt)*

                             0.5_rt*(Akp(i,j,N+1)+Akp(i,j,N));

            cff_tke=0.5_rt*(tke(i,j,0,nnew)+tke(i,j,1,nnew));

            Real gls_fluxb = dt_lev*gls_fac2*std::pow(cff_tke,gls_m)*

                              std::pow(0.5_rt*Hz(i,j,0)+Zob_min,gls_n-1.0_rt)*

                              0.5_rt*(Akp(i,j,0)+Akp(i,j,1));

            Real cff_BCP = 1.0_rt / BCP(i,j,N);

            CF(i,j,N) = cff_BCP * FCP(i,j,N-1);

            gls(i,j,N,nnew)=cff_BCP*(gls(i,j,N,nnew)-gls_fluxt);

            for (int k=N-1;k>=1;k--) {

                cff_BCP = 1.0_rt / (BCP(i,j,k)-CF(i,j,k+1)*FCP(i,j,k));

                CF(i,j,k) = cff_BCP * FCP(i,j,k-1);

                gls(i,j,k,nnew) = cff_BCP * (gls(i,j,k,nnew) - FCP(i,j,k)*gls(i,j,k+1,nnew));

            }

            gls(i,j,1,nnew) = gls(i,j,1,nnew)-cff_BCP*gls_fluxb;

            for (int k=2; k<=N; k++) {

                gls(i,j,k,nnew) = gls(i,j,k,nnew) - CF(i,j,k) * gls(i,j,k-1,nnew);

            }

        });


        // Compute vertical mixing coefficients (m2/s).

        ParallelFor(grow(bx,2,-1), [=] AMREX_GPU_DEVICE (int i, int j, int k)

        {

            tke(i,j,k,nnew) = std::max(tke(i,j,k,nnew),gls_Kmin);

            gls(i,j,k,nnew) = std::max(gls(i,j,k,nnew),gls_Pmin);

            Real gls_comparison = gls_fac5 *

                                    std::pow(tke(i,j,k,nnew),tke_exp4)*

                                    std::pow(std::sqrt(std::max(0.0_rt,

                                          buoy2(i,j,k)))+eps,-gls_n);

            gls(i,j,k,nnew) = (gls_n >= 0.0_rt) ? std::min(gls(i,j,k,nnew),gls_comparison) : std::max(gls(i,j,k,nnew),gls_comparison);

            Real Ls_lmt;

            Real Ls_unlmt=std::max(eps,

                                   std::pow(gls(i,j,k,nnew),( gls_exp1))*cmu_fac1*

                                   std::pow(tke(i,j,k,nnew),(-tke_exp1)));

            // Some problems are very sensitive to this condition (ultimate cause of

            // some discrepancies in BoundaryLayer test between CPU and GPU)

            Ls_lmt = (buoy2(i,j,k) > 0.0_rt) ? std::min(Ls_unlmt,

                                                std::sqrt(0.56_rt*tke(i,j,k,nnew)/

                                                (std::max(0.0_rt,buoy2(i,j,k))+eps))) : Ls_unlmt;

            //

            //  Recompute gls based on limited length scale

            //

            gls(i,j,k,nnew)=std::max(cmu0_exp_p*

                                           std::pow(tke(i,j,k,nnew),gls_m)*

                                           std::pow(Ls_lmt,gls_n), gls_Pmin);


            //   Compute nondimensional stability functions for tracers (Sh) and

            //   momentum (Sm).

            Real Sh, Sm;

            Real Gh=std::min(gls_Gh0,-buoy2(i,j,k)*Ls_lmt*Ls_lmt/

                            (2.0_rt*tke(i,j,k,nnew)));

            Gh=std::min(Gh,Gh-(Gh-gls_Ghcri)*(Gh-gls_Ghcri)/

                       (Gh+gls_Gh0-2.0_rt*gls_Ghcri));

            Gh=std::max(Gh,gls_Ghmin);


            if (gls_stability_type == GLS_StabilityType::Canuto_A ||

                gls_stability_type == GLS_StabilityType::Canuto_B) {

                //

                //   Canuto stability: Compute shear number.

                //

                Real Gm=(gls_b0/gls_fac6-gls_b1*Gh+gls_b3*gls_fac6*(Gh*Gh))/

                             (gls_b2-gls_b4*gls_fac6*Gh);

                Gm=std::min(Gm,shear2(i,j,k)*Ls_lmt*Ls_lmt/

                            (2.0_rt*tke(i,j,k,nnew)));

                /////Gm=std::min(Gm,(gls_s1*gls_fac6*Gh-gls_s0)/(gls_s2*gls_fac6));

                //

                //  Compute stability functions

                //

                Real stab_cff=gls_b0-gls_b1*gls_fac6*Gh+gls_b2*gls_fac6*Gm+

                    gls_b3*gls_fac6*gls_fac6*Gh*Gh-gls_b4*gls_fac6*gls_fac6*Gh*Gm+

                    gls_b5*gls_fac6*gls_fac6*Gm*Gm;

                Sm=(gls_s0-gls_s1*gls_fac6*Gh+gls_s2*gls_fac6*Gm)/stab_cff;

                Sh=(gls_s4-gls_s5*gls_fac6*Gh+gls_s6*gls_fac6*Gm)/stab_cff;

                Sm=std::max(Sm,0.0_rt);

                Sh=std::max(Sh,0.0_rt);


                //

                //  Relate Canuto stability to ROMS notation

                //

                Sm=Sm*sqrt2/(gls_cmu0_cube);

                Sh=Sh*sqrt2/gls_cmu0_cube;

            } else if (gls_stability_type == GLS_StabilityType::Galperin) {

                Real cff_galperin = 1.0_rt - my_Sh2*Gh;

                Sh = my_Sh1 / cff_galperin;

                Sm = (my_Sm3+Sh*Gh*my_Sm4)/(1.0_rt-my_Sm2*Gh);

            } else {

                Sh = 0.0;

                Sm = 0.0;

            }


            //  Compute vertical mixing (m2/s) coefficients of momentum and

            //  tracers.  Average ql over the two timesteps rather than using

            //  the new Lscale and just averaging tke.


            Real ql=sqrt2*0.5_rt*(Ls_lmt*std::sqrt(tke(i,j,k,nnew))+

                                  Lscale(i,j,k)*std::sqrt(tke(i,j,k,nstp)));

            Akv(i,j,k)=Akv_bak+Sm*ql;

            for (int n=0; n<ncons_local; n++) {

                Akt(i,j,k,n)=Akt_bak+Sh*ql;

            }


            //  Compute vertical mixing (m2/s) coefficients of turbulent kinetic

            //  energy and generic statistical field.


            Akk(i,j,k)=Akk_bak+Sm*ql/gls_sigk;

            Akp(i,j,k)=Akp_bak+Sm*ql*ogls_sigp;


            //  Save limited length scale.

            Lscale(i,j,k)=Ls_lmt;

        });


        ParallelFor(bxD, [=] AMREX_GPU_DEVICE (int i, int j, int )

        {

            Real Zob_min = std::max(ZoBot(i,j,0), 0.0001_rt);

            Akv(i,j,N+1)=Akv_bak+L_sft*Zos_eff*gls_cmu0*

                          std::sqrt(tke(i,j,N+1,nnew));

            Akv(i,j,0)=Akv_bak+vonKar*Zob_min*gls_cmu0*

                      std::sqrt(tke(i,j,0,nnew));


            Akk(i,j,N+1)=Akk_bak+Akv(i,j,N+1)/gls_sigk;

            Akk(i,j,0)=Akk_bak+Akv(i,j,0)/gls_sigk;

            Akp(i,j,N+1)=Akp_bak+Akv(i,j,N+1)*ogls_sigp;

            Akp(i,j,0)=Akp_bak+Akv(i,j,0)/gls_sigp_cb;


            for (int n=0; n<ncons_local; n++) {

                Akt(i,j,N+1,n)  = Akt_bak;

                Akt(i,j,0,n) = Akt_bak;

            }

        });

    }


    for (int icomp=0; icomp<3; icomp++) {

        FillPatch(lev, t_old[lev], *mf_tke, GetVecOfPtrs(vec_tke), zvel_bc(), BdyVars::null, icomp, false, false);

        FillPatch(lev, t_old[lev], *mf_gls, GetVecOfPtrs(vec_gls), zvel_bc(), BdyVars::null, icomp, false, false);

    }

    for (int icomp=0; icomp<ncons; icomp++) {

        FillPatch(lev, t_old[lev], *mf_Akt, GetVecOfPtrs(vec_Akt), zvel_bc(), BdyVars::null, icomp, false, false);

    }

    FillPatchNoBC(lev, t_old[lev], *mf_Akv, GetVecOfPtrs(vec_Akv), BdyVars::null);

    FillPatchNoBC(lev, t_old[lev], *mf_Akp, GetVecOfPtrs(vec_Akp), BdyVars::null);

    FillPatchNoBC(lev, t_old[lev], *mf_Akk, GetVecOfPtrs(vec_Akk), BdyVars::null);

}


REMORA.H

vonKar
constexpr amrex::Real vonKar
Definition REMORA_Constants.H:17

GLS_StabilityType::Canuto_B
@ Canuto_B

GLS_StabilityType::Canuto_A
@ Canuto_A

GLS_StabilityType::Galperin
@ Galperin

NGROW
#define NGROW
Definition REMORA_IndexDefines.H:12

Temp_comp
#define Temp_comp
Definition REMORA_IndexDefines.H:8

if
if(traditional)
Definition REMORA_InitAnalyticBathymetry_DogboneAnalytic.H:6

geomdata
auto geomdata
Definition REMORA_InitAnalyticGridScale_BoundaryLayer.H:2

REMORA::ncons
int ncons
Number of conserved scalars in the state (temperature + salt + passive scalars)
Definition REMORA.H:1480

REMORA::zvel_bc
int zvel_bc() const noexcept
Definition REMORA.H:1183

REMORA::xvel_bc
int xvel_bc() const noexcept
Definition REMORA.H:1181

REMORA::domain_bcs_type
amrex::Vector< amrex::BCRec > domain_bcs_type
vector (over BCVars) of BCRecs
Definition REMORA.H:1429

REMORA::vec_pm
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_pm
horizontal scaling factor: 1 / dx (2D)
Definition REMORA.H:491

REMORA::vec_ZoBot
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_ZoBot
Bottom roughness length [m], defined at rho points.
Definition REMORA.H:448

REMORA::vec_tke
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_tke
Turbulent kinetic energy.
Definition REMORA.H:548

REMORA::vec_gls
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_gls
Turbulent generic length scale.
Definition REMORA.H:550

REMORA::vec_sustr
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_sustr
Surface stress in the u direction.
Definition REMORA.H:396

REMORA::yvel_bc
int yvel_bc() const noexcept
Definition REMORA.H:1182

REMORA::foextrap_bc
int foextrap_bc() const noexcept
Definition REMORA.H:1189

REMORA::vec_Lscale
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Lscale
Vertical mixing turbulent length scale.
Definition REMORA.H:552

REMORA::vec_Hz
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Hz
Width of cells in the vertical (z-) direction (3D, Hz in ROMS)
Definition REMORA.H:341

REMORA::vec_Akt
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Akt
Vertical diffusion coefficient (3D)
Definition REMORA.H:361

REMORA::FillPatchNoBC
void FillPatchNoBC(int lev, amrex::Real time, amrex::MultiFab &mf_to_be_filled, amrex::Vector< amrex::MultiFab * > const &mfs, const int bdy_var_type=BdyVars::null, const int icomp=0, const bool fill_all=true, const bool fill_set=true)
Fill a new MultiFab by copying in phi from valid region and filling ghost cells without applying boun...
Definition REMORA_FillPatch.cpp:199

REMORA::xvel_old
amrex::Vector< amrex::MultiFab * > xvel_old
multilevel data container for last step's x velocities (u in ROMS)
Definition REMORA.H:308

REMORA::gls_prestep
void gls_prestep(int lev, amrex::MultiFab *mf_gls, amrex::MultiFab *mf_tke, amrex::MultiFab &mf_W, amrex::MultiFab *mf_msku, amrex::MultiFab *mf_mskv, const int nstp, const int nnew, const int iic, const int ntfirst, const int N, const amrex::Real dt_lev)
Prestep for GLS calculation.
Definition REMORA_gls.cpp:20

REMORA::vec_bvf
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_bvf
Brunt-Vaisala frequency (3D)
Definition REMORA.H:535

REMORA::physbcs
amrex::Vector< std::unique_ptr< REMORAPhysBCFunct > > physbcs
Vector (over level) of functors to apply physical boundary conditions.
Definition REMORA.H:1417

REMORA::FillPatch
void FillPatch(int lev, amrex::Real time, amrex::MultiFab &mf_to_be_filled, amrex::Vector< amrex::MultiFab * > const &mfs, const int bccomp, const int bdy_var_type=BdyVars::null, const int icomp=0, const bool fill_all=true, const bool fill_set=true, const int n_not_fill=0, const int icomp_calc=0, const amrex::Real dt=amrex::Real(0.0), const amrex::MultiFab &mf_calc=amrex::MultiFab())
Fill a new MultiFab by copying in phi from valid region and filling ghost cells.
Definition REMORA_FillPatch.cpp:30

REMORA::vec_svstr
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_svstr
Surface stress in the v direction.
Definition REMORA.H:398

REMORA::vec_Huon
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Huon
u-volume flux (3D)
Definition REMORA.H:343

REMORA::yvel_old
amrex::Vector< amrex::MultiFab * > yvel_old
multilevel data container for last step's y velocities (v in ROMS)
Definition REMORA.H:310

REMORA::t_new
amrex::Vector< amrex::Real > t_new
new time at each level
Definition REMORA.H:1407

REMORA::solverChoice
static SolverChoice solverChoice
Container for algorithmic choices.
Definition REMORA.H:1537

REMORA::vec_Akk
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Akk
Turbulent kinetic energy vertical diffusion coefficient.
Definition REMORA.H:554

REMORA::cons_old
amrex::Vector< amrex::MultiFab * > cons_old
multilevel data container for last step's scalar data: temperature, salinity, passive tracer
Definition REMORA.H:306

REMORA::vec_bustr
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_bustr
Bottom stress in the u direction.
Definition REMORA.H:451

REMORA::vec_bvstr
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_bvstr
Bottom stress in the v direction.
Definition REMORA.H:453

REMORA::vec_pn
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_pn
horizontal scaling factor: 1 / dy (2D)
Definition REMORA.H:493

REMORA::vec_Akv
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Akv
Vertical viscosity coefficient (3D)
Definition REMORA.H:359

REMORA::t_old
amrex::Vector< amrex::Real > t_old
old time at each level
Definition REMORA.H:1409

REMORA::vec_z_w
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_z_w
z coordinates at w points (faces between z-cells)
Definition REMORA.H:373

REMORA::vec_Hvom
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Hvom
v-volume flux (3D)
Definition REMORA.H:345

REMORA::vec_Akp
amrex::Vector< std::unique_ptr< amrex::MultiFab > > vec_Akp
Turbulent length scale vertical diffusion coefficient.
Definition REMORA.H:556

REMORA::gls_corrector
void gls_corrector(int lev, amrex::MultiFab *mf_gls, amrex::MultiFab *mf_tke, amrex::MultiFab &mf_W, amrex::MultiFab *mf_Akv, amrex::MultiFab *mf_Akt, amrex::MultiFab *mf_Akk, amrex::MultiFab *mf_Akp, amrex::MultiFab *mf_mskr, amrex::MultiFab *mf_msku, amrex::MultiFab *mf_mskv, const int nstp, const int nnew, const int N, const amrex::Real dt_lev)
Corrector step for GLS calculation.
Definition REMORA_gls.cpp:247

BdyVars::null
@ null
Definition REMORA_IndexDefines.H:51

amrex
Definition REMORA_console_io.cpp:11

SolverChoice::gls_stability_type
GLS_StabilityType gls_stability_type
Definition REMORA_DataStruct.H:700

SolverChoice::Akv_bak
amrex::Real Akv_bak
Definition REMORA_DataStruct.H:781

SolverChoice::gls_sigp
amrex::Real gls_sigp
Definition REMORA_DataStruct.H:776

SolverChoice::Zos
amrex::Real Zos
Definition REMORA_DataStruct.H:718

SolverChoice::gls_m
amrex::Real gls_m
Definition REMORA_DataStruct.H:765

SolverChoice::my_B2
amrex::Real my_B2
Definition REMORA_DataStruct.H:803

SolverChoice::my_A1
amrex::Real my_A1
Definition REMORA_DataStruct.H:800

SolverChoice::gls_sigk
amrex::Real gls_sigk
Definition REMORA_DataStruct.H:775

SolverChoice::gls_L3
amrex::Real gls_L3
Definition REMORA_DataStruct.H:792

SolverChoice::gls_cmu0
amrex::Real gls_cmu0
Definition REMORA_DataStruct.H:770

SolverChoice::gls_L6
amrex::Real gls_L6
Definition REMORA_DataStruct.H:795

SolverChoice::gls_L2
amrex::Real gls_L2
Definition REMORA_DataStruct.H:791

SolverChoice::Akk_bak
amrex::Real Akk_bak
Definition REMORA_DataStruct.H:779

SolverChoice::gls_L1
amrex::Real gls_L1
Definition REMORA_DataStruct.H:790

SolverChoice::gls_n
amrex::Real gls_n
Definition REMORA_DataStruct.H:766

SolverChoice::Akt_bak
amrex::Real Akt_bak
Definition REMORA_DataStruct.H:782

SolverChoice::gls_c3m
amrex::Real gls_c3m
Definition REMORA_DataStruct.H:773

SolverChoice::my_A2
amrex::Real my_A2
Definition REMORA_DataStruct.H:801

SolverChoice::gls_Gh0
amrex::Real gls_Gh0
Definition REMORA_DataStruct.H:785

SolverChoice::gls_Ghmin
amrex::Real gls_Ghmin
Definition REMORA_DataStruct.H:787

SolverChoice::my_C1
amrex::Real my_C1
Definition REMORA_DataStruct.H:804

SolverChoice::gls_c1
amrex::Real gls_c1
Definition REMORA_DataStruct.H:771

SolverChoice::gls_L5
amrex::Real gls_L5
Definition REMORA_DataStruct.H:794

SolverChoice::gls_L8
amrex::Real gls_L8
Definition REMORA_DataStruct.H:797

SolverChoice::gls_Kmin
amrex::Real gls_Kmin
Definition REMORA_DataStruct.H:767

SolverChoice::gls_c3p
amrex::Real gls_c3p
Definition REMORA_DataStruct.H:774

SolverChoice::gls_p
amrex::Real gls_p
Definition REMORA_DataStruct.H:764

SolverChoice::gls_L4
amrex::Real gls_L4
Definition REMORA_DataStruct.H:793

SolverChoice::my_B1
amrex::Real my_B1
Definition REMORA_DataStruct.H:802

SolverChoice::gls_L7
amrex::Real gls_L7
Definition REMORA_DataStruct.H:796

SolverChoice::gls_Ghcri
amrex::Real gls_Ghcri
Definition REMORA_DataStruct.H:786

SolverChoice::gls_Pmin
amrex::Real gls_Pmin
Definition REMORA_DataStruct.H:768

SolverChoice::gls_c2
amrex::Real gls_c2
Definition REMORA_DataStruct.H:772

SolverChoice::Akp_bak
amrex::Real Akp_bak
Definition REMORA_DataStruct.H:780

SolverChoice::gls_E2
amrex::Real gls_E2
Definition REMORA_DataStruct.H:788