{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "247af578",
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "Determination of memory status is not supported on this \n",
      " platform, measuring for memoryleaks will never fail\n"
     ]
    }
   ],
   "source": [
    "import pandas as pd\n",
    "import cobra\n",
    "from BFAIR.mfa.INCA import INCA_reimport\n",
    "from BFAIR.mfa.sampling import (\n",
    "    model_rxn_overlap,\n",
    "    rxn_coverage,\n",
    "    split_lumped_rxns,\n",
    "    split_lumped_reverse_rxns,\n",
    "    find_reverse_rxns,\n",
    "    combine_split_rxns,\n",
    "    cobra_add_split_rxns,\n",
    "    find_biomass_reaction,\n",
    "    replace_biomass_rxn_name,\n",
    ")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "0e52647c",
   "metadata": {},
   "source": [
    "#### INCA re-import"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "ac4d8422",
   "metadata": {},
   "source": [
    "First, let's reimport the data using our `BFAIR INCA_reimport` tools"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "id": "ee0f4c60",
   "metadata": {},
   "outputs": [],
   "source": [
    "filename = 'data/MFA_modelInputsData/TestFile.mat'\n",
    "simulation_info = pd.read_csv('data/MFA_modelInputsData/Re-import/experimentalMS_data_I.csv')\n",
    "simulation_id = 'WTEColi_113C80_U13C20_01'"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "1ae4727d",
   "metadata": {},
   "source": [
    "Here we re-import the INCA output"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "b514e21e",
   "metadata": {},
   "outputs": [],
   "source": [
    "reimport_data = INCA_reimport()\n",
    "(fittedData,\n",
    " fittedFluxes,\n",
    " fittedFragments,\n",
    " fittedMeasuredFluxes,\n",
    " fittedMeasuredFragments,\n",
    " fittedMeasuredFluxResiduals,\n",
    " fittedMeasuredFragmentResiduals,\n",
    " simulationParameters) = reimport_data.reimport(\n",
    "    filename,\n",
    "    simulation_info,\n",
    "    simulation_id\n",
    ")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "id": "a56c8f11",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>simulation_id</th>\n",
       "      <th>simulation_dateAndTime</th>\n",
       "      <th>rxn_id</th>\n",
       "      <th>flux</th>\n",
       "      <th>flux_stdev</th>\n",
       "      <th>flux_lb</th>\n",
       "      <th>flux_ub</th>\n",
       "      <th>flux_units</th>\n",
       "      <th>fit_alf</th>\n",
       "      <th>fit_chi2s</th>\n",
       "      <th>fit_cor</th>\n",
       "      <th>fit_cov</th>\n",
       "      <th>free</th>\n",
       "      <th>used_</th>\n",
       "      <th>comment_</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>26dap_DASH_MSYN</td>\n",
       "      <td>2.295040e-01</td>\n",
       "      <td>0.002608</td>\n",
       "      <td>0.224392</td>\n",
       "      <td>0.234616</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACONTa_ACONTb</td>\n",
       "      <td>2.074886e+00</td>\n",
       "      <td>16996.864976</td>\n",
       "      <td>1.185984</td>\n",
       "      <td>1000.000000</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACONTa_ACONTb_reverse</td>\n",
       "      <td>8.690514e-07</td>\n",
       "      <td>15432.592032</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>28.927600</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>AKGDH</td>\n",
       "      <td>1.423617e-01</td>\n",
       "      <td>7673.615592</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>1.919800</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ALATA_L</td>\n",
       "      <td>3.435520e-01</td>\n",
       "      <td>0.003904</td>\n",
       "      <td>0.335900</td>\n",
       "      <td>0.351204</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>92</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>TPI</td>\n",
       "      <td>2.175603e+00</td>\n",
       "      <td>25620.656341</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>1000.000000</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>93</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>TPI_reverse</td>\n",
       "      <td>8.689299e-07</td>\n",
       "      <td>24739.593649</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>1000.000000</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>94</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>TrpSYN</td>\n",
       "      <td>3.801600e-02</td>\n",
       "      <td>0.000432</td>\n",
       "      <td>0.037169</td>\n",
       "      <td>0.038863</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>95</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>TyrSYN</td>\n",
       "      <td>9.222400e-02</td>\n",
       "      <td>0.001048</td>\n",
       "      <td>0.090170</td>\n",
       "      <td>0.094278</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>96</th>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ValSYN</td>\n",
       "      <td>2.830080e-01</td>\n",
       "      <td>0.003216</td>\n",
       "      <td>0.276705</td>\n",
       "      <td>0.289311</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>97 rows × 15 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "               simulation_id simulation_dateAndTime                 rxn_id  \\\n",
       "0   WTEColi_113C80_U13C20_01    2021-04-16 18:29:37        26dap_DASH_MSYN   \n",
       "1   WTEColi_113C80_U13C20_01    2021-04-16 18:29:37          ACONTa_ACONTb   \n",
       "2   WTEColi_113C80_U13C20_01    2021-04-16 18:29:37  ACONTa_ACONTb_reverse   \n",
       "3   WTEColi_113C80_U13C20_01    2021-04-16 18:29:37                  AKGDH   \n",
       "4   WTEColi_113C80_U13C20_01    2021-04-16 18:29:37                ALATA_L   \n",
       "..                       ...                    ...                    ...   \n",
       "92  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37                    TPI   \n",
       "93  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37            TPI_reverse   \n",
       "94  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37                 TrpSYN   \n",
       "95  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37                 TyrSYN   \n",
       "96  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37                 ValSYN   \n",
       "\n",
       "            flux    flux_stdev   flux_lb      flux_ub        flux_units  \\\n",
       "0   2.295040e-01      0.002608  0.224392     0.234616  mmol*gDCW-1*hr-1   \n",
       "1   2.074886e+00  16996.864976  1.185984  1000.000000  mmol*gDCW-1*hr-1   \n",
       "2   8.690514e-07  15432.592032  0.000000    28.927600  mmol*gDCW-1*hr-1   \n",
       "3   1.423617e-01   7673.615592  0.000000     1.919800  mmol*gDCW-1*hr-1   \n",
       "4   3.435520e-01      0.003904  0.335900     0.351204  mmol*gDCW-1*hr-1   \n",
       "..           ...           ...       ...          ...               ...   \n",
       "92  2.175603e+00  25620.656341  0.000000  1000.000000  mmol*gDCW-1*hr-1   \n",
       "93  8.689299e-07  24739.593649  0.000000  1000.000000  mmol*gDCW-1*hr-1   \n",
       "94  3.801600e-02      0.000432  0.037169     0.038863  mmol*gDCW-1*hr-1   \n",
       "95  9.222400e-02      0.001048  0.090170     0.094278  mmol*gDCW-1*hr-1   \n",
       "96  2.830080e-01      0.003216  0.276705     0.289311  mmol*gDCW-1*hr-1   \n",
       "\n",
       "    fit_alf fit_chi2s fit_cor fit_cov   free  used_ comment_  \n",
       "0      0.05      None    None    None  False   True     None  \n",
       "1      0.05      None    None    None  False   True     None  \n",
       "2      0.05      None    None    None   True   True     None  \n",
       "3      0.05      None    None    None  False   True     None  \n",
       "4      0.05      None    None    None  False   True     None  \n",
       "..      ...       ...     ...     ...    ...    ...      ...  \n",
       "92     0.05      None    None    None  False   True     None  \n",
       "93     0.05      None    None    None   True   True     None  \n",
       "94     0.05      None    None    None  False   True     None  \n",
       "95     0.05      None    None    None  False   True     None  \n",
       "96     0.05      None    None    None  False   True     None  \n",
       "\n",
       "[97 rows x 15 columns]"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "fittedFluxes"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "ea2e6c1e",
   "metadata": {},
   "source": [
    "Here we import the model"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "id": "f2f6f0d7",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Academic license - for non-commercial use only - expires 2021-07-30\n",
      "Using license file /Users/matmat/gurobi.lic\n"
     ]
    }
   ],
   "source": [
    "model = cobra.io.load_json_model('data/FIA_MS_example/database_files/iJO1366.json')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "id": "213b6a45",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "61.0 %\n"
     ]
    }
   ],
   "source": [
    "rxn_coverage(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "ef6cf6a2",
   "metadata": {},
   "source": [
    "61 % of all the reimported reactions have non-overlapping names with the model we want to use for simulations! That a bit much. Let's do something about that"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "9cac90bd",
   "metadata": {},
   "source": [
    "First, let's find the name of the biomass reaction in the model and replace the one in our data with it"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "id": "9f0cb319",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['BIOMASS_Ec_iJO1366_WT_53p95M', 'BIOMASS_Ec_iJO1366_core_53p95M']"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "find_biomass_reaction(model)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "db5cf93e",
   "metadata": {},
   "source": [
    "This model has two biomass reactions, a full and a reduced core biomass reaction. In the summary we can see that the core biomass reaction is the assigned objective function, so we will reassign this name to our biomass function"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "id": "0716fb30",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<h3>Objective</h3><p>1.0 BIOMASS_Ec_iJO1366_core_53p95M = 0.9823718127269793</p><h4>Uptake</h4><table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th>Metabolite</th>\n",
       "      <th>Reaction</th>\n",
       "      <th>Flux</th>\n",
       "      <th>C-Number</th>\n",
       "      <th>C-Flux</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>ca2_e</td>\n",
       "      <td>EX_ca2_e</td>\n",
       "      <td>0.005113</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>cl_e</td>\n",
       "      <td>EX_cl_e</td>\n",
       "      <td>0.005113</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>cobalt2_e</td>\n",
       "      <td>EX_cobalt2_e</td>\n",
       "      <td>2.456E-05</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>cu2_e</td>\n",
       "      <td>EX_cu2_e</td>\n",
       "      <td>0.0006965</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>fe2_e</td>\n",
       "      <td>EX_fe2_e</td>\n",
       "      <td>0.01578</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>glc__D_e</td>\n",
       "      <td>EX_glc__D_e</td>\n",
       "      <td>10</td>\n",
       "      <td>6</td>\n",
       "      <td>100.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>k_e</td>\n",
       "      <td>EX_k_e</td>\n",
       "      <td>0.1918</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>mg2_e</td>\n",
       "      <td>EX_mg2_e</td>\n",
       "      <td>0.008522</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>mn2_e</td>\n",
       "      <td>EX_mn2_e</td>\n",
       "      <td>0.0006788</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>mobd_e</td>\n",
       "      <td>EX_mobd_e</td>\n",
       "      <td>0.0001267</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>nh4_e</td>\n",
       "      <td>EX_nh4_e</td>\n",
       "      <td>10.61</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>ni2_e</td>\n",
       "      <td>EX_ni2_e</td>\n",
       "      <td>0.0003173</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>o2_e</td>\n",
       "      <td>EX_o2_e</td>\n",
       "      <td>17.58</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>pi_e</td>\n",
       "      <td>EX_pi_e</td>\n",
       "      <td>0.9476</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>so4_e</td>\n",
       "      <td>EX_so4_e</td>\n",
       "      <td>0.2478</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>zn2_e</td>\n",
       "      <td>EX_zn2_e</td>\n",
       "      <td>0.000335</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table><h4>Secretion</h4><table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th>Metabolite</th>\n",
       "      <th>Reaction</th>\n",
       "      <th>Flux</th>\n",
       "      <th>C-Number</th>\n",
       "      <th>C-Flux</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>4crsol_c</td>\n",
       "      <td>DM_4crsol_c</td>\n",
       "      <td>-0.0002191</td>\n",
       "      <td>7</td>\n",
       "      <td>0.01%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5drib_c</td>\n",
       "      <td>DM_5drib_c</td>\n",
       "      <td>-0.000221</td>\n",
       "      <td>5</td>\n",
       "      <td>0.01%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>amob_c</td>\n",
       "      <td>DM_amob_c</td>\n",
       "      <td>-1.965E-06</td>\n",
       "      <td>15</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>mththf_c</td>\n",
       "      <td>DM_mththf_c</td>\n",
       "      <td>-0.0004401</td>\n",
       "      <td>5</td>\n",
       "      <td>0.01%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>co2_e</td>\n",
       "      <td>EX_co2_e</td>\n",
       "      <td>-19.68</td>\n",
       "      <td>1</td>\n",
       "      <td>99.98%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>h2o_e</td>\n",
       "      <td>EX_h2o_e</td>\n",
       "      <td>-45.62</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>h_e</td>\n",
       "      <td>EX_h_e</td>\n",
       "      <td>-9.026</td>\n",
       "      <td>0</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>meoh_e</td>\n",
       "      <td>EX_meoh_e</td>\n",
       "      <td>-1.965E-06</td>\n",
       "      <td>1</td>\n",
       "      <td>0.00%</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>"
      ],
      "text/plain": [
       "<cobra.summary.model_summary.ModelSummary at 0x7fd00bedd160>"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "model.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "id": "7482586f",
   "metadata": {},
   "outputs": [],
   "source": [
    "fittedFluxes = replace_biomass_rxn_name(fittedFluxes, biomass_string='Biomass', biomass_rxn_name='BIOMASS_Ec_iJO1366_core_53p95M')"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "3cefceae",
   "metadata": {},
   "source": [
    "Next step, adjust the names of our MFA data so that they can be assigned to our model's reactions"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "id": "2dc33063",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0                       26dap_DASH_MSYN\n",
       "1                         ACONTa_ACONTb\n",
       "2                 ACONTa_ACONTb_reverse\n",
       "5                                ArgSYN\n",
       "14               EX_ac_LPAREN_e_RPAREN_\n",
       "15              EX_co2_LPAREN_e_RPAREN_\n",
       "16    EX_co2_LPAREN_e_RPAREN__unlabeled\n",
       "17              EX_glc_LPAREN_e_RPAREN_\n",
       "18              EX_nh4_LPAREN_e_RPAREN_\n",
       "19               EX_o2_LPAREN_e_RPAREN_\n",
       "20              EX_so4_LPAREN_e_RPAREN_\n",
       "21           FADR_NADH_CYTBD_HYD_ATPS4r\n",
       "23                          FBA_reverse\n",
       "25                          FUM_reverse\n",
       "26                          G6PDH2r_PGL\n",
       "27                             GAPD_PGK\n",
       "28                     GAPD_PGK_reverse\n",
       "30                       GHMT2r_reverse\n",
       "34                               GluSYN\n",
       "37                               HisSYN\n",
       "39                       ICDHyr_reverse\n",
       "41                               IleSYN\n",
       "42                               LeuSYN\n",
       "45                          MDH_reverse\n",
       "48                               MetSYN\n",
       "49                             MlthfSYN\n",
       "50                     MlthfSYN_reverse\n",
       "53                NADH_CYTBD_HYD_ATPS4r\n",
       "54                       NADTRHD_THD2pp\n",
       "55               NADTRHD_THD2pp_reverse\n",
       "59                          PGI_reverse\n",
       "61                          PGM_reverse\n",
       "62                               PheSYN\n",
       "65                               ProSYN\n",
       "67                        PTAr_ACKr_ACS\n",
       "68                PTAr_ACKr_ACS_reverse\n",
       "71                          RPE_reverse\n",
       "73                          RPI_reverse\n",
       "74                           SERAT_CYSS\n",
       "75                               SerSYN\n",
       "76                              SUCCOAS\n",
       "77                      SUCCOAS_reverse\n",
       "79                        SUCDi_reverse\n",
       "81                         TALA_reverse\n",
       "82                           THRD_GLYAT\n",
       "83                               ThrSYN\n",
       "84                                TKT1a\n",
       "85                        TKT1a_reverse\n",
       "86                                TKT1b\n",
       "87                        TKT1b_reverse\n",
       "88                                TKT2a\n",
       "89                        TKT2a_reverse\n",
       "90                                TKT2b\n",
       "91                        TKT2b_reverse\n",
       "93                          TPI_reverse\n",
       "94                               TrpSYN\n",
       "95                               TyrSYN\n",
       "96                               ValSYN\n",
       "Name: rxn_id, dtype: object"
      ]
     },
     "execution_count": 10,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "model_rxn_overlap(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "dbda89f0",
   "metadata": {},
   "source": [
    "Observations: \n",
    "1) some reaction names include more than one metabolite\n",
    "2) many unassigned amino acids end with `SYN` and\n",
    "3) some exchange reactions include `LPAREN_` and `RPAREN_`. Let's try to do something about that\n",
    "4) probably all `_reverse` reactions could not be assigned"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "dda8a6c2",
   "metadata": {},
   "source": [
    "1) Split the lumped reactions and give all of them the same bounds"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "1c5ecaf0",
   "metadata": {},
   "source": [
    "So let's pick the ones we want. Let's save the reverse reactions for a separate step"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "id": "4532e13b",
   "metadata": {},
   "outputs": [],
   "source": [
    "lumped_ids = [1, 21, 26, 27, 53, 54, 67, 74, 82]\n",
    "mask = []\n",
    "overlap = model_rxn_overlap(fittedFluxes, model)\n",
    "for i in overlap.iteritems():\n",
    "    if i[0] in lumped_ids:\n",
    "        mask.append(True)\n",
    "    else:\n",
    "        mask.append(False)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "id": "698d6eb0",
   "metadata": {},
   "outputs": [],
   "source": [
    "lumped_rxns = model_rxn_overlap(fittedFluxes, model)[mask]\n",
    "fittedFluxes = split_lumped_rxns(lumped_rxns, fittedFluxes)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "id": "80a80b32",
   "metadata": {},
   "outputs": [],
   "source": [
    "lumped_reverse_ids = [2, 28, 55, 68]\n",
    "mask_reverse = []\n",
    "for i in model_rxn_overlap(fittedFluxes, model).iteritems():\n",
    "    if i[0] in lumped_reverse_ids:\n",
    "        mask_reverse.append(True)\n",
    "    else:\n",
    "        mask_reverse.append(False)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "id": "2f8149c7",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "ACONTa_ACONTb_reverse\n",
      "GAPD_PGK_reverse\n",
      "NADTRHD_THD2pp_reverse\n",
      "PTAr_ACKr_ACS_reverse\n"
     ]
    }
   ],
   "source": [
    "lumped_reverse_rxns = model_rxn_overlap(fittedFluxes, model)[mask_reverse]\n",
    "fittedFluxes = split_lumped_reverse_rxns(lumped_reverse_rxns, fittedFluxes)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "id": "b22349e6",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0              26dap_DASH_MSYN\n",
       "2               ACONTa_reverse\n",
       "5                       ArgSYN\n",
       "14      EX_ac_LPAREN_e_RPAREN_\n",
       "15     EX_co2_LPAREN_e_RPAREN_\n",
       "                ...           \n",
       "112             ACONTb_reverse\n",
       "113                PGK_reverse\n",
       "114             THD2pp_reverse\n",
       "115               ACKr_reverse\n",
       "116                ACS_reverse\n",
       "Name: rxn_id, Length: 63, dtype: object"
      ]
     },
     "execution_count": 15,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "model_rxn_overlap(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "id": "b65848cb",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "54.0 %\n"
     ]
    }
   ],
   "source": [
    "rxn_coverage(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "f163e56e",
   "metadata": {},
   "source": [
    "2) SYN, these reactions might be lumped; let's investigate!"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "id": "d78af3cb",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "ARGAGMt7pp\n",
      "ARGDC\n",
      "ARGDCpp\n",
      "ARGORNt7pp\n",
      "ARGSL\n",
      "ARGSS\n",
      "ARGTRS\n",
      "ARGabcpp\n",
      "ARGt3pp\n",
      "ARGtex\n"
     ]
    }
   ],
   "source": [
    "for rxn in model.reactions:\n",
    "    if 'ARG' in rxn.id:\n",
    "        print(rxn.id)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "38c9a1da",
   "metadata": {},
   "source": [
    "Yeah I guess so... This sucks, not sure of we can do anything about that"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "48a77bad",
   "metadata": {},
   "source": [
    "3) Let's remove the extra bits in the exchange reaction strings"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 18,
   "id": "35ad96e7",
   "metadata": {},
   "outputs": [],
   "source": [
    "for i, row in fittedFluxes.iterrows():\n",
    "    if 'LPAREN_' in row['rxn_id']:\n",
    "        fittedFluxes.at[i, 'rxn_id'] = row['rxn_id'].replace('LPAREN_', '').replace('_RPAREN_', '')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "id": "51464d06",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "50.0 %\n"
     ]
    }
   ],
   "source": [
    "rxn_coverage(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "2442e13a",
   "metadata": {},
   "source": [
    "4) Reverse. Let's check if the forward and reverse fluxes are actually separate. If not, then the two of them will define the bounds together. If they are, then we should add new reverse reactions to the model."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 20,
   "id": "6113cc10",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>forward</th>\n",
       "      <th>reverse</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>ACONTa</td>\n",
       "      <td>ACONTa_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>FBA</td>\n",
       "      <td>FBA_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>FUM</td>\n",
       "      <td>FUM_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>GAPD</td>\n",
       "      <td>GAPD_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>30</th>\n",
       "      <td>GHMT2r</td>\n",
       "      <td>GHMT2r_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>39</th>\n",
       "      <td>ICDHyr</td>\n",
       "      <td>ICDHyr_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>45</th>\n",
       "      <td>MDH</td>\n",
       "      <td>MDH_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>50</th>\n",
       "      <td>MlthfSYN</td>\n",
       "      <td>MlthfSYN_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>55</th>\n",
       "      <td>NADTRHD</td>\n",
       "      <td>NADTRHD_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>59</th>\n",
       "      <td>PGI</td>\n",
       "      <td>PGI_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>61</th>\n",
       "      <td>PGM</td>\n",
       "      <td>PGM_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>68</th>\n",
       "      <td>PTAr</td>\n",
       "      <td>PTAr_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>71</th>\n",
       "      <td>RPE</td>\n",
       "      <td>RPE_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>73</th>\n",
       "      <td>RPI</td>\n",
       "      <td>RPI_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>77</th>\n",
       "      <td>SUCCOAS</td>\n",
       "      <td>SUCCOAS_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>79</th>\n",
       "      <td>SUCDi</td>\n",
       "      <td>SUCDi_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>81</th>\n",
       "      <td>TALA</td>\n",
       "      <td>TALA_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>85</th>\n",
       "      <td>TKT1a</td>\n",
       "      <td>TKT1a_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>87</th>\n",
       "      <td>TKT1b</td>\n",
       "      <td>TKT1b_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>89</th>\n",
       "      <td>TKT2a</td>\n",
       "      <td>TKT2a_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>91</th>\n",
       "      <td>TKT2b</td>\n",
       "      <td>TKT2b_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>93</th>\n",
       "      <td>TPI</td>\n",
       "      <td>TPI_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>112</th>\n",
       "      <td>ACONTb</td>\n",
       "      <td>ACONTb_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>113</th>\n",
       "      <td>PGK</td>\n",
       "      <td>PGK_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>114</th>\n",
       "      <td>THD2pp</td>\n",
       "      <td>THD2pp_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>115</th>\n",
       "      <td>ACKr</td>\n",
       "      <td>ACKr_reverse</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>116</th>\n",
       "      <td>ACS</td>\n",
       "      <td>ACS_reverse</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "      forward           reverse\n",
       "2      ACONTa    ACONTa_reverse\n",
       "23        FBA       FBA_reverse\n",
       "25        FUM       FUM_reverse\n",
       "28       GAPD      GAPD_reverse\n",
       "30     GHMT2r    GHMT2r_reverse\n",
       "39     ICDHyr    ICDHyr_reverse\n",
       "45        MDH       MDH_reverse\n",
       "50   MlthfSYN  MlthfSYN_reverse\n",
       "55    NADTRHD   NADTRHD_reverse\n",
       "59        PGI       PGI_reverse\n",
       "61        PGM       PGM_reverse\n",
       "68       PTAr      PTAr_reverse\n",
       "71        RPE       RPE_reverse\n",
       "73        RPI       RPI_reverse\n",
       "77    SUCCOAS   SUCCOAS_reverse\n",
       "79      SUCDi     SUCDi_reverse\n",
       "81       TALA      TALA_reverse\n",
       "85      TKT1a     TKT1a_reverse\n",
       "87      TKT1b     TKT1b_reverse\n",
       "89      TKT2a     TKT2a_reverse\n",
       "91      TKT2b     TKT2b_reverse\n",
       "93        TPI       TPI_reverse\n",
       "112    ACONTb    ACONTb_reverse\n",
       "113       PGK       PGK_reverse\n",
       "114    THD2pp    THD2pp_reverse\n",
       "115      ACKr      ACKr_reverse\n",
       "116       ACS       ACS_reverse"
      ]
     },
     "execution_count": 20,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "find_reverse_rxns(fittedFluxes)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "id": "b9820148",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "These reactions need to be split into two: ACONTa\n",
      "These reactions need to be split into two: FUM\n",
      "These reactions need to be split into two: GAPD\n",
      "These reactions need to be split into two: ICDHyr\n",
      "These reactions need to be split into two: MlthfSYN\n",
      "These reactions need to be split into two: PGM\n",
      "These reactions need to be split into two: PTAr\n",
      "These reactions need to be split into two: ACONTb\n",
      "These reactions need to be split into two: PGK\n",
      "These reactions need to be split into two: ACKr\n",
      "These reactions need to be split into two: ACS\n"
     ]
    }
   ],
   "source": [
    "fittedFluxes, rxns_to_split = combine_split_rxns(fittedFluxes)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "id": "b382bb6e",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>index</th>\n",
       "      <th>simulation_id</th>\n",
       "      <th>simulation_dateAndTime</th>\n",
       "      <th>rxn_id</th>\n",
       "      <th>flux</th>\n",
       "      <th>flux_stdev</th>\n",
       "      <th>flux_lb</th>\n",
       "      <th>flux_ub</th>\n",
       "      <th>flux_units</th>\n",
       "      <th>fit_alf</th>\n",
       "      <th>fit_chi2s</th>\n",
       "      <th>fit_cor</th>\n",
       "      <th>fit_cov</th>\n",
       "      <th>free</th>\n",
       "      <th>used_</th>\n",
       "      <th>comment_</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>26dap_DASH_MSYN</td>\n",
       "      <td>2.295040e-01</td>\n",
       "      <td>2.607999e-03</td>\n",
       "      <td>0.224392</td>\n",
       "      <td>0.234616</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>1</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACONTa</td>\n",
       "      <td>2.074886e+00</td>\n",
       "      <td>1.699686e+04</td>\n",
       "      <td>1.185984</td>\n",
       "      <td>1000.000000</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>2</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACONTa_reverse</td>\n",
       "      <td>8.690514e-07</td>\n",
       "      <td>1.543259e+04</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>28.927600</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>3</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>AKGDH</td>\n",
       "      <td>1.423617e-01</td>\n",
       "      <td>7.673616e+03</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>1.919800</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>4</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ALATA_L</td>\n",
       "      <td>3.435520e-01</td>\n",
       "      <td>3.904002e-03</td>\n",
       "      <td>0.335900</td>\n",
       "      <td>0.351204</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>96</th>\n",
       "      <td>111</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>GLYAT</td>\n",
       "      <td>1.000000e-07</td>\n",
       "      <td>6.096786e-12</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.035201</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>False</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>97</th>\n",
       "      <td>112</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACONTb_reverse</td>\n",
       "      <td>8.690514e-07</td>\n",
       "      <td>1.543259e+04</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>28.927600</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>98</th>\n",
       "      <td>113</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>PGK_reverse</td>\n",
       "      <td>8.689295e-07</td>\n",
       "      <td>9.920303e+03</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>24.418874</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>99</th>\n",
       "      <td>115</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACKr_reverse</td>\n",
       "      <td>8.695792e-07</td>\n",
       "      <td>2.139235e+04</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>28.262368</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>100</th>\n",
       "      <td>116</td>\n",
       "      <td>WTEColi_113C80_U13C20_01</td>\n",
       "      <td>2021-04-16 18:29:37</td>\n",
       "      <td>ACS_reverse</td>\n",
       "      <td>8.695792e-07</td>\n",
       "      <td>2.139235e+04</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>28.262368</td>\n",
       "      <td>mmol*gDCW-1*hr-1</td>\n",
       "      <td>0.05</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>None</td>\n",
       "      <td>True</td>\n",
       "      <td>True</td>\n",
       "      <td>None</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>101 rows × 16 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "     index             simulation_id simulation_dateAndTime           rxn_id  \\\n",
       "0        0  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37  26dap_DASH_MSYN   \n",
       "1        1  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37           ACONTa   \n",
       "2        2  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37   ACONTa_reverse   \n",
       "3        3  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37            AKGDH   \n",
       "4        4  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37          ALATA_L   \n",
       "..     ...                       ...                    ...              ...   \n",
       "96     111  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37            GLYAT   \n",
       "97     112  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37   ACONTb_reverse   \n",
       "98     113  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37      PGK_reverse   \n",
       "99     115  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37     ACKr_reverse   \n",
       "100    116  WTEColi_113C80_U13C20_01    2021-04-16 18:29:37      ACS_reverse   \n",
       "\n",
       "             flux    flux_stdev   flux_lb      flux_ub        flux_units  \\\n",
       "0    2.295040e-01  2.607999e-03  0.224392     0.234616  mmol*gDCW-1*hr-1   \n",
       "1    2.074886e+00  1.699686e+04  1.185984  1000.000000  mmol*gDCW-1*hr-1   \n",
       "2    8.690514e-07  1.543259e+04  0.000000    28.927600  mmol*gDCW-1*hr-1   \n",
       "3    1.423617e-01  7.673616e+03  0.000000     1.919800  mmol*gDCW-1*hr-1   \n",
       "4    3.435520e-01  3.904002e-03  0.335900     0.351204  mmol*gDCW-1*hr-1   \n",
       "..            ...           ...       ...          ...               ...   \n",
       "96   1.000000e-07  6.096786e-12  0.000000     0.035201  mmol*gDCW-1*hr-1   \n",
       "97   8.690514e-07  1.543259e+04  0.000000    28.927600  mmol*gDCW-1*hr-1   \n",
       "98   8.689295e-07  9.920303e+03  0.000000    24.418874  mmol*gDCW-1*hr-1   \n",
       "99   8.695792e-07  2.139235e+04  0.000000    28.262368  mmol*gDCW-1*hr-1   \n",
       "100  8.695792e-07  2.139235e+04  0.000000    28.262368  mmol*gDCW-1*hr-1   \n",
       "\n",
       "     fit_alf fit_chi2s fit_cor fit_cov   free  used_ comment_  \n",
       "0       0.05      None    None    None  False   True     None  \n",
       "1       0.05      None    None    None  False   True     None  \n",
       "2       0.05      None    None    None   True   True     None  \n",
       "3       0.05      None    None    None  False   True     None  \n",
       "4       0.05      None    None    None  False   True     None  \n",
       "..       ...       ...     ...     ...    ...    ...      ...  \n",
       "96      0.05      None    None    None  False   True     None  \n",
       "97      0.05      None    None    None   True   True     None  \n",
       "98      0.05      None    None    None   True   True     None  \n",
       "99      0.05      None    None    None   True   True     None  \n",
       "100     0.05      None    None    None   True   True     None  \n",
       "\n",
       "[101 rows x 16 columns]"
      ]
     },
     "execution_count": 22,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "fittedFluxes"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "58206bfc",
   "metadata": {},
   "source": [
    "The reactions that are acutally separate (i.e. non-overlapping bounds, exchange fluxes) are a problem. COBRA has some ways to account for that but they seem to be quite involved. An easier way to deal with that is that just add the reverse reaction as a separate reaction to the model; it's the same reaction, just with the inverse direction. The following method is \"destructive\", i.e. it will alter the model. Be aware of that."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "id": "85fc40e4",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['ACONTa',\n",
       " 'FUM',\n",
       " 'GAPD',\n",
       " 'ICDHyr',\n",
       " 'MlthfSYN',\n",
       " 'PGM',\n",
       " 'PTAr',\n",
       " 'ACONTb',\n",
       " 'PGK',\n",
       " 'ACKr',\n",
       " 'ACS']"
      ]
     },
     "execution_count": 28,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "rxns_to_split"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 23,
   "id": "8c0cb14b",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "- Added ACONTa to model\n",
      "- Added FUM to model\n",
      "- Added GAPD to model\n",
      "- Added ICDHyr to model\n",
      "# Could not add MlthfSYN to model\n",
      "- Added PGM to model\n",
      "- Added PTAr to model\n",
      "- Added ACONTb to model\n",
      "- Added PGK to model\n",
      "- Added ACKr to model\n",
      "- Added ACS to model\n"
     ]
    }
   ],
   "source": [
    "cobra_add_split_rxns(rxns_to_split, model)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "id": "becc5617",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0        26dap_DASH_MSYN\n",
       "5                 ArgSYN\n",
       "16    EX_co2_e_unlabeled\n",
       "17              EX_glc_e\n",
       "21                  FADR\n",
       "32                GluSYN\n",
       "35                HisSYN\n",
       "39                IleSYN\n",
       "40                LeuSYN\n",
       "45                MetSYN\n",
       "46              MlthfSYN\n",
       "47      MlthfSYN_reverse\n",
       "50                  NADH\n",
       "57                PheSYN\n",
       "60                ProSYN\n",
       "68                SerSYN\n",
       "69               SUCCOAS\n",
       "73                ThrSYN\n",
       "74                 TKT1a\n",
       "75                 TKT1b\n",
       "76                 TKT2a\n",
       "77                 TKT2b\n",
       "79                TrpSYN\n",
       "80                TyrSYN\n",
       "81                ValSYN\n",
       "83                  NADH\n",
       "84                 CYTBD\n",
       "85                   HYD\n",
       "86                ATPS4r\n",
       "89                 CYTBD\n",
       "90                   HYD\n",
       "91                ATPS4r\n",
       "Name: rxn_id, dtype: object"
      ]
     },
     "execution_count": 24,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "model_rxn_overlap(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 25,
   "id": "cdae7dde",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "32.0 %\n"
     ]
    }
   ],
   "source": [
    "rxn_coverage(fittedFluxes, model)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "f170ebdb",
   "metadata": {},
   "source": [
    "Ok... well, guess you can't please everyone. You could of course find a way to add the remaining reactions manually or investigate further how to distribute their values to other reactions but this is as far as we will go here."
   ]
  },
  {
   "cell_type": "markdown",
   "id": "88d5a965",
   "metadata": {},
   "source": [
    "For the next steps, please check the `MFA_feasibility_and_sampling` notebook"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 26,
   "id": "e4ec00a0",
   "metadata": {},
   "outputs": [],
   "source": [
    "fittedFluxes.to_pickle(\"data/MFA_sampling/preprocessed_fittedFluxes.obj\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 27,
   "id": "dde3ee59",
   "metadata": {},
   "outputs": [],
   "source": [
    "cobra.io.save_json_model(model, \"data/MFA_sampling/preprocessed_model.json\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "99d4c41a",
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "bfair",
   "language": "python",
   "name": "bfair"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}