src/lib/statistics_module.py from siruku6/fx_alarm_py

src/lib/statistics_module.py
Summary

Maintainability

1 hr
Test Coverage

91%
Issues
Coverage
from datetime import datetime
from decimal import ROUND_HALF_UP, Decimal  # , ROUND_HALF_EVEN
import os
from typing import Any, Dict, List

import numpy as np
import pandas as pd

from src.trader_config import FILTER_ELEMENTS, TraderConfig

TRADE_RESULT_ITEMS = [
    "DoneTime",
    "Rule",
    "Granularity",
    "StoplossBuf",
    "Spread",
    "Duration",
    "CandlesCnt",
    "EntryCnt",
    "WinRate",
    "WinCnt",
    "LoseCnt",
    "Gross",
    "GrossProfit",
    "GrossLoss",
    "MaxProfit",
    "MaxLoss",
    "MaxDrawdown",
    "Profit Factor",
    "Recovery Factor",
    "Sharp Ratio",
    "Sortino Ratio",
]


def aggregate_backtest_result(
    rule: str, df_positions: pd.DataFrame, config: TraderConfig
) -> pd.DataFrame:
    """
    Calculate statistics from the result of trading

    Parameters
    ----------
    rule : string
        Example: 'swing', 'scalping', ... etc
    df_positions : pd.DataFrame
        Columns:
            Name: time,          dtype=object ('yyyy-MM-dd HH:mm:ss')
            Name: position,      dtype=object ('long', 'short', 'sell_exit', 'buy_exit' or None)
            Name: entry_price,   dtype=float64
            Name: exitable_price dtype=float64

    Returns
    -------
    pd.DataFrame
        Columns:
            Name: time,   dtype=object
            Name: profit, dtype=float64
            Name: gross,  dtype=float64
    """
    filter_boolean: List[bool] = __filter_to_boolean(config.get_entry_rules("entry_filters"))  # type: ignore

    positions: pd.DataFrame = df_positions.loc[df_positions.position.notnull(), :].copy()
    positions = __calc_profit(copied_positions=positions)
    positions.loc[:, "gross"] = positions.profit.cumsum()
    positions.loc[:, "drawdown"] = positions.gross - positions.gross.cummax()

    performance_result = __calc_performance_indicators(positions)
    __append_performance_result_to_csv(
        rule=rule,
        granularity=config.get_entry_rules("granularity"),  # type: ignore
        sl_buf=config.stoploss_buffer_pips,
        spread=config.static_spread,
        candles=df_positions,
        performance_result=performance_result,
        filter_boolean=filter_boolean,
        operation=config.operation,
    )

    # TODO: Remove - this is a temporary line of cord.
    if config.operation != "unittest":
        positions.to_csv("./tmp/csvs/positions_dump.csv")
    return positions[["time", "profit", "gross"]].copy()


def __filter_to_boolean(_filter: List[str]) -> List[bool]:
    return [(elem in _filter) for elem in FILTER_ELEMENTS]


def __calc_profit(copied_positions: pd.DataFrame) -> pd.DataFrame:
    """calculate the profit and loss for each trades"""
    copied_positions.loc[:, "profit"] = 0.0

    # INFO: entry したその足で exit してしまった分の profit を計算
    is_soon_exit: pd.Series = (
        copied_positions["exitable_price"].notnull() & copied_positions["entry_price"].notnull()
    )
    soon_exit_positions: pd.DataFrame = copied_positions[is_soon_exit]
    exit_entry_diffs: pd.Series = (
        soon_exit_positions.exitable_price - soon_exit_positions.entry_price
    ).map(__round_really)
    copied_positions.loc[is_soon_exit, "profit"] = __pl_calculator(
        soon_exit_positions.position, exit_entry_diffs
    )

    # INFO: entry 後、次の足までは position を持ち越した分の profit を計算
    continued_index: pd.Series = (
        copied_positions["exitable_price"].notnull()
        & copied_positions.shift(1)["exitable_price"].isna()
    )
    exit_entry_diffs = (
        copied_positions.exitable_price - copied_positions.shift(1).entry_price
    ).map(__round_really)[continued_index]
    copied_positions.loc[continued_index, "profit"] += __pl_calculator(
        copied_positions[continued_index].position, exit_entry_diffs
    )
    return copied_positions.astype({"profit": float})


def __pl_calculator(position_series: pd.Series, diffs: pd.Series) -> np.ndarray:
    # INFO: long か short かで正負を逆にする
    return np.nan_to_num(np.where(position_series == "sell_exit", diffs, diffs * -1))


def __calc_performance_indicators(positions: pd.DataFrame) -> Dict[str, Any]:
    long_cnt = len(positions[__hist_index_of(positions, sign="long|sell_exit")])
    short_cnt = len(positions[__hist_index_of(positions, sign="short|buy_exit")])
    entry_cnt = long_cnt + short_cnt
    win_positions = positions[positions.profit > 0]
    lose_positions = positions[positions.profit < 0]
    gross_profit = win_positions.profit.sum()
    gross_loss = lose_positions.profit.sum()
    pl = positions.profit.sum()
    max_drawdown = positions.drawdown.min()
    sharp_ratio = pl / positions.profit.std()
    sortino_ratio = pl / lose_positions.profit.std()

    return {
        "entry_count": entry_cnt,
        "win_rate": round(len(win_positions) / entry_cnt * 100, 2) if entry_cnt > 0 else "-",
        "win_count": len(win_positions),
        "lose_count": len(lose_positions),
        "long_count": long_cnt,
        "short_count": short_cnt,
        "profit_sum": positions.profit.sum(),
        "gross_profit": gross_profit,
        "gross_loss": gross_loss,
        "max_profit": win_positions.profit.max(),
        "max_loss": lose_positions.profit.min(),
        "drawdown": max_drawdown,
        "profit_factor": round(-gross_profit / gross_loss, 2) if gross_loss != 0 else "-",
        "recovery_factor": round((gross_profit + gross_loss) / -max_drawdown, 2)
        if max_drawdown != 0
        else "-",
        "sharp_ratio": sharp_ratio,
        "sortino_ratio": sortino_ratio,
    }


def __hist_index_of(positions: pd.DataFrame, sign: str) -> pd.Series:
    """
    long 又は short どちらかのみの position を絞り込むための boolean 型 Series を生成する
    params:
        positions
            type:    DataFrame
            columns: [
                'position',      # str ('long', 'short', 'sell_exit', 'buy_exit' or None)
                'entry_price',   # float64
            ]
        sign
            type:    string
            example: 'long|sell_exit' or 'short|buy_exit'
    returns:
        type:    Series
    """
    return positions["position"].str.contains(sign) & pd.notna(positions["entry_price"])


def __append_performance_result_to_csv(
    rule: str,
    granularity: str,
    sl_buf: float,
    spread: float,
    candles: pd.DataFrame,
    performance_result: pd.DataFrame,
    filter_boolean: List[bool],
    operation: str,
) -> pd.DataFrame:
    now = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    duration = "{start} ~ {end}".format(start=candles.time[20], end=candles.iloc[-1].time)
    result_row = [
        now,  # 'DoneTime'
        rule,  # 'Rule'
        granularity,  # 'Granularity'
        sl_buf,  # 'StoplossBuf'
        spread,  # 'Spread'
        duration,  # 'Duration'
        len(candles) - 20,  # 'CandlesCnt'
        performance_result["entry_count"],  # 'EntryCnt'
        performance_result["win_rate"],  # 'WinRate'
        performance_result["win_count"],  # 'WinCnt'
        performance_result["lose_count"],  # 'LoseCnt'
        round(performance_result["profit_sum"] * 100, 3),  # 'Gross'
        round(performance_result["gross_profit"] * 100, 3),  # 'GrossProfit'
        round(performance_result["gross_loss"] * 100, 3),  # 'GrossLoss'
        round(performance_result["max_profit"] * 100, 3),  # 'MaxProfit'
        round(performance_result["max_loss"] * 100, 3),  # 'MaxLoss'
        round(performance_result["drawdown"] * 100, 3),  # 'MaxDrawdown'
        performance_result["profit_factor"],  # 'Profit Factor'
        performance_result["recovery_factor"],  # 'Recovery Factor'
        performance_result["sharp_ratio"],  # 'Sharp Ratio'
        performance_result["sortino_ratio"],  # 'Sortino Ratio'
    ]
    result_df: pd.DataFrame = pd.DataFrame(
        [result_row + filter_boolean], columns=TRADE_RESULT_ITEMS + FILTER_ELEMENTS
    )

    if operation != "unittest":
        filepath: str = "tmp/csvs/verify_results.csv"
        need_header: bool = not os.path.isfile(filepath)
        result_df.to_csv(filepath, encoding="shift-jis", mode="a", index=False, header=need_header)
        print("[Trader] Added the result of backtest in 'verify_results.csv'!")

    return result_df


def __round_really(x: float) -> float:
    """小数点第3位で四捨五入(roundでは四捨五入できないため、実装した)"""
    return float(Decimal(str(x)).quantize(Decimal("0.001"), rounding=ROUND_HALF_UP))