benchmarks/analyze_timeseries.py from choderalab/protons

benchmarks/analyze_timeseries.py
Summary

Maintainability

3 hrs
Test Coverage

Issues
import pymbar
import numpy as np


def autocorrelation_analysis(txt):

    data, headers = parse_file(txt)
    # Store individual values
    x = list()

    if data.T.ndim > 1:
        for arr in data.T:
            try:
                x.append(pymbar.timeseries.integratedAutocorrelationTime(arr))
            except pymbar.utils.ParameterError:
                x.append(np.nan)
    else:
        try:
            x.append(pymbar.timeseries.integratedAutocorrelationTime(data))
        except pymbar.utils.ParameterError:
            x.append(np.nan)

    x = list(map(float, x))
    named_values = dict(zip(headers, x))

    open('autocorrelation.txt', 'w').write(repr(named_values))


def parse_file(txt):
    data = np.genfromtxt(txt, dtype=float, delimiter=',', skip_header=1)
    headers = open(txt).readline()[1:].strip().split(sep=',')
    return data, headers


def count_values(txt):
    data, headers = parse_file(txt)
    # Store individual values
    x = list()

    if data.T.ndim > 1:
        for arr in data.T:
            unique = np.unique(arr, return_counts=True)
            x.append(dict(zip(unique[0], unique[1])))

    else:
        unique = np.unique(data, return_counts=True)
        x.append(dict(zip(unique[0], unique[1])))

    named_values = dict(zip(headers, x))
    print(named_values)


txt = 'states.txt'
autocorrelation_analysis(txt)
count_values(txt)