utilities/data-ingestion/ingest-applications.py from coforma/swift-tech-challenge

utilities/data-ingestion/ingest-applications.py
Summary

Maintainability

0 mins
Test Coverage

Issues
import boto3
import csv
import logging
import os


s3_client = boto3.client("s3")
dynamodb = boto3.resource("dynamodb")
table = dynamodb.Table(os.getenv("DYNAMODB_TABLE") or "institutions")
logger = logging.getLogger()


def lambda_handler(event, context):
    try:
        # Grab file from S3, based on Lambda trigger
        s3_bucket_name = event["Records"][0]["s3"]["bucket"]["name"]
        s3_file_name = event["Records"][0]["s3"]["object"]["key"]
        csv_object = s3_client.get_object(Bucket=s3_bucket_name, Key=s3_file_name)

        # massage data
        data = csv_object["Body"].read().decode("utf-8")
        institution_questions = data.split("\n")
        institution_questions.pop(0)

        # transform data into Item and write to table
        items = []
        logger.info(
            "Processing questions for "
            + str(len(institution_questions))
            + " institutions"
        )
        for questions in institution_questions:
            try:
                # opting for csv reader due to commas in the questions and .split(",")
                csv_reader = csv.reader([questions])
                question_list = next(csv_reader)
                Item = {
                    "institutionId": int(question_list.pop(0)),
                    "recordType": "application",
                    "institutionName": question_list.pop(0),
                    "questions": question_list,
                }
                items.append(Item)
            except Exception as err:
                print(err)

        logger.info("Preparing to write " + str(len(items)) + " to DynamoDB")
        with table.batch_writer() as batch:
            for item in items:
                batch.put_item(Item=item)

    except Exception as err:
        print(err)