Análisis/Ingeniería de datos y IA Generativa (GenAI)

Tuve la oportunidad de trabajar con Tommi en el desarrollo de una herramienta de Web Scraping (proceso en el cual se extra información valiosa de sitios web), y un servidor; fundamentales para nuestra empresa. Su experiencia técnica, su enfoque innovador y su dedicación para comprender nuestras necesidades específicas dieron como resultado una solución eficiente y sin problemas. La herramienta ha mejorado significativamente nuestros procesos de recopilación de datos, lo que demuestra la capacidad de Tommi para ofrecer un trabajo de alta calidad en plazos ajustados. Su profesionalismo y su voluntad de ir más allá marcaron una diferencia notable. Recomiendo altamente a Tommi a cualquiera que busque soluciones técnicas excepcionales en gestión de datos e infraestructura.
Vesa Karjalainen, Polq Oy

Este portafolio presenta la canalización de ETL de raspado web en Python y JavaScript, Jupyter Notebooks que analizan muchos conjuntos de datos diferentes y visualizaciones de datos con Tableau y la biblioteca de Python Plotly. Aquí encontrarás mis análisis, datos que van desde información de Netflix, McDonalds, Wallmart, datos médicos, hasta datos de aerolíneas, etc. Por favor da click en los enlaces correspondientes para ver los análisis

Tabla de contenido

Certificación en Ingeniería de datos de Datacamp

Carta de recomendación de Profesor de Analista de Datos

Web Scraping ETL


Recolección de datos de bolsas de trabajo de varios sitios web para aplicaciones de bolsa de trabajo personalizadas.

Primero se creó con la configuración de la comunidad Docker Compose, pero se trasladó a Prefect.io antes de su lanzamiento, ya que era una solución más simplificada para el cliente.

Cuadernos de Jupyter para Python

Utilizo varios paquetes de Ciencia de datos de Python, por ejemplo: NumPy, matplotlib, pandas, seaborn, scipy.

Respondo preguntas en mis análisis de datos como:

Conjunto de datos de pacientes con cáncer


¿Por qué un porcentaje mayor del sexo 1 tiene tumores malignos?


¿Qué otras características pueden estar relacionadas con los tumores malignos?


Nivel de cáncer y obesidad
Contenedores de edad y nivel de cáncer

Conjunto de datos de aerolíneas

Conjunto de datos de McDonald's

Scripts de utilidad


Python para hojas de cálculo y bases de datos


Script de cumplimiento para la FDA


Recopila todas las páginas de un sitio web en un archivo csv que se puede importar a ChatGPT para su análisis. También incluimos las directrices más actualizadas junto con el CSV y pedimos a ChatGPT que señale cualquier contenido que vaya en contra de las directrices. Ahorra mucho tiempo al crear contenido de CBD que cumpla con las normas.

API cliente para Shopify


Consultando los productos más populares para poder mostrarlos en el comercio electrónico sin pantalla con datos en tiempo real, en consecuencia, en la sección de productos populares

Secuencias de comandos y extensiones de Airtable

Hojas de cálculo de Google para la generación de leads

Secuencia de comandos para comprobar la velocidad de las páginas en busca de URL en la columna. Útil para la generación de prospectos (clientes, usuarios, visitantes), (lead generation). También otros scripts de limpieza para datos más pequeños

Tableau