Tuve la oportunidad de trabajar con Tommi en el desarrollo de una herramienta de Web Scraping (proceso en el cual se extra información valiosa de sitios web), y un servidor; fundamentales para nuestra empresa. Su experiencia técnica, su enfoque innovador y su dedicación para comprender nuestras necesidades específicas dieron como resultado una solución eficiente y sin problemas. La herramienta ha mejorado significativamente nuestros procesos de recopilación de datos, lo que demuestra la capacidad de Tommi para ofrecer un trabajo de alta calidad en plazos ajustados. Su profesionalismo y su voluntad de ir más allá marcaron una diferencia notable. Recomiendo altamente a Tommi a cualquiera que busque soluciones técnicas excepcionales en gestión de datos e infraestructura.
Este portafolio presenta la canalización de ETL de raspado web en Python y JavaScript, Jupyter Notebooks que analizan muchos conjuntos de datos diferentes y visualizaciones de datos con Tableau y la biblioteca de Python Plotly. Aquí encontrarás mis análisis, datos que van desde información de Netflix, McDonalds, Wallmart, datos médicos, hasta datos de aerolíneas, etc. Por favor da click en los enlaces correspondientes para ver los análisis
Recolección de datos de bolsas de trabajo de varios sitios web para aplicaciones de bolsa de trabajo personalizadas.
Primero se creó con la configuración de la comunidad Docker Compose, pero se trasladó a Prefect.io antes de su lanzamiento, ya que era una solución más simplificada para el cliente.
Utilizo varios paquetes de Ciencia de datos de Python, por ejemplo: NumPy, matplotlib, pandas, seaborn, scipy.
Nivel de cáncer y obesidad
Contenedores de edad y nivel de cáncer
Recopila todas las páginas de un sitio web en un archivo csv que se puede importar a ChatGPT para su análisis. También incluimos las directrices más actualizadas junto con el CSV y pedimos a ChatGPT que señale cualquier contenido que vaya en contra de las directrices. Ahorra mucho tiempo al crear contenido de CBD que cumpla con las normas.
Consultando los productos más populares para poder mostrarlos en el comercio electrónico sin pantalla con datos en tiempo real, en consecuencia, en la sección de productos populares
Secuencia de comandos para comprobar la velocidad de las páginas en busca de URL en la columna. Útil para la generación de prospectos (clientes, usuarios, visitantes), (lead generation). También otros scripts de limpieza para datos más pequeños