Processamento de dados em larga escala com PySpark

Nesta palestra, vamos explorar as técnicas e ferramentas essenciais para trabalhar com grandes volumes de dados utilizando a biblioteca PySpark, que integra o poder do Apache Spark com a flexibilidade do Python. Serão abordadas as principais funcionalidades do PySpark, como a distribuição de dados e o processamento paralelo, permitindo a análise eficiente de datasets massivos, e demonstraremos como a inteligência artificial do Gemini, diretamente no ambiente interativo e colaborativo do Google Colab, pode acelerar o desenvolvimento.

Speaker

Carla Vieira

Carla Vieira é mestre em Inteligência artificial pela USP e atua como Engenheira de Dados. Foi reconhecida como Google Developer Expert em Machine Learning e uma das 100 mulheres brilhantes na área de IA Ética.