Newsletter

Por que todo mundo quer virar Analytics Engineer?¬†ūüď£

Enviado em: July 11, 2022
View this email in your browser

Por que todo mundo quer virar Analytics Engineer? ūüď£


Fala, Data Hackers! Bem-vindos a mais uma news do DH!

Pra quem t√° ligado, ja sabe que Analytics Engineer √© um cargo que faz - ou vai fazer - parte dos nossos times de Dados. Mas, por que que esse termo para uma posi√ß√£o t√£o imatura e recente tem sido t√£o disputado por empresas? Por que ser√° que tem tanta gente migrando para esse cargo?

No highlight dessa newsletter, trouxemos um texto de um dos maiores influencers do mundo de Dados atualmente botando v√°rias doses de fatos e "futurologia" sobre Analytics Engineering.

Mas essa edi√ß√£o tem muuuito conte√ļdo ainda. Hoje voc√™ vai ver sobre:

STATE OF DATA CHALLENGE: O DEADLINE EST√Ā CHEGANDO!
N√£o perca o prazo para concorrer ao pr√™mio mais importante de Data Storytelling do pa√≠s!

Se você é daqueles que gosta de uma emoção no envio do trabalho de faculdade? Se liga que o prazo para submissão ja é essa semana! Quer concorrer a um PS5, um Meta Quest 2 e um monitor portátil ASUS? Então agiliza aí!

Dia 12 de Julho (Terça-Feira) as 23:59 BRT (Horário de Brasília)

N√£o deixe de conferir as Regras da competi√ß√£o e fazer o upload do seu Notebook no Kaggle! (em Portugu√™s)

Por que todo mundo quer virar Analytics Engineer?

Se voc√™ ainda n√£o ouviu falar nesse novo cargo, voc√™ precisa voltar algumas casas nas nossas newsletters. A posi√ß√£o de Analytics Engineer surgiu nos √ļltimos 3 anos e j√° corresponde a uma porcentagem relevante dos times de dados modernos por a√≠.

Nesse artigo top do Benn Stancil, CAO e Co-Founder da Mode, um dos maiores influenciadores da nossa √°rea, voc√™ vai entender os principais motivos do "hype" (?) desta nova profiss√£o e como os ventos das mudan√ßas nas Data Platforms e da Modern Data Stack est√£o influenciando no nosso dia-a-dia como Data Pros. Imperd√≠vel! (em Ingl√™s)

Data Vault, Star Schema, Bronze/Silver/Gold? Como modelar um Lakehouse?


Com a crescente de novos conceitos surgindo, como Lakehouse, Data Lakes e Data Mesh, fica cada vez mais complicado escolher uma t√©cnica de modelagem para um Data Lake/DW/Lakehouse. Este post da galera do Databricks, traz as principais refer√™ncias de modelagem, do Star Schema at√© o Bronze/Silver/Gold do Delta Lake, passando pelo, √°s vezes esquecido, Data Vault. Imperd√≠vel! (em Ingl√™s) 


Rspotify: Pacote que vai alegrar os f√£s de R e de M√ļsica!


Existe uma m√°xima de que na linguagem R "existe um pacote para tudo"! Seguindo nesse mantra, a galera do Curso R postou um guia sobre um dos pacotes mais legais pra quem gosta de explorar dados musicais: o RSpotify. Com este pacote, √© poss√≠vel, em poucos passos, usar capturar dados sobre Artistas, Playlists e M√ļsicas muito facilmente. Bem completo e simples de seguir, d√° uma lida!
(em Português)
OUTROS T√ďPICOS
Pydantic v2.0 com core em Rust

Se voc√™ n√£o conhece o Pydantic, a hora √© agora! √Č uma lib python que agiliza demais o data validation, garantindo que os formados dos campos de uma classe obede√ßa certos padr√Ķes. Agora, com a v2.0, o Pydantic est√° 17x mais r√°pido, pois seu core foi refeito em Rust, uma das linguagens mais perform√°ticas da nova gera√ß√£o. (em Ingl√™s)

TF-IDF: o algoritmo mais usado pra Buscas de Textos

TF-IDF (Term Frequence - Inverse Document Frequency) é uma forma algébrica de representar um texto dentro de um Corpus (uma série de textos). Essa forma é uma das mais utilizadas do mundo para implementação de buscas de texto e comparar similaridade entre eles. Nesse artigo, o Data Hacker Arthur Vaz explica como que funciona e quais formulas são usadas para esse método.

Reconhecimento de Entidades Nomeadas: entidades, subentidades, relacionamentos e ambiguidade

Em NLP, um dos grandes desafios é fazer Reconhecer e Definir Entidades. Nesse post incrível, a Data Hacker Beatriz Albuquerque fala de Named Entity Recognition, que é uma máquina entender Nomes - como Bia, São Paulo e Amazon - dentro de texto.
 
DICA DE VIDEO
Live Data Hackers: Dicas de Data Storytelling e Visualização de Dados

Se voc√™ ainda quer umas dicas para dar um tapa na sua submiss√£o pro Challenge State of Data Brazil 2021, ainda h√° tempo! 

Chamamos 3 FERAS em Data Storytelling & Visualization para contarem quais são as formas e técnicas mais relevantes para se passar uma história ou uma conclusão através dos dados. Mesmo se você não vai participar do Challenge, as dicas do pessoal são infalíveis para quem quer entregar resultado de maneira efetiva para os seus usuários e clientes.(em Português)
VAGAS DA SEMANA
  • Forte conhecimento em SQL e Excel; NoSQL desej√°vel. 
  • Exp. com ferramentas de Viz, como Tableau, Metabase;
  • Programa√ß√£o em Python, R, Scala, Etc;
  • Conhecimentos intermedi√°rios em Matem√°tica | Estat√≠stica;
  • An√°lise descritiva, l√≥gica e infer√™ncia;
  • Forma√ß√£o: gradua√ß√£o exatas;
  • Profici√™ncia em Estat√≠stica e Machine Learning;
  • Conhecimento avan√ßado em Python, R, SQL, etc;
  • Experi√™ncia com plataforma de Big Data (Hadoop, Spark, etc);
  • Ingl√™s intermedi√°rio;
  • Cloud AWS √© Diferencial.
MEME DA SEMANA
Pra quem n√£o t√° no Challenge: Voc√™ e o trabalho final do semestre que voc√™ j√° comemorou as 3 vezes que o professor adiou. Estamos de olho! ūüĎĀÔłŹūüĎĀÔłŹ
DATA VISUALIZATION DA SEMANA
A grande queda dos valuations em 22

Quem acompanhou nossa Live sobre os Layoffs e deu uma estudada no assunto, t√° ligado na situa√ß√£o. Nesse post do excelente Snaq, eles mostram como cairam os valuations de 6 unic√≥rnios desde seus √ļltimos investimentos. Impressionante, n√£o √© mesmo? (em Ingl√™s)

PR√ďXIMOS EVENTOS E MEETUPS
Nextflow Summit 2022 - Com sess√Ķes de Treinamento Gratuitas
12 a 14 de Outubro - Evento Gratuito


Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.
Facebook
Site
LinkedIn
Twitter
Medium