Newsletter

Conheça o mais importante modelo de ML da década

Enviado em: July 25, 2022
View this email in your browser

Mil pesquisadores, 70 países, um modelo: BLOOM


Fala Data Hackers, preparados para mais uma semana cheia de dados? O destaque dessa semana vai para o BLOOM: um modelo de linguagem à lá GPT-3 que está dando o que falar. Um dos destaques desse modelo é o grande suporte a outras linguagens, a quantidade de pessoas envolvidas e, claro, o fato dele ser totalmente open-source. Confira ainda nessa news mais detalhes sobre esse avanço.

Mas não para por aí, além desse tópico temos vários outros assuntos interessantes:

NOVA PARCEIRA DO DATA HACKERS

A nossa querida Thoughtworks é a mais nova parceira do Data Hackers! Estamos muito animados com essa nova parceria, onde vamos criar uma série de conteúdos com a TW sobre a área de dados e Machine Learning. Então espere podcasts, blogposts e outros conteúdos que vão contar tudo sobre como a TW impacta o mundo.

A propósito, no começo de Agosto irá rolar o XConf Brasil: uma conferência de tecnologia realizada pela TW, que trará gigantes da indústria para discutir o impacto do software no mundo. Aproveite para se inscrever logo no evento e não perder essa oportunidade! (em Português)
 

BLOOM: o GPT-3 do povo!

Uma das iniciativas mais incríveis que já vi finalmente saiu do forno! O projeto BigScience, idealizado pelo Hugging Face e que juntou mais de mil pesquisadores ao redor do mundo, anunciou a criação do BLOOM: um modelo de linguagem (semelhante ao GPT-3) totalmente open-source!

Um dos maiores destaques desse feito está em incluir muitas outras linguagens, diferente do Inglês. Para se ter uma ideia, para os idiomas Espanhol, Francês e Árabe, o BLOOM é o maior modelo já feito na história. Se você quiser brincar com o BLOOM direto do navegador, pode acessar o site do Hugging Face e mandar ele escrever alguma (em inglês).

O que é MLOps? O guia que você precisa ler

MLOps está entre nós e isso é inegável. Mais e mais será necessário conhecer e entender como que essa nova área em AI funciona. Para te ajudar a entender tudo sobre a área de uma forma bem didática, Cora Silberschneider traz esse post completo falando desde o que é e como identificar o nível de maturidade de MLOps da sua empresa. (em Português) 

DALL-E, a AI desenhista, entra em fase Beta

Essa semana, a OpenAI anunciou que seu modelo de geração de imagens, o DALL-E, entraria em fase beta. Isso quer dizer que mais de 1 milhão de pessoas que estiverem na sua lista de espera receberão acesso a desejada AI. Eu já recebi o meu acesso e estou jogando no meu Twitter algumas imagens que estou criando lá. Aproveite para acessar o site e já pedir seu acesso também (em Inglês)
Conheça os finalistas do State of Data Brazil 

Obrigado a todos que colaboraram com incríveis análises para o State of Data! Abaixo você pode conferir os 10 finalistas do State of Data Brazil que estão concorrente aos três prêmios incríveis da competição:

Júlio Cesar
Edson R. Barbosa
Fábio Junior Damacena
Davi Ribeiro dos Santos
Rafael Assis
Nicholas Marino
Vinicius Duzac Cerutti
Fellipe Gomes
Hayala Cavenague
Luiz Simões

Parabéns aos finalistas! A próxima e última etapa do State of Data Brazil ocorrerá no dia 11 de Agosto, onde faremos uma live para anunciar o primeiro, segundo e terceiro lugar da competição. Até lá!
OUTROS TÓPICOS
A Google demitiu o engenheiro que disse que sua AI tem consciência
Há algumas semanas, falamos aqui na news sobre a notícia do engenheiro da Google, Blake Lemoine, que dizia que a AI deles, a LaMDA, possuía consciência. Após ser afastado, o último capítulo dessa novela foi a demissão de Blake do Google. (em Português)

O GPT-3 é capaz de explicar como seu código funciona
O GPT-3 é um dos modelos de linguagem mais famosos que tem atualmente, e ele continua surpreendendo com suas possibilidades. Nesse post, Simon Willison explica seus experimentos que conseguem fazer com o GPT-3 explique de forma bem efetiva como códigos de programação funcionam (em Inglês)

Algoritmos de ML explicandos em menos de 1 minuto
Um post bem legal do KDnuggets explicando brevemente alguns dos mais comuns algoritmos usados em Machine Learning. (em Inglês)

Como a Stitchfix criou sua plataforma de Machine Learning
A Stitch Fix é uma das maiores referências em uso de ML para alto impacto. Eles publicaram esse post falando sobre como foi a experiência em criar sua própria plataforma de Machine Learning, destacando os desafios e escolhas de arquitetura. (em Inglês)
DICA DE VIDEO
Como desenvolvedores se preparam para entrevistas (humor)
Um vídeo bem-humorado pra você começar bem a semana. Qualquer semelhança com a realidade é mera. coincidência (ou não). (em Inglês)
VAGAS DA SEMANA
  • +2 anos de EXP
  • Estatística
  • Machine Learning
  • SQL
  • Python ou R
  • Spark
  • Git
  • Estatística
  • Python ou R
  • EXP. com ferramentas de cloud para ML
MEME DA SEMANA
Apenas use SQL. Vai por mim
DATA VISUALIZATION DA SEMANA
Quando a humanidade domesticou os animais?

Confira essa incrível vis mostrando como e quando os seres humanos domesticaram animais, a começar com os doguinhos, que foram domesticados há mais de 10 mil anos (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS
Data Train: Modelos de QA com Deep Learning e Data Platform - Data Lake
25 de Julho - Evento Gratuito e 100% Online

Data for Breakfast: um evento da Snowflake
28 de Julho - Evento Gratuito e 100% Online


Data Universe - 5ª Edição
08 e 09 de Agosto - Evento Gratuito e 100% Online

XConf Brasil, o evento de tecnologia da Thoughworks
17 de Agosto - Evento Gratuito e 100% Online

Coalesce: The Analytics Engineer Conference
17 a 21 de Outubro - Evento Gratuito e 100% Online


Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.
Facebook
Site
LinkedIn
Twitter
Medium