Podcasts de Data Science e Machine Learning
2023 May 25Podcasts de Data Science e Machine Learning
Postado em 21 de Maio de 2021
O assunto surgiu em uma thread no fórum do Data Hackers e surgiu essa lista interessante. Alguns deles eu não conhecia pessoalmente, mas ficam as referências para quem tiver interessado.
Português
-
Data Hackers: Dispensando maiores apresentações dado que é o podcast oficial da maior comunidade de Ciência de Dados, Machine Learning e Data Engineering do Brasil atualmente; o podcast conta com uma abordagem técnica e ao mesmo tempo descontraída que sai do lugar comum, e conta com muitos episódios excelentes. Conta como anfitriões o Cientista de Dados universal Paulo Vasconcellos, o Engenheiro de Dados de todas as ferramentas do sistema solar Alan Sene, e o Gabriel “The DS Manager” Lages. Eu tive a grata oportunidade de participar no episódio “O dia a dia de um Machine Learning Engineer — Data Hackers Podcast 24” e foi uma experiência sensacional em que eu aprendi muito com os caras e foi bem divertido a gravação (com o destaque para a referência totalmente aleatória do Lages que citou o caso de uma lib que simplesmente parou de ser desenvolvida porque o principal desenvolvedor foi preso).
-
Dados e Saúde: Sempre que os assuntos “Medicina” e “Inteligência Artificial” aparecem em alguma notícia, sempre é o mais do mesmo: Uma porção de promessas infundadas, hype, e uma tonelada de nonsense pra gerar engajamento. Para quem busca uma visão ponderada sobre a mistura desses dois universos, o podcast do Dados e Saúde é uma ilha de sanidade, pragmatismo e ponderação sobre esses assuntos. Com a apresentação do Fabiano Filho, Eduardo Farina, e do Matheus Coradini o podcast consegue trazer perspectivas realistas de como os dados estão ajudando a melhorar a vida das pessoas, no que se refere a perspectiva médica. O podcast tem um conjunto interessante de episódios. *Startups *que usam dados para inovação? Tem. Informações realistas de quem está na trincheira aplicando IA em medicina? Tem. Desafios de aplicação de Deep Learning em imagens médicas? Tem também. Algoritmos na medicina? Sem problemas, também tem. Episódio de destaque: Aqui eu deixo o que eu considero um dos melhores epidódios, que foi o bate papo com o professor Luis Correia do ótimo blog Medicina Baseada em Evidências no episódio #47 Racionalidade baseada em evidências na saúde — com Luis Correia.
-
Mario Filho: O Mário Filho é uma daquelas figuras antológicas da comunidade de Ciência de Dados não somente pelo seu conhecimento técnico, mas pelo fato de que ele é um Kaggle Grandmaster (tipo, Kaggle Grandaster real que ganha competição e coda, e não a atual geração de KGM que forka código e ficam medigando voto nos fóruns). Juntamente com o Giba e o saudoso Leustagos desbravaram o Kaggle com um time 100% BR em meados de 2013 (quando nem existia Ciência de Dados ainda, imaginem). Particularmente eu sou suspeito para falar da capacidade técnica do Mário dado que coisa de 6 a 7 anos atrás ele estava aplicando *ensembling, stacking, *calculando similaridade usando *hashing *e tudo isso usando XGBoost e Deep Learning; coisas que parecem *mainstream *hoje nas que na época bateram de frente até com publicações acadêmicas em ML. Episódio de Destaque: Como me organizei para completar mais de 50 cursos online
-
Pizza de Dados: Eu era leitor da Letícia Portella por conta de um post bem interessante que ela fez sobre a mortalidade no trânsito no BR e pelo o acaso acabei achando o podcast do Pizza de Dados que ela faz juntamente com a Jéssica Temporal e com o Gustavo Coelho. Uma coisa bacana que eu acho do podcast é que todas as pessoas da comunidade técnica que eu penso “Poxa esse(a) Fulano(a) é fod@” com certeza já passaram por lá. Episódio de Destaque: Aqui a recomendação é o episódio 007: Ética, leis e segurança de dados que mostra que o podcast está muito a frente do tempo em relação as pautas, dado que essa entrevista trouxe não somente a perspectiva ético-jurídica em 2018 muito antes da LGPD e do hype sobre a ética em IA que existe nos dias de hoje.
-
Databasecast: Apresentado pelo Dr. Mauro Pichiliani e Wagner Crivelini o Databasecast é um podcast raiz que fala desde backup *e *restore, passando por ciência de dados e até chegar em IA. Um dos maiores destaques do podcast na minha opinião, é a forma pragmática na qual os temas são tratados; não existe deslumbramento com tecnologia e nem hype e tanto o Mauro quanto o Wagner falam a realidade nua e crua do dia-dia de profissionais como DBAs: Backups falham, nem todo mundo tem Disaster Recovery, que a carreira de dados é difícil, entre outras coisas. A variedade (e o alto calibre) dos profissionais que eles convidam são outro destaque. Muitas das histórias que eu passei na pele (ex: deletar banco de produção, update *sem o *where, entre outras tragédias) eu via que mesmo grandes profissionais com vasta experiência tinham passado pelas mesmas coisas; e que mesmo com tudo isso eles aprendiam e compartilhavam a sua experiência de campo com um altissímo grau de honestidade. O episódio DatabaseCast 85: Demissão e desemprego, foi um dos melhores episódios que eu ouvi em todos os tempos, e conta a realidade nua e crua do que geralmente não aparece em posts de medium/em blog de empresa quando o facão chega.
-
Intervalo de Confiança: Fundado pela Nicolli Gautério e pela Patrícia Balthazar, com quase 2 anos de estrada o IC tem uma abordagem que eu acho interessante pois eles preenchem uma lacuna muito grande na internet brasileira de um verdadeiro jornalismo de dados, algo mais ou menos na linha do FiveThirtyEight. E não é à toa: o time tem uma diversidade de profissionais bem ampla e é muito bem produzido e dirigido. Se as redes de mídia *mainstream *tivessem redações sérias de reportagem de dados, o resultado seria o IC. Episódio de destaque: Variância — XIV — Inteligência Artificial e Prevenção de Crimes
-
Data Cast: Feito pelo Grupo Toccato o podcast começou em 2020 e tem como destaque a linguagem leve, acessível e didática na abordagem de temas complexos como transformação digital e LGPD. Os convidados nos episódios que eu ouvi tem uma vasta experiência corporativa, e com episódios de aproximadamente 30 minutos o podcast vai direto ao ponto. Episódio de destaque: #5 LGPD: O que ainda falta para a sua empresa se adequar à lei e como acelerar este processo.
-
Analytics Selvagem: O podcast da Oncase se apresenta como “uma iniciativa da Oncase com o objetivo de compartilhar, ao longo de vários episódios deste Podcast, um pouco do dia a dia de profissionais que trabalham com Analytics, Big Data e Inteligência Artificial.” e é isso que o podcast entrega. Roterizado e apresentado pelo Lucas França e o Henrique Tavares o podcast fala do dia-dia de uma consultoria de dados e tem alguns episódios bem interessantes como o Episódio 4: DataOPS, a buzzword.
-
Teste de Turing: Apresentado pelo Erick Fonseca em suas próprias palavras o TdT é “Tradução automática, chatbots, IAs que escrevem como gente, e tantas outras coisas: como as máquinas estão aprendendo a falar a nossa língua? O Teste de Turing explica tudo isso!”. Por mais que o título dê a impressão de ser um podcast generalista, o TdT fala de detalhes de implementação e é extremamente técnico. Uma amostra do grau de profundidade do podcast pode ser encontrado no episódio sobre *Parsers *sintáticos e Linguística Computacional. Episódio de destaque: Teste de Turing #5: Wordnets e Recursos Lexicais
-
Let’s Data Podcast: Tendo como *hosts *Bernardo Lago, Felipe Schiavon e León Silva o podcast começou agora em Março de 2021, e vendo a excelente entrevista com o Pedro Albuquerque já dá pra ver que o podcast promete ser um dos melhores do segmento para quem gosta de uma conversa bem roteirizada, mas sem o lugar comum de perguntas e respostas fechadas. Uma coisa que eu achei interessante no roteiro é que tanto o Bernardo, o Felipe e o León têm uma mistura entre conhecimento de dados tanto da perspectiva de mercado quanto a base acadêmica forte.
Inglês
E aí o que acharam? Tem algum podcast que você deseja recomendar? Deixa aqui nos comentários que eu quero conhecer mais podcasts de Dados.
…
Atualização 18/03/2021: Correção de links quebrados.
Atualização 31/03/2021: Inclusão de descrição dos podcasts PT-BR.