Em 11 de junho de 2025, tive a oportunidade de compartilhar na Trilha de Data Science do TDC Florianópolis 2025, reflexões sobre Ética e Responsabilidade na Ciência de Dados.
Agora, registro aqui alguns pontos principais da minha apresentação...
Quando os Dados Enganam
Ética e Responsabilidade na Ciênica de Dados
Introdução
"Se você torturar os dados por tempo suficiente, eles confessarão qualquer coisa."
Esta frase, de Ronald Coase, economista britânico e Nobel de Economia (1991), ilustra bem o poder, e o perigo de manipular dados para ququer fim desejado.
Vivemos na era dos dados. Eles estão por toda parte - nos aplicativos que usamos, nas decisões que nos afetam, nas políticas públicas e nas estratégias empresariais.
Mas... e se eles, os dados, estiverem errados?
Ou pior: e se os dados forem usados de forma a distorcer a realidade?
O objetivo desta postagem, é refletir sobre o papel da ética na ciência de dados, entender como decisões aparentemente técnicas podem ter impactos sociais profundos, e talvez o mais importante: o que pode ser feito para garantir que os dados sirvam ao bem comum.
Um pouco de história...
Antes de entrar no tema efetivamente, gostaria de compartilhar como me interessei ética e dados.
Em 2024, participei de um Datathon do Women in Data Science sobre Equity in Healthcare. O desafio era criar modelos preditivos para estimar o tempo até o diagnóstico de câncer metastático em pacientes com câncer de mama. Ao analisar o dataset, percebi que variáveis importantes, como o IMC (Índice de Massa Corporal), tinham muitos valores ausentes. Tentei várias técnicas de imputação, mas, devido ao perfil majoritário dos pacientes (brancos), o viés persistia. Esse desafio me fez refletir sobre como tratar dados de forma ética e responsável.
No meu dia a dia, também vejo como a forma de apresentar dados pode mudar percepções. Por exemplo, ao medir o tempo médio de resposta do meu time a requests, a média aritmética era distorcida por outliers. Ao usar a mediana e gráficos boxplot, o desempenho real ficou mais claro.
Veja um exemplo:
E, finalmente, não posso deixar de citar o livro "Como mentir com estatística". Não vou entrar em muitos detalhes neste ponto, pois já fiz uma postagem dedicada ao livro aqui - leiam esse post, e vocês entenderão.
O Poder dos Dados
Um teste..
Você prefere trabalhar presencialmente ou remotamente?
Correlação não é Causalidade
- Cambridge Analytica - onde foram usados de forma indevida dados do facebook para manipular eleições.
- Amazon e o algoritmo de recrutamento - o sistema penalizava candidatas mulheres por cause de viés nos dados históricos.
- O paradoxo de Simpson - um padrão que aparece em grupos separados desaparece ou se inverte quando os dados são combinados.
Ética na Ciência de Dados
- Justiça: evitar discriminação e viés algoritmico.
- Transparência: tomar decisões compreensíveis e auditáveis.
- Responsabilidade: assumir as consequências do uso de dados.
- Privacidade: respeitar os direitos dos indivíduos sobre seus dados.
- Finalidade
- Adequação
- Necessidade
- Livre Acesso
- Qualidade dos Dados
- Transparência
- Seguraça
- Prevenção
- Não discriminação
- Responsaiblização de contas.
- OCDE: recomenda IA que seja robusta, segura, justa, explicável e centrada no ser humano.
- UNESCO: defende IA que respeite direitos humanos, diversidade cultural e sustentabilidade.
- AI Act (União Européia): propõe classificação de riscos e obrigações éticas conforme o impacto da IA.
Como aplicar isso na prática?
A ética em dados não é apenas uma escolah técnica: é uma escolha civilizatória. É o que garante que a tecnologia sirva às pessoas, e não o contrário.
Afinal, Ética não é só sobre o que fazemos com os dados, mas é também sobre como os tratamos em cada etapa do caminho.
Para refletir
- Você já enfrentou um dilema ético em projetos de dados?
- Como você / sua empresa lida com privacidade e viés?
- O que você acredita que falta para termos uma cultura mais ética em dados?
Com grandes dados, vêm grandes responsabilidades.
Vamos juntos construir uma cultura de dados mais ética, transparente e inclusiva?
Deixe seu comentário, compartilhe suas experiências, e vamos continuar essa conversa!
No comments:
Post a Comment