Ciência de Dados

100 Prompts

4.7/5(11)

Copie, cole e use na sua IA favorita:

OpenAI
Claude
Gemini
DeepSeek
Grok
Qwen
Claude Code
Cursor
Antigravity
NotebookLM
OpenAI
Claude
Gemini
DeepSeek
Grok
Qwen
Claude Code
Cursor
Antigravity
NotebookLM

O que você conquista

—Manipular dados com Pandas e SQL
—Visualizar com estética em Matplotlib
—Treinar modelos de regressão e clustering
—Construir dashboards em Streamlit
—Fazer storytelling e preparar entrevistas

Preço de lançamento

$7.90$15.80USD

Apenas $0.08 por prompt · pagamento único

100 prompts

Vitalício

Toda IA

+9.500 profissionais já usam o GoPrompts AI

Ver exemplos

Conteúdo da coleção

100 recursos incluídos

Extracción de patrones con expresiones regulares

Optimización de memoria en DataFrames

Agregaciones personalizadas mediante funciones Lambda

Manejo eficiente de datos categóricos

Pivotado dinámico de series temporales

Tratamiento de índices multinivel jerárquicos

Interpolación de valores nulos numéricos

Vectorización de cálculos matemáticos pesados

Filtrado avanzado por condiciones booleanas

Uniones complejas de múltiples fuentes

Sobre esta coleção

Esta coleção definitiva de solicitações de IA para ciência de dados foi projetada especificamente para transformar profissionais e estudantes em especialistas de alto desempenho. Através de uma estrutura meticulosa, esta biblioteca cobre tudo, desde a manipulação técnica de dados até a comunicação estratégica de descobertas, permitindo automatizar fluxos de trabalho complexos e aumentar a precisão de seus modelos preditivos em tempo recorde. Ao integrar essas solicitações ao seu fluxo de trabalho, você obterá uma vantagem competitiva imediata no mercado de trabalho. Cada instrução é otimizada para gerar código limpo, análise estatística rigorosa e visualizações impactantes, garantindo que cada estágio do seu pipeline de dados atenda aos padrões mais exigentes do setor de tecnologia atual.

Amostra de prompt

Prompt #1

Gerenciamento eficiente de dados categóricos

Primeiro, execute um diagnóstico completo das colunas [list_columnas_categoricas] usando métodos de criação de perfil de memória para comparar o tipo de dados 'objeto' com o tipo 'categoria'. Explica detalhadamente como o armazenamento baseado em dicionário da classe Pandas Categorical reduz o consumo de memória e melhora a velocidade das operações de agrupamento e filtragem em comparação com cadeias de caracteres de texto bruto.

Segundo, implementar uma estratégia diferenciada dependendo da cardinalidade dos dados. Para variáveis com baixa cardinalidade, aplicar técnicas de One-Hot Encoding utilizando pd.get_dummies ou Scikit-Learn, garantindo a eliminação da primeira coluna para evitar a armadilha da multicolinearidade. Para colunas com alta cardinalidade, como [high_cardinality_column], implemente Target Encoding ou Frequency Encoding, lidando cuidadosamente com possíveis vazamentos de dados usando validação cruzada ou suavização.

Terceiro, aborda o gerenciamento de categorias invisíveis e valores nulos. O script deve ser capaz de atribuir proativamente uma categoria 'Desconhecida' e transformar as colunas para serem compatíveis com algoritmos de aprendizado de máquina que não aceitam valores não numéricos. Inclua uma seção de benchmarking onde você mede o tempo de execução de uma operação de agregação complexa antes e depois da otimização do tipo de dados.

Por fim, gera uma função reutilizável chamada [nome_função_limpeza] que automatiza todo esse fluxo, permitindo parametrizar o limite de cardinalidade para decidir o método de codificação e que retorna um relatório comparativo da economia de memória em megabytes (MB) e porcentagem (%). Certifique-se de que o código siga as práticas recomendadas do PEP8 e esteja devidamente documentado com docstrings.

Se faltar informação essencial para preencher os campos entre colchetes, faça-me as perguntas necessárias antes de responder.

Abrir em:

Perguntas frequentes

Como recebo os prompts?

Acesso imediato após a compra no seu painel. Basta copiar e colar na sua IA.

Em quais IAs funcionam?

No ChatGPT, Claude, Gemini, DeepSeek, Grok, Qwen e qualquer chat de IA.

Posso adaptá-los ao meu caso?

Sim. Cada prompt inclui campos entre colchetes onde você insere suas informações, contexto e dados específicos, então se ajustam à sua situação, país ou setor.

Posso ver como são antes de comprar?

Sim. Acima você pode ler prompts de amostra completos, exatamente como os receberá, para verificar a qualidade antes de pagar.

É um pagamento único?

Sim. Você paga uma vez e são seus para sempre, com atualizações incluídas.

Oferta de lançamento

Desbloqueie todas as coleções

Por $9.90 USD/mês você acessa 42300+ prompts em 422 coleções. Cancele quando quiser.

Preço de lançamento

$7.90$15.80USD

Apenas $0.08 por prompt · pagamento único

100 Prompts prontos para uso

Atualizações permanentes

Compatível com vários idiomas

Funciona em 6 IAs

Atua como Cientista de Dados Sênior com especialização em engenharia de dados e otimização de performance em Python. Seu objetivo é desenvolver um script Pandas extremamente otimizado para o tratamento de variáveis categóricas no dataset [dataset_name], que apresenta desafios de escalabilidade e alto consumo de memória RAM. Primeiro, execute um diagnóstico completo das colunas [list_columnas_categoricas] usando métodos de criação de perfil de memória para comparar o tipo de dados 'objeto' com o tipo 'categoria'. Explica detalhadamente como o armazenamento baseado em dicionário da classe Pandas Categorical reduz o consumo de memória e melhora a velocidade das operações de agrupamento e filtragem em comparação com cadeias de caracteres de texto bruto. Segundo, implementar uma estratégia diferenciada dependendo da cardinalidade dos dados. Para variáveis com baixa cardinalidade, aplicar técnicas de One-Hot Encoding utilizando pd.get_dummies ou Scikit-Learn, garantindo a eliminação da primeira coluna para evitar a armadilha da multicolinearidade. Para colunas com alta cardinalidade, como [high_cardinality_column], implemente Target Encoding ou Frequency Encoding, lidando cuidadosamente com possíveis vazamentos de dados usando validação cruzada ou suavização. Terceiro, aborda o gerenciamento de categorias invisíveis e valores nulos. O script deve ser capaz de atribuir proativamente uma categoria 'Desconhecida' e transformar as colunas para serem compatíveis com algoritmos de aprendizado de máquina que não aceitam valores não numéricos. Inclua uma seção de benchmarking onde você mede o tempo de execução de uma operação de agregação complexa antes e depois da otimização do tipo de dados. Por fim, gera uma função reutilizável chamada [nome_função_limpeza] que automatiza todo esse fluxo, permitindo parametrizar o limite de cardinalidade para decidir o método de codificação e que retorna um relatório comparativo da economia de memória em megabytes (MB) e porcentagem (%). Certifique-se de que o código siga as práticas recomendadas do PEP8 e esteja devidamente documentado com docstrings. Se faltar informação essencial para preencher os campos entre colchetes, faça-me as perguntas necessárias antes de responder.

Atua como Cientista de Dados Sênior e Arquiteto de Dados especializado em otimização de pipelines de processamento com Python. Sua missão é desenvolver um script avançado e altamente eficiente usando a biblioteca Pandas para realizar agregações personalizadas complexas em um conjunto de dados em grande escala hospedado em [File_Name_or_Source]. O objetivo não é simplesmente aplicar funções estatísticas básicas, mas projetar lógica de agregação sofisticada por meio do uso de expressões Lambda em métodos como .groupby() e .agg(), permitindo extrair insights que não são possíveis com funções predefinidas. O conjunto de dados contém informações críticas sobre [Descrever a natureza dos dados, por exemplo: transações bancárias, registros de telemetria, comportamento do usuário de comércio eletrônico] e apresenta desafios específicos, como a presença de valores nulos, valores discrepantes extremos e tipos de dados heterogêneos. Você deve implementar uma função Lambda que execute um cálculo [Especificar métrica complexa, por exemplo: índice de Gini ponderado, taxa de conversão ajustada sazonalmente ou cálculo de rotatividade probabilística] para cada grupo definido pela coluna [Group_Criteria_Column]. A lógica deve ser capaz de lidar com condições internas (if-else) e operações NumPy vetorizadas dentro do próprio Lambda para maximizar o desempenho computacional em ambientes com memória limitada. Além do desenvolvimento do código, é necessária uma análise técnica profunda sobre a eficiência da solução proposta. Compara o uso da função Lambda com alternativas como o uso de .apply() ou funções vetorizadas nativas, explicando quando cada abordagem é preferível em termos de sobrecarga do Python versus velocidade de execução do C. Fornece recomendações para otimizar o consumo de memória reduzindo tipos de dados numéricos e usando tipos categóricos no agrupamento de colunas antes de executar operações de agregação. O resultado final deve ser entregue como um script modular, documentado sob os padrões PEP 8 e pronto para ser integrado a um fluxo de trabalho de produção em [Deployment_Environment, por exemplo: AWS Glue, Azure Databricks ou ambiente local]. Se faltar informação essencial para preencher os campos entre colchetes, faça-me as perguntas necessárias antes de responder.

Atua como Cientista de Dados Sênior e especialista em Engenharia de Dados especializado no ecossistema PyData. Seu objetivo é projetar um script Python usando a biblioteca Pandas para realizar pivotamento dinâmico e avançado de séries temporais, transformando estruturas de dados do formato 'longo' para o formato 'largo' de forma eficiente e escalável. O principal problema é processar um conjunto de dados chamado [dataset_name] que contém métricas de alta frequência capturadas de múltiplas fontes ou sensores. O DataFrame original possui as colunas [time_column], [identifier_column] e [value_column]. É imperativo que o processo de dinamização não apenas reestruture a forma dos dados, mas também lide de forma inteligente com índices duplicados usando uma função de agregação personalizada definida como [agregação_função], que deve ser capaz de lidar com valores nulos (NaN) usando a estratégia [imputation_strategy]. Adicionalmente, a solução deve integrar uma fase de reamostragem dinâmica. Antes ou durante a rotação, os dados devem ser agrupados em intervalos de tempo de [time_frequency] (por exemplo, '5min', '1H', 'D'). Você deve garantir que o índice resultante seja um DatetimeIndex limpo e que não haja intervalos de tempo; Para fazer isso, use o método 'reindex' ou 'asfreq' para completar os períodos faltantes no intervalo entre [data_inicial] e [data_final]. Otimiza o desempenho do código considerando que o volume de dados pode exceder [million_rows] de registros. Implementa o uso de categorias (Dados Categóricos) para a coluna [identifier_column] para reduzir o uso de RAM. O script final deve incluir uma seção de validação que verifica a integridade da forma do DataFrame resultante e gera um rápido resumo estatístico das colunas dinâmicas para detectar anomalias imediatamente. Por fim, ele fornece código documentado seguindo os padrões PEP 8, incluindo comentários detalhados sobre por que usar 'pd.pivot_table' é preferível a 'df.pivot' em cenários de produção com dados ruidosos e como a vetorização do Pandas melhora a velocidade de processamento em comparação com loops iterativos tradicionais. Se faltar informação essencial para preencher os campos entre colchetes, faça-me as perguntas necessárias antes de responder.

Ciência de Dados

O que você conquista

Conteúdo da coleção

Manipulação Avançada com Pandas

Visualização Estética com Matplotlib

Limpeza profissional de conjunto de dados

Algoritmos de regressão linear

Classificação em aprendizado de máquina

Clustering e segmentação não supervisionados

Consultas SQL para analistas

Painéis interativos com Streamlit

Contação de histórias e narrativa de dados

Preparação para entrevista técnica

Sobre esta coleção

Amostra de prompt

Gerenciamento eficiente de dados categóricos

Perguntas frequentes

Como recebo os prompts?

Em quais IAs funcionam?

Posso adaptá-los ao meu caso?

Posso ver como são antes de comprar?

É um pagamento único?

Desbloqueie todas as coleções

Meu carrinho

Meu carrinho

Ciência de Dados

O que você conquista

Conteúdo da coleção

Manipulação Avançada com Pandas

Visualização Estética com Matplotlib

Limpeza profissional de conjunto de dados

Algoritmos de regressão linear

Classificação em aprendizado de máquina

Clustering e segmentação não supervisionados

Consultas SQL para analistas

Painéis interativos com Streamlit

Contação de histórias e narrativa de dados

Preparação para entrevista técnica

Sobre esta coleção

Amostra de prompt

Gerenciamento eficiente de dados categóricos

Perguntas frequentes

Como recebo os prompts?

Em quais IAs funcionam?

Posso adaptá-los ao meu caso?

Posso ver como são antes de comprar?

É um pagamento único?

Desbloqueie todas as coleções

Agregações personalizadas usando funções Lambda

Pivotagem dinâmica de séries temporais

Você também pode gostar

Comércio exterior

Contadores

Livrarias

O que a IA gera com estes prompts

O que é um prompt?

O que dizem os clientes

Cumpre

Útil

Muito recomendado

Qualidade top

Excelente

Útil