Seu carrinho está vazio
Adicione pacotes de prompts para continuar
Esta coleção definitiva de solicitações de IA para ciência de dados foi projetada especificamente para transformar profissionais e estudantes em especialistas de alto desempenho. Através de uma estrutura meticulosa, esta biblioteca cobre tudo, desde a manipulação técnica de dados até a comunicação estratégica de descobertas, permitindo automatizar fluxos de trabalho complexos e aumentar a precisão de seus modelos preditivos em tempo recorde. Ao integrar essas solicitações ao seu fluxo de trabalho, você obterá uma vantagem competitiva imediata no mercado de trabalho. Cada instrução é otimizada para gerar código limpo, análise estatística rigorosa e visualizações impactantes, garantindo que cada estágio do seu pipeline de dados atenda aos padrões mais exigentes do setor de tecnologia atual.
100 recursos incluídos
Atua como Desenvolvedor Python Sênior e Arquiteto de Dados especializado em otimização de Dashboards Interativos com Streamlit. Sua missão é analisar uma aplicação de análise de dados que apresenta problemas de latência e transformá-la em uma ferramenta de alto desempenho. Para fazer isso, você precisará aplicar habilmente os mecanismos de cache do Streamlit, diferenciando claramente quando usar @st.cache_data para persistência de dados serializáveis e @st.cache_resource para objetos globais que não devem ser recarregados, como modelos de IA ou conexões de banco de dados em [Data_Source]. Analise cuidadosamente o fluxo de trabalho descrito em [Code_or_Process] e identifique pontos críticos onde a execução fica mais lenta devido a operações repetitivas em um volume de [Dataset_Size]. Você deve propor uma reestruturação de código que implemente decoradores de cache avançados, definindo parâmetros específicos como 'ttl' definido como [TTL_Seconds] para garantir a atualização dos dados, 'max_entries' para controle de memória e 'show_spinner' para melhorar a percepção de velocidade do usuário final no ambiente de exibição dinâmica. Fornece uma solução técnica completa que inclui: 1. Uma função otimizada de carregamento de dados que trata de exceções e limpa os dados antes do armazenamento em cache. 2. Uma função de processamento pesado que utiliza técnicas de vetorização, se possível. 3. A integração desses elementos em um layout Streamlit que utiliza contêineres e colunas para uma apresentação profissional. Certifique-se de explicar a lógica por trás de cada decisão de armazenamento em cache, especialmente porque um método foi escolhido em vez de outro com base na natureza dos objetos [Object_Type]. Por fim, ele gera um bloco de código pronto para produção que serve como modelo de alto desempenho para projetos de ciência de dados. O código deve incluir comentários detalhados, seguir os guias de estilo PEP 8 e demonstrar como a invalidação do cache pode ser tratada programaticamente para evitar que o usuário exiba informações obsoletas. O objetivo é que a interação com os filtros do painel seja instantânea, independentemente da complexidade dos cálculos subjacentes.
Atua como Cientista de Dados Sênior com vasta experiência em Marketing Analytics e modelos de aprendizagem não supervisionada. O principal objetivo desta tarefa é desenhar e implementar um sistema avançado de segmentação de clientes para o setor [Indústria ou Negócios], focado exclusivamente em padrões de comportamento transacional e interação digital. Para começar, a análise deve contemplar o pré-processamento rigoroso dos dados brutos hospedados em [Fonte de Dados]. É imprescindível a realização de uma Análise Exploratória de Dados (EDA) que identifique a correlação entre variáveis como a frequência de utilização da plataforma, o gasto total acumulado, o tempo gasto por sessão e [Variável Adicional 1]. Você precisará propor técnicas de engenharia de recursos para transformar dados temporais em variáveis acionáveis, como “taxa de rotatividade potencial” ou “sazonalidade de compra”. Posteriormente, desenvolve uma comparação técnica entre os algoritmos K-Means, DBSCAN e Hierarchical Clustering. Para K-Means, ele integra visualizações do Método Elbow e Silhouette Score para validar cientificamente o número ideal de clusters (k). No caso do DBSCAN, justificar a escolha dos parâmetros 'épsilon' e 'min_samples' com base na densidade dos dados e na presença de ruídos ou outliers que devem ser excluídos dos segmentos principais. Uma vez definidos os grupos, gera-se uma descrição exaustiva de cada segmento identificado. Não se limite às estatísticas; traduz dados em 'Arquétipos de Clientes'. Por exemplo, defina grupos como 'Campeões', 'Clientes em Risco' ou 'Novos Entusiastas'. Para cada segmento, detalhe: 1) Comportamento-chave, 2) Valor econômico projetado, 3) Estratégia de retenção recomendada e 4) Canais de comunicação preferidos com base em suas interações anteriores. Por fim, entrega o código completo e documentado em Python, utilizando bibliotecas de ponta como Scikit-Learn para modelagem, Pandas para manipulação e Matplotlib/Seaborn ou Plotly para visualização espacial dos clusters. O código deve incluir uma seção de ‘Importância das Características’ para entender quais variáveis tiveram mais influência na separação de cada grupo.
Atua como consultor especialista em Visualização de Dados e UI/UX Design especializado em acessibilidade digital e padrões WCAG. Seu objetivo é projetar uma arquitetura de cores personalizada para um relatório técnico para [Nome do projeto ou indústria] usando exclusivamente a biblioteca Python Matplotlib. A paleta deve ser esteticamente sofisticada e profissional, mas a sua prioridade absoluta é garantir a inclusão, satisfazendo os níveis de contraste AA ou AAA e sendo perfeitamente legível para utilizadores com deficiências de visão cromática, como Protanopia, Deuteranopia e Tritanopia. Gere um script Python robusto e modular que defina uma sequência de cores no formato HEX. O esquema deve ser composto por uma cor primária de alto impacto para destacar descobertas críticas ([Cor primária sugerida]), um conjunto de [Número de categorias] cores secundárias balanceadas para comparações multivariadas e uma variedade de tons de cinza técnicos para apoiar elementos como eixos, rótulos e grades. Utilize `matplotlib.colors.ListedColormap` para registrar esta paleta no sistema Matplotlib, permitindo seu uso global através de `plt.rcParams`. O script deve incluir uma função de validação visual que gere um painel de teste com três subparcelas: 1) Um gráfico de barras agrupadas demonstrando a separação visual entre categorias contíguas; 2) Um gráfico de linhas com marcadores distintos para garantir redundância de informações além das nuances; e 3) Um mapa de calor que valida a uniformidade perceptual da escala de luminosidade. Cada visualização deve aplicar princípios de design minimalistas, eliminando ruído visual ou “chartjunk”. Por fim, fornece uma justificativa técnica detalhada para cada escolha de cor, explicando a relação de contraste em relação a um fundo colorido [Cor de fundo: Branco/Cinza Claro/Escuro]. O código deve estar preparado para ser integrado a um fluxo de trabalho profissional de Ciência de Dados em [Nome do Repositório ou Ambiente de Trabalho], incluindo comentários abrangentes que explicam como as mudanças na saturação e no Valor melhoram a legibilidade sob condições de cansaço visual ou impressão em preto e branco.