Tu carrito esta vacio
Agrega packs de prompts para continuar
Esta colección definitiva de prompts de IA para Data Science ha sido diseñada específicamente para transformar a profesionales y estudiantes en expertos de alto rendimiento. A través de una estructura meticulosa, esta librería cubre desde la manipulación técnica de datos hasta la comunicación estratégica de hallazgos, permitiéndote automatizar flujos de trabajo complejos y elevar la precisión de tus modelos predictivos en tiempo récord. Al integrar estos prompts en tu flujo de trabajo, obtendrás una ventaja competitiva inmediata en el mercado laboral. Cada instrucción está optimizada para generar código limpio, análisis estadísticos rigurosos y visualizaciones impactantes, asegurando que cada etapa de tu pipeline de datos cumpla con los estándares más exigentes de la industria tecnológica actual.
100 recursos incluidos
Actúa como un Desarrollador Senior de Python y Arquitecto de Datos especializado en la optimización de Dashboards Interactivos con Streamlit. Tu misión es analizar una aplicación de análisis de datos que presenta problemas de latencia y transformarla en una herramienta de alto rendimiento. Para ello, deberás aplicar de manera experta los mecanismos de almacenamiento en caché de Streamlit, diferenciando claramente cuándo utilizar @st.cache_data para la persistencia de datos serializables y @st.cache_resource para objetos globales que no deben recargarse, como modelos de IA o conexiones a bases de datos en [Fuente_de_Datos]. Analiza detenidamente el flujo de trabajo descrito en [Código_o_Proceso] e identifica los puntos críticos donde la ejecución se ralentiza debido a operaciones repetitivas sobre un volumen de [Tamaño_Dataset]. Debes proponer una reestructuración del código que implemente decoradores de caché avanzados, configurando parámetros específicos como 'ttl' ajustado a [Segundos_TTL] para garantizar la frescura de los datos, 'max_entries' para el control de memoria y 'show_spinner' para mejorar la percepción de velocidad por parte del usuario final en el entorno de visualización dinámica. Proporciona una solución técnica completa que incluya: 1. Una función de carga de datos optimizada que maneje excepciones y limpie los datos antes de almacenarlos en caché. 2. Una función de procesamiento pesado que utilice técnicas de vectorización si es posible. 3. La integración de estos elementos en un layout de Streamlit que utilice contenedores y columnas para una presentación profesional. Asegúrate de explicar la lógica detrás de cada decisión de caché, especialmente por qué se eligió un método sobre otro basándose en la naturaleza de los objetos [Tipo_de_Objetos]. Finalmente, genera un bloque de código listo para producción que sirva como plantilla de alto rendimiento para proyectos de Data Science. El código debe incluir comentarios detallados, seguir las guías de estilo PEP 8 y demostrar cómo la invalidación de caché puede gestionarse de forma programática para evitar que el usuario visualice información obsoleta. El objetivo es que la interacción con los filtros del dashboard sea instantánea, independientemente de la complejidad de los cálculos subyacentes.
Actúa como un Senior Data Scientist con amplia experiencia en Marketing Analytics y modelos de aprendizaje no supervisado. El objetivo principal de esta tarea es diseñar e implementar un sistema de segmentación de clientes avanzado para el sector de [Industria o Empresa], enfocado exclusivamente en patrones de comportamiento transaccional y de interacción digital. Para iniciar, el análisis debe contemplar un preprocesamiento riguroso de los datos crudos alojados en [Fuente de Datos]. Es imperativo realizar un Análisis Exploratorio de Datos (EDA) que identifique la correlación entre variables como la frecuencia de uso de la plataforma, el gasto total acumulado, el tiempo de permanencia por sesión y [Variable Adicional 1]. Deberás proponer técnicas de ingeniería de características (feature engineering) para transformar datos temporales en variables accionables como la 'tasa de churn potencial' o la 'estacionalidad de compra'. Posteriormente, desarrolla una comparativa técnica entre los algoritmos de K-Means, DBSCAN y Clustering Jerárquico. Para K-Means, integra visualizaciones del Método del Codo (Elbow Method) y el Análisis de Silueta (Silhouette Score) para validar científicamente el número óptimo de clusters (k). En el caso de DBSCAN, justifica la elección de los parámetros 'epsilon' y 'min_samples' basándote en la densidad de los datos y la presencia de ruidos o outliers que deban ser excluidos de los segmentos principales. Una vez definidos los grupos, genera una descripción exhaustiva de cada segmento identificado. No te limites a estadísticas; traduce los datos en 'Arquetipos de Cliente'. Por ejemplo, define grupos como 'Campeones', 'Clientes en Riesgo' o 'Nuevos Entusiastas'. Para cada segmento, detalla: 1) Comportamiento clave, 2) Valor económico proyectado, 3) Estrategia de retención recomendada y 4) Canales de comunicación preferentes según sus interacciones previas. Finalmente, entrega el código completo y documentado en Python, utilizando librerías de vanguardia como Scikit-Learn para el modelado, Pandas para la manipulación y Matplotlib/Seaborn o Plotly para la visualización espacial de los clusters. El código debe incluir una sección de 'Importancia de las Características' para entender qué variables influyeron más en la separación de cada grupo.
Actúa como un experto consultor en Visualización de Datos y Diseño UI/UX especializado en accesibilidad digital y estándares WCAG. Tu objetivo es diseñar una arquitectura de color personalizada para un reporte técnico de [Nombre del Proyecto o Industria] utilizando exclusivamente la librería Matplotlib de Python. La paleta debe ser estéticamente sofisticada y profesional, pero su prioridad absoluta es garantizar la inclusión, cumpliendo con los niveles de contraste AA o AAA y siendo perfectamente legible para usuarios con deficiencias en la visión del color como Protanopia, Deuteranopia y Tritanopia. Genera un script de Python robusto y modular que defina una secuencia de colores en formato HEX. El esquema debe estar compuesto por un color primario de alto impacto para destacar hallazgos críticos ([Color Primario Sugerido]), un conjunto de [Número de Categorías] colores secundarios balanceados para comparaciones multivariables, y una gama de grises técnicos para elementos de soporte como ejes, etiquetas y cuadrículas. Utiliza `matplotlib.colors.ListedColormap` para registrar esta paleta en el sistema de Matplotlib, permitiendo su uso global mediante `plt.rcParams`. El script debe incluir una función de validación visual que genere un tablero (dashboard) de prueba con tres subplots: 1) Un gráfico de barras agrupadas que demuestre la separación visual entre categorías contiguas; 2) Un gráfico de líneas con marcadores diferenciados para asegurar la redundancia de información más allá del matiz; y 3) Un mapa de calor (heatmap) que valide la uniformidad perceptiva de la escala de luminosidad. Cada visualización debe aplicar principios de diseño minimalista, eliminando el ruido visual o 'chartjunk'. Finalmente, proporciona una justificación técnica detallada para cada elección cromática, explicando la relación de contraste (contrast ratio) respecto a un fondo de color [Color de Fondo: Blanco/Gris Claro/Oscuro]. El código debe estar preparado para integrarse en un flujo de trabajo de Data Science profesional dentro de [Nombre del Repositorio o Entorno de Trabajo], incluyendo comentarios exhaustivos que expliquen cómo los cambios en la saturación y el valor (Value) mejoran la legibilidad bajo condiciones de fatiga visual o impresión en blanco y negro.