Data Science

100 Prompts

4.7/5(11)

Copia, pega y úsalos en tu IA favorita:

OpenAI
Claude
Gemini
DeepSeek
Grok
Qwen
Claude Code
Cursor
Antigravity
NotebookLM
OpenAI
Claude
Gemini
DeepSeek
Grok
Qwen
Claude Code
Cursor
Antigravity
NotebookLM

Lo que logras

—Manipular datos con Pandas y SQL
—Visualizar estéticamente con Matplotlib
—Entrenar modelos de regresión y clustering
—Construir dashboards en Streamlit
—Hacer storytelling y preparar entrevistas

Precio de lanzamiento

$7.90$15.80USD

Solo $0.08 por prompt · pago único

100 prompts

De por vida

Toda IA

+9500 profesionales ya usan GoPrompts AI

Ver ejemplos

Contenido de la Colección

100 recursos incluidos

Extracción de patrones con expresiones regulares

Optimización de memoria en DataFrames

Agregaciones personalizadas mediante funciones Lambda

Manejo eficiente de datos categóricos

Pivotado dinámico de series temporales

Tratamiento de índices multinivel jerárquicos

Interpolación de valores nulos numéricos

Vectorización de cálculos matemáticos pesados

Filtrado avanzado por condiciones booleanas

Uniones complejas de múltiples fuentes

Sobre esta colección

Esta colección definitiva de prompts de IA para Data Science ha sido diseñada específicamente para transformar a profesionales y estudiantes en expertos de alto rendimiento. A través de una estructura meticulosa, esta librería cubre desde la manipulación técnica de datos hasta la comunicación estratégica de hallazgos, permitiéndote automatizar flujos de trabajo complejos y elevar la precisión de tus modelos predictivos en tiempo récord. Al integrar estos prompts en tu flujo de trabajo, obtendrás una ventaja competitiva inmediata en el mercado laboral. Cada instrucción está optimizada para generar código limpio, análisis estadísticos rigurosos y visualizaciones impactantes, asegurando que cada etapa de tu pipeline de datos cumpla con los estándares más exigentes de la industria tecnológica actual.

Muestra de prompt

Prompt #1

Manejo eficiente de datos categóricos

Primero, realiza un diagnóstico exhaustivo de las columnas [lista_columnas_categoricas] utilizando métodos de perfilamiento de memoria para comparar el tipo de dato 'object' frente al tipo 'category'. Explica detalladamente cómo el almacenamiento basado en diccionarios de la clase Categorical de Pandas reduce la huella de memoria y mejora la velocidad de las operaciones de agrupación (groupby) y filtrado en comparación con las cadenas de texto crudas.

Segundo, implementa una estrategia diferenciada según la cardinalidad de los datos. Para variables con baja cardinalidad, aplica técnicas de One-Hot Encoding utilizando pd.get_dummies o Scikit-Learn, asegurando la eliminación de la primera columna para evitar la trampa de la multicolinealidad. Para columnas con alta cardinalidad como [columna_alta_cardinalidad], implementa un Target Encoding o Frequency Encoding, manejando cuidadosamente el posible 'data leakage' mediante el uso de validación cruzada o suavizado (smoothing).

Tercero, aborda la gestión de categorías no vistas (unseen categories) y valores nulos. El script debe ser capaz de asignar una categoría 'Unknown' de forma proactiva y transformar las columnas para que sean compatibles con algoritmos de Machine Learning que no aceptan valores no numéricos. Incluye una sección de benchmarking donde midas el tiempo de ejecución de una operación de agregación compleja antes y después de la optimización del tipo de dato.

Finalmente, genera una función reutilizable llamada [nombre_funcion_limpieza] que automatice todo este flujo, permitiendo parametrizar el umbral de cardinalidad para decidir el método de codificación y que devuelva un reporte comparativo del ahorro de memoria en megabytes (MB) y porcentaje (%). Asegúrate de que el código siga las mejores prácticas de PEP8 y esté debidamente documentado con docstrings.

Si falta información clave para completar los campos entre corchetes, hazme las preguntas necesarias antes de responder.

Abrir en:

Preguntas frecuentes

¿Cómo recibo los prompts?

Acceso inmediato tras la compra desde tu panel. Solo copias y pegas en tu IA.

¿En qué IA funcionan?

En ChatGPT, Claude, Gemini, DeepSeek, Grok, Qwen y cualquier chat de IA.

¿Puedo adaptarlos a mi caso?

Sí. Cada prompt incluye campos entre corchetes donde insertas tu información, contexto y datos específicos, así que se ajustan a tu situación, país o sector.

¿Puedo ver cómo son antes de comprar?

Sí. Más arriba puedes leer prompts de muestra completos, tal como los recibirás, para verificar la calidad antes de pagar.

¿Es un pago único?

Sí. Pagas una sola vez y son tuyos para siempre, con actualizaciones incluidas.

Oferta de lanzamiento

Desbloquea todas las colecciones

Por $9.90 USD al mes accedes a 42300+ prompts en 422 colecciones. Cancela cuando quieras.

Precio de lanzamiento

$7.90$15.80USD

Solo $0.08 por prompt · pago único

100 Prompts listos para usar

Actualizaciones permanentes

Compatible con múltiples lenguajes

Funciona en 6 IAs

Actúa como un Senior Data Scientist con especialización en ingeniería de datos y optimización de rendimiento en Python. Tu objetivo es desarrollar un script de Pandas extremadamente optimizado para el tratamiento de variables categóricas en el dataset [nombre_del_dataset], el cual presenta desafíos de escalabilidad y alto consumo de memoria RAM. Primero, realiza un diagnóstico exhaustivo de las columnas [lista_columnas_categoricas] utilizando métodos de perfilamiento de memoria para comparar el tipo de dato 'object' frente al tipo 'category'. Explica detalladamente cómo el almacenamiento basado en diccionarios de la clase Categorical de Pandas reduce la huella de memoria y mejora la velocidad de las operaciones de agrupación (groupby) y filtrado en comparación con las cadenas de texto crudas. Segundo, implementa una estrategia diferenciada según la cardinalidad de los datos. Para variables con baja cardinalidad, aplica técnicas de One-Hot Encoding utilizando pd.get_dummies o Scikit-Learn, asegurando la eliminación de la primera columna para evitar la trampa de la multicolinealidad. Para columnas con alta cardinalidad como [columna_alta_cardinalidad], implementa un Target Encoding o Frequency Encoding, manejando cuidadosamente el posible 'data leakage' mediante el uso de validación cruzada o suavizado (smoothing). Tercero, aborda la gestión de categorías no vistas (unseen categories) y valores nulos. El script debe ser capaz de asignar una categoría 'Unknown' de forma proactiva y transformar las columnas para que sean compatibles con algoritmos de Machine Learning que no aceptan valores no numéricos. Incluye una sección de benchmarking donde midas el tiempo de ejecución de una operación de agregación compleja antes y después de la optimización del tipo de dato. Finalmente, genera una función reutilizable llamada [nombre_funcion_limpieza] que automatice todo este flujo, permitiendo parametrizar el umbral de cardinalidad para decidir el método de codificación y que devuelva un reporte comparativo del ahorro de memoria en megabytes (MB) y porcentaje (%). Asegúrate de que el código siga las mejores prácticas de PEP8 y esté debidamente documentado con docstrings. Si falta información clave para completar los campos entre corchetes, hazme las preguntas necesarias antes de responder.

Actúa como un experto Senior Data Scientist y Arquitecto de Datos especializado en la optimización de pipelines de procesamiento con Python. Tu misión es desarrollar un script avanzado y altamente eficiente utilizando la librería Pandas para realizar agregaciones personalizadas complejas sobre un conjunto de datos de gran escala alojado en [Nombre_del_Archivo_o_Fuente]. El objetivo no es simplemente aplicar funciones estadísticas básicas, sino diseñar una lógica de agregación sofisticada mediante el uso de expresiones Lambda dentro de métodos como .groupby() y .agg(), permitiendo extraer insights que no son posibles con funciones predefinidas. El dataset contiene información crítica sobre [Describir Naturaleza de los Datos, ej: transacciones bancarias, logs de telemetría, comportamiento de usuarios e-commerce] y presenta desafíos específicos como la presencia de valores nulos, outliers extremos y tipos de datos heterogéneos. Debes implementar una función Lambda que realice un cálculo de [Especificar Métrica Compleja, ej: Índice de Gini ponderado, ratio de conversión ajustado por estacionalidad o cálculo de churn probabilístico] para cada grupo definido por la columna [Columna_Criterio_Agrupacion]. La lógica debe ser capaz de manejar condiciones internas (if-else) y operaciones vectorizadas de NumPy dentro de la propia Lambda para maximizar el rendimiento computacional en entornos de memoria limitada. Además del desarrollo del código, se requiere un análisis técnico profundo sobre la eficiencia de la solución propuesta. Compara el uso de la función Lambda con alternativas como el uso de .apply() o funciones vectorizadas nativas, explicando cuándo es preferible cada enfoque en términos de 'overhead' de Python frente a la velocidad de ejecución de C. Proporciona recomendaciones para optimizar el consumo de memoria mediante técnicas de 'downcasting' de tipos de datos numéricos y el uso de tipos categóricos en las columnas de agrupación antes de ejecutar las operaciones de agregación. El resultado final debe entregarse como un script modular, documentado bajo estándares PEP 8, y listo para ser integrado en un flujo de trabajo de producción en [Entorno_de_Despliegue, ej: AWS Glue, Azure Databricks o entorno local]. Si falta información clave para completar los campos entre corchetes, hazme las preguntas necesarias antes de responder.

Actúa como un Senior Data Scientist y experto en Ingeniería de Datos especializado en el ecosistema PyData. Tu objetivo es diseñar un script de Python utilizando la librería Pandas para realizar un pivotado dinámico y avanzado de series temporales, transformando estructuras de datos de formato 'long' (largo) a formato 'wide' (ancho) de manera eficiente y escalable. El problema central consiste en procesar un conjunto de datos denominado [nombre_del_dataset] que contiene métricas de alta frecuencia capturadas de múltiples fuentes o sensores. El DataFrame original posee las columnas [columna_tiempo], [columna_identificador] y [columna_valor]. Es imperativo que el proceso de pivotado no solo reestructure la forma de los datos, sino que también maneje de forma inteligente los índices duplicados mediante una función de agregación personalizada definida como [funcion_agregacion], la cual debe ser capaz de gestionar valores nulos (NaN) mediante la estrategia de [estrategia_imputacion]. Además, la solución debe integrar una fase de remuestreo (resampling) dinámica. Antes o durante el pivotado, los datos deben agruparse en intervalos temporales de [frecuencia_temporal] (por ejemplo, '5min', '1H', 'D'). Debes asegurar que el índice resultante sea un DatetimeIndex limpio y que no existan lagunas temporales; para ello, utiliza el método 'reindex' o 'asfreq' para completar los periodos faltantes en el rango comprendido entre [fecha_inicio] y [fecha_fin]. Optimiza el rendimiento del código considerando que el volumen de datos puede superar los [millones_de_filas] de registros. Implementa el uso de categorías (Categorical Data) para la columna [columna_identificador] con el fin de reducir el uso de memoria RAM. El script final debe incluir una sección de validación que verifique la integridad de la forma del DataFrame resultante y genere un resumen estadístico rápido de las columnas pivotadas para detectar anomalías de manera inmediata. Finalmente, proporciona el código documentado siguiendo los estándares de PEP 8, incluyendo comentarios detallados sobre por qué se prefiere el uso de 'pd.pivot_table' sobre 'df.pivot' en escenarios de producción con datos ruidosos, y cómo la vectorización de Pandas mejora la velocidad de procesamiento en comparación con bucles iterativos tradicionales. Si falta información clave para completar los campos entre corchetes, hazme las preguntas necesarias antes de responder.

Data Science

Lo que logras

Contenido de la Colección

Manipulación Avanzada con Pandas

Visualización Estética con Matplotlib

Limpieza Profesional de Datasets

Algoritmos de Regresión Lineal

Clasificación en Machine Learning

Clustering y Segmentación No Supervisada

Consultas SQL para Analistas

Dashboards Interactivos con Streamlit

Storytelling y Narrativa de Datos

Preparación de Entrevistas Técnicas

Sobre esta colección

Muestra de prompt

Manejo eficiente de datos categóricos

Preguntas frecuentes

¿Cómo recibo los prompts?

¿En qué IA funcionan?

¿Puedo adaptarlos a mi caso?

¿Puedo ver cómo son antes de comprar?

¿Es un pago único?

Desbloquea todas las colecciones

Mi Carrito

Mi Carrito

Data Science

Lo que logras

Contenido de la Colección

Manipulación Avanzada con Pandas

Visualización Estética con Matplotlib

Limpieza Profesional de Datasets

Algoritmos de Regresión Lineal

Clasificación en Machine Learning

Clustering y Segmentación No Supervisada

Consultas SQL para Analistas

Dashboards Interactivos con Streamlit

Storytelling y Narrativa de Datos

Preparación de Entrevistas Técnicas

Sobre esta colección

Muestra de prompt

Manejo eficiente de datos categóricos

Preguntas frecuentes

¿Cómo recibo los prompts?

¿En qué IA funcionan?

¿Puedo adaptarlos a mi caso?

¿Puedo ver cómo son antes de comprar?

¿Es un pago único?

Desbloquea todas las colecciones

Agregaciones personalizadas mediante funciones Lambda

Pivotado dinámico de series temporales

También te podría interesar

Gestión administrativa y directiva

Impresión 3D

Excel

Lo que la IA genera con estos prompts

¿Qué es un prompt?

Lo que dicen los clientes

Cumple

Útil

Muy recomendado

Calidad top

Excelente

Útil