Saltar a contenido

Distinct

Información general

El paso Distinct se utiliza para eliminar entradas duplicadas del flujo de datos, dejando solo valores únicos. Este proceso ayuda a optimizar el procesamiento de datos al eliminar duplicados y reducir la cantidad de datos analizados.

Parámetros

Configuraciones del paso:

Campo de configuración Opciones de valor Propósito
Nombre del paso - Nombre del paso en el flujo de datos
Paso fuente - Selección del paso anterior
Claves - Claves para verificar la unicidad

Casos

  • Limpieza de datos: Eliminación de entradas duplicadas para simplificar el análisis.
  • Preparación para la agregación: Pre-limpieza de datos antes de realizar operaciones de agregación.

Excepciones

  • Selección de claves: La selección incorrecta de claves puede resultar en la pérdida de datos importantes.
  • Pérdida de información: Riesgo de perder parte de los datos si el paso está configurado incorrectamente.

Escenario de aplicación

Este componente verifica la disponibilidad de campos en el paso Distinct. Se hace clic en el botón "Distinct" en el frontend. Si el paso funciona correctamente, debería aparecer una línea de "execute" con una vista previa de la respuesta HTTP en la pestaña de Red, que contiene datos para tres registros.

  • Puedes descargar la configuración del componente aquí.